Job Description:
【岗位职责】
1、负责K8S平台相关环境的部署和运维,解决各种场景下的K8S的的疑难问题;
2、负责K8S平台的集群管理、MASTER组件的维护管理、网络组牛(如flannel、Calico)、存储组件 (如ceph)等功能在实际生产环境的功能扩展和维护工作;
3、负责K8S上的应用的部署、调度、反亲和、健康自愈、资源隔离离、镜像优化等相关配置操作标准和规范制定和推行,对K8S监控体系进行完善和健全;
4、负责K8S平台在运维工作中疑难问题的分析和解决,负责集群高高可用优化的方案设计和灾难故障恢复的机制建立和演练;
5、参与对K8S集群周边生态的技术研究,能引进新技术在生产环境镜中最佳落地,提升K8S云平台的稳定性、安全性和易用性;
6、参与跨部门沟通,协调各产品线和IT项目方案在K8S环境中方案对接。
Job Requirements:
【任职资格】
1、本科及以上学历,计算机相关专业,有3年以上K8S、Docker等实际管理工作经验。
2、深入了解K8S集群基础概念和原理,有istio等service mesh经验优先。
3、了解Docker底层原理,熟悉Cgroup、Namespace,有LinuxKernel核心子系统(如内存管理、文件系统、网络、进程调度)等经验优先。
4、熟悉网络基本原理,熟悉tcp/ip协议,熟悉容器网络的基本原理。
5、熟练使用基于云原生的Prometheus等监控工具对K8S集群进行监控和告警管理。
6、掌握bash/python/go任意一门语言,有运维开发经验优先。
7、熟悉阿里云/华为云K8S集群管理经验尤佳。
8、熟悉常见CI/CD和自动化运维工具,如jenkins/git等,了解项目构建、打包、部署、配置管理等流程。
9、具备良好的沟通能力和强烈的责任心,热爱运维技术,有良好的的文字表达能力和自学能力,有良好的工作流程、文档制定撰写习惯和良好的团队合作意识。
10、能够独立完成工作,具有较强的综合分析问题及解决问题的能力。
Benefits:
4000u-5000u
base北美/海外优先


