DevOps工程师 at Injective

全职1个月前
Employment Information
职位描述
该职位需要具备高度专业技能的人员来管理和维护企业级IT基础设施,确保系统持续可用且性能最佳。理想的候选人将负责设计、部署和运营可扩展的云原生解决方案,重点关注基于Kubernetes的环境。您将在监控系统健康状况、主动识别并解决潜在问题、实施稳健的事件响应协议以减少停机时间方面发挥关键作用。该职位还包括与跨职能团队合作,使基础设施策略与业务目标和技术需求保持一致。
主要职责
  • 通过主动监控、维护和故障排查服务器、网络和存储系统,确保关键基础设施的7×24小时可用性。
  • 通过分析瓶颈、调整配置和实施资源管理的自动化工具来优化系统性能和可扩展性。
  • 迅速响应事件,进行根本原因分析,并记录解决方案以防止重复发生,同时保持符合服务等级协议。
  • 部署和管理Kubernetes集群,包括容器编排、节点配置以及与CI/CD流水线的集成。
  • 实施安全最佳实践和合规标准,以保护基础设施资产并确保数据完整性。
  • 与开发人员和DevOps团队合作,设计可扩展的架构并排查应用层面的问题。
  • 监控系统指标和日志,识别性能趋势,优化资源分配,提高整体系统可靠性。
  • 及时了解新兴技术和行业趋势,推荐基础设施改进和创新。
  • 记录技术流程、配置和事件解决方案,确保知识共享和运营连续性。
  • 定期进行系统审计和容量规划,以预测未来需求并确保基础设施准备就绪。
职位要求
  • 在系统管理、DevOps或相关领域有至少5年的实践经验。
  • 精通Kubernetes集群的部署、配置和操作,熟悉Docker和Helm等容器编排工具。
  • 深入了解云平台(AWS、Azure、GCP)和混合云环境,以实现基础设施的可扩展性。
  • 熟练掌握脚本语言(Python、Bash、PowerShell)和自动化框架,用于系统维护任务。
  • 了解网络协议、DNS管理和安全实践(防火墙、加密、IAM),以确保基础设施的弹性。
  • 能够分析系统性能指标,并实施解决方案以减少延迟和优化资源使用。
  • 熟悉监控工具(Prometheus、Grafana、ELK技术栈),用于实时跟踪系统健康状况和检测事件。
  • 具备出色的解决问题能力和分析思维,能够诊断复杂的技术问题并制定预防措施。
  • 具备良好的沟通能力,能够与利益相关者合作,记录技术流程,并有效呈现解决方案。
  • 优先考虑持有认证 Kubernetes管理员(CKA)、AWS解决方案架构师认证或CompTIA Security+证书。
  • 能够在快节奏环境中工作,具备高度的注意力和组织能力。
  • 熟悉CI/CD流水线和基础设施即代码(IaC)实践,用于自动化部署和配置管理。
  • 理解灾难恢复策略和业务连续性规划,以增强基础设施的弹性。
  • 了解容器化技术和微服务架构,用于可扩展的云解决方案。
  • 能够设计和实施满足企业需求的、安全且高性能的基础设施解决方案。
MyJob.one —— 远程工作,真实影响

新内容将持续不断
定期更新

MyJob.one —— 远程工作,真实影响