职位描述
我们正在寻找一位技术娴熟的专业人士,负责设计、实施并管理全面的监控解决方案,以确保我们基础设施和应用的高可用性与性能表现。理想的候选人将与跨职能团队协作,将监控工具集成至CI/CD流程中,并主导事件响应工作。
核心职责
- 设计、实施并管理全面的监控解决方案,确保基础设施和应用的高可用性与性能表现
- 开发维护健全的记录与告警机制,主动识别并消除潜在问题
- 与基础设施团队协作,将监控方案集成至CI/CD流程,保障无缝部署与运行
- 执行性能分析、容量规划及扩展性测试,确保系统满足当前与未来需求
- 主导事件响应与故障排查工作,利用监控数据快速解决运营问题
任职要求
- 具备为复杂基础设施和应用设计实施监控解决方案的实战经验
- 深入理解CI/CD流程,并有监控工具集成经验
- 出色的问题解决能力及性能指标分析能力
- 具有基于监控数据开展事件响应和故障排查的经验
- 能够高效协同基础设施与开发团队开展工作
- 掌握容量规划及扩展性测试方法论