职位描述
我们正在寻找一位技术精湛的高级DevOps工程师加入团队。理想的候选人将负责确保我们的点对点(p2p)节点和传统应用程序零停机稳定运行。您需要与开发人员紧密合作排查问题、加固系统安全,并构建强大的监控解决方案。
核心职责
- 确保p2p节点和传统应用程序以零停机状态持续稳定运行
- 与开发团队共同排查所有偏离"零停机"标准的问题,包括但不限于调试工作
- 与外部社区成员及合作伙伴沟通,协助解决其技术问题,并作为节点参与Allora生态系统
- 防护系统免受常见Web2漏洞攻击(如DDoS)
- 建立监控与告警系统以预防潜在问题
- 与开发团队共同参与值班待命
- 主动识别自动化需求并实施自动化方案
- 协助承担部分软件开发职责(主要使用Golang,部分Python和Shell脚本)
必备技能
- 深厚的DevOps实践经验和原则理解
- 精通Golang、Python和Shell脚本编程
- 具有监控与告警系统实施经验
- 掌握安全防护最佳实践和漏洞预防知识
- 出色的故障排查与调试能力
- 具备与开发人员及外部合作伙伴的协同工作能力
- 有P2P网络和分布式系统经验者优先
附加信息
本职位需参与轮值待命,并要求能够主动识别自动化改进机会。理想的候选人应具备自我驱动精神、强大的问题解决能力,以及对维护高可用性系统的热忱。