내 소개
경력
核心负责人 / 架构设计 / 后端研发 / 数据链路建设
未知公司 - - 지금
职位: 核心负责人 / 架构设计 / 后端研发 / 数据链路建设 | 时间段: 2023.01 – 2024.12 | 工作内容: 负责企业级AIOps智能运维平台的架构设计和后端研发,包括统一数据模型设计、实时数据接入链路建设、告警事件中心设计、异常检测模块构建、根因分析模块构建、自动化处置模块构建以及RAG运维助手的引入。项目成果包括日均告警量降低50%,重复告警压缩率达到50%,Top-K根因推荐命中率达到60%,核心故障定位效率提升80%,高频故障自动化处置覆盖多个场景,自动化闭环成功率60%。
技术负责人 / 可观测性平台研发
未知公司 - - 지금
职位: 技术负责人 / 可观测性平台研发 | 时间段: 2022.03 – 2023.06 | 工作内容: 负责云原生可观测性平台的建设,包括基于Prometheus Operator建设多集群监控体系、引入OpenTelemetry SDK/Collector、建设日志采集链路、设计Grafana标准化看板、建设SLI/SLO模板、设计告警规范以及开发监控配置自动生成工具。项目成果包括核心服务可观测覆盖率提升至99%,研发平均排障路径优化为统一入口,问题定位耗时降低50%,SLO覆盖多个核心服务,告警有效率提升50%。
后端研发 / 算法工程化 / 告警平台负责人
未知公司 - - 지금
职位: 后端研发 / 算法工程化 / 告警平台负责人 | 时间段: 2021.08 – 2022.12 | 工作内容: 负责智能告警降噪与根因分析系统的后端研发和算法工程化,包括设计告警指纹算法、建设告警风暴识别能力、接入CMDB和服务拓扑、设计根因评分模型、建设告警质量评估体系以及为高频故障配置自动化诊断流程。项目成果包括重复告警压缩率达到50%,告警风暴场景下首条有效告警识别时间缩短50%,根因推荐Top-3命中率达到60%,值班人员夜间无效唤醒次数下降80%。


