About Me
Experience
Operations and Maintenance Engineer
修正药业 - - Now
职位: Operations and Maintenance Engineer | 时间段: Not specified | 工作内容: 1.协同跨部门团队,共同维护华为云线上生产环境与测试环境的稳定运行。2.负责华为云平台服务器和数据库的运维工作,以及机房测试环境服务器和中间件的维护。3.设计并实现了Jenkins+GitLab+Docker+K8s的自动化流水线,以支持项目的持续集成和持续交付。4.监控华为云服务器的使用情况,包括CPU、内存等关键指标,并及时发出告警通知,以确保系统的正常运行。5.与杭州部门紧密合作,共同完成华为云上B2B项目的运维工作。6.负责微服务应用集群的维护工作,包括自建Kubernetes集群和华为云的迁移工作。7.实现日志收集存储的解决方案,使用ELK和Loki进行日志跟踪,以便快速定位和解决问题。
Operations and Maintenance Engineer
红洞科技 - - Now
职位: Operations and Maintenance Engineer | 时间段: Not specified | 工作内容: 1.领导团队从零开始搭建生产环境,成功将原生产环境从阿里云ACK容器平台迁移至金山云容器平台,实现平台平稳过渡和优化。2.负责超过100个Linux服务器的环境配置与维护,监控管理,测试与研发环境的组件安装,确保服务器和业务环境的稳定运行。3.负责金山云上ECS、SLB、WAF、RDS、Harbor仓库管理,阿里云上的CDN、OSS、DNS相关配置,实现资源合理分配和优化。4.负责业务系统环境的日常维护,版本发版管理,故障排除,并配合公司研发和测试团队进行环境准备,确保业务顺利进行。5.负责监控平台Zabbix、Prometheus的建设与优化,完善监控策略,保障服务器运行的稳定性。6.负责线上业务(如NFT数藏平台、NFT如道链浏览器、NFT宽瑜平台等)的运维保障工作,确保业务的稳定运行。7.负责基础系统相关组件的运维工作,如VPN、堡垒机、跳板机等,保障系统安全。8.负责GitLab代码仓库管理,Jenkins持续集成工具,开发Pipeline流水线,以及Jenkins+GitLab+Docker+Kubernetes自动化构建,提高开发效率。9.负责基础组件(如RabbitMQ、Jenkins、ES、Nginx、Redis、MySQL、Nexus等)的维护和优化,提升系统性能和稳定性。
Operations and Maintenance Engineer
慧明软件 - - Now
职位: Operations and Maintenance Engineer | 时间段: Not specified | 工作内容: 1.从0-1构建环境,负责50+linux服务器环境的配置与维护。2.负责日常网络及各子系统管理维护。3.负责监控平台,zabbix、Prometheus的部署搭建。4.负责设计并部署相关应用平台,并提出平台的实施、运行报告。5.负责配合开发搭建测试平台,协助开发设计、推行、实施和持续改进。6.负责相关故障、疑难问题排查处理,编制汇总故障、问题,定期提交汇总报告。7.负责日常系统维护,及监控,提供IT软硬件方面的服务和支持,保证系统的稳定。8.负责配置ITSM流程配置,CMDB资产的管理,统一汇聚监控大屏开发,服务器监控。