Mô Tả Công Việc
Trách Nhiệm Chính
- Xác định và thúc đẩy lộ trình độ tin cậy bao gồm SLO, ngân sách lỗi, lập kế hoạch công suất và tối ưu hóa chi phí/hiệu suất
- Thiết lập tiêu chuẩn nền tảng cho việc triển khai từng bước, hoàn nguyên an toàn và quản lý thay đổi
- Tăng cường khả năng quan sát thông qua OpenTelemetry (số liệu/nhật ký/theo dõi) và triển khai hệ thống cảnh báo có thể hành động
- Giám sát chương trình quản lý sự cố bao gồm ca trực, phân tích nguyên nhân gốc rễ và họp rút kinh nghiệm để đảm bảo cải tiến liên tục
- Phát triển chính sách quản lý bí mật và khóa (Vault/HSM/KMS) và củng cố cơ sở hạ tầng
- Chuẩn hóa hoạt động node/RPC blockchain (thiết lập, nâng cấp, chuyển đổi dự phòng) và tích hợp chúng vào quy trình dịch vụ
- Dẫn dắt tuyển dụng, cố vấn và phát triển đội ngũ trong khi hợp tác với các nhóm backend, cơ sở hạ tầng, bảo mật và sản phẩm
Yêu Cầu Công Việc
- 5+ năm kinh nghiệm DevOps/SRE bao gồm 2+ năm vận hành blockchain hoặc cơ sở hạ tầng quan trọng
- Chuyên môn sâu về Kubernetes, khung tự động hóa (Terraform/Helm/Ansible) và đường ống CI/CD
- Thành tích đã được chứng minh trong việc cung cấp độ tin cậy cấp sản xuất cho các dịch vụ vi mô quy mô lớn
- Kinh nghiệm thực tế với hoạt động node blockchain (Ethereum, Solana, Bitcoin hoặc tương tự)
- Nền tảng vững chắc về khả năng quan sát, ứng phó sự cố và củng cố hệ thống
- Kỹ năng giao tiếp xuất sắc; Ưu tiên thành thạo tiếng Anh
Phúc Lợi
- Hoạt động xây dựng đội nhóm
- Kiểm tra sức khỏe toàn diện
- Thưởng cuối năm
- Cơ hội phát triển chuyên môn
- Sắp xếp công việc linh hoạt


