Mô tả Công việc
Trách nhiệm Chính
- Xác định và thúc đẩy lộ trình độ tin cậy (SLOs, ngân sách lỗi, lập kế hoạch công suất, tối ưu hóa chi phí/hiệu suất).
- Thiết lập các tiêu chuẩn nền tảng cho việc triển khai tiến bộ, hoàn tác an toàn và quản lý thay đổi.
- Mở rộng khả năng quan sát (số liệu/nhật ký/theo dõi bằng OpenTelemetry) và triển khai cảnh báo có thể hành động.
- Giám sát quản lý sự cố (luân phiên trực, phân tích nguyên nhân gốc rễ, hậu kiểm) để đảm bảo cải tiến liên tục.
- Phát triển chính sách quản lý bí mật/khóa (Vault/HSM/KMS) và củng cố cơ sở hạ tầng.
- Chuẩn hóa hoạt động nút/RPC blockchain (thiết lập, nâng cấp, chuyển đổi dự phòng) và tích hợp chúng vào quy trình dịch vụ.
- Tuyển dụng, hướng dẫn và phát triển nhóm trong khi hợp tác với các nhóm backend, cơ sở hạ tầng, bảo mật và sản phẩm.
Yêu cầu Công việc
- 5+ năm kinh nghiệm DevOps/SRE, bao gồm 2+ năm quản lý cơ sở hạ tầng blockchain hoặc quan trọng.
- Kinh nghiệm lãnh đạo quản lý 3-5 kỹ sư.
- Chuyên môn sâu về Kubernetes, khung tự động hóa (Terraform/Helm/Ansible) và đường ống CI/CD.
- Thành tích đã được chứng minh trong việc cung cấp độ tin cậy cấp sản xuất cho các microservices quy mô lớn.
- Kinh nghiệm thực tế với các nút blockchain (Ethereum, Solana, Bitcoin hoặc tương tự).
- Nền tảng vững chắc về khả năng quan sát, ứng phó sự cố và củng cố hệ thống.
- Kỹ năng giao tiếp xuất sắc; Ưu tiên thành thạo tiếng Anh.
Yêu cầu Ưu tiên
- Khả năng cân bằng giữa kỹ thuật thực hành với lãnh đạo nhóm và lập kế hoạch chiến lược.
Phúc lợi
- Nghỉ phép hàng năm
- Kiểm tra sức khỏe
- Thưởng hiệu suất
- Linh hoạt làm việc từ xa


