Описание вакансии
Основные обязанности
- Определение и реализация плана по обеспечению надежности (SLO, бюджеты ошибок, планирование мощности, оптимизация затрат/производительности).
- Установление стандартов платформы для постепенного внедрения, безопасного отката и управления изменениями.
- Расширение возможностей наблюдаемости (метрики/логи/трейсинг с использованием OpenTelemetry) и внедрение действенных оповещений.
- Контроль управления инцидентами (дежурства, анализ первопричин, постмортемы) для обеспечения постоянного улучшения.
- Разработка политик управления секретами/ключами (Vault/HSM/KMS) и усиления инфраструктуры.
- Стандартизация операций с узлами/RPC блокчейна (настройка, обновления, отказоустойчивость) и их интеграция в рабочие процессы сервисов.
- Набор, наставничество и развитие команды при сотрудничестве с бэкенд-, инфраструктурными, security- и продуктовыми командами.
Требования к кандидату
- 5+ лет опыта в DevOps/SRE, включая 2+ года управления блокчейн- или критически важной инфраструктурой.
- Опыт руководства командой из 3-5 инженеров.
- Глубокие знания Kubernetes, фреймворков автоматизации (Terraform/Helm/Ansible) и CI/CD-процессов.
- Доказанный опыт обеспечения надежности микросервисов в продакшене для крупномасштабных систем.
- Практический опыт работы с узлами блокчейна (Ethereum, Solana, Bitcoin или аналогичными).
- Прочная база в области наблюдаемости, реагирования на инциденты и усиления систем.
- Отличные коммуникативные навыки; предпочтителен высокий уровень владения английским языком.
Желательные квалификации
- Способность сочетать практическую инженерную работу с руководством командой и стратегическим планированием.
Преимущества
- Ежегодный отпуск
- Медицинские осмотры
- Бонусы за производительность
- Гибкие возможности удаленной работы


