職務内容
主な責任
- SLO(サービスレベル目標)、エラーバジェット、キャパシティプランニング、コスト/パフォーマンス最適化を含む信頼性ロードマップの定義と推進
- プログレッシブデリバリー、安全なロールバック、変更管理のためのプラットフォーム標準の確立
- OpenTelemetry(メトリクス/ログ/トレーシング)による可観測性の向上と、実践可能なアラートシステムの実装
- オンコールローテーション、根本原因分析、事後検証を含むインシデント管理プログラムの監督と継続的改善の確保
- シークレットおよびキー管理(Vault/HSM/KMS)とインフラストラクチャ強化のためのポリシー開発
- ブロックチェーンノード/RPC操作(セットアップ、アップグレード、フェイルオーバー)の標準化とサービスワークフローへの統合
- バックエンド、インフラストラクチャ、セキュリティ、製品チームと協力しながら、チームの採用、メンタリング、育成を主導
求めるスキル
- 5年以上のDevOps/SRE経験(うち2年以上はブロックチェーンまたはミッションクリティカルなインフラ運用経験)
- Kubernetes、自動化フレームワーク(Terraform/Helm/Ansible)、CI/CDパイプラインに関する深い専門知識
- 大規模マイクロサービスの本番環境レベルの信頼性を提供した実績
- ブロックチェーンノード操作(Ethereum、Solana、Bitcoinなど)の実務経験
- 可観測性、インシデント対応、システム強化に関する強固な基礎知識
- 優れたコミュニケーションスキル(英語力があることが望ましい)
福利厚生
- チームビルディング活動
- 総合健康診断
- 年末ボーナス
- 専門能力開発機会
- 柔軟な勤務体制


