Описание вакансии
Инженер по AI-инфраструктуре В качестве инженера по AI-инфраструктуре вы будете играть ключевую роль в разработке и поддержке основной инфраструктуры, которая обеспечивает работу наших AI-систем. Ваша работа напрямую повлияет на стабильность, масштабируемость и эффективность наших AI-сервисов.
Ключевые обязанности
- Постоянная разработка и модернизация основных сервисов архитектурной команды (API-шлюзы, сервис регистрации/обнаружения, балансировка нагрузки) для обеспечения стабильности и масштабируемости системы
- Оптимизация инженерии AI-инфраструктуры: снижение задержек вызовов AI, улучшение пользовательского опыта; снижение затрат через кэширование, стратегии маршрутизации, выбор моделей; обеспечение стабильности AI-инфраструктуры
- Разработка DevOps-решений, адаптированных для AI-команд, для повышения эффективности поставки
- Создание систем оценки и мониторинга AI-возможностей для отслеживания затрат, эффективности и производительности вызовов моделей
- Построение и внедрение общефирменной технической AI-инфраструктуры, включая общие инструменты разработки, библиотеки кода и промежуточное ПО для повышения эффективности НИОКР
- Продвижение внедрения AI для повышения эффективности НИОКР (генерация кода, интеллектуальное тестирование, умные операции, диагностика неисправностей и т.д.)
- Установление технических стандартов и спецификаций (включая руководства по AI-инженерии) для продвижения технической реализации и обеспечения качества кода/производительности системы
- Повышение эффективности НИОКР за счет оптимизации процессов разработки и продвижения оптимизации технических затрат/использования ресурсов
- Решение технических проблем, устранение узких мест системы и предоставление инновационных решений
- Демонстрация сильных коммуникативных навыков и командной работы для продвижения межкомандной реализации технических требований
- Наставничество членов команды для технического роста и организация сессий обмена знаниями
Требования к кандидату
- Образование: степень бакалавра или выше в области компьютерных наук или смежной области
- Опыт: 5+ лет опыта backend-разработки
- Языки программирования: владение хотя бы одним из Go, Java или C++
- Инструменты: навыки работы с одним или несколькими инструментами программирования, такими как Cursor/Claude Code/Codex
- Облачные сервисы:
- Глубокое понимание хотя бы одного крупного облачного провайдера (Alibaba Cloud/AWS/Google Cloud)
- Знакомство с интеграцией облачных AI-сервисов (например, Alibaba Cloud Bailian/Open Router)
- Опыт проектирования, развертывания и эксплуатации облачных архитектур
- Инженерные способности:
- Практический опыт проектирования распределенных систем и систем с высокой нагрузкой
- Знакомство с промежуточным ПО, таким как очереди сообщений (Kafka/RocketMQ), кэширование (Redis), векторные базы данных (Milvus/Pinecone)
- Высокие стандарты кодирования и возможности проектирования систем
- Опыт работы с LLM:
- Знание основных парадигм применения LLM (Prompt, RAG, Agent, Function Calling, Memory)
- Практический опыт реализации систем RAG или приложений Agent
- Предпочтительные квалификации:
- Опыт тонкой настройки моделей (LoRA, QLoRA) или развертывания моделей
- Знание Web3/блокчейна, опыт работы с финансовыми/торговыми системами
- Вклад или техническое влияние в AI-сообществах с открытым исходным кодом
Преимущества
Для получения информации о преимуществах, пожалуйста, свяжитесь с нашим HR напрямую через Telegram!