Вакансия - Senior MLOps\AI Platform Engineer,
Вакансия по специальности Senior MLOps\AI Platform Engineer, работа Москва МО, . Зарплата от 250000
Обновленные данные по специальности Senior MLOps\AI Platform Engineer для трудоустройства, адрес г Москва.
Вакансия Senior MLOps\AI Platform Engineer
Свежий список на сегодня 22 апреля 2026 г. Точные данные о вакантных местах можно посмотреть в расширенной части анкеты.
Введите название специальности и выберите город
Расширенная анкета
Регион: Москва МО
Должность: Senior MLOps\AI Platform Engineer
Организация: Зарубежнефть
Заработная плата: от 250000
Трудоустройство
Специальность: Senior MLOps\AI Platform Engineer
Режим работы:
Адрес, контакты работодателя
Регион: Москва МО
Адрес: г Москва
ОГРН: 1067761906805
ИНН: 7718620740
КПП: 997750001
Адрес места работы
Регион: Москва МО
Дополнительная информация: г Москва
Месторасположение работы
Работа в городе: Москва МО
Уточнения по адресу: г Москва
Работа Senior MLOps\AI Platform Engineer
Специальность: Senior MLOps\AI Platform Engineer
Тип занятости:
График работы: Полный рабочий день
Профобласть: Информационные технологии, телекоммуникации, связь
Должностные обязанности
it-компания gnivc - партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга. Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh среди крупных компаний; Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job; У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата; Являемся аккредитованной ИТ-компанией. Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей. Основной фокус — стабильный и эффективный инференс, интеграция моделей в сервисы и развитие платформы ИИ в on-prem / изолированном контуре. задачи: Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.); Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache); Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование); Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование); Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация); Интегрировать модели в корпоративные системы через REST/gRPC; Участвовать в построении RAG-систем (эмбеддинги, поиск, векторные базы данных); Настраивать мониторинг (метрики, логи, трассировки, алерты); Диагностировать и устранять проблемы в промышленной эксплуатации (узкие места, деградации, OOM, проблемы GPU); Оптимизировать использование ресурсов (GPU/CPU/хранилище/сеть); Работать с CI/CD пайплайнами для деплоя моделей и сервисов; Плотно взаимодействовать с командой информационной безопасности; Обеспечивать соблюдение требований и практик информационной безопасности при разработке и эксплуатации систем ИИ; Разрабатывать и поддерживать документацию; Взаимодействовать с командами Data Science, Backend и Platform Engineering. мы от вас ждём: 4+ года опыта в MLOps / DevOps / инфраструктурной разработке; Практический опыт работы с Kubernetes; Опыт работы с GPU (NVIDIA stack, nvidia-smi, CUDA); Опыт запуска и эксплуатации ML/LLM моделей в промышленной эксплуатации; Уверенное владение Python; Понимание принципов работы инференса LLM (токены, контекст, задержки, батчинг); Опыт работы с Linux на уровне диагностики и отладки; Понимание сетевого взаимодействия (HTTP, TLS, прокси, балансировка); Опыт работы с CI/CD; Понимание и соблюдение базовых принципов и «гигиены» информационной безопасности; Умение разбираться в логах и находить первопричины проблем. Будем плюсом: Опыт с vLLM / GPUStack / Triton / TensorRT-LLM; Опыт работы с LiteLLM или аналогичными прокси/шлюзами; Опыт построения RAG-систем (векторные БД, эмбеддинги); Опыт работы с Milvus / Qdrant / pgvector; Опыт оптимизации инференса (квантизация, параллелизм, шардинг); Опыт работы с высоконагруженными системами; Опыт работы в изолированных (air-gapped) средах; Опыт настройки Prometheus / Grafana для ML-сервисов; Понимание требований регуляторов (152-ФЗ, ГОСТ). Стек: Инфраструктура: Kubernetes, Docker, Helm; Инференс: vLLM, llama.cpp, Triton, HuggingFace; API / шлюзы: OpenAI-совместимый API, LiteLLM, Envoy / Nginx RAG / данные: векторные БД (Milvus, Qdrant, pgvector), Kafka, S3/MinIO; Мониторинг: Prometheus, Grafana, ELK; CI/CD: GitLab CI/CD, Jenkins, ArgoCD; Инфраструктура как код: Terraform, Ansible; Языки: Python (обязательно), Bash, SQL. мы предлагаем: Возможность работы в офисе, по гибридному графику или полностью дистанционно на территории РФ; Рабочий график: пятидневная рабочая неделя (Пн. – Чт. с 09:00 до 18:00, Пт. с 09:00 до 16:45); Достойное вознаграждение: конкурентная заработная плата по результатам собеседования, а также премии за эффективную работу и достигнутые результаты; Официальное трудоустройство: полное соблюдение требований ТК РФ, включая оплачиваемые отпуска (с дополнительной выплатой 50% от оклада после 11 месяцев работы в Компании) и выплату заработной платы дважды в месяц; Заботу о здоровье: Компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню. Добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию. Возмещение до 50% затрат на занятия спортом. Развитие и обучение: Профессиональное обучение и сертификация за счет компании. Организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов. Партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox. Доступ к корпоративной библиотеке на платформе Alpina Digital. Дополнительные выходные: возможность взять 5 дополнительных оплачиваемых выходных (ресурсных) дней в течение календарного года (с 1 января до 31 декабря) для сотрудников, проработавших в компании более 11 месяцев.
Требования к кандидату
Образование: Не указано
Дополнительная информация
Размещение: 2026-04-21
Источник: Вакансия интернет ресурса
Город
Показать QR-код этой страницы с вакансией
Запомните страницу с вакантными местами на своем мобильном телефоне