Главная
Москва МО
Senior MLOps\AI Platform Engineer

Вакансия - Senior MLOps\AI Platform Engineer,

Вакансия по специальности Senior MLOps\AI Platform Engineer, работа Москва МО, . Зарплата от 250000

Обновленные данные по специальности Senior MLOps\AI Platform Engineer для трудоустройства, адрес г Москва.

Вакансия Senior MLOps\AI Platform Engineer

Свежий список на сегодня 22 апреля 2026 г. Точные данные о вакантных местах можно посмотреть в расширенной части анкеты.

Введите название специальности и выберите город

Соискателю

Резюме

Вы можете послать резюме по факсу . Послать резюме на почту

Вакансия - Senior MLOps\AI Platform Engineer

Контакты
Трудоустройство
г Москва

Расширенная анкета

Регион: Москва МО

Должность: Senior MLOps\AI Platform Engineer

Организация: Зарубежнефть

Заработная плата: от 250000

Трудоустройство

Специальность: Senior MLOps\AI Platform Engineer

Режим работы:

Адрес, контакты работодателя

Регион: Москва МО

Адрес: г Москва

ОГРН: 1067761906805

ИНН: 7718620740

КПП: 997750001

Адрес места работы

Регион: Москва МО

Дополнительная информация: г Москва

Месторасположение работы

Работа в городе: Москва МО

Уточнения по адресу: г Москва

Работа Senior MLOps\AI Platform Engineer

Специальность: Senior MLOps\AI Platform Engineer

Тип занятости:

График работы: Полный рабочий день

Профобласть: Информационные технологии, телекоммуникации, связь

Должностные обязанности

it-компания gnivc - партнер государственных компаний и лидеров российского бизнеса, разработчик и системный интегратор крупнейших государственных информационных систем, а также коммерческих решений для налогового мониторинга. Компания входит в ТОП-100 лучших работодателей страны и на 9-м месте в категории «IT-компании» 2025 года по рейтингу работодателей hh среди крупных компаний; Мы в 25% лучших по уровню счастья среди компаний отрасли IT и России 2025 по версии Happy Job; У нас есть ИИ-песочница - среда для экспериментов и реальных проектов на современных опенсорс-больших языковых моделях. Здесь можно применять ИИ для оптимизации своей работы, автоматизации процессов и реализации собственных идей от гипотезы до результата; Являемся аккредитованной ИТ-компанией. Ищем инженера с практическим опытом, который будет заниматься разработкой и эксплуатацией платформы инференса LLM в промышленной эксплуатации. Роль предполагает активную работу с инфраструктурой, GPU-нагрузкой, API-слоем и оптимизацией производительности моделей. Основной фокус — стабильный и эффективный инференс, интеграция моделей в сервисы и развитие платформы ИИ в on-prem / изолированном контуре. задачи: Разворачивать и поддерживать сервисы инференса моделей (vLLM, llama.cpp, Triton и др.); Настраивать и оптимизировать инференс LLM (пропускная способность, задержки, батчинг, KV-cache); Работать с GPU-инфраструктурой (распределение, загрузка, диагностика, профилирование); Разворачивать и сопровождать сервисы ИИ в Kubernetes (Helm, Stateful workloads, автомасштабирование); Строить API-слой для моделей (OpenAI-совместимый API, потоковые ответы, маршрутизация); Интегрировать модели в корпоративные системы через REST/gRPC; Участвовать в построении RAG-систем (эмбеддинги, поиск, векторные базы данных); Настраивать мониторинг (метрики, логи, трассировки, алерты); Диагностировать и устранять проблемы в промышленной эксплуатации (узкие места, деградации, OOM, проблемы GPU); Оптимизировать использование ресурсов (GPU/CPU/хранилище/сеть); Работать с CI/CD пайплайнами для деплоя моделей и сервисов; Плотно взаимодействовать с командой информационной безопасности; Обеспечивать соблюдение требований и практик информационной безопасности при разработке и эксплуатации систем ИИ; Разрабатывать и поддерживать документацию; Взаимодействовать с командами Data Science, Backend и Platform Engineering. мы от вас ждём: 4+ года опыта в MLOps / DevOps / инфраструктурной разработке; Практический опыт работы с Kubernetes; Опыт работы с GPU (NVIDIA stack, nvidia-smi, CUDA); Опыт запуска и эксплуатации ML/LLM моделей в промышленной эксплуатации; Уверенное владение Python; Понимание принципов работы инференса LLM (токены, контекст, задержки, батчинг); Опыт работы с Linux на уровне диагностики и отладки; Понимание сетевого взаимодействия (HTTP, TLS, прокси, балансировка); Опыт работы с CI/CD; Понимание и соблюдение базовых принципов и «гигиены» информационной безопасности; Умение разбираться в логах и находить первопричины проблем. Будем плюсом: Опыт с vLLM / GPUStack / Triton / TensorRT-LLM; Опыт работы с LiteLLM или аналогичными прокси/шлюзами; Опыт построения RAG-систем (векторные БД, эмбеддинги); Опыт работы с Milvus / Qdrant / pgvector; Опыт оптимизации инференса (квантизация, параллелизм, шардинг); Опыт работы с высоконагруженными системами; Опыт работы в изолированных (air-gapped) средах; Опыт настройки Prometheus / Grafana для ML-сервисов; Понимание требований регуляторов (152-ФЗ, ГОСТ). Стек: Инфраструктура: Kubernetes, Docker, Helm; Инференс: vLLM, llama.cpp, Triton, HuggingFace; API / шлюзы: OpenAI-совместимый API, LiteLLM, Envoy / Nginx RAG / данные: векторные БД (Milvus, Qdrant, pgvector), Kafka, S3/MinIO; Мониторинг: Prometheus, Grafana, ELK; CI/CD: GitLab CI/CD, Jenkins, ArgoCD; Инфраструктура как код: Terraform, Ansible; Языки: Python (обязательно), Bash, SQL. мы предлагаем: Возможность работы в офисе, по гибридному графику или полностью дистанционно на территории РФ; Рабочий график: пятидневная рабочая неделя (Пн. – Чт. с 09:00 до 18:00, Пт. с 09:00 до 16:45); Достойное вознаграждение: конкурентная заработная плата по результатам собеседования, а также премии за эффективную работу и достигнутые результаты; Официальное трудоустройство: полное соблюдение требований ТК РФ, включая оплачиваемые отпуска (с дополнительной выплатой 50% от оклада после 11 месяцев работы в Компании) и выплату заработной платы дважды в месяц; Заботу о здоровье: Компенсация больничного листа продолжительностью до 7 дней с сохранением полной оплаты, эквивалентной рабочему дню. Добровольное медицинское страхование (ДМС) по окончании испытательного срока, с широким перечнем ведущих медицинских учреждений, включая качественную стоматологию. Возмещение до 50% затрат на занятия спортом. Развитие и обучение: Профессиональное обучение и сертификация за счет компании. Организация внутренних и внешних митапов, хакатонов, конференций, семинаров и тренингов. Партнерские программы по изучению иностранных языков и развитию профессиональных навыков от Skyeng и Skillbox. Доступ к корпоративной библиотеке на платформе Alpina Digital. Дополнительные выходные: возможность взять 5 дополнительных оплачиваемых выходных (ресурсных) дней в течение календарного года (с 1 января до 31 декабря) для сотрудников, проработавших в компании более 11 месяцев.

Требования к кандидату

Образование: Не указано

Дополнительная информация

Размещение: 2026-04-21

Источник: Вакансия интернет ресурса

Работа Senior MLOps\AI Platform Engineer

Каталог на сегодня. Источник вакансий сайт trudvsem.ru.

Город

Показать QR-код этой страницы с вакансией

Запомните страницу с вакантными местами на своем мобильном телефоне

Главная
Москва МО
Senior MLOps\AI Platform Engineer