Вакансия - LLM Platform Engineer (ML Engineer),
Вакансия по специальности LLM Platform Engineer (ML Engineer), работа Москва МО, . Зарплата от 0
Обновленные данные по специальности LLM Platform Engineer (ML Engineer) для трудоустройства, адрес г Москва.
Вакансия LLM Platform Engineer (ML Engineer)
Свежий список на сегодня 04 мая 2026 г. Точные данные о вакантных местах можно посмотреть в расширенной части анкеты.
Введите название специальности и выберите город
Расширенная анкета
Регион: Москва МО
Должность: LLM Platform Engineer (ML Engineer)
Организация: СБЕР
Заработная плата: от 0
Трудоустройство
Специальность: LLM Platform Engineer (ML Engineer)
Режим работы:
Адрес, контакты работодателя
Регион: Москва МО
Адрес: г Москва
ОГРН: 1067761906805
ИНН: 7718620740
КПП: 997750001
Адрес места работы
Регион: Москва МО
Дополнительная информация: г Москва
Месторасположение работы
Работа в городе: Москва МО
Уточнения по адресу: г Москва
Работа LLM Platform Engineer (ML Engineer)
Специальность: LLM Platform Engineer (ML Engineer)
Тип занятости:
График работы: Полный рабочий день
Профобласть: Информационные технологии, телекоммуникации, связь
Должностные обязанности
Наша задача - создать систему (ASC AI Fabrique), которая создает ИИ-агентов для оптимизации различных бизнес-процессов клиентских менеджеров. Система представляет собой рой специализированных ИИ-агентов, задача которых - выполнять полный SDLC (жизненный цикл разработки программного обеспечения) для создания других ИИ-агентов. ASC AI Fabrique — это мета-генеративная фабрика цифровых сотрудников (ИИ-агентов), построенная на парадигме Agentic Swarm Coding. Система способна автономно проектировать, кодировать, тестировать и разворачивать ИИ-агентов по текстовому бизнес-описанию. Первый этап отбора на эту вакансию – общение с AI-рекрутером. После отклика вам на почту и в чат на платформе HeadHunter придет приглашение пройти первичное интервью с ГигаРекрутером в Telegram. Диалог займёт примерно 10 минут. Его задача — уточнить недостающие детали и ускорить рассмотрение вашей кандидатуры. ГигаРекрутер только начинает свой путь, поэтому просим относиться с пониманием. Ваш опыт и участие помогут сделать его удобным и полезным! Обязанности развертывание и оптимизация LLM моделей на multi-GPU установках с tensor/pipeline/data parallelism организация MLOps-процессов и системная оценка качества моделей обеспечение production latency 2s и uptime 95% для инфраструктуры inference профилирование и оптимизация использования VRAM (CUDA OOM prevention) мониторинг GPU-производительности. Требования Python (asyncio, multiprocessing, typing) Advanced уровня Bash/Shell scripting Advanced уровня для автоматизации развертывания практический опыт с vLLM, TensorRT-LLM, TGI для serving моделей опыт работы с квантизацией (AWQ, GPTQ, GGUF) для снижения требований к VRAM знание оптимизаций Flash Attention и Paged Attention навыки работы с PyTorch, JAX, ONNX для универсального развертывания опыт отладки GPU memory и понимание CUDA (Intermediate C++/CUDA). Условия комфортный современный офис рядом с м. Кутузовская гибридный формат работы ежегодный пересмотр зарплаты и годовая премия корпоративный спортзал и зоны отдыха гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ более 400 образовательных программ СберУниверситета для профессионального и карьерного развития программа адаптации и помощь руководителя на старте расширенный ДМС, льготное страхование для семьи и корпоративная пенсионная программа бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров.
Требования к кандидату
Образование: Не указано
Дополнительная информация
Размещение: 2026-03-20
Источник: Вакансия интернет ресурса
Город
Показать QR-код этой страницы с вакансией
Запомните страницу с вакантными местами на своем мобильном телефоне