Senior RL - Engineer (GigaChat Vision)

От 3 до 6 летПолный деньМосква15 мая 2026 г.

Требования

Глубокое понимание RL для LLM/VLM (RLHF, GRPO, PPO) и практический опыт. Понимание полного цикла обучения VLM/LLM (pretrain → SFT...

Обязанности

Разрабатывать и улучшать RL-подходы для обучения VLM/LLM-моделей: выбор алгоритмов, постановка экспериментов и анализ результатов. Проектировать reward-функции...

Откликнуться на hh.ru Автоотклик с ИИ

Откликайтесь автоматически

AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.

Начать бесплатно

Назад к вакансиям «Data Science»