
СБЕР
2 дн. назад
Senior RL - Engineer (GigaChat Vision)
От 3 до 6 летПолный деньМосква21 апреля 2026 г.
Требования
Глубокое понимание RL для LLM/VLM (RLHF, GRPO, PPO) и практический опыт. Понимание полного цикла обучения VLM/LLM (pretrain → SFT...
Обязанности
Разрабатывать и улучшать RL-подходы для обучения VLM/LLM-моделей: выбор алгоритмов, постановка экспериментов и анализ результатов. Проектировать reward-функции...
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно