
СБЕР
2 дн. назад
Middle DS / GenAI Agent Engineer
От 3 до 6 летПолный деньМосква5 мая 2026 г.
Требования
Высшее техническое образование. Практический опыт в ML/DL/NLP от 2х лет: обучение, дообучение, валидация моделей, анализ ошибок, работа...
Обязанности
Эксперименты с RL-подходами для LLM: GRPO, DPO, reward modeling, preference datasets, self-play/evolutionary data generation, автоматическая оценка траекторий.
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно