Вакансии/Python разработчик/Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL)

МФТИ
Сегодня
Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL)
190 000 – 250 000 ₽
От 1 года до 3 летПолный деньМосква12 мая 2026 г.
Требования
Уверенный Python / PyTorch и опыт обучения моделей. Сильный опыт хотя бы в одной из областей: Умение читать статьи, превращать идеи...
Обязанности
Исследовать и реализовывать методы асинхронного RL и дообучения LLM. Предлагать исследовательские гипотезы, ставить эксперименты и проверять их на задачах рассуждения.
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно