Вакансии/Python разработчик/Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL)
МФТИ

МФТИ

Сегодня

Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL)

190 000 – 250 000 ₽

От 1 года до 3 летПолный деньМосква12 мая 2026 г.

Требования

Уверенный Python / PyTorch и опыт обучения моделей. Сильный опыт хотя бы в одной из областей: Умение читать статьи, превращать идеи...

Обязанности

Исследовать и реализовывать методы асинхронного RL и дообучения LLM. Предлагать исследовательские гипотезы, ставить эксперименты и проверять их на задачах рассуждения.

Откликайтесь автоматически

AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.

Начать бесплатно
Исследователь-разработчик в DL/RL (дообучение LLM, RLHF, асинхронный RL) — МФТИ | AFK Offer