
СБЕР
Сегодня
NLP Engineer (Reinforcement Learning)
От 3 до 6 летПолный деньМосква24 июня 2026 г.
Требования
Опыт в online RL и хорошие теоретические знания. Уверенное владение Python, PyTorch. Знание базовых алгоритмов и математики. Знания в DL...
Обязанности
Улучшать качество работы GigaChat Reasoning на русском и английском языках. Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг.
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно