NLP Engineer (Reinforcement Learning)

От 3 до 6 летПолный деньМосква24 июня 2026 г.

Требования

Опыт в online RL и хорошие теоретические знания. Уверенное владение Python, PyTorch. Знание базовых алгоритмов и математики. Знания в DL...

Обязанности

Улучшать качество работы GigaChat Reasoning на русском и английском языках. Ускорять пайплайн обучения: профилирование узких мест, эффективный сэмплинг.

Откликнуться на hh.ru Автоотклик с ИИ

Откликайтесь автоматически

AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.

Начать бесплатно

Назад к вакансиям «Data Science»