
СберЗдоровье
3 нед. назад
Data Scientist (NLP|LLM)
От 1 года до 3 летУдаленная работаМосква31 марта 2026 г.
Требования
рекомендации, понимание доменных рисков. Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation. Практика продакшн-инференса: vLLM, оптимизация стоимости...
Обязанности
Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO...
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно