
СБЕР
Сегодня
Middle+ AI Engineer (Native Omnimodality & VLA)
до 400 000 ₽
От 3 до 6 летУдаленная работаМосква28 апреля 2026 г.
Требования
Глубокое понимание representation learning и multimodal learning. Опыт с vision, audio и video моделями. Понимание трансформеров, contrastive learning, joint embeddings.
Обязанности
Разработка принципиально новых мультимодальных представлений и кодирования информации (vision, audio, video, text). Создание универсальных энкодеров и shared latent spaces.
Откликайтесь автоматически
AFK Offer автоматически откликается на подходящие вакансии с персонализированными сопроводительными письмами. Попробуйте 24 часа бесплатно.
Начать бесплатно