Новость
MolmoMotion: Прогнозирование 3D-движения с языковым управлением
Команда исследователей представила модель MolmoMotion, способную прогнозировать трёхмерное движение объектов на основе текстовых инструкций. Система объединяет возможности компьютерного зрения и языковых моделей для понимания сценариев и предсказания траекторий в динамической среде. Это открывает новые возможности для робототехники и автономных систем, требующих семантического понимания движения.