- Точка:
(x, y)или[(x1, y1), (x2, y2)] - Коробка:
[xmin, ymin, xmax, ymax] - Координаты нормализованы до целочисленного диапазона
(0, 1000). - В режиме
thinking modeответы структурированы как<think>[reasoning]</think><answer>[answer]</answer>.
Для тонкой настройки (SFT) и других режимов инференса (пакетный инференс, мульти-изображения/видео входы, API HyEmbodiedPipeline, CLI), а также для спецификации формата данных и полного набора данных для обучения, необходимо обратиться к официальному репозиторию GitHub: https://github.com/Tencent-Hunyuan/HY-Embodied-0.5-X.
Что это значит
Выпуск hy-embodied-0-5-x представляет собой попытку сделать робототехнику более автономной и адаптивной. Возможность модели точно понимать, рассуждать и действовать в реальном мире, при этом оставаясь достаточно компактной для развертывания на периферийных устройствах, открывает пути для новых применений в автоматизации домашних задач, логистике и интерактивных системах. Инженеры могут использовать эту модель для создания роботов, которые не просто реагируют на команды, но и обладают собственным пониманием задачи и способностью к долгосрочному планированию, что приближает нас к воплощенному AI в повседневной жизни.