Tin tức Cổng Gate News, ngày 10 tháng 4, Tencent Hunyuan đã phát hành loạt mô hình nền tảng trí tuệ thể hiện HY-Embodied-0.5; phiên bản tham số 2B đã chính thức được mở mã nguồn. Loạt mô hình này được thiết kế cho các tác nhân trí tuệ thể hiện trong thế giới thực, tập trung nâng cao năng lực cảm nhận theo không gian-thời gian và suy luận của trí tuệ thể hiện, có thể ứng dụng vào các kịch bản như dự đoán môi trường, thực thi tương tác và lập kế hoạch nhiệm vụ.
Họ mô hình này bao gồm hai phiên bản 2B và 32B: mô hình 2B hướng đến các thiết bị biên và triển khai nhẹ, trong khi mô hình 32B dùng cho các tác vụ suy luận phức tạp và quyết định thông minh cấp cao. Về kiến trúc công nghệ, HY-Embodied-0.5 giới thiệu cơ chế Mixture-of-Transformers (MoT) để thực hiện tính toán phân công cho đa phương thức, thông qua các token tiềm ẩn để nâng cao năng lực biểu diễn cảm nhận; kết hợp huấn luyện tự tiến hóa và phương pháp chưng cất dựa trên chiến lược, đạt tối ưu hóa phối hợp năng lực giữa mô hình nhỏ và mô hình lớn.
Về hiệu năng, loạt mô hình này thể hiện nổi bật trong 22 bài kiểm tra chuẩn; mô hình 2B vượt qua các mô hình SOTA cùng quy mô ở 16 tác vụ, phiên bản 32B đã tiến gần đến trình độ tiên phong, thể hiện năng lực tổng quát hóa trí tuệ thể hiện mạnh mẽ và tiềm năng ứng dụng thực tế.