首页 >> 车评 >

智元发布全国首个通用具身基座模型ViLLA，开启具身智能新纪元

2025-03-10 16:36:21 来源：网易用户：江群初

智元发布全国首个通用具身基座模型ViLLA

2025年3月10日，国内人工智能领军企业智元科技在北京国家会议中心正式发布“智元启元大模型（Genie Operator-1）”，这是我国首个面向复杂物理世界的通用具身智能基座模型，标志着中国在通用人工智能领域取得重大技术跃迁。

该模型突破性地提出“Vision-Language-Latent-Action（ViLLA）”融合架构，实现多模态深度融合。ViLLA架构由多模态大模型（VLM）与混合专家模型（MoE）组成，其中VLM借助海量互联网图文数据获得通用场景感知和语言理解能力，MoE中的Latent Planner（隐式规划器）和Action Expert（动作专家）则分别获得通用的动作理解和精细的动作执行能力。这一架构成功弥合了视觉、语言与动作之间的鸿沟，增强了策略的泛化能力。

在测试中，该模型展现出跨场景任务迁移能力，面对复杂指令时能自主规划路径、识别物品类别并完成精准抓取摆放，全程无需人工干预。基于该基座开发的具身智能终端已进入规模化测试阶段，在工业质检、智能家居、医疗护理等领域展现出广泛应用前景。

智元科技还联合清华大学、中科院自动化所等机构成立“具身智能联合实验室”，计划年内开放百万级参数级的开源训练框架，以加速具身智能技术的普及和应用。

此次智元科技的突破或将加速我国在通用人工智能赛道上的国际竞争力，推动机器人从依赖特定任务的工具向具备通用智能的自主体发展，在商业、工业、家庭等多领域发挥更大的作用，开启具身智能新纪元。

　　免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！