虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

智元启元大模型GO-1发布:ViLLA架构开启具身智能新篇章

2025-03-10来源:ITBEAR编辑:瑞雪

近日,智元机器人在其官方渠道宣布了一项重大突破,正式推出了业界首个通用具身基座模型——智元启元大模型(Genie Operator-1),这一创新成果标志着智元在人工智能领域的又一里程碑。

智元启元大模型的核心在于其独创的Vision-Language-Latent-Action(ViLLA)架构,这一架构的提出,为具身智能的发展开辟了新的路径。ViLLA架构由两大核心组件构成:多模态大模型VLM与混合专家系统MoE。

VLM组件通过深度挖掘海量互联网图文数据,赋予了智元启元大模型卓越的通用场景感知和语言理解能力。它能够准确识别并理解图像中的信息,同时与文本数据进行高效融合,实现了对复杂场景的全面理解。

而MoE系统则进一步增强了智元启元大模型的动作理解与执行能力。其中,Latent Planner(隐式规划器)通过分析大量跨本体和人类操作视频数据,掌握了通用的动作规划逻辑。与此同时,Action Expert(动作专家)则依托百万级真机数据训练,具备了精细且高效的动作执行能力。

ViLLA架构中的这三大组件相互协同,形成了一个高效且智能的系统。它不仅能够从人类视频中学习并快速泛化到小样本场景,还显著降低了具身智能的应用门槛。这一创新成果已经成功应用于智元的多款机器人本体上,展现了强大的实际应用潜力。

Newline亮相2025数字中国智慧视听峰会,三大硬核驱动未来!
作为全球显示行业的年度盛会,DIC EXPO 2025国际(上海)显示技术及应用创新展于8月6-9日在上海新国际博览中心隆重举行。鸿合Newline受邀出席“2025数字中国智慧视听产业发展峰会”分论坛,Newline CMO李宇鹏发表了题

2025-08-12

深度剖析!格力两项核心技术获国际领先鉴定,全球领先突破50项!
在珠海格力电器的实验室里,一台转缸容积式制冷剂泵正以稳定的频率运转。它的外壳并不起眼,但内部的机械结构却藏着行业的重大突破——这项被鉴定为“国际首创”的技术,将数据中心空调的效率提升了1至5倍,让北京的

2025-08-12