虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

VLA模型:具身智能的突破与挑战

2025-06-03来源:ITBEAR编辑:瑞雪

在具身智能领域,视觉-语言-动作模型(VLA)作为一种新兴范式,正逐渐崭露头角。该模型通过整合视觉信息、语言指令和行动决策,显著提升了机器人对复杂环境的理解和适应能力,为机器人从单一任务执行向多样化场景自主决策的转变提供了强大支持。VLA因此成为学术界和工业界的研究热点。

近期,雷峰网与AI科技评论GAIR Live品牌联合举办了一场线上圆桌沙龙,主题为“具身智能之VLA的实践与突破”。此次沙龙由北京大学计算机学院助理教授仉尚航主持,并邀请了清华大学交叉信息院的助理教授高阳、赵行,以及北京大学人工智能研究院的助理教授杨耀东,共同探讨VLA的最新进展和未来方向。

沙龙上,仉尚航首先引导讨论了VLA的定义、起源及其与其他相关模型的区别。随后,各位嘉宾深入分析了VLA的技术路线和新成果,探讨了不同技术路线的优缺点,并围绕机器人常见任务,剖析了核心技术瓶颈和主流输出范式。还讨论了强化学习与VLA的结合、泛化能力的提升、异构数据的利用以及协同训练等议题。

高阳指出,推理与数据是当前VLA面临的两大核心挑战。尽管已有不少研究探索了VLA与推理的结合路径,但尚未找到最优方案。同时,VLA的数据量级远不及训练大语言模型(VLM)的数据,且多样性严重不足,这限制了模型的能力提升。赵行表示,VLA在实际应用中的系统运行频率单一化问题,以及高低频自适应闭环系统的设计,仍是未解决的课题。杨耀东则提到,当前VLA训练存在割裂问题,大脑(VLM)和小脑(底层策略模型)多分开训练,缺乏端到端训练及类似人类大小脑的双向交互。

在讨论VLA的前世今生时,高阳回顾了VLA的起源和发展,指出其源于大模型的技术变革。杨耀东则从大模型视角和行为动作决策控制视角阐述了VLA的重要性。赵行则分享了GPT-4发布对其研究方向的启发,以及VLA在解决长尾问题上的潜力。

对于VLA的技术路线和最新进展,高阳提到了架构与数据两方面的进展,并强调了数据多样性的重要性。杨耀东从模型架构角度分类了VLA,并探讨了行为动作空间的表征方式。赵行则关注双系统设计,并介绍了不同团队在VLA方面的研究成果。

在探讨VLA的核心技术瓶颈时,高阳强调推理和数据的挑战,赵行提到高低频自适应闭环系统的设计难题,杨耀东则指出端到端训练和测试时计算闭环的缺乏。对于强化学习与VLA的结合,嘉宾们一致认为这是VLA发展的必由之路,但仍面临许多未解问题。

在数据使用方面,高阳强调数据的多样性比绝对数量更重要,并介绍了千寻智能如何利用互联网数据优化VLA模型。杨耀东则提出,互联网数据虽然丰富,但信噪比低,且对具体任务的适用性有限。赵行则认为,仿真数据可以作为真实数据的补充,通过技术手段缩小sim to real gap。

对于VLA的泛化能力,嘉宾们提出了多种提升策略,包括利用大量互联网数据进行联合训练、创新模型架构、实现具身认知等。在探讨VLA与本体构型设计的关系时,嘉宾们认为VLA模型与机器人本体没有必然绑定,但硬件局限和VLA能力需相互匹配。

最后,关于VLA是否能完成长程任务,嘉宾们持不同观点。高阳认为,先通过VLM拆解任务再由VLA执行是更实际的方法。杨耀东则强调VLA具备完成长程任务的潜力,并指出需赋予模型推理能力和测试时计算闭环。赵行则提出,需先定义和评测推理能力,再探索VLA在长程任务中的应用。

在落地场景方面,嘉宾们一致认为工业场景是VLA最先落地的选择,但也提到了商业领域和ToBC模式等新场景的可能性。

此次圆桌沙龙为观众带来了VLA领域的深入洞察和前沿思考,对于推动VLA技术的发展和应用具有重要意义。

荣耀GT2来袭:9000mAh大电池配骁龙8E,两千档新机能否逆袭红米?
作为新系列的首款机型,荣耀GT在曝光之初备受期待,被认为是最有希望挑战红米K80地位的产品。 据悉荣耀GT2将搭载骁龙8E处理器,看齐红米K90,而骁龙8E的性能经过一年时间的考验大家已经很清楚了,依然非常强…

2025-11-15

华为顶级旗舰价格大跳水,16GB+512GB直降2100元,为新机让路
这段时间虽然登场了很多新旗舰,但阿维觉得挺遗憾的,因为绝大多数新旗舰都只是常规升级,单纯为了启用第五代骁龙8至尊版和天玑9500,在这种情况下,甚至就连小米17 Pro系列上并不算多大创新的背屏也成为了大家津…

2025-11-15

Apple Store应用6.6版焕新登场:液态玻璃设计带来视觉与交互新体验
2025-11-14 08:20:29 作者:狼叫兽 今日,iPhone与iPad平台的AppleStore应用迎来6.6版本更新,此次更新引入了全新设计的应用图标,并对界面进行了视觉升级,以适配iOS 2…

2025-11-14

高通跃龙IQ-X系列处理器登场 助力工业PC与边缘智能场景革新发展
高通技术公司汽车、工业及嵌入式物联网事业群总经理Nakul Duggal称,高通跃龙IQ-X系列将Qualcomm Oryon CPU的计算性能引入工业PC领域,有助于提升工厂车间边缘控制器的运行能力与…

2025-11-14

谷歌Pixel 6及更新机型获通话录音功能推送,部分非Pixel机型也能享
IT之家 11 月 14 日消息,据科技媒体 Phone Arena 今天报道,谷歌现已为 Pixel 6系列及更新机型推送通话录音功能,部分非 Pixel 系列手机也能用上。 IT之家在此援引 Phone…

2025-11-14

iPhone 17系列发售不到俩月,中国市场激活量破1000W,双十一销量也亮眼
11月14日,数码博主“数码闲聊站”发文透露iPhone17系列于本周完成中国市场激活1000W+。 iPhone17系列9月19日正式发售,如今距发售不到两个月。 该博主此前曾透露,截至11月2日,iPh…

2025-11-14

手机电池容量怎么选?联想新机与大疆眼镜选购指南来了
续航方面,moto X70 Air的电池容量为4800mAh,虽然在当前动辄5000mAh甚至6000mAh的中端机中并不占优,但结合机身厚度来看,这一数据仍非常可观,而且该机还支持68W有线快充,可在30…

2025-11-14

百度文库网盘GenFlow3.0焕新升级,推出两大智能体,助力用户成“超级个体”且加速出海
基于GenFlow3.0,文库网盘在多产品矩阵中升级AI能力,帮助用户在工作、生活、学习上成为“超级个体”。基于百度文库全新能力,Oreate采用多智能体架构,能够端到端完成全场景、全模态创作,涵盖文档、P…

2025-11-14

京东11.11平板教育品类齐发力 办公游戏平板热销 智能学习设备受青睐
直播渠道同样表现抢眼,联想小新Pro GT、荣誉平板GT2 Pro、小米平板7 Pro获得观众最多青睐。在新兴的闺蜜机品类中,海信、小度添添、小米占据品牌领先地位,海信大白闺蜜机X8 Pro、小度添添闺蜜机…

2025-11-13