在科技日新月异的今天,人工智能与机器人技术正以前所未有的速度交融发展。2023年以来,以大模型为核心的人工智能技术和以具身智能为特征的机器人技术,共同构成了科技进步的两大支柱。将人工智能算法,尤其是大模型技术,应用于提升机器人的智能水平,已成为一种必然趋势。
在此背景下,“机器人学习”与“具身大脑”这两个概念迅速升温,成为业界热议的焦点。通过与多位行业专家的交流,我们了解到,“具身大脑”的定义并非一成不变,它泛指任何将人工智能算法与机器人技术相结合,以提升机器人在交互、感知与控制方面能力的技术体系。
当前,国内专注于机器人模型研发的厂商大致可以分为两大派别:身体控制派和交互感知派。而从技术源头上看,这些厂商又可细分为视觉感知派、强化学习派和语言模型派等多个流派。然而,在解决机器人大脑问题上,各技术流派之间存在着路径差异和观点分歧。
在过去的一年里,研究基础模型出身的大模型派在机器人领域的落地实践尤为艰难。除了激烈的市场竞争外,更关键的是,端侧模型在机器人终端的落地还面临着芯片开发的挑战,这导致机器人厂商、大模型厂商与芯片厂商之间形成了一种复杂的三角关系。
这种三角关系目前正处于一种负向增强的反馈循环中。首先,端侧模型在机器人上的应用需要适配特定的芯片,但芯片的迭代往往基于市场需求。由于机器人尚未从专业级产品转变为消费级产品,其出货量远低于手机、PC等硬件设备,因此适配机器人端侧模型的芯片迟迟未能推出。其次,机器人消费市场的扩大高度依赖于智能水平的提升,即AI模型的迭代,而AI模型的升级又需要大量真实世界的高质量数据,这些数据需要通过机器人与用户进行交互来获取。然而,目前具身VLA(一种机器人大脑模型)的实际效果还远未达到消费级可用的精度和准确率要求,导致机器人的智能水平迭代缓慢,出货量进一步减少,这又反过来影响了芯片的研发和出货成本。
在这段三角关系中,模型厂商、芯片厂商和机器人厂商都期待着对方能主动打破僵局。然而,现实却陷入了僵局,难以自拔。大模型在机器人终端的落地是端侧AI发展的一个缩影,至少在短期内,将大模型商业化寄托于机器人领域可能会面临重重困难。
尽管如此,大模型在提升机器人智能水平方面仍然扮演着至关重要的角色。它们主要作为“大脑”存在,负责泛化与规划能力。然而,在目前的实际应用中,大模型更多地是帮助机器人进行简单的任务理解与拆分。机器人仍然在执行逐个任务,更多停留在交互层面,尚未展现出学习能力的显著增强和多模态任务的实现。机器人在执行任务时更多地依赖短期动作规划,而很少用到大模型的长期规划能力。
为了提升机器人的智能水平,大模型厂商正在积极探索各种方法。例如,面壁智能正致力于让机器人能够完成更加多样、复杂且多步操作的任务,以提高执行准确率和泛化性。而RockAI则选择将文本、语音、视频以及机体参数进行整体对齐,然后一起输入给大模型进行处理。然而,这些努力仍然处于初级阶段,大模型的泛化、规划、纠错等能力在机器人侧的应用还相对初步。
数据不足是当前大模型在机器人领域应用面临的最大挑战之一。由于机器人尚未实现量产,无法从专业级转变为消费级产品,因此难以获取大量的、多元化的预训练数据。这导致模型厂商在提升模型泛化性方面遇到了困难。不同形态的机器人对大模型有不同的要求,而短时间内实现设备泛化也面临着诸多挑战。
除了数据问题外,算力也是制约机器人端模型发展的关键瓶颈之一。目前,国内研究基础大模型的主力军虽然也在发力“端侧小模型”,但起步较晚、技术进展缓慢。云端大模型虽然参数规模庞大、能力强大,但无法在机器人本体上离线部署。而端侧小模型虽然能够在机器人上运行,但在任务泛化、智能理解等方面仍无法与云端大模型相提并论。因此,如何在保持大模型能力的同时实现高效部署是当前亟待解决的问题之一。
为了应对这些挑战,不少大模型厂商正在积极探索解决方案。例如,一些厂商通过端云协作的方式实现大小模型的协同训练和部署。他们首先在云端训练大模型,然后通过知识蒸馏、模型量化等方法得到一个小模型,再将其部署在终端上。这种做法既能保持大模型的能力,又能实现更高效的部署。还有一些厂商通过优化推理框架、适配不同芯片等方式来提高模型在终端上的运行效率。
然而,这些努力仍然需要机器人厂商、芯片厂商和大模型厂商之间的紧密合作。只有三方共同努力、互相支持,才能打破当前的僵局,推动机器人技术向前发展。
值得注意的是,虽然当前机器人领域面临着诸多挑战和困难,但业界对未来仍然充满信心。随着技术的不断进步和市场的逐步扩大,相信在不久的将来,机器人技术一定能够取得更大的突破和进展。
在探索机器人技术的过程中,不少业内人士也提出了宝贵的建议和意见。他们认为,要推动机器人技术的发展,需要注重技术创新和人才培养。同时,还需要加强产业链上下游之间的合作与协同,共同推动整个行业的健康发展。
还有一些专家指出,当前机器人领域的研究还存在一些盲点和不足之处。例如,对于机器人的本体构型、肢体参数等方面的研究还不够深入;对于如何更好地利用仿真数据进行模型训练等问题也需要进一步探索。
尽管如此,随着技术的不断进步和市场的逐步扩大,相信这些问题都将得到逐步解决。未来,机器人技术一定能够在更多领域得到广泛应用,为人类社会的发展和进步做出更大的贡献。