虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

小米发布开源Xiaomi-Robotics-0大模型 破解推理延迟痛点推动具身智能发展

2026-02-12来源:快讯编辑:瑞雪

小米公司近日宣布,正式推出并开源其首款机器人视觉语言动作(VLA)大模型Xiaomi-Robotics-0,标志着具身智能领域迎来重要技术突破。该模型以47亿参数规模实现视觉语言理解与实时动作执行的深度融合,突破了传统VLA模型因推理延迟导致的物理世界交互瓶颈,在消费级硬件上即可完成高效推理,多项性能指标刷新行业纪录。

传统VLA模型虽具备强大的泛化能力,但高延迟问题严重制约了机器人在动态环境中的响应速度。小米研发团队通过架构创新破解这一难题,采用"大脑+小脑"双核心设计:以多模态视觉语言模型(VLM)构建认知中枢,可解析人类模糊指令并识别复杂空间关系;通过多层扩散变换器(DiT)搭建动作执行模块,利用"动作块"生成技术与流匹配算法,确保机器人动作的精准性与高频性。这种混合架构使模型在保持认知能力的同时,将物理交互延迟降低至行业领先水平。

在训练体系方面,小米独创跨模态两阶段训练法。预训练阶段通过动作提议机制实现视觉特征与动作空间的深度对齐,在冻结VLM参数的前提下专项优化DiT模块,使模型同时掌握物体识别、逻辑推理与操作技能。后训练阶段引入异步推理框架,结合清洁动作前缀与Λ型注意力掩码技术,有效解决真实机器人执行中的动作断层问题,既保证运动轨迹的连续性,又强化了对实时视觉反馈的响应能力。

为推动技术生态建设,小米已全面开源Xiaomi-Robotics-0的技术文档、训练代码及模型权重,提供完整的开发工具链支持。与此同时,小米机器人团队正式启动全球人才招募计划,面向计算机视觉、强化学习、机器人控制等领域专家,共同探索物理智能的前沿边界。此次开源不仅为学术界提供重要研究基准,更为工业界落地具身智能应用开辟了新路径。

内存成本飙升智能手机承压 苹果凭策略稳坐价格“避风港”
快科技2月12日消息,根据研究机构TrendForce集邦咨询发布的最新报告,全球内存成本正处于飞速上涨的阶段,目前已经占据了智能手机BOM成本的近一半。 TrendForce在报告中指出,内存成本在智能手机…

2026-02-12

科大讯飞星火X2大模型发布:算力自主场景适配,引领行业新方向
科大讯飞相关负责人对《证券日报》记者表示,星火X2大模型实现了通用能力的全面升级,同时将更加专注于教育、医疗、汽车、智能体等高专业性、高体验性场景,致力于在多领域提供领先、可靠的技术方案与支撑。 相较于同类…

2026-02-12

马斯克月球建厂产AI卫星;DeepSeek灰度测试百万Token;AI相亲软件风靡斯坦福校园|科技快讯
2 月 11 日消息,当地时间 2 月 10 日,据《纽约时报》报道,马斯克在 xAI全员会议上提出一个极具科幻色彩的构想:在月球建设工厂生产 AI 卫星,并配备一套名为「质量驱动器」的大型弹射装置,将卫…

2026-02-12

9月安卓旗舰迎新变局:骁龙8E6双版本登场,小米18系列或首发三款新机
标准版大概率搭载骁龙8E6,性能提升有限,可能和小米17 Pro打平甚至小幅领先;只有Pro和Pro Max才会上骁龙8E6Pro,性能进一步拉开。 这对消费者来说,反而是好事,如果不追极限性能可以选标准…

2026-02-12

苹果iOS 26.3更新:新增数据转安卓工具 欧盟设备配对功能再升级
该功能支持在设备设置过程中启动数据传输,无需分别下载Apple与Google的应用即可完成迁移,可转移照片、消息、备忘录、应用、密码、电话号码等数据。 在欧盟相关的更新方面,针对第三方设备(如智能手表),引入…

2026-02-12

科大讯飞推出星火X2大模型:全国产算力赋能,深耕多行业技术升级
新浪科技讯 2月11日下午消息,科大讯飞发布基于全国产算力训练的星火X2大模型。据悉,此次升级有两大亮点:一是通用能力全面升级,星火X2整体能力对标国际顶尖模型水平,在数学、推理、语言理解、智能体等能力上媲…

2026-02-12

科大讯飞智能语音及AI技术赋能多行业 开放平台聚超千万伙伴共筑生态
证券日报网讯 2月11日,科大讯飞在互动平台回答投资者提问时表示,讯飞智能语音及人工智能技术已经广泛应用于各行各业,目前,讯飞开放平台已链接超过千万的合作伙伴共建人工智能生态,且时刻更新、增加,不便于一一确认…

2026-02-12