虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

“AI教母”李飞飞携RTFM模型亮相,单芯片实时渲染3D世界开启新篇章

2025-10-18来源:快讯编辑:瑞雪

美国华人科学家、斯坦福大学计算机科学教授李飞飞,因其对人工智能领域的卓越贡献,被誉为“AI教母”。近日,由她担任联合创始人兼CEO的World Labs公司,正式发布了一款名为RTFM(Real-Time frame Model,实时帧模型)的全新实时生成式世界模型,再次引发科技界广泛关注。

RTFM基于大规模视频数据进行端到端训练,是一款自回归扩散Transformer模型。其最大亮点在于无需依赖显式3D表征,仅通过输入一张或多张2D图像,即可生成不同视角下的全新2D图像。业内人士称其为“学会渲染的AI”,因其能够精准建模3D几何、反射、阴影等复杂物理现象,甚至可以利用稀疏照片重建真实场景。

据介绍,该模型具备高效性、可扩展性和持久性三大核心优势。在硬件配置上,仅需一块英伟达H100 GPU芯片,即可实现实时渲染持久且3D一致的场景,无论是真实空间还是虚拟想象场景,均能提供交互式体验。李飞飞团队在技术文章中指出,随着算力成本持续下降,生成式世界模型将从中受益,并逐步占据主导地位。

前谷歌高级工程师Rui Diao对RTFM给予高度评价,认为其解决了长期困扰世界模型可扩展性的问题。他指出,传统视频架构在生成交互视频流时面临巨大挑战,例如生成60帧的4K视频每秒需处理超过10万个token,而维持一小时以上的持续交互,上下文token将突破1亿大关。基于当前计算基础设施,这种方案既不可行也不经济。

空间智能的概念最早由美国心理学家霍华德·加德纳提出,指人类或机器在三维空间中的感知、理解和交互能力。对于人类而言,它包括以三维方式思考、重现和修饰影像的能力;对于机器而言,则是指其在三维空间中处理视觉数据、精准预测并采取行动的能力。李飞飞曾表示,视觉能力引发了寒武纪大爆发,而“我们想要的不仅仅是能看会说的AI,我们想要的是能做的AI”。

随着生成式AI技术的兴起,“空间智能+世界模型”成为实现通用人工智能(AGI)的重要路径之一。强大的世界模型能够实时重建、生成并模拟具有持久性、可交互且物理精确的世界,这将彻底改变软件、机器人等多个领域。李飞飞认为,空间智能与世界模型是解决AI技术难题的关键。

今年3月,李飞飞联合Ben Mildenhall、Justin Johnson、Christoph Lassner三位学者创立World Labs,致力于研发高效、可扩展的生成式世界模型。RTFM的通用端到端架构能够随数据与算力增长不断优化,而“带位姿帧空间记忆”与“上下文调度”技术则确保了场景的持久性,即使长时间交互也能保持一致性。

在融资方面,World Labs于今年9月宣布获得2.3亿美元(约合人民币16亿元)投资,由a16z、NEA恩颐投资和Radical Ventures领投,AMD、Adobe、Databricks的风投部门以及Shinrai Investments LLC参与,英伟达创投部门也加入其中。公司目前拥有约24名员工,其中华人约占三分之一,成立仅三个月估值便达到10亿美元(约合70亿元)。

投资人透露,World Labs的未来规划分为三个阶段:第一阶段构建对三维、物理以及空间和时间概念有深入理解的空间智能大模型LWM;第二阶段支持增强现实(AR)应用;第三阶段将模型应用于机器人技术,改进自动驾驶汽车、自动化工厂和人形机器人等领域。李飞飞表示,团队最早将于2025年推出产品,并承认在盈利模式等方面仍需突破。

除了World Labs,李飞飞还在推动Behavior视觉挑战比赛的发展。该比赛旨在解决机器人学习中的三大痛点:任务缺乏标准化、任务体系不统一以及训练数据不足。今年10月,她正式发布了Behavior 1K挑战,这是一个包含1000个任务的综合仿真基准与训练环境,聚焦于日常家庭环境中的“长时序任务”。Behavior为全球研究者提供了开放源码的训练与评测平台,促进不同机构在相同标准下进行比较和评估。

李飞飞近期表示,人类正处在一个文明性的转折时刻,语言、空间、视觉、具身智能等多种AI技术正在融合,并开始真正改变人类社会。她强调,只要始终将“以人为本”放在心中,这些技术就能成为造福人类的力量。

vivo X300 Pro:以技术创新重塑旗舰性能,打造全能无短板体验
vivo X300 Pro搭载的OriginOS 6带来的内存动态分区技术和双渲染架构的创新组合,让系统的每一次响应都做到极致丝滑。vivoX300 Pro不是单纯堆砌硬件的产物,而是vivo工程师们对性能…

2025-10-17

iPhone17Pro Max升级iOS26.1.3体验:流畅续航双提升,五大优化助性能飞跃
苹果iOS26.1.3被更多果粉认可,这个版本也是目前能升级到的最新版本,也就是iOS26.1beta3版本的简称,很多用户表示这版本续航提升了,但不同的机型更新后续航有所不同,那么除了续航优化以外还带来了哪…

2025-10-17

台积电客户格局生变:英伟达借AI芯片崛起,2025年或超越苹果
10月16日消息,全球芯片代工龙头台积电正迎来客户结构的历史性洗牌——英伟达凭借AI芯片的爆发式需求,已逼近苹果占据十年的“头号客户”宝座。 供应链数据显示,苹果2024年仍以22%的营收占比(约新台币624…

2025-10-17

2025年Q3国内手机市场:vivo登顶但出货量下滑,头部品牌竞争胶着
Omdia认为过去的第三季度中国市场智能手机整体出货量达到6720万台,同比下跌3%。看整体数据确实如报告所讲头部品牌之间的差距根本拉不开,否则也不可能后三名的市场份额都是15%。即使是算上第一名的vivo…

2025-10-17

OpenAI Sora 2迎更新:视频时长拓展,拟真与音频生成能力升级,首周iOS下载超ChatGPT
10 月 16 日消息,北京时间今天上午,OpenAI 通过官方 X 账号宣布为 Sora 2 推出两大更新:Pro用户可以在网页端使用“故事板”,所有用户均可在 App、网页生成最长 15 秒的视频,Pr…

2025-10-17

荣耀Magic 8 Pro正式登场:第五代骁龙8至尊版+7200mAh大电池来袭
屏幕方面,和之前互联网上的爆料信息一致,荣耀Magic8 Pro这款智能手机采用6.71英寸全等深四微曲屏,分辨率为1256 x 2808 像素,支持3D人脸解锁,并覆盖巨犀玻璃,支持IP68、IP69、I…

2025-10-17

OPPO Find X9影像革新:8K超清画质加持,标准版也能体验Pro级享受
静态照片的清晰度升级之外,OPPO Find X9在动态的实况照片上,将2K级分辨率全面升级到了4K超清分辨率,在拍实况照片时,就能够让封面帧和过程帧,处于相同级别的分辨率,因此在3秒的实况过程中,任意一帧…

2025-10-17

OPPO ColorOS 16深度剖析:流畅升级与AI战略双轨驱动新体验
2025 年 10 月 15 日,OPPO 开发者大会「ODC25」在深圳正式开幕,雷科技也受邀参加了此次开发者大会与随后的 OPPO AI峰会。 在雷科技看来,要实现 OPPO 所描绘的「全场景、全链路…

2025-10-16

苹果10月新品来袭:M5芯片领衔,三款Pro新机17日开启预购
按照苹果的说法,对于还在使用 M1 芯片或 Intel 版本的 Mac 用户而言,M5 MacBook Pro 的性能提升将是「颠覆性」的。另外,苹果本次为新款 Vision Pro 推出了一款全新的配件…

2025-10-16