虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

谷歌Gemini Omni多模态大模型发布:支持混合输入,对话实时编辑生成多元内容

2026-05-20来源:互联网编辑:瑞雪

在谷歌2026 I/O开发者大会上,一款名为Gemini Omni的全模态大模型正式亮相,成为全场焦点。这款模型突破了传统AI在模态处理上的割裂状态,实现了文本、图像、音频、视频等多种信息形式的深度互通与自由生成。

Gemini Omni的核心能力被概括为“任意输入、任意输出”。无论是手绘草图、文字描述,还是图片、音频、视频素材,用户都可以自由组合输入模型。系统能够自主解析信息逻辑,并模拟真实物理规则,最终生成高精度、符合现实逻辑的多元化内容,包括视频、图像和文本等。

支撑这一强大功能的是谷歌的三大核心技术底座:世界模型Genie、图像模型Nano Banana和视频生成模型Veo。这三项技术共同构建了Gemini Omni的全模态AI框架,使其能够处理复杂的多模态任务。

在发布会上,Gemini Omni的对话式实时编辑能力成为最大亮点。与传统AI生成工具一次性输出、修改繁琐不同,这款模型支持用户在生成过程中通过自然语言对话进行交互式迭代优化。例如,用户可以精准调整视频场景、修改物体材质或调整动态特效,而修改过程不会破坏画面的整体逻辑和物理效果。

现场演示中,工作人员仅用手绘简易图形和文字指令,便生成了一段带有物理碰撞效果的完整特效视频。这一展示直观展现了Gemini Omni在内容创作领域的强大潜力,为AI技术的应用开辟了新的可能性。

iOS 26.6与iOS 27测试版发布时间预测,新功能亮点抢先看
热衷于参与苹果系统测试、抢先尝鲜的小伙伴,可能已经在期待接下来的两件事了:一个是 iOS 26.6 的开发者测试版,另一个就是苹果即将在WWDC 26 上发布的全新 iOS 27 系统。如果苹果今年继续遵照…

2026-05-20

谷歌Wear OS 7来袭:续航提升智能升级,成跨设备任务新入口
IT之家 5 月 20 日消息,在今日的 2026 谷歌 I/O 开发者大会上,谷歌发布智能手表平台 Wear OS7,新版本相比前代更聪明,也更高效,重点升级续航优化与智能交互体验。 在自动化体验方面,谷…

2026-05-20

小米YU7 GT刷新纽北SUV圈速纪录 雷军点赞车手任周灿实力
快科技5月19日消息,小米汽车官方宣布,小米YU7GT以7分34秒931的成绩成功刷新纽博格林北环SUV圈速纪录,小米汽车首席测试车手任周灿成为首个获得纽北官方圈速认证的中国车手。 据悉,小米汽车官方已宣布…

2026-05-20

小米生态再添猛将!5月21日小米17 Max重磅登场,大屏旗舰新体验来袭
新机已预热多方面,比如2亿像素主摄、超级像素大屏、大电池、旗舰之芯、消除背屏等方面,与其它版本的确有所区别,新机围绕着屏幕、续航、影像三大方面提升,其它配置与标准版本相近,毕竟是同系列机型。 影像仅预热后置…

2026-05-20