虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

即梦AI年末“交卷”,字节跳动的文生影像野心能否照进现实?

2025-01-02来源:ITBEAR编辑:瑞雪

在2024年的尾声,文生影像领域迎来了一场前所未有的技术盛宴。国内外各大科技巨头纷纷亮出杀手锏,其中,OpenAI的Sora、谷歌的Veo 2以及背靠字节跳动的即梦AI尤为引人注目。

Sora以最高1080P的分辨率、20秒的时长以及创新的故事板、Remix等功能,率先点燃了这场技术竞赛的战火。然而,谷歌随后发布的Veo 2模型,凭借在指令遵循、镜头控制以及画面质量上的卓越表现,再次刷新了人们的认知。与此同时,即梦AI也在激烈的市场竞争中崭露头角,其背靠字节跳动强大的短视频基因,短短数月内便经历了数次迭代,成功解决了AI生成影像中的中文嵌入难题。

在这场技术较量中,即梦AI凭借其独特的“智能参考”功能,让用户能够通过一句简单的话语实现零门槛改图,并精准收获预期效果。例如,用户只需输入“兵马俑喝奶茶”的prompt,即梦AI便能在几秒钟内将一张兵马俑的照片转化为左手握奶茶的图片,且图片其余部位保持原样,无需额外操作。这一功能不仅满足了C端用户在社交媒体制图方面的需求,也为创作者提供了极大的便利,降低了使用成本,提高了创作效率。

不仅如此,即梦AI还上线了“文字海报”功能,用户只需输入一句话即可生成中/英文海报,并可在后续进行涂抹修改错字。这一功能不仅实现了简单快速的排版设计,更在AI图像生成中中文难以生成的问题上取得了突破。同时,即梦的模型还能根据提示词自动完善文案并补充画面细节,在控制图片中的文字生成方面开创了行业先河。

在视频生成方面,即梦AI同样表现出色。其S&P双模型采用了DiT架构,其中S2.0 pro模型在首帧一致性和画质上表现出色,而P2.0 pro模型则具有较高的“提示词遵循能力”。用户输入复杂的提示词,如镜头切换、人物连续动作、情绪演绎、运镜控制等,模型都能理解并精准生成视频。

在实测中,即梦AI的P2.0 pro模型在镜头切换、人物动作以及运镜控制等方面都展现出了卓越的性能。例如,输入一张图和prompt,即可生成多镜头视频,实现全景、中景、特写等镜头切换,并保持视频与原图风格、场景以及人物的高度一致。同时,模型还能演绎哭、笑、悲伤、生气等单一情绪以及“哭中带笑”等复杂情绪,为用户提供了丰富的创作空间。

即梦AI在B端场景的应用同样具有广阔的前景。商品展示类的广告短片、红人口播短视频等都可以通过即梦AI的模型能力实现。即梦还上线了“对口型”功能,用户只需提供一张图片、一段文字或音频,即可生成对口型视频,人物表情、神态以及服饰、配饰等细节都能达到动态逼真的效果。

在12月18日的即梦发布会上,剪映业务负责人张楠表示,视觉模型将极大改变人们观看视频的方式。用户将不再是被动观看,而是可以在任何时刻介入、参与和影响剧情走向或观看不同的故事分支。这一观点不仅展现了即梦AI在技术创新方面的雄心壮志,也预示着未来视频内容创作和观看方式的变革。

剪映业务负责人 张楠

作为字节跳动在生成式AI领域的重要布局,即梦AI不仅拥有优越的资源禀赋和算力资源,还具备独特的生态站位优势。抖音作为字节跳动旗下的短视频平台,需要源源不断的内容支持。即梦AI可以与剪映结合,引入AI生产力工具后将内容反哺给抖音,为抖音提供更加丰富多样的内容创作方式。

小米再拓欧洲版图:巴黎首家直营门店即将开业 开启法国市场新篇章
近日,小米法国副国家经理“产品逸飞”发文官宣,小米将在巴黎开设首家直营门店。针对网友提问“之前不是在香街有一个吗?”,他进一步回应称,该店为客户运营的授权店,后因疫情因素暂时退出市场。 此前,小米集团总裁卢…

2025-11-15

华为Mate80 Pro Max来袭:自研双长焦加持,配置拉满对标苹果小米!
并且一直在曝光的Mate80系列具体机型也得到了最终确认,首先是依然有4款机型全名华为Mate80 ProMax,这也是继苹果小米之后,又一款Pro Max顶级旗舰。接下来直到发布前,华为Mate80系列还…

2025-11-15

TCL华星全球显示生态大会:四款新品亮相,AI赋能制造,印刷OLED节能显著
智东西11月14日苏州现场报道,今天上午,国内显示产业头部玩家TCL华星召开了自家一年一度的全球显示生态大会(DTC2025),发布了覆盖LCD、OLED和MLED等技术领域的多款旗舰新品,以及《视觉健康白…

2025-11-15

华为Mate 80系列新料:20GB国产内存搭配麒麟9030 配置亮点多
根据近期华为新机规划以及各方爆料,这款机型预计为华为 Mate 80 系列,有爆料称该系列新品将在 11 月 25 日发布。其中,ProMax 并非简单的名称更换,而是定位与 Pro 版差距更大的新增机型…

2025-11-14

全RGB排列屏幕成新趋势,vivo新机或搭载,小米17 Pro Max已率先应用
据CNMO了解,近期发布的小米17 ProMax就搭载了全RGB排列屏幕。凭借超级像素技术,其子像素总数高达938万,与传统2K屏约920万的子像素数量基本持平。 小米总裁卢伟冰曾表示,在友商同级产品纷纷…

2025-11-14

小米斩获国际大奖,OPPO新机参数曝光,荣耀500系列真机设计吸睛
官方放出了荣耀500系列真机的渲染视频,从视频中可以看出荣耀500系列外观设计非常有特点,大家都说像iPhoneAir,甚至有人讲荣耀提前发布“iPhone Air 2”。另外行业信息显示荣耀500全系是…

2025-11-13

iPhone 17系列线上线下热销,苹果2025年有喜有忧未来可期
在此情况下,原本不被看好的苹果 iPhone 17 系列成为一匹黑马,上市后销售极为火爆,尤其是中国市场的表现远超预期:首发 10天销量同比增长 14%,第三季度出货量达 1010 万台,成为头部厂商中唯…

2025-11-13

iPhone16Pro升级iOS26.2beta2实测:续航提升,发热改善,流畅与信号双飞跃
苹果今天凌晨突然发布了iOS26.2第二个预览版,有很多凌晨熬夜更新的小伙伴表示优化非常好,各方面体验要比第一版更好用,也获得了不少老果粉们的认可,那么最适合更新iOS26.2beta2的是哪款机型呢?下面就…

2025-11-13

大疆新品亮点频现:Avata 360无人机配旋转云台,Osmo Action 6相机可变光圈
在镜头和视频规格方面,Action 6 将配备全新的 F2.0-F4.0 可变光圈镜头,等效焦距为 16mm;支持录制带有 HDR 和ProRes 编码的 8K / 30fps 视频,还支持 5.3K /…

2025-11-13

原DeepSeek核心成员罗福莉加盟小米MiMo团队 疑聚焦世界模型与具身智能领域
智东西11月12日消息,今天上午,原DeepSeek核心成员、被业内称为“天才少女”的罗福莉在朋友圈正式官宣加盟XiaomiMiMo团队,并宣告“全力奔赴心中的AGI(通用人工智能)”。 罗福莉一条简单的…

2025-11-13