虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

即梦AI年末“交卷”,字节跳动的文生影像野心能否照进现实?

2025-01-02来源:ITBEAR编辑:瑞雪

在2024年的尾声,文生影像领域迎来了一场前所未有的技术盛宴。国内外各大科技巨头纷纷亮出杀手锏,其中,OpenAI的Sora、谷歌的Veo 2以及背靠字节跳动的即梦AI尤为引人注目。

Sora以最高1080P的分辨率、20秒的时长以及创新的故事板、Remix等功能,率先点燃了这场技术竞赛的战火。然而,谷歌随后发布的Veo 2模型,凭借在指令遵循、镜头控制以及画面质量上的卓越表现,再次刷新了人们的认知。与此同时,即梦AI也在激烈的市场竞争中崭露头角,其背靠字节跳动强大的短视频基因,短短数月内便经历了数次迭代,成功解决了AI生成影像中的中文嵌入难题。

在这场技术较量中,即梦AI凭借其独特的“智能参考”功能,让用户能够通过一句简单的话语实现零门槛改图,并精准收获预期效果。例如,用户只需输入“兵马俑喝奶茶”的prompt,即梦AI便能在几秒钟内将一张兵马俑的照片转化为左手握奶茶的图片,且图片其余部位保持原样,无需额外操作。这一功能不仅满足了C端用户在社交媒体制图方面的需求,也为创作者提供了极大的便利,降低了使用成本,提高了创作效率。

不仅如此,即梦AI还上线了“文字海报”功能,用户只需输入一句话即可生成中/英文海报,并可在后续进行涂抹修改错字。这一功能不仅实现了简单快速的排版设计,更在AI图像生成中中文难以生成的问题上取得了突破。同时,即梦的模型还能根据提示词自动完善文案并补充画面细节,在控制图片中的文字生成方面开创了行业先河。

在视频生成方面,即梦AI同样表现出色。其S&P双模型采用了DiT架构,其中S2.0 pro模型在首帧一致性和画质上表现出色,而P2.0 pro模型则具有较高的“提示词遵循能力”。用户输入复杂的提示词,如镜头切换、人物连续动作、情绪演绎、运镜控制等,模型都能理解并精准生成视频。

在实测中,即梦AI的P2.0 pro模型在镜头切换、人物动作以及运镜控制等方面都展现出了卓越的性能。例如,输入一张图和prompt,即可生成多镜头视频,实现全景、中景、特写等镜头切换,并保持视频与原图风格、场景以及人物的高度一致。同时,模型还能演绎哭、笑、悲伤、生气等单一情绪以及“哭中带笑”等复杂情绪,为用户提供了丰富的创作空间。

即梦AI在B端场景的应用同样具有广阔的前景。商品展示类的广告短片、红人口播短视频等都可以通过即梦AI的模型能力实现。即梦还上线了“对口型”功能,用户只需提供一张图片、一段文字或音频,即可生成对口型视频,人物表情、神态以及服饰、配饰等细节都能达到动态逼真的效果。

在12月18日的即梦发布会上,剪映业务负责人张楠表示,视觉模型将极大改变人们观看视频的方式。用户将不再是被动观看,而是可以在任何时刻介入、参与和影响剧情走向或观看不同的故事分支。这一观点不仅展现了即梦AI在技术创新方面的雄心壮志,也预示着未来视频内容创作和观看方式的变革。

剪映业务负责人 张楠

作为字节跳动在生成式AI领域的重要布局,即梦AI不仅拥有优越的资源禀赋和算力资源,还具备独特的生态站位优势。抖音作为字节跳动旗下的短视频平台,需要源源不断的内容支持。即梦AI可以与剪映结合,引入AI生产力工具后将内容反哺给抖音,为抖音提供更加丰富多样的内容创作方式。

华为鸿蒙HarmonyOS 6发布:跨生态互联、安全升级、小艺智能体协同新体验
华为碰一碰支持应用超60个,用户可以通过简单的“碰一碰”轻松分享照片、音乐、链接等丰富内容。此外,还支持一碰多分享、游戏组队等互动体验,以及手机与电脑屏幕的轻碰分享,实现全场景设备间实现高效协同。 鸿蒙6…

2025-10-23

三季度印度智能手机市场微增3% vivo以20%份额稳居榜首
三星以680万台的出货量排名第二,市场份额为14%。 该机构分析称,vivo凭借均衡的产品组合、积极的零售策略以及强大的促销团队,进一步巩固了其市场领先地位。OPPO的出货量主要得益于以F31系列为核心、层次…

2025-10-23

华为nova 14活力版10月24日开售:影像升级鸿蒙加持,低中端市场新选择
新机的核心在影像、鸿蒙安全、鸿蒙智慧通信等方面,不愧是鸿蒙生态,已覆盖到多方面,让各大产品系统更完善,形成全场景全生态。 影像配置,前置摄像头拥有5000万像素,光圈达到F/2.4,大底为1/2.5英寸,对…

2025-10-23

红米K90来袭:6.59英寸屏配7100mAh电池,50MP长焦能否成新亮点?
机身内置7100毫安时电池,支持100W有线充电,这套组合是目前中屏旗舰的续航天花板,而超级像素排列让该机的续航体验再次锦上添花。 红米K90外围配置也很旗舰:比如内置1115对称式立体双扬,还有Bose和…

2025-10-23

华硕携手AMD推TUF Gaming RX 9070 XT《使命召唤:黑色行动7》限量版,全球仅千块
华硕在其官方博客中公布了这款专为COD粉丝打造的特别版显卡,该卡采用了TUF Gaming RX 9070XT的设计基础,但外观融入了游戏主题元素。 显卡的背板上印有醒目的《使命召唤:黑色行动7》Logo…

2025-10-22

博主爆料:一加Ace 6系列新机或携骁龙8 Gen5芯片与超8000mAh电池登场
IT之家 10 月 22 日消息,博主 @数码闲聊站 今天在微博透露了某厂骁龙 8 Gen5 新机的最新情报。 博主表示,这台手机将配备骁龙 8Gen5 芯片,拥有 1.5K 直屏,刷新率是 165Hz,其…

2025-10-22

JerryRigEverything实测:小米17 Pro龙晶玻璃3.0抗划痕出众,暴力弯折测试稳过关
视频源:JerryRigEverything,字幕源:UP 主 @诸葛成佛丶 在屏幕硬度测试中,小米 17 Pro 正面覆盖的龙晶玻璃 3.0表现出色,直到莫氏硬度 7 级才出现划痕,而常规手机屏幕通常…

2025-10-22

Wi-Fi 7时代来临,BAW滤波器如何助力无线连接体验升级?
针对国内Wi-Fi7路由器频段需求,可实现精准频段划分与干扰抑制;面向海外6GHz频段应用,产品也通过相关认证,为国产设备出海提供关键元器件支持。 开元通信BAW滤波器成功导入多家头部客户并实现量产,不仅积…

2025-10-22

古尔曼爆料:苹果首款可折叠iPad或2029年上市,售价近3000美元面临多重挑战
但据知情人士透露,与重量、功能和显示技术相关的工程难题已将其可能的首次亮相时间推迟到 2029 年或更晚。知情人士称,苹果正与三星显示公司合作,为这款设备开发约 18 英寸的面板。 不过,相较于可折叠 i…

2025-10-22

中国核聚变领域迎突破:最大制冷功率氦制冷机成功启机并稳定运行
IT之家 10 月 21 日消息,据合肥综合性国家科学中心能源院消息,该院孵化企业河南中科清能科技有限公司 (简称“中科清能”) 研发制造的3kW@4.5K 氦制冷机近日在合肥一次启机成功,截至 2025 …

2025-10-22