虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

快手新动作!联合推出开源文生视频AI模型,效果如何?

2024-10-12来源:ITBEAR编辑:瑞雪

近日,快手科技、北京大学和北京邮电大学携手,共同推出了Pyramid Flow文生视频模型。这款模型能够根据用户输入的文本,生成最长可达10秒、分辨率为1280x768、帧率为24fps的高质量视频。这一创新成果为开发者、艺术家和创作者们带来了更高效、更灵活的视频生成解决方案,并已在Hugging Face平台上线,实现完全开源。

Pyramid Flow的核心优势在于其高效生成的能力。该模型采用新技术,通过统一的AI模型分阶段生成视频,其中大多数阶段为低分辨率,仅在最后阶段达到全分辨率。这种“金字塔流匹配”方法在保持视频高视觉质量的同时,大幅降低了计算成本,其tokens数量仅为传统diffusion模型的四分之一。

在推理速度方面,Pyramid Flow同样表现出色。它能够在56秒内生成一个5秒、384p的视频,速度上媲美甚至超过了许多全序列diffusion模型。

Pyramid Flow在MIT许可证下发布,允许包括商业应用、修改和再分发在内的广泛使用。这一开源和商业友好的政策,吸引了众多希望将模型集成到专有系统中的开发者和公司。

资深硬件专家成功移植:iPhone 16e运行macOS 15.6并搭载部分M4芯片驱动
IT之家 1 月 2 日消息,资深硬件专家 Duy Tran 昨天在 X 平台发文称,他成功在苹果 iPhone 16e 手机上运行了macOS Sequoia 15.6 系统。 Duy Tran 表示,他…

2026-01-02

OpenAI加码音频AI布局,2026年拟推新模型及智能伴侣设备
来源:环球网 【环球网科技综合报道】1月2日消息,据Techcrunch报道,OpenAI正在大力投资音频 AI,该公司在过去两个月里整合了多个工程、产品和研发团队,对其音频模型进行了全面改造,这一切都是为推…

2026-01-02

OpenAI加码音频AI研发 布局无屏设备或引领未来交互新潮流
OpenAI 团队希望用户通过“说话”而非“看屏幕”与设备互动,认为语音才是最贴近人类交流本能的方式。 与 OpenAI 合作推进硬件项目的乔尼・艾维也强调,无屏幕设计不仅更自然,还有助于避免用户沉迷。在推出…

2026-01-02

安信稳健聚申一年持有混合A:12月31日净值微跌,前十大重仓股曝光
来源:新浪基金∞工作室该基金成立以来收益51.05%,今年以来收益7.05%,近一月收益-0.66%,近一年收益7.05%,近三年收益22.38%。黄琬舒自2025年7月15日管理(或拟管理)该基金,任职期内…

2026-01-02