虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们 热点资讯

图森未来发布Ruyi视频大模型,消费级显卡即可运行

2024-12-17来源:ITBEAR编辑:瑞雪

图森未来近期在人工智能领域迈出了重要一步,正式推出了名为“Ruyi”的图生视频大模型,并慷慨地将Ruyi-Mini-7B版本向公众开源,用户现可通过huggingface平台轻松下载并使用这一创新工具。

Ruyi是一款基于DiT架构的视频生成模型,其设计理念独特,由两大核心模块构成:一是Casual VAE模块,负责高效处理视频数据的压缩与解压;二是Diffusion Transformer模块,专注于生成经过压缩的视频内容。这款模型拥有约71亿个参数,经过大量训练,涉及约2亿个视频片段,旨在为用户提供前所未有的视频生成体验。

图森未来在设计Ruyi时,充分考虑了用户的实际需求,特别优化了模型在消费级显卡上的运行效率,如RTX 4090等,确保用户无需高端硬件也能轻松体验。Ruyi还配备了详尽的部署指南和ComfyUI工作流,即便是初次接触的用户也能迅速上手。

Ruyi的功能性同样令人瞩目,支持多分辨率、多时长的视频生成,分辨率范围从384*384到1024*1024,任意长宽比,最长可达120帧或5秒的视频内容。用户还可通过控制首帧和首尾帧来定制视频,最多可设置5个起始帧和5个结束帧,通过循环叠加,实现任意长度的视频创作。

更Ruyi还提供了4档运动幅度控制和5种镜头控制选项,包括上、下、左、右移动和静止,使用户能够更精细地调控画面变化和镜头切换,为视频创作增添更多可能性。

然而,Ruyi目前仍存在一些不足,如手部动作可能显得不够自然,多人场景中的面部细节有时会出现失真,以及不可预测的转场效果。图森未来对此表示,团队正在积极改进这些缺点,并计划在未来的更新中逐步修复。

图森未来强调,Ruyi的发布旨在利用大模型技术缩短动漫和游戏内容的开发周期,降低制作成本。目前,Ruyi已经能够根据用户输入的关键帧,自动生成接下来的5秒内容,或根据两个关键帧生成中间的过渡画面,极大地提升了创作效率。未来,图森未来还将推出更多版本的Ruyi,以满足不同创作者的多样化需求。

对于想要探索Ruyi-Mini-7B版本的开发者,可以访问以下开源链接:

荣耀方飞再谈“Pro与Air融合新机”:以勇气探索 以底气铸就创新之作
IT之家 1 月 7 日消息,本月早些时候( 1 月 4 日上午),荣耀终端股份有限公司产品线总裁方飞在祝福大家 2026年开工大吉的同时,也宣布荣耀一台既 Pro 又 Air 的手机也即将和大家见面。 …

2026-01-07

OPPO阔折叠新机或下代登场?此前Find系列负责人曾表态不做此类机型
IT之家 1 月 7 日消息,博主 @数码闲聊站今日发文透露,某厂的阔折叠新机确定在评估中,大概率是下代。结合评论区讨论及暗示表情符号来看,这款新机预计归属 OPPO 品牌。作为参考,华为在去年 3 月 …

2026-01-07

移远通信CES 2026首日发布SP895BD-AP智能模组 性能能效双提升
(全球TMT2026年1月6日讯)1月6日,在2026年国际消费电子产品展览会(CES 2026)首日,移远通信宣布正式推出其新一代旗舰级智能模组SP895BD-AP。该模组搭载的高通跃龙Q-8750处理器,…

2026-01-07

AMD锐龙7 9850X3D亮相CES 2026:频率提升功耗不变,104MB缓存成亮点
2026-01-06 17:20:58 作者:狼叫兽 在CES 2026展会期间,AMD正式推出锐龙9000系列新品——锐龙79850X3D,作为前代明星产品锐龙7 9800X3D的升级版本。该处理器延续…

2026-01-07

雷军详解新一代小米SU7电压平台命名:杜绝歧义,清晰表达
IT之家 1 月 7 日消息,新一代小米 SU7 今天上午 10 时开启小订,预售价 22.99 万-30.99 万元,预计 2026 年 4月上市。 标准版:22.99 万元 Pro:25.99 万元 …

2026-01-07

雷蛇CES 2026发布Project Madison:三觉融合打造沉浸式电竞新体验
IT之家 1 月 7 日消息,Razer 雷蛇在 CES 2026 上发布了新一代游戏座椅概念设计 ProjectMadison。其集成了雷蛇多项技术,从听觉、视觉、触觉三方面塑造全方位的沉浸游戏体验。 P…

2026-01-07