虎科技
业界资讯 手机产品 数码产品 移动互联 软件产品 智能汽车 生活家电 关于我们

智谱清言App新功能上线,CogView3-Plus文生图模型有何亮点?

2024-10-14来源:ITBEAR编辑:瑞雪

智谱技术团队今日宣布,其研发的文生图模型CogView3及CogView3-Plus-3B已正式开源,并已在“智谱清言”App中上线。据团队介绍,CogView3是一款基于级联扩散技术的text2img模型,其生成过程分为三个阶段:首先生成512x512像素的低分辨率图像,随后通过中继扩散过程实现2倍超分辨率,生成1024x1024像素的图像,最后再次迭代生成2048x2048像素的高分辨率图像。

在实际应用中,CogView3的表现尤为出色。据官方数据显示,在人工评估中,其性能比目前最先进的开源文本到图像扩散模型SDXL高出77.0%,同时,其推理时间仅为SDXL的约十分之一。CogView3-Plus模型在CogView3的基础上引入了最新的DiT框架,进一步提升了整体性能。该模型采用了Zero-SNR扩散噪声调度,并引入了文本-图像联合注意力机制,有效降低了训练和推理成本。

CogView3-Plus模型使用的VAE潜在维度为16,相较于常用的MMDiT结构,它在保持模型基本能力的同时,实现了成本的有效控制。这两款模型的开源,无疑将为文本到图像的生成领域带来新的突破。

用户可以通过以下链接访问CogView3及CogView3-Plus-3B的开源仓库:

开源仓库地址:https://github.com/THUDM/CogView3

Plus 开源模型仓库:https://huggingface.co/THUDM/CogView3-Plus-3B https://modelscope.cn/models/ZhipuAI/CogView3-Plus-3B

凯迪拉克XT5延期交付新政策:锁单超30天,每天送积分!
10月14日消息,继昨天别克公布了全新一代昂科威Plus延期交付补贴之后,同属通用汽车的凯迪拉克也公布了全新XT5的延期交付补贴。豪华型:26.59万元铂金型:33.59万元凯迪拉克全新XT5长宽高分…

2024-10-14

现代汽车全新胜达插混版来袭,纯电续航可达100公里!
10月14日消息,海外车媒“SHORTSCAR”昨天发布了现代全新一代胜达插混版的实车谍照。暂时不明确该版本后续是否会引入国内。探索家Air:19.58万元(置换尊享价18.58万元)探索家Pro:2…

2024-10-14