智谱开源新一代文生图模型 CogView3-Plus-低调大师

智谱开源新一代文生图模型 CogView3-Plus

2024-10-15 403

智谱宣布开源文生图模型 CogView3 及 CogView3-Plus-3B。CogView3 以及 CogView3-Plus 模型均使用 Apache 2.0 协议，目前该系列模型的能力已上线「智谱清言」（chatglm.cn）。

CogView3-Plus-3B 的效果：

CogView3 是一个基于级联扩散的 text2img 模型，包含三个阶段：

第一阶段：利用标准扩散过程生成 512x512 低分辨率的图像。
第二阶段：利用中继扩散过程，执行 2 倍的超分辨率生成，从 512x512 输入生成 1024x1024 的图像。
第三阶段：将生成结果再次基于中继扩散迭代，生成 2048×2048 高分辨率的图像。

公告称，在实际效果上，CogView3 在人工评估中比目前最先进的开源文本到图像扩散模型 SDXL 高出 77.0%，同时只需要 SDXL 大约 1/10 的推理时间。

CogView-3-Plus 在 CogView3（ECCV'24）的基础上引入了最新的 DiT 框架，以实现整体性能的进一步提升。其采用了 Zero-SNR 扩散噪声调度，并引入了文本-图像联合注意力机制。与常用的 MMDiT 结构相比，它在保持模型基本能力的同时，有效降低了训练和推理成本。CogView-3Plus 使用潜在维度为 16 的 VAE。

借由混合分辨率训练，CogView-3Plus 模型支持 512 ~ 2048 像素区间内分辨率的灵活生成。从效果上看，CogView3-plus 有着和最领先的 text2img 模型持平的水平。

微信关注我们

原文链接：https://www.oschina.net/news/316161

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

openKylin 杭州用户组成立，更多用户组持续招募中！

10月13日，KCC@杭州暨openKylin杭州用户组沙龙在杭州未来科技城国际人才园举办。本次活动由openKylin社区及开源社联合举办，在杭州城西科创大走廊高层次人才联合会支持下，为杭州本地开源爱好者及openKylin用户带来一场关于开源社区治理、开源合规及创新的交流活动。 Part.01 主题分享 1.《如何在开源世界成长为超级个体—从openKylin开源实践说起》 openKylin Community SIG Maintainer范娇带来《如何在开源世界成长为超级个体——从openKylin开源实践说起》主题分享，就新时代下人才需求，以及个人如何在openKylin通过开源贡献成长为超级个体进行介绍。互联网下半场及人工智能加持下，个人拥有的潜能将逐步爆发，openKylin作为中国领先的开源社区，持续关注开发者赋能及生态建设，通过开源知识分享、社区活动举办、城市站点建设为开发者搭建良好的成长型平台，共同推动Linux开源技术及其生态的繁荣发展。 2.《治愈你的“GPL恐惧症”》 lfapac开源布道者陶冶带来《治愈你的“GPL恐惧症”》主题分享。当下，很多企业开始关注...

2024-10-15

307

Python 3.13上周正式发布了稳定版，主要变化包括一个新的交互式解释器、对在自由线程模式（无全局解释锁，no-GIL）下运行的实验性支持 (PEP 703)，以及即时编译器 (PEP 744)。这些改进预计将带来性能的适度提升。近日，开发者在AMD Ryzen 7000系列和第13代Intel Core处理器的电脑上，对Python 3.13与Python 3.12进行了性能测试，共计100项不同的基准测试。所有测试都在使用Windows 11的电脑上进行，使用的是Python 3.12.7和Python 3.13.0（均为64位版本）的pyperformance 1.11.0库。 AMD Ryzen 7000系列桌面处理器测试的第一部分使用一台配备AMD Ryzen 9 7900处理器、DDR5内存和M.2 PCIe Gen4 NVMe驱动器的台式电脑。下表显示了在该设备上使用Python 3.12（作为参考）和Python 3.13进行的100项测试的结果。基准测试 Python 3.12 Python 3.13 提升倍数 2to3 226 ms 217 ms (1...

2024-10-15

632

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。