清华与快手联手推出新型 SVG 扩散模型,训练效率暴增 6200%
清华大学与快手可灵团队合作推出了一款名为 SVG(无 VAE 潜在扩散模型)的新型生成模型。此次创新不仅在训练效率上实现了6200% 的惊人提升,而且在生成速度上更是达到了3500% 的飞跃。
VAE 在图像生成领域的衰退,主要源于其存在的 “语义纠缠” 问题。也就是说,当我们尝试仅仅改变图像中某一特征(如猫的颜色)时,其他特征(如体型、表情)往往也会受到影响,导致生成的图像不够精准。为了解决这个问题,清华与快手的 SVG 模型采取了不同的策略,主动构建了一个融合语义与细节的特征空间。
在 SVG 模型的设计中,团队首先使用 DINOv3预训练模型作为语义提取器,该模型经过大规模的自监督学习,能够有效识别和分离不同类别的特征,解决了传统 VAE 模型中的语义混乱。此外,为了补充细节,团队还特别设计了一个轻量级的残差编码器,确保细节信息不会与语义特征相冲突。关键的分布对齐机制则进一步增强了这两种特征的融合,保证了生成图像的高质量。
实验结果表明,SVG 模型在生成质量和多任务通用性方面,全面超越了传统的 VAE 方案。在 ImageNet 数据集上,SVG 模型在仅训练80个周期时,FID 值(衡量生成图像与真实图像相似度的指标)达到6.57,远超同规模的 VAE 模型;而在推理效率上,SVG 模型也显示出卓越的性能,在较少的采样步骤下即可生成清晰图像。此外,SVG 模型的特征空间还可直接用于图像分类、语义分割等多种视觉任务,无需额外微调,大大提高了应用的灵活性。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
EA 强制员工“万事皆 AI”,员工抱怨修 AI 代码比写还累
EA正在强制员工几乎在所有工作中使用AI,但结果往往存在缺陷,反而让开发者的工作量更大。据《商业内幕》报道,多名现任EA员工证实,公司领导层在过去一年左右的时间里,一直在推动旗下约1.5万名员工在几乎所有任务中使用AI——从为游戏生成代码、概念美术,到建议管理人员如何与员工谈论某些话题,包括薪酬或晋升。 其中,用于生成代码的AI工具问题最为突出。据称,这些工具常常产出有缺陷的代码,需要人工修复。另一些开发者则担心,公司要求他们用自己的作品来训练AI模型,这可能会削弱对概念美术师和关卡设计师的需求。 AI的广泛使用也威胁到了质量保证(QA)岗位。一名前Respawn员工表示,他们在今年春季被裁员,当时约有100名员工一同被解雇。原因是公司开始使用AI来审查并总结试玩者反馈,而这项工作原本由人工员工负责。 尽管在游戏开发及相关岗位中大量使用AI确实对就业构成威胁,但并非所有开发者都反对AI的使用。 《任天堂明星大乱斗》系列的创作者樱井政博认为,生成式AI的应用能够提升效率,让大型项目的开发在当下变得更可持续,尤其是在日本这样人才日益短缺的环境中。 而《合金装备》和《死亡搁浅》系列的创作者小...
-
下一篇
我国 IPv6 活跃用户数达 8.65 亿,居世界第一位
第四届中国IPv6创新发展大会发布《中国IPv6发展报告(2025)》。 报告显示,IPv6用户规模跨越式增长。截至2025年9月,我国IPv6活跃用户数达8.65亿,相较于2017年的293万,增长了294倍,在网民中的占比从2017年的0.39%提升至77.02%,位居世界前列。 IPv6网络流量大幅跃升。截至2025年9月,全国移动网络和固定网络总流量中IPv6流量占比达34.02%。其中,移动网络IPv6平均流量占比达69.02%,相比2019年底增长近14倍;固定网络IPv6平均流量占比达30.63%,相比2019年底增长近34倍。2023年2月,我国移动网络IPv6流量占比首次超过50%,实现IPv6流量超越IPv4流量的历史性突破。 IPv6地址资源储备充足。截至2025年9月,我国IPv6地址资源总量达71590块(/32),占全球已分配IPv6地址的14.61%,位居世界第二,为未来发展提供坚实保障。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS关闭SELinux安全模块
- MySQL数据库中FOR UPDATE的使用
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程



微信收款码
支付宝收款码