腾讯混元开源全新 AIGC 视频生成加速方案 DisCa-低调大师

腾讯混元开源全新 AIGC 视频生成加速方案 DisCa

2026-04-16 97

腾讯混元的全新 AIGC 视频生成加速方案--(Distillation-CompatibleLearnableFeatureCaching) DisCa 现已正式开源，其代码和模型权重公开可用。作为学界和业界首次对基于可学习的特征缓存技术进一步加速蒸馏后少步模型的这一方向的尝试，该工作现已被CVPR2026接收。

DisCa主要聚焦于两大方向的讨论：

DisCa首次提出在蒸馏后的少步模型上，通过引入可学习的轻量神经网络预测器，进一步利用特征缓存高度压缩推理成本，在保证质量前提下将加速边界拓展至11.8倍。
MeanFlow蒸馏方案简单实用的进一步改进。这一点上与麻省理工(MIT)，谷歌(Google)等团队同期工作的探索不谋而合，互相印证；相较之下，该工作在更复杂的高质量视频生成任务上开展，更具实践指导意义。

DisCa：蒸馏兼容的可学习缓存

在扩散模型进行多步生成的过程（左）中，传统的特征缓存方案直接将以往特征缓存，然后在接下来推理步中直接复用，或简单地进行预测，就能达到不错的加速效果。但在已经进行少步蒸馏的模型（右）中，直接地运用特征缓存方案会导致过大的缓存误差，进而导致严重崩坏。

DisCa首次提出通过引入轻量神经网络预测器，通过神经网络以更好地捕获高维特征的演化轨迹，从利用以往推理步中的特征更精准地预测后续特征演化，实现推理加速。

基于生成-判别对抗的预测器训练

对于轻量级神经网络预测器Predictor(P)，项目团队将上图所示的对抗学习方案引入其训练过程。

简单来说，在这个过程中，神经网络预测器P的目标是使其生成结果尽量接近同输入下，大模型M的输出，而判别器D的目标则是精准分别出预测器P和大模型M的输出。通过神经网络预测器P和判别器D的交替学习进化的博弈过程，轻量神经网络预测器P能很好地习得如何基于缓存来预测接下来的特征。

引入预测器后的推理模式

完成预测器训练后，主模型M和预测器P组装起来，按所示模式进行推理：

R-MeanFlow: 剪除激进场景的MeanFlow训练

来自麻省理工的何恺明团队提出的MeanFlow，引入“预测平均速度场”的观点，在ImageNet图像生成任务的加速上取得了显著成功。而腾讯混元团队研究中注意到，在更复杂多样，要求更高的视频生成任务上，这样“一步生成”的目标过于激进，以“一步生成”为目标的激进训练样本，甚至会对模型训练产生明显的负面影响。

其相应的改进方案简单而实用：既然暂时不打算做“一步生成”，就剪除这些激进的训练场景，使得左图中本来模型每一步步长可能在0到1之间任取的训练，被约束为右图中步长受限在0到r（r<1)的RestrictedMeanFlow(R-MeanFlow)模式。这与麻省理工团队和谷歌团队的同期研究结论相互印证，并作为更复杂任务，更大规模的实践证据。相关研究成果也被用于当前最佳开源视频生成模型 HunyuanVideo-1.5的步数蒸馏实践中。

实验结果展示

微信关注我们

原文链接：https://www.oschina.net/news/421414

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

技术日报｜Karpathy 的 Claude 配置连续两日夺冠累计揽星近 2 万，superpowers 突破 15 万星

🌟 TrendForge 每日精选 - 发现最具潜力的开源项目 📊 今日共收录 13 个热门项目 🌐 智能中文翻译版 - 项目描述已自动翻译，便于理解 🏆 今日最热项目 Top 10 🥇 forrestchang/andrej-karpathy-skills 项目简介: 一个独立的CLAUDE.md文件，用于改进Claude代码行为，源自Andrej Karpathy对大型语言模型编码常见... 今日新增: 9646 * 总星数: 42773 * 语言: 未指定 https://github.com/forrestchang/andrej-karpathy-skills 🥈 the...

2026-04-16

108

腾讯正式发布并开源混元 3D 世界模型 2.0（ HY-World 2.0），让 AI 从“对话”、"画图"、“捏物体”，进化到了“造世界” —— 生成包含人、物、景的完整“世界”。根据介绍，HY-World2.0是一个多模态世界模型，能够根据文字、图片、视频等不同类型输入，自动生成、重建和模拟 3D 世界，同时支持多格式3D资产（Mesh/3DGS/点云等）导出，支持与现有的游戏工作流无缝对接，用于快速生成游戏地图和关卡原型。 HY-World2.0 ...

2026-04-16

99

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。