中国科大与字节发布 MoGA 长视频生成模型
中国科学技术大学与字节跳动即将联合发布一款具有里程碑意义的 端到端长视频生成模型。该模型能够直接生成分钟级长度、480p 分辨率、24帧/秒(fps)的高质量视频,并支持多镜头场景切换,标志着国产视频生成技术在全球生成式 AI 竞赛中实现关键突破。
这项成果的核心创新在于其底层算法——MoGA(Modular Global Attention),这是一种全新的注意力机制,专为解决长视频生成中的上下文扩展与算力开销问题而设计。凭借 MoGA 的结构优化,模型可处理长达 580K token 的上下文信息,大幅降低计算成本,使长时间、多场景的视频生成成为可能。
研究团队表示,传统视频生成模型往往受限于显存和计算量,只能生成几秒钟的动画 GIF 或短片。而 MoGA 的引入,让模型能够“一次性”生成包含多个镜头切换、视觉叙事连贯的 “迷你短片”,极大拓展了生成式视频模型的应用边界。
此外,MoGA 具有高度的 模块化与兼容性,可直接与现有的高效加速库(如 FlashAttention、xFormers、DeepSpeed 等)集成,实现更快的训练与推理效率。这意味着该技术不仅具备科研突破意义,也具备产业落地潜力,可应用于影视创作、广告生成、游戏过场动画以及数字人内容生产等领域。
随着 OpenAI、Pika、Runway 等公司相继推进短视频生成,中国科大与字节跳动此次推出的模型被认为是国内首个能真正实现分钟级长视频生成的系统,其在算法、效率和可扩展性上的领先性,或将推动中国在视频生成领域进入全球前列。
关注公众号
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
【直播回顾】1024 守护者之夜:用可观测性点亮系统稳定(附PPT)
当代码融入黑夜,当系统静默运行,是谁在守护着数字世界的稳定与安宁? 又是一年 1024 ,由快猫星云主办的 1024 程序员节特别直播“1024守护者之夜:用可观测性点亮系统稳定”已于前一晚圆满落幕。 在这个充满极客精神的夜晚,快猫星云联创& CMO 秦晓辉、B站 SRE 负责人武安闯、OSCHINA.NET 负责人林师授三位行业大咖,以“系统稳定性建设”为题,从实战体系、高效方法论、社区应对策略等多个维度,为大家带来从硬核技术分享。 直播精彩回顾 分享一:《 SRE 稳定性体系建设分享》 快猫星云联创& CMO 秦晓辉 “ 可观测性,其实最核心应该从 SLO(服务等级目标)着手,需要与业务团队一起率先梳理好 SLO 。”秦晓辉老师表示,SLO 这个指标,是谁拍板呢?其实应该是业务团队来拍,而不是运维人员:根据业务的实际需要,制定出错误预算,以及预估消耗完错误预算之后,系统呈现怎样的行为,这些都是需要提前梳理的内容。 直播中,秦晓辉老师举了一个 Google SRE 的典型案例:以 28 天为周期,形成 SLO 的计算窗口,在这个窗口中,将上线的稳定性着以次之,从而凸显...
-
下一篇
蚂蚁集团多模态 AI 应用“灵光”即将发布
据新浪科技消息,近日,一款名为“灵光”的全新多模态应用已在腾讯应用宝、vivo 应用商店等平台悄然上线,并开启邀约内测。用户可通过手机号或支付宝账号直接登录体验。 据悉,“灵光”由 支付宝(杭州)数字服务技术有限公司开发,其最大亮点在于内置的 “AGI 相机” 功能。这一功能可通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与回答。有业内人士指出,该功能与字节跳动的 豆包 App、阿里 元宝 App 的图像识别功能类似,但灵光更强调“认知层理解”,或具备更强的场景分析与多模态推理能力。 事实上,蚂蚁集团在多模态与 AGI 方向的探索已持续数月。今年4月底,蚂蚁首次实现了图像理解与生成的统一;5月份又推出了 Ming-Lite-omni-Preview 模型,这是全球首个在模态支持上可媲美 GPT-4o 的开源模型,具备语音、图像的生成与理解整合能力。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库中FOR UPDATE的使用
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Windows10,CentOS7,CentOS8安装Nodejs环境
- MySQL表碎片整理
- SpringBoot2整合Redis,开启缓存,提高访问速度


微信收款码
支付宝收款码