Open-Sora:开源 Sora 复现方案,成本降低 46%,序列扩充至近百万
Colossal-AI开源了完整的Sora复现架构方案Open-Sora,声称可降低46%复现成本,并将模型训练输入序列长度扩充至819K patches。
Sora 算法复现方案
在Sora的技术报告中,Sora使用了一个视频压缩网络将各种尺寸的视频压缩成一个隐空间(latent space)的时空块序列(a sequence of patial temporal patch),然后使用了Diffusion Transformer进行去噪,最后进行解码生成视频。
Open-Sora将Sora可能使用的训练pipeline归纳为下图。
目前Open-Sora已涵盖:
-
提供完整的Sora复现架构方案,包含从数据处理到训练推理全流程。
-
支持动态分辨率,训练时可直接训练任意分辨率的视频,无需进行缩放。
-
支持多种模型结构。由于Sora实际模型结构未知,我们实现了adaLN-zero、cross attention、in-context conditioning(token concat)等三种常见的多模态模型结构。
-
支持多种视频压缩方法。用户可自行选择使用原始视频、VQVAE(视频原生的模型)、SD-VAE(图像原生的模型)进行训练。
-
支持多种并行训练优化。包括结合Colossal-AI的AI大模型系统优化能力,及Ulysses和FastSeq的混合序列并行。
性能
以在单台H800 SXM 8*80GB GPU上使用DiT-XL/2模型的性能测试为例。在600K的序列长度时,Open-Sora的方案比基线方案有40%以上的性能提升和成本降低。
Open-Sora 开源地址:https://github.com/hpcaitech/Open-Sora

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
微软将 CBL-Mariner Linux 重命名为 Azure Linux
微软内部用于各种用途的 Linux 发行版曾被称为 CBL-Mariner,意为"Common Base Linux",而现在似乎正在向Azure Linux过渡。 Azure Linux 是从 CBL-Mariner 演化而来的,但注意不要将其与微软基于 Linux 的 Azure Sphere 操作系统混淆,后者是物联网/微控制器的使用平台。 随着 CBL-Mariner 2.0.20240301 的发布,该项目现在已重定向到 GitHub 上的 Microsoft/AzureLinux 项目。CBL-Mariner 存储库已更名为"AzureLinux",其他对 CBL-Mariner 的引用也已过渡到 Azure Linux 品牌,但仍保留了一些 CBL-Mariner 标记。 在新发布的 v2.0.20240301 版本中,还有一些源代码更新开始重命名工件,例如 Azure Linux 从"MARINER_VERSION"更名为"AZL_VERSION"。 微软是否会更好地公开定位其内部 Linux 平台,或者 Azure Linux 还会有哪些其他变化,值得进一步的探究。
- 下一篇
如何基于容器网络流量指标进行弹性伸缩
本文分享自华为云社区《【自定义指标HPA】基于容器网络流量指标进行弹性伸缩》,作者: 可以交个朋友。 一、背景 业务程序非CPU、memeory敏感类业务,希望可以基于流量指标进行HPA弹性伸缩,但是大部分程序并没有集成Prometheus SDK相关代码进行插桩。此时可以通过cAdvisor提供的容器网络流量指标实现业务峰谷期间的弹性扩缩容。 二、方案介绍 cAdvisor负责节点上的容器和节点本身资源的统计,内置在kubelet中,并通过kubelet的/metrics/cadvisor接口对外提供API。它可以采集容器网络累积接收数据总量和容器网络累积传输数据总量,即网络流入和流出指标。 参考指标: container_network_receive_bytes_total容器接受的网络流量,单位是字节数 container_network_transmit_bytes_total容器传输的网络流量,单位是字节数 上面两个指标都是counter计数器类型,对应的值只增不减。在配置自定义指标转换规则时需要做下速率换算,将总量换算成每秒接受多少字节数的流量指标。 三、实践操作 3.1...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G