“一键”模型迁移,性能翻倍,多语言AltDiffusion推理速度超快
为了推进 AIGC 行业的降本增效,同时也回应用户的热情要求,OneFlow 正在将业内备受欢迎的相关 Diffusion 模型的加速“一网打尽”。
此前,OneFlow 首度 将 Stable Diffusion 模型加速至“一秒出图”时代 ,极大提升了文生图的速度,在 AIGC 领域引发巨大反响,并得到了 Stability.ai 官方的支持。
不过,由于目前大部分团队主要是基于翻译 API + 英文 Stable Diffusion 模型进行开发,所以在使用中文独特的叙事和表达时,英文版模型就很难给出正确匹配的图片内容,这对部分国内用户来说不太方便。
为此,国内的 IDEA 研究院出品了中文版 太乙Stable Diffusion ,春节前,OneFlow 对此进行了支持,使其推 理速度翻倍。
另外,智源研究院出品了首个支持 9 种语言的 AltDiffusion。近期,OneFlow 团队为其适配了 OneFlow 后端,大大提升了推理性能,也可以做到一秒出图。
欢迎Star、运行 OneFlow 版 AltDiffusion:
https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker
通过搭建多语言文图表征模型 AltCLIP,智源研究院的研究者先推出了 中英双语图像生成模型 AltDiffusi on , 支持精细长中文 Prompts 高级创作,为中文世界带来专业级 AI 文图创作的强劲动力。
在此基础上, 研究者很快又 推出了多语言升级版 AltDiffusion-m9 ,其成为 首个支持 9 种语言(英文、中文、日语、法语、韩语、西班牙语、俄语、意大利语、阿拉伯语)的文图生成模型。该研究的主要贡献是搭建了一个多语言文图生成模型的基石,使得更多使用不同语言的创作者可以通过 AltDiffusion 模型进行创作。
AltDiffusion 在多语言对齐方面表现非常出色,是目前市面上开源的最强多语言版本,保留了原版 Stable Diffusion的大部分能力,并且在某些例子上的表现比原版模型更出色 。
比如当用户给定不同语言的提示语(prompt),模型即可展现语言背后所反映的不同文化图像面貌,如直接生成不同人种的人物形象或不同的地域风物特征。
后文将展示 OneFlow 版 AltDiffusion 的性能表现以及生成图片,不少开发者好奇 OneFlow 使用了哪些优化“秘笈”,也将进行简要解读。
1
对比 PyTorch,OneFlow 将“AltDiffusion”推理速度提升 1 倍以上
下面的图表分别展示了在 A100 (PCIe 40GB / SXM 80GB),V100 ( SXM2 32GB ), RTX 3090,RTX 3080 Ti,RTX 2080和 T4 不同类型的 GPU 硬件上分别使用 PyTorch, 和 OneFlow 对 AltDiffusion 进行推理的性能表现。
可以看到,对于 A100 显卡,无论是 PCIe 40GB 的配置还是 SXM 80GB 的配置, OneFlow 的性能相比 PyTorch 能提升 1 倍以上,推理速度达到了 51it/s 以上,生成一张图片所需要的时间在 1 秒以内。
其他硬件性能数据:
综上,在各种硬件的对比中,对比 PyTorch, OneFlow 平均能将 AltDiffusion 的推理性能提升 1 倍左右。
2
生成图片展示
滔滔江水, 连绵不绝, 唯美, 插画
长城, 清晨, 朦胧, 唯美, 插画
梦回江南,中国古代小镇,唯美,插画
中国的未来城市, 科幻,插画
古代建筑, 白雪纷飞
巴黎铁塔下情侣
黑暗精灵公主,非常详细,幻想,非常详细,数字绘画,概念艺术,敏锐的焦点,插图
金发天使戴着兔耳朵发圈,非常详细,幻想,非常详细,数字绘画,概念艺术,敏锐的焦点,插图
用照相机拍照的可爱女孩,非常详细,幻想,非常详细,数字绘画,概念艺术,敏锐的焦点,插图
注:上述图片均基于 OneFlow 版AltDiffusion 生成
3
无缝兼容 PyTorch 生态
想体验 OneFlow 版的 AltDiffusion? 只需要修改两行代码:
之所以能这么轻松迁移模型,是因为 OneFlow Stable Diffusion 有两个出色的特性:
1. OneFlowAltDiffusionPipeline .from_pretrained 能够直接使用 PyTorch 权重;
2. OneFlow 本身的 API 和 PyTorch 对齐,因此 import oneflow as torch 之后, torch.autocast 、 torch.float16 等表达式完全不需要修改。
上述特性使得 OneFlow 兼容了 PyTorch 的生态,这不仅在 OneFlow 对 AltDiffusion 的迁移中发挥了作用,也大大加速了 OneFlow 用户迁移其它许多模型,比如在和 torchvision 对标的 flowvision 中,许多模型只需通过在 torchvision 模型文件中加入 import oneflow as torch 即可得到。
此外,OneFlow 还提供全局 “mock torch” 功能,在命令行运行 eval $(oneflow-mock-torch) 就可以让接下来运行的所有 Python 脚本里的 import torch 都自动指向 oneflow。
4
动静一体的编程体验
深度学习算法原型开发阶段需要快速修改和调试,动态图执行(Eager mode, define by run)最优。但在部署阶段,模型已经固定下来,计算效率变得更重要,静态图执行(Lazy mode,define and run)可以借助编 译器做静态优化来获得更好的性能。因此, 推理阶段主要使用静态图模式。
最近,PyTorch 升级到2.0引入了 compile() 这个API,可以把一个模型或一个Module从动态图执行变成静态图执行。 OneFlow里也有一个类似的机制,不过接口名是 nn.Graph() ,它可以把传入Module转成静态图执行模式。
不仅如此,OneFlow的nn.Graph模式基于MLIR实现了一系列计算图的图层优化 ,譬如内存布局、算子融合等。
这不仅使得计算图表示的深度学习模型可以在各种硬件上达到最高性能,更重要的是,使得深度学习框架导入的计算图更方便地在不同硬件之间实现迁移,有助于克服国产硬件软件生态薄弱的问题。
未来,我们将发布更多内容来揭示OneFlow深度学习编译器的设计和实现。
欢迎Star、运行 OneFlow 版 AltDiffusion:
https://github.com/Oneflow-Inc/diffusers/wiki/How-to-Run-OneFlow-Stable-Diffusion#without-docker
OneFlow 地址:
https://github.com/Oneflow-Inc/oneflow/
其他人都在看
欢迎Star、试用OneFlow最新版本:https://github.com/Oneflow-Inc/oneflow/
本文分享自微信公众号 - OneFlow(OneFlowTechnology)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ChatGPT 威胁?谷歌联合创始人下场“考察”聊天机器人代码
随着硅谷公司之间人工智能技术之战的升温,谷歌联合创始人谢尔盖·布林 (Sergey Brin)也于近日下场触及软件代码。 外媒 Forbes 指出,自 2019 年以来,谢尔盖·布林基本上没有参与谷歌的日常运作,1 月 24 日提交的代码访问请求似乎是他时隔多年来的第一次。谢尔盖·布林此次提交的请求与谷歌的大型自然语言对话模型 LaMDA 有关;该项目最初于 2021 年宣布,但最近随着其竞争对手 ChatGPT 的大热逐渐获得了更多关注。 具体而言,谢尔盖·布林提交了一份 changelist,旨在对配置文件进行更改以获取权限,从而得到训练 LaMDA 的数据。有数十名工程师提出了 LGTM (looks good to me) 批准请求,其中一些来自该团队以外的工作人员。对此,谷歌没有回应多项置评请求。 图源:GETTY IMAGES Forbes 认为,此举虽是一个小的技术变化,但突显了谷歌对来自 OpenAI 和其他竞争对手的迫在眉睫的威胁的重视程度。谢尔盖·布林和联合创始人拉里·佩奇 (Lawrence Edward Page)自 2019 年以来基本上不在公司,并将将大权交...
- 下一篇
如何又快又好实现 Catalog 系统搜索能力?火山引擎 DataLeap 这样做
摘要 DataLeap 是火山引擎数智平台 VeDI 旗下的大数据研发治理套件产品,帮助用户快速完成数据集成、开发、运维、治理、资产、安全等全套数据中台建设,降低工作成本和数据维护成本、挖掘数据价值、为企业决策提供数据支撑。 火山引擎 DataLeap 的 Data Catalog 系统通过汇总和组织各种元数据,解决了数据生产者梳理数据、数据消费者找数和理解数的业务场景,其中搜索是 Data Catalog 的主要功能之一。本文详细介绍火山引擎 DataLeap 的 Data Catalog 系统搜索功能的设计与实现。 背景 Data Catalog 能够帮助大公司更好地梳理和管理自己的资产,是 Data-drvien 公司的重要平台。一个通用的 Data Catalog 平台通常包含元数据管理,搜索,血缘,标签,术语等功能。其中,搜索是 Data Catalog 的入口功能,承担着让用户“找到数”的主要能力。在火山引擎 DataLeap 的 Data Catalog 系统中,每天有 70%以上的用户会使用搜索功能。 功能要求 业界主要的 Augmented Data Catalog ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启