PyTorch 1.10 发布:包括 CUDA Graphs API、前端和编译器改进
PyTorch 1.10 现已发布,该版本包含了自 1.9 以来的 3400 多个 commit ,有 426 位贡献者参与更新。PyTorch 1.10 更新侧重于改进 PyTorch 的训练和性能以及开发人员的可用性。完整的发行说明可在此处获得。主要亮点内容包括:
- 集成了 CUDA Graphs API 以减少 CUDA 工作负载的 CPU 开销。
- FX、torch.special 和 nn.Module Parametrization 等几个前端 API 已从测试版变为稳定版。
- 除了 GPU 之外,JIT Compiler 中对自动融合的支持扩展到 CPU。
- Android NNAPI 支持现已进入测试阶段。
除了 PyTorch 1.10 外,PyTorch 团队还发布了针对 PyTorch 库的重大更新,点此查看关于库更新的详细消息。
PyTorch 版本中的功能分为稳定版 (Stable)、测试版 (Beta) 和原型版 (Prototype)。
(Beta) CUDA Graphs API 集成
PyTorch 现在集成了 CUDA Graphs API 以减少 CUDA 工作负载的 CPU 开销。
CUDA Graphs 大大降低了 CPU 绑定 cuda 工作负载的 CPU 开销,从而通过提高 GPU 利用率来提高性能。对于分布式工作负载,CUDA Graphs 还可以减少 jitter,并且由于并行工作负载必须等待最慢的工作负载,因此减少 jitter 可以提高整体并行效率。
集成允许 cuda graphs 捕获的网络部分与由于 graph 限制而无法捕获的网络部分之间的无缝互操作。
(Beta)CPU 融合
开发团队在 PyTorch 1.10 中为 CPU 添加了一个基于 LLVM 的 JIT compiler,可以将torch
库调用序列融合在一起以提高性能。这是 PyTorch 团队第一次将编译引入 CPU。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
XAMPP 发布 7.3.31、7.4.25 更新
XAMPP 发布更新了,官方为所有平台发布了支持最新 PHP 系列的 XAMPP 新版本。 用户可以从http://www.apachefriends.org/download.html下载这些新的安装程序。 安装包包含以下组件: 7.3.31-3 / 7.4.25-0 PHP 7.3.31 , 7.4.25 Apache 2.4.51 MariaDB 10.4.21 Perl 5.32.1 OpenSSL 1.1.1l (UNIX only) phpMyAdmin 5.1.1 XAMPP 是流行的 PHP 开发环境,也是一个易于安装的 Apache 发行版,其中包含 MariaDB、PHP 和 Perl。仅仅需要下载并启动安装程序即可,就是这么简单。
- 下一篇
smqtt 1.0.9 正式发布:高性能、开箱即用的 MQTT 消息代理
SMQTT 基于 Netty 开发,底层采用 Reactor 3 反应堆模型,支持单机、集群和容器化部署,具备低延迟、高吞吐量,支持百万 TCP 连接,同时支持多种协议交互、规则引擎,是一款非常优秀的消息中间件! smqtt 目前拥有的功能如下: 更新日志 新增系统事件类型 设备离线事件 设备在线事件
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Windows10,CentOS7,CentOS8安装Nodejs环境
- Linux系统CentOS6、CentOS7手动修改IP地址
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Red5直播服务器,属于Java语言的直播服务器