PyTorch 2.0 现已正式发布!
PyTorch 2.0 现已发布!
新版本包括稳定版的 Accelerated Transformers(以前称为 Better Transformers);Beta 功能包括:
- 使用 torch.compile 作为 PyTorch 2.0 的主要 API(有关 torch.compile 的全面介绍和技术概述,请访问 2.0 入门页面。)
- scaled_dot_product_attention 函数作为 torch.nn.functional 的一部分
- MPS 后端
- torch.func 模块中的 functorch API
- 以及 GPU 和 CPU 上各种推理、性能和训练优化功能的其他 Beta/Prototype 改进。
新功能的概括介绍:
- torch.compile 是 PyTorch 2.0 的主要 API,它包装并返回编译后的模型,torch.compile 是一个完全附加(和可选)的特性,因此 2.0 版本是 100% 向后兼容的。
- 作为 torch.compile 的基础技术,带有 Nvidia 和 AMD GPU 的 TorchInductor 将依赖 OpenAI Triton 深度学习编译器来生成高性能代码,并隐藏低级硬件细节。OpenAI Triton 生成的内核实现的性能,与手写内核和 cublas 等专门的 cuda 库相当。
- Accelerated Transformers 引入了对训练和推理的高性能支持,使用自定义内核架构实现缩放点积注意力 (SPDA)。API 与 torch.compile() 集成,模型开发人员也可以通过调用新的 scaled_dot_product_attention() 运算符,直接使用缩放的点积注意力内核。
- Metal Performance Shaders (MPS) 后端在 Mac 平台上提供 GPU 加速的 PyTorch 训练,并增加了对前 60 个最常用操作的支持,覆盖了 300 多个操作符。
- Amazon AWS 优化了基于 AWS Graviton3的 C7g 实例上的 PyTorch CPU 推理。与之前的版本相比,PyTorch 2.0 提高了 Graviton 的推理性能,包括对 Resnet50 和 Bert 的改进。
- 跨 TensorParallel、DTensor、2D parallel、TorchDynamo、AOTAutograd、PrimTorch 和 TorchInductor 的新原型功能和技术。
除了 PyTorch 2.0 ,PyTorch 官方还发布了 PyTorch 域库的一系列 beta 更新,包括那些在树中的库,以及包括 TorchAudio、TorchVision 和 TorchText 在内的独立库。TorchX 转向社区支持模式,正在发布更新。可以在该博客中找到更多详细信息。
PyTorch 2.0 官方发布公告中对 2.0 的每个新特性作了详细介绍。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Netty 4.1.90.Final 发布
Netty 4.1.90.Final 现已发布。Netty 是一个异步事件驱动的网络应用框架,主要用于可维护的高性能协议服务器和客户端的快速开发。 这是一个错误修复版本,但也包括一些性能改进。具体更新内容包括: 添加未通过验证的header name(#13209) 修复 non-String headers 的 HttpHeaders.names (#13219) 在常见的 hothttp 解码器路径中保存expensive volatile operations (#13224) 避免针对出站缓冲区进度的 promises 进行slow type checks (#13225) 实现 NonStickyEventExecutorGroup.inEventLoop (#13233) Native image:添加对 unix 域套接字的支持 (#13242) 使用 MacOS SDK 10.9 防止苹果公证失败 (#13253) 增加 errno 缓存并防止 IOOBE (#13254) 设置应用程序协议时不要重置 BSSLParameters (#13262) WebSocketC...
- 下一篇
OpenSSL 3.1 已发布
OpenSSL 3.1 正式发布了,OpenSSL 3.1 主要是对 OpenSSL 3.0 中可用功能的一个小型增量改进版本。 主要变化是: 符合 FIPS 140-3 的 FIPS 提供程序 3.1 版本的FIPS 提供程序已升级为符合 FIPS 140-3 标准。为了实现此合规性,需要对 FIPS 提供程序进行一些更改。 其中最重要的更改是: 某些算法包含在提供程序中,但不再被批准使用。包括三重 DES ECB、三重 DES CBC 和 EdDSA。出于向后兼容的原因,它们保留在 FIPS 提供程序中,但标有 fips=no 属性查询。这意味着所有需要 FIPS 合规性的应用程序都应该明确指定 fips=yes ,即使它们只加载了 FIPS 提供程序(通常通过配置或使用 EVP_default_properties_enable_fips() 函数) 现在每次加载模块时都会运行自检,而不是在安装模块时运行。由于 NIST 简化了自测过程,这些测试的运行速度比在 3.0 FIPS 提供程序中的运行速度快得多。 其他性能改进 重构 OSSL_LIB_CTX 代码以避免过度锁定 编码器...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS关闭SELinux安全模块
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Linux系统CentOS6、CentOS7手动修改IP地址
- Hadoop3单机部署,实现最简伪集群
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7,8上快速安装Gitea,搭建Git服务器