NVIDIA / Arm /Intel 联合发布 FP8 标准化规范，作为 AI 的可交换格式-低调大师

NVIDIA / Arm /Intel 联合发布 FP8 标准化规范，作为 AI 的可交换格式

2022-10-01 667

NVIDIA、Arm 和英特尔共同撰写了一份白皮书《深度学习的 FP8 格式》，描述了 8 位浮点 (FP8) 规范。它提供了一种通用格式，可通过优化内存使用来加速 AI 开发，并适用于 AI 训练和推理。

此 FP8 规范有两个变体，E5M2 和 E4M3。

兼容性和灵活性

FP8 最大限度地减少了与现有 IEEE 754 浮点格式的偏差，并在硬件和软件之间实现了良好的平衡，以利用现有的实施、加速采用并提高开发人员的生产力。

E5M2 使用 5 位作为指数，2 位作为尾数，是一种截断的 IEEE FP16 格式。在需要以牺牲某些数值范围为代价来提高精度的情况下，E4M3 格式会进行一些调整，以扩展可使用四位指数和三位尾数表示的范围。

新格式节省了额外的计算周期，因为它只使用八位。它可用于 AI 训练和推理，无需在精度之间进行任何重铸。此外，通过最大限度地减少与现有浮点格式的偏差，它为未来的人工智能创新提供了最大的自由度，同时仍然遵守当前的规范。

高精度训练和推理

对 FP8 格式的测试显示，在广泛的用例、架构和网络中，精度与 16 位精度相当。变压器、计算机视觉和 GAN 网络的结果都表明，FP8 训练精度与 16 位精度相似，同时提供了显著的加速。

下图为语言模型 AI 训练测试：

下图为语言模型 AI 推理测试：

在 AI 行业常用的基准测试 MLPerf Inference v2.1中，NVIDIA Hopper 利用这种新的 FP8 格式在 BERT 高精度模型上实现了 4.5 倍的加速，在不影响准确性的情况下获得了更高的吞吐量。

标准化

NVIDIA、Arm 和 Intel 以开放、免许可的格式发布了此规范，以鼓励 AI 行业采用该规范。此外，该提案已提交给 IEEE。

通过这种可保持准确性的可互换格式，人工智能模型可以在所有硬件平台上一致且高效地运行，有助于推进人工智能技术的发展。

微信关注我们

原文链接：https://www.oschina.net/news/212362/nvidia-arm-and-intel-publish-fp8-specification

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

调查报告表明 WebAssembly 可能被过度炒作

HTTP Archive 发布了一份 2022 年度网络状态报告 Web Almanac，该报告结合了 HTTP Archive 的原始统计数据和趋势与 Web 社区的专业知识；其中包含 22 个章节，涵盖了页面内容、用户体验、发布和分发的各个方面。 HTTP Archive 是一个社区运行的项目，自 2010 年以来一直致力于研究 Web 是如何构建的；利用 WebPageTest 和 Lighthouse，每月测试大约 840 万个网站的元数据，并将其纳入公共 BigQuery 数据库中进行分析。这些网站是谷歌的 Chrome 用户体验报告所分析的网站，报告数据只基于最活跃的网站，其中所涵盖的网站也都是可公开访问且足够受欢迎的。2022 Web Almanac 网络年鉴则基于 2022 年 6 月的数据集。结论之一是“WebAssembly 没有被广泛使用，我们看到的不是使用量的增长，而是适度的收缩”。报告指出，网页中的 wasm（已编译的 WebAssembly 代码）数量很少。研究人员在 desktop 上发现了 3,204 个确认的 WebAssembly 请求，在移动端发...

2022-10-01

452

KPlayer 是什么 kplayer为你提供最小化成本搭建视频推流功能的工具，最优的推流方案OBS或其他软件依赖与xWindow或图形化界面的需要，不适合在服务端与云服务器上进行部署。KPlayer无需依赖图形化界面，您可以使用任意一款你喜欢的发行版本即可实现多视频资源无缝推流的方案。只需要定义您的配置文件，针对定制化的修改。即可达成想要的结果。并且可以24小时无人值守的方式运行它。点击这里查看更多使用文档：https://docs.kplayer.net 更新内容添加支持输入资源文件为文件夹类型，自动遍历文件夹下视频资源添加对 arm64 与 x86_64 的 docker 支持更好的适配 srt 推流协议修复交互式命令添加默认参数的问题修复通过 CLI 与 API 跳过适配资源无效的问题修复某些异常情况下程序假死的情况修复在某些发行版本上运行 kplayer 出现segmentation fault的异常情况添加程序异常崩溃退出时的错误信息捕获更新主程序插件配置版本为 v0.4.1，新增插件可订阅当前推流资源基础信息接口 github https://g...

2022-10-01

681

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。