LLVM 17 支持 Arm Neoverse-V2 调度模型,提升 AArch64 二进制文件性能
LLVM/Clang 17 是一个开源的编译器套件,它可以为多种平台和架构生成优化的代码。最近,LLVM 17 在 Git 仓库中添加了一个重要的特性:针对 Arm Neoverse-V2 处理器核心的调度模型。
Arm Neoverse-V2 是 Arm 公司推出的一款面向服务器市场的高性能处理器,旨在提供最佳的性能和成本效益。Arm 公司去年宣布了 Neoverse-V2 的计划,并且在开源编译器和其他组件中开始提交相关的补丁,为未来基于 Neoverse-V2 平台的服务器硬件做好准备。
调度模型是编译器在生成代码时考虑处理器的微架构特征,如指令延迟、流水线阶段、功能单元等,从而优化指令顺序和资源利用率的一种机制。一个合适的调度模型可以显著提高二进制文件在目标处理器上的运行效率。
在此之前,LLVM 17 针对 Neoverse-V2 的目标只是使用了 Neoverse-N2 的调度模型,而 Neoverse-N2 是另一款 Arm 的服务器处理器,与 Neoverse-V2 有一定的差异。现在,LLVM 17 根据 Neoverse-V2 的软件优化指南,添加了一个专门针对 Neoverse-V2 的调度模型。这意味着 LLVM/Clang 17 可以更好地适应 Neoverse-V2 的核心特性,为其生成更高效的 AArch64 二进制文件。
LLVM/Clang 17 预计将于今年九月发布稳定版本。届时,我们将可以看到基于 LLVM/Clang 17 编译的软件在 Neoverse-V2 平台上的表现。
相关链接、相关信息来源:
[1]: https://www.phoronix.com/news/LLVM-17-Neoverse-V2-Sched-Model "LLVM 17 Lands Arm Neoverse-V2 Scheduling Model - Phoronix"
[2]: https://twitter.com/phoronix/status/1669305518991572992 "Phoronix on Twitter: \"#LLVM 17 Lands #Arm Neoverse-V2 Scheduling Model\""
[3]: https://lists.llvm.org/pipermail/llvm-commits/Week-of-Mon-20220704/1054520.html "[PATCH] D128631: [AArch64] Initial sched model for Neoverse N2"

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
W3C 推出新的网络标准,提升在线支付的安全性
网络支付是现代电子商务的重要组成部分,但也面临着欺诈和认证的挑战。为了解决这些问题,万维网联盟(W3C)正在开发一种新的网络标准,可以与苹果支付、谷歌支付等其他支付服务协同工作,增加在线支付的安全性和便利性。 这种新的网络标准被称为安全支付确认(SPC),它可以让商家、银行、支付服务提供商和卡网络等各方减少强客户认证(SCA)的障碍,并生成用户同意的加密证明。这些因素对于满足欧洲支付服务指令(PSD2)等法规要求至关重要。 为了应对在线支付欺诈的日益增长,欧洲和其他地区都制定了多因素认证的要求,以保护某些支付场景。虽然多因素认证有效地降低了欺诈风险,但它也增加了结账过程的复杂性,可能导致客户放弃购物车。 安全支付确认在网络认证的基础上增加了一个额外的“用户同意”的层次。在交易过程中,SPC会通过浏览器控制的“交易对话框”提示用户同意支付条款。用户的FIDO认证器会对交易细节进行签名,从而让银行或相关方可以密码学地验证认证结果。密码学验证确保用户确实同意了支付条款,符合欧洲支付服务指令2(PSD2)下的“动态链接”的概念。 W3C网络支付工作组从2019年开始开发安全支付确认,旨在满足强...
- 下一篇
“真正开放”大模型 Falcon 登陆 Hugging Face 生态
引言 Falcon 是由位于阿布扎比的 技术创新研究院 (Technology Innovation Institute, TII) 创建的一系列的新语言模型,其基于 Apache 2.0 许可发布。值得注意的是,Falcon-40B 是首个“真正开放”的模型,其能力可与当前许多闭源模型相媲美。这对从业者、爱好者和行业来说都是个好消息,因为“真开源”使大家可以毫无顾忌地基于它们探索百花齐放的应用。 本文,我们将深入探讨 Falcon 模型: 首先探讨它们的独特之处,然后 展示如何基于 Hugging Face 生态提供的工具轻松构建基于 Falcon 模型的多种应用 (如推理、量化、微调等) 。 目录 Falcon 模型 演示 推理 评估 用 PEFT 微调模型 总结 Falcon 模型 Falcon 家族有两个基础模型: Falcon-40B 及其小兄弟 Falcon-7B。40B 参数模型目前在 Open LLM 排行榜 中名列前茅,而 7B 模型在同等参数量的模型中表现最佳。 运行 Falcon-40B 需要约 90GB 的 GPU 显存 —— 虽然还是挺多的,但比 LLaMA-...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址