英特尔开源其 Python NPU 加速库
英特尔已将其 NPU 加速库 (intel-npu-acceleration-library) 在 Apache-2.0 协议下开源。这是一个 Python 库,旨在利用英特尔神经处理单元 (NPU) 的强大功能在兼容硬件上执行高速计算,从而提高应用程序的效率。
该库目前正处于积极开发状态。为了显着提高库的性能,项目团队正在努力实现一系列关键功能。其中已实现的包括支持 8 位量化、Float16 支持、torch.compile 支持和 Static shape inference。计划实现的有:
- 4 位量化和 GPTQ
- NPU-Native 混合精度推理
- BFloat16 (Brain Floating Point Format)
- LLM MLP horizontal fusion 实现
- MHA NPU 推理
- NPU/GPU 异构计算
- Paper
仓库页面上的 Python 代码示例还展示了在 NPU 上进行单矩阵乘法运算、为 NPU 编译模型,甚至在 NPU 上运行 Tiny-Llama 模型。
from intel_npu_acceleration_library.backend import MatMul import numpy as np inC, outC, batch = ... # Define your own values # Create both inputs X1 = np.random.uniform(-1, 1, (batch, inC)).astype(np.float16) X2 = np.random.uniform(-1, 1, (outC, inC)).astype(np.float16) mm = MatMul(inC, outC, batch, profile=False) result = mm.run(X1, X2)
更多详情可查看此处。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
深圳发布政策支持鸿蒙原生应用发展
深圳市工业和信息化局、深圳市政务服务和数据管理局联合印发《深圳市支持开源鸿蒙原生应用发展2024年行动计划》。 《行动计划》提出到2024年底,深圳市在鸿蒙原生应用发展上的具体目标包括: 深圳企业开发的鸿蒙原生应用软件数量占全国总量10%以上。 深圳政务服务、教育医疗、银行金融、交通运输、生活保障、文旅体育等各类垂直领域实现鸿蒙原生应用软件全覆盖,满足消费者"衣食住行、吃喝玩乐“应用软件所需。 深圳主要高校和培训机构开设鸿蒙原生应用软件开发培训课程,取得资质的鸿蒙开发者数量占全国总量15%以上,拥有鸿蒙开发资质的软件企业超千家。 建成2家以上以鸿蒙原生应用软件开发、应用企业为主的专业产业园。探索设立鸿蒙产业基金,推动各类政策性基金将鸿蒙原生应用软件企业作为投资重点之一。 推动鸿蒙生态创新中心稳健运营,提供鸿蒙原生应用展示推广、人才培养等公共服务。全球智慧物联网联盟正式落地运营,持续扩大鸿蒙原生应用国际影响力。
- 下一篇
vivo 在离线混部探索与实践
作者:来自 vivo 互联网服务器团队 本文根据甘青、黄荣杰老师在“2023 vivo开发者大会"现场演讲内容整理而成。公众号回复【2023 VDC】获取互联网技术分会场议题相关资料。 伴随 vivo 互联网业务的高速发展,数据中心的规模不断扩大,成本问题日益突出。在离线混部技术可以在保证服务质量的同时,极大的提升数据中心资源利用率,降低成本。混部技术涉及任务调度、资源隔离、运维观测等一系列技术难题,本文将介绍 vivo 在混部技术方面的实践和探索,为读者提供借鉴和参考。 一、在离线混部技术背景 1.1 为什么混部 数据中心运行的服务可以分为在线服务和离线任务两大类,它们具有不同的资源使用特征。 在线服务是指那些长时间运行、对时延非常敏感的服务,如电商、游戏等,在线服务的资源利用率存在明显的波峰波谷现象,平均利用率较低。离线任务是指那些运行周期短,有容错性,对实时性要求低的服务,如数据转换、模型训练等,离线任务在执行过程中资源利用率很高。 在混部之前,在线和离线都是分开独立部署,机器不共享,无法形成有效的资源互补,这导致数据中心整体资源利用率不高,却要不断购买新机器,造成了资源浪费。 ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS关闭SELinux安全模块
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作