AI PC 新突破 端侧首次支持 128K 上下文窗口 实现 2.2 倍推理优化
面壁智能正式发布并开源了「面壁小钢炮」端侧系列最新力作——MiniCPM 4.0 模型,实现了端侧可落地的系统级软硬件稀疏化的高效创新。英特尔与面壁智能从模型开发阶段就紧密合作,实现了长短文本多重推理效率的提升,端侧AI PC在Day 0全面适配,128K长上下文窗口等多方面突破。
双方开展了深度技术协同,基于英特尔硬件架构定制投机解码配置。通过硬件感知的草稿模型优化策略,结合英特尔加速套件与KV Cache内存增强技术,实现端到端推理效率的2.2倍提升1,携手为业界带来了全新的模型创新和端侧性能体验。
此次,面壁推出的MiniCPM 4.0系列LLM模型拥有 8B、0.5B 两种参数规模,针对单一架构难以兼顾长、短文本不同场景的技术难题,MiniCPM 4.0-8B采用「高效双频换挡」机制,能够根据任务特征自动切换注意力模式:在处理高难度的长文本、深度思考任务时,启用稀疏注意力以降低计算复杂度,在短文本场景下切换至稠密注意力以确保精度,实现了长、短文本切换的高效响应。
目前,具有CPU、GPU、NPU三个AI运算引擎的英特尔酷睿Ultra处理器已迅速对此适配,并借助OpenVINO™ 工具套件为MiniCPM 4.0系列模型提供优化的卓越性能表现。英特尔再次在NPU上对模型发布提供第零日(Day 0)支持,为不同参数量模型和应用场景提供更多样化的、更有针对性的平台支持。
* 上述测试评估了在int4混合精度和fp16精度设置下1K输入的首词元延迟和平均吞吐量。每项测试在预热阶段后执行三次,选取平均值作为报告数据。性能结果基于以下SKU1或SKU2配置2
在长上下文窗口的技术创新方面,英特尔也有了新的突破。依托分块稀疏注意力机制,结合深度算子融合与硬件驱动的算法优化,实现了长文本缓存的大幅锐减,和推理效率的进一步提升。 在保证输出质量的前提下,我们首次在基于英特尔锐炫™ Pro B60上将长上下文窗口扩展至128K。相较于稠密模型,首Token延迟降低了38%3,Token速率提升多达3.8倍3。经过这样的提升,一整部300多页的哈利波特小说,可以在90秒内完成阅读、分析和总结。这不仅极大地提升了AI PC的用户体验,也为解锁更多端侧AI新应用建立了强大的基础。未来,英特尔将持续保持与面壁的深度合作和协同研发,进一步提升长上下文窗口应用的性能。
对128K的文本输入进行处理的效果请参考视频演示。
MiniCPM Video CN Final
在当今数字化时代,人工智能技术正以前所未有的速度发展,英特尔作为全球领先的科技企业和AI PC的发起和倡导者,始终致力于推动端侧AI模型的创新发展。
此次合作不仅彰显了英特尔在AI领域的强大技术实力,也体现了其对创新生态系统的坚定承诺。通过整合双方的技术优势和资源,英特尔平台和MiniCPM 4.0系列模型联合解决方案的广泛应用和落地部署已经奠定了坚实的基础,有望在智能生活、生产力提升等多个场景中发挥关键作用。
展望未来,英特尔将继续与面壁智能保持紧密合作,同时积极拓展合作关系,不断探索AI技术的新边界。英特尔致力于通过持续创新,推动人工智能技术的普及与发展,构建更加智能、高效的未来社会。
快速上手指南 (Get Started)
- 参考代码:https://blog.csdn.net/inteldevzone/article/details/148473561
- llm-chatbot notebook:https://github.com/openvinotoolkit/openvino_notebooks/tree/latest/notebooks/llm-chatbot
- GenAI API:https://github.com/openvinotoolkit/openvino.genai
- 魔搭社区OpenVINO™专区:https://www.modelscope.cn/organization/OpenVINO
- OpenVINO™ Model Hub:https://www.intel.com/content/www/us/en/developer/tools/openvino-toolkit/model-hub.html
1基于SD Eagle2 优化前与优化后,2nd token推理速度的提升
2SKU 1 (Intel® Core™ Ultra 7 258V) Brand: Intel, OEM: Lenovo, Model: Yoga Air 15s ILL9, CPU: Core Ultra 7-258V, Memory: 32GB LPDDR5-8533MHz, Storage: WD PC SN740 1TB, OS: Windows 11, OS Version: 24H2 (26100.4061), Graphics: Intel Arc 140V GPU, Graphics Driver Version: 32.0.101.6790, Resolution: 2880 x 1800 200% DPI, NPU Driver:32.0.100.4023, Software Version: Openvino 2025.2.0-dev20250520, Openvino-genai 2025.2.0.0-dev20250520
SKU2 (Intel® Core™ Ultra 9 285H) Brand: Intel, OEM: Lenovo, Model: Ideapad Pro 5 16IAH10, CPU: Core Ultra 9-285H, Memory: 32GB LPDDR5-8533MHz, Storage: Kioxia KBG60ZNT1T02 1TB, OS: Windows 11, OS Version: 24H2 (26100.4061), Graphics: Intel Arc 140T GPU, Graphics Driver Version: 32.0.101.6790, Resolution: 2880 x 1800 200% DPI, NPU Driver:32.0.100.4023, Software Version: Openvino 2025.2.0-dev20250520, Openvino-genai 2025.2.0.0-dev20250520
3基于Spare Attention优化前与优化后,输入128K长文本,1st token加载时间缩短 与 2nd token 推理速度的提升
©英特尔公司,英特尔、英特尔logo及其它英特尔标识,是英特尔公司或其分支机构的商标。文中涉及的其它名称及品牌属于各自所有者资产。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
容器安全加固实战-防御 Kubernetes 集群漏洞的五大策略
随着云原生技术的普及,Kubernetes已成为容器编排的事实标准,但随之而来的安全威胁也日益严峻。本文将深入剖析Kubernetes集群常见漏洞类型,并提供经过实战验证的五层防御体系,帮助企业构建从镜像构建到运行时保护的完整容器安全防线。 容器安全加固实战-防御Kubernetes集群漏洞的五大策略 一、容器安全威胁全景图:Kubernetes集群的致命弱点 现代Kubernetes集群面临的安全威胁呈现多元化特征,从脆弱的容器镜像到配置错误的RBAC(基于角色的访问控制)策略都可能成为攻击入口。2023年CNCF安全报告显示,78%的容器逃逸事件源于未打补丁的基础镜像,而过度宽松的服务账户权限导致43%的横向移动攻击。值得注意的是,容器运行时(如containerd、CRI-O)的零日漏洞可能让攻击者突破隔离边界,去年曝出的runc容器逃逸漏洞CVE-2021-30465就影响了数百万容器实例。企业需要建立覆盖镜像供应链、网络策略、API访问控制等多维度的防御矩阵,才能有效应对这些容器安全挑战。 二、黄金镜像构建法则:从源头扼杀漏洞 构建安全容器镜像需要遵循"最小化原则",这意味着...
- 下一篇
SmolVLA: 让机器人更懂 “看听说做” 的轻量化解决方案
🧭 TL;DR 今天,我们希望向大家介绍一个新的模型: SmolVLA ,这是一个轻量级 (450M 参数) 的开源视觉 - 语言 - 动作 (VLA) 模型,专为机器人领域设计,并且可以在消费级硬件上运行。 SmolVLA https://hf.co/lerobot/smolvla_base 仅使用开源社区共享的数据集进行预训练,数据集标签为 lerobot 。 https://hf.co/datasets?other=lerobot&sort=trending SmolVLA-450M 的表现优于许多更大的 VLA 模型,并且在仿真任务 (LIBERO,Meta-World) 和实际任务 ( SO100, SO101 ) 上超过了强基线模型,如 ACT 。 https://github.com/TheRobotStudio/SO-ARM100 https://hf.co/papers/2401.02117 支持异步推理,可提供30% 更快的响应和2 倍的任务吞吐量。 相关链接: 用于训练和评估 SO-100/101 的硬件: https://github.com/TheR...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Linux系统CentOS6、CentOS7手动修改IP地址
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8编译安装MySQL8.0.19
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长