探讨深度学习框架在端侧OS中的角色
5月24日,OSC源创会第113期活动在上海成功举办,本期活动以《LLM与操作系统:协同进化》为主题。百度飞桨硬件生态产品负责人王凯发表《探讨深度学习框架在端侧OS中的角色》主题演讲。
首先从市场与技术双重维度分析,王凯指出,当前端侧部署工具呈现开源与硬件专用方案并行的格局。开源方案如MLC-LLM (TVM) 和 llama.cpp,凭借轻量化设计、广泛的硬件覆盖(支持CPU/GPU)、丰富的量化方案以及在PC端的优秀体验,展现出强大的生态属性,为用户提供了开箱即用的便利。而另一方面,硬件巨头纷纷推出专用方案以最大化利用其硬件潜能:Intel的BigDL-LLM 可调用专用神经网络加速核;Apple的CoreML/MLX 能高效利用苹果NPU;高通的QNN-HTP 及其AI Hub、联发科的NeuroPilot 及其Model Hub,均专注于调用自家HTP/APU加速内核,并通过构建模型库和集成框架,打通从模型到推理的闭环体验。成功的端侧生态策略在于提供多硬件、多模型支持,充分借助生态力量扩大规模、提升体验、拓展场景,并通过对接或自建关键模型库,结合硬件市场份额和更优性能形成正反馈循环。
在端侧性能方面,王凯强调了几个关键点:普遍采用int4数据类型以降低模型体积和计算需求;开源方案依赖CPU/GPU运行可能面临功耗挑战;闭源方案则能通过如“投机解码器(lookahead decoder)”等创新方法,实现高达30-50%的额外性能提升。目前业界普遍认为,端侧推理速度达到每秒20个token(20 tok/s)即可满足流畅使用的体验要求。
王凯重点展示了当前大模型在端侧设备上的丰富应用场景,这些场景的核心价值在于本地化处理带来的隐私保护、低延迟和离线可用性:
-
生产力与辅助功能: 如轻量级模型(如Phi-Silica)驱动的PC端应用提升效率;为视障用户提供的本地文本转语音服务;实时生成音频视频字幕,提升听障用户的可访问性。
-
智能交互与理解: 功能有限的离线语音助手执行本地语音命令或回答简单问题;设备上的情绪分析,本地解析邮件或文档语气保障隐私;安全语音搜索在本地文件或数据库中检索;智能听写软件利用本地上下文理解进行纠错。
-
语言处理: 实时语言翻译无需网络连接;离线场景下的正确书写辅助与长文档本地摘要,确保用户快速掌握要点;个性化的语言学习工具提供本地词汇建议和翻译。
展望未来,王凯指出了巨大的机遇所在。现有硬件方案虽在持续优化,但仍可能限制端侧大模型想象力的边界。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
AI 浪潮下的操作系统及其生态演进
5月24日,华东师范大学副教授,畅销书《计算机科学之美》作者李昌龙在 OSC 源创会上海站带来《AI 浪潮下的操作系统及其生态演进》主题演讲。作为兼具学界研究与产业经验的系统软件专家,李昌龙从技术演进、科研突破到人文思考,为现场观众呈现了一场关于智能时代操作系统变革的深度剖析。 李教授指出,当前计算机的三大核心能力正经历深刻变革:以LLM为代表的AI技术正接管人类决策权;VR/脑机接口重构人机信息传递模式;无人机/eVTOL则拓展了机器的物理交互边界。这种变革催生了"具身智能"与"离身智能"的双轨发展——前者通过无人机、机器人重塑交通与家居场景,后者以LLM赋能千行百业,共同推动2025-2035年成为AI普惠化的关键十年。 面对技术浪潮,李教授团队勾勒出操作系统进化的三维图景:在智能化维度,内核设计正从资源导向转向用户体验导向,其研发的Archer内存压缩技术首创关联规则挖掘算法动态调整压缩粒度,攻克AR/VR场景内存瓶颈;ICE智能冻结技术通过内存与进程管理的联合设计,在资源受限设备提升50%流畅度。在乐高化方向,团队打破单设备局限实现跨终端协同,LegoSwap内...
- 下一篇
开箱即用AI力! 华为云MaaS解锁DeepSeek-R1-0528超能推理
小更新,大智慧,新版DeepSeek-R1-0528模型正式开源,该模型在数学推理、代码生成等关键能力上实现显著突破,已成为开源领域高性能推理模型的新标杆。目前华为云已针对该模型完成了基于昇腾AI云服务的深度适配与优化,并正式上线华为云ModelArts Studio 大模型即服务平台(MaaS)。 DeepSeek-R1-0528性能突破:开源推理新巅峰 多领域SOTA表现:在数学推理、代码生成、逻辑推理等多个核心基准测试中,展现出开源模型当前最先进(SOTA)的性能水平。 开放与兼容:模型架构保持原模型架构一致,保持全量权重MIT 许可,对开发者保持零门槛,保证兼容性与易用性。 昇腾优化效能:得益于昇腾AI云服务的全栈优化,该模型在华为云平台上实现了高推理效率和资源利用率,助力企业大幅降低推理成本。 华为云持续投入AI基础技术创新,昇腾AI云服务的目标是为业界提供性能卓越、稳定可靠、成本优化的AI算力平台。DeepSeek-R1-0528的成功上线与优化,是华为云在推动大模型技术普惠化、助力企业高效落地方向的坚定承诺。 百模千态:模型开箱即用,降本增效 华为云MaaS平台,作为...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- MySQL8.0.19开启GTID主从同步CentOS8