探讨深度学习框架在端侧OS中的角色-低调大师

探讨深度学习框架在端侧OS中的角色

2025-05-30 254

5月24日，OSC源创会第113期活动在上海成功举办，本期活动以《LLM与操作系统：协同进化》为主题。百度飞桨硬件生态产品负责人王凯发表《探讨深度学习框架在端侧OS中的角色》主题演讲。

首先从市场与技术双重维度分析，王凯指出，当前端侧部署工具呈现开源与硬件专用方案并行的格局。开源方案如MLC-LLM (TVM) 和 llama.cpp，凭借轻量化设计、广泛的硬件覆盖（支持CPU/GPU）、丰富的量化方案以及在PC端的优秀体验，展现出强大的生态属性，为用户提供了开箱即用的便利。而另一方面，硬件巨头纷纷推出专用方案以最大化利用其硬件潜能：Intel的BigDL-LLM 可调用专用神经网络加速核；Apple的CoreML/MLX 能高效利用苹果NPU；高通的QNN-HTP 及其AI Hub、联发科的NeuroPilot 及其Model Hub，均专注于调用自家HTP/APU加速内核，并通过构建模型库和集成框架，打通从模型到推理的闭环体验。成功的端侧生态策略在于提供多硬件、多模型支持，充分借助生态力量扩大规模、提升体验、拓展场景，并通过对接或自建关键模型库，结合硬件市场份额和更优性能形成正反馈循环。

在端侧性能方面，王凯强调了几个关键点：普遍采用int4数据类型以降低模型体积和计算需求；开源方案依赖CPU/GPU运行可能面临功耗挑战；闭源方案则能通过如“投机解码器（lookahead decoder）”等创新方法，实现高达30-50%的额外性能提升。目前业界普遍认为，端侧推理速度达到每秒20个token（20 tok/s）即可满足流畅使用的体验要求。

王凯重点展示了当前大模型在端侧设备上的丰富应用场景，这些场景的核心价值在于本地化处理带来的隐私保护、低延迟和离线可用性：

生产力与辅助功能：如轻量级模型（如Phi-Silica）驱动的PC端应用提升效率；为视障用户提供的本地文本转语音服务；实时生成音频视频字幕，提升听障用户的可访问性。
智能交互与理解：功能有限的离线语音助手执行本地语音命令或回答简单问题；设备上的情绪分析，本地解析邮件或文档语气保障隐私；安全语音搜索在本地文件或数据库中检索；智能听写软件利用本地上下文理解进行纠错。
语言处理：实时语言翻译无需网络连接；离线场景下的正确书写辅助与长文档本地摘要，确保用户快速掌握要点；个性化的语言学习工具提供本地词汇建议和翻译。

展望未来，王凯指出了巨大的机遇所在。现有硬件方案虽在持续优化，但仍可能限制端侧大模型想象力的边界。

微信关注我们

原文链接：https://my.oschina.net/u/4489239/blog/18515787

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

AI 浪潮下的操作系统及其生态演进

5月24日，华东师范大学副教授，畅销书《计算机科学之美》作者李昌龙在 OSC 源创会上海站带来《AI 浪潮下的操作系统及其生态演进》主题演讲。作为兼具学界研究与产业经验的系统软件专家，李昌龙从技术演进、科研突破到人文思考，为现场观众呈现了一场关于智能时代操作系统变革的深度剖析。李教授指出，当前计算机的三大核心能力正经历深刻变革：以LLM为代表的AI技术正接管人类决策权；VR/脑机接口重构人机信息传递模式；无人机/eVTOL则拓展了机器的物理交互边界。这种变革催生了"具身智能"与"离身智能"的双轨发展——前者通过无人机、机器人重塑交通与家居场景，后者以LLM赋能千行百业，共同推动2025-2035年成为AI普惠化的关键十年。面对技术浪潮，李教授团队勾勒出操作系统进化的三维图景：在智能化维度，内核设计正从资源导向转向用户体验导向，其研发的Archer内存压缩技术首创关联规则挖掘算法动态调整压缩粒度，攻克AR/VR场景内存瓶颈；ICE智能冻结技术通过内存与进程管理的联合设计，在资源受限设备提升50%流畅度。在乐高化方向，团队打破单设备局限实现跨终端协同，LegoSwap内...

2025-05-30

393

小更新，大智慧，新版DeepSeek-R1-0528模型正式开源，该模型在数学推理、代码生成等关键能力上实现显著突破，已成为开源领域高性能推理模型的新标杆。目前华为云已针对该模型完成了基于昇腾AI云服务的深度适配与优化，并正式上线华为云ModelArts Studio 大模型即服务平台（MaaS)。 DeepSeek-R1-0528性能突破：开源推理新巅峰多领域SOTA表现：在数学推理、代码生成、逻辑推理等多个核心基准测试中，展现出开源模型当前最先进（SOTA）的性能水平。开放与兼容：模型架构保持原模型架构一致，保持全量权重MIT 许可，对开发者保持零门槛，保证兼容性与易用性。昇腾优化效能：得益于昇腾AI云服务的全栈优化，该模型在华为云平台上实现了高推理效率和资源利用率，助力企业大幅降低推理成本。华为云持续投入AI基础技术创新，昇腾AI云服务的目标是为业界提供性能卓越、稳定可靠、成本优化的AI算力平台。DeepSeek-R1-0528的成功上线与优化，是华为云在推动大模型技术普惠化、助力企业高效落地方向的坚定承诺。百模千态：模型开箱即用，降本增效华为云MaaS平台，作为...

2025-05-30

430

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。