基于 M5 MacBook Pro 进行本地 LLM 推理比云端贵多少？-低调大师

基于 M5 MacBook Pro 进行本地 LLM 推理比云端贵多少？

2026-05-18 62

独立开发者 William Angel 近日发布了关于在 Apple Silicon M5 MacBook Pro 上进行本地 LLM 推理的成本分析文章。这篇文章以具体数字回答了一个许多人关心的问题：用自己的 MacBook 跑本地模型，到底比调用云端 API 贵多少？

先看电费。在北弗吉尼亚地区，电价约为每千瓦时 0.18 美元。M5 MacBook Pro 在满载推理时功耗约为 50-100 瓦。以 100 瓦、0.18 美元/千瓦时计算，每小时电费约为 0.018 美元，一天约 0.48 美元。电费本身并不贵——每千瓦时不到 2 美分。

然后是硬件折旧。一台 14 英寸 M5 Max MacBook Pro，配备 64GB 内存，目前售价 4299 美元。如果这台设备使用 3 年，每年的硬件折旧约为 1433 美元；使用 5 年则每年 860 美元；使用 10 年每年 430 美元。将折旧分摊到每小时（假设每天运行 8 小时）：3 年约 0.16 美元/小时，5 年约 0.10 美元/小时，10 年约 0.05 美元/小时。电费在整个成本中只占很小一部分，硬件折旧才是大头。

关键变量是 token 吞吐量。William 在 M5 Max 上测试了 Gemma 4 31b 等较大模型，实际推理速度在 10-40 tokens/秒之间。以 10 tokens/秒计算，每小时可生成 36000 个 tokens；在 40 tokens/秒时，每小时可生成 144000 个 tokens。将这些数字代入成本计算：以 5 年使用期、40 tokens/秒的乐观估计，每百万 tokens 的成本约为 0.40-1.20 美元；以悲观估计（3 年使用期、10 tokens/秒），每百万 tokens 成本高达 1.61-4.79 美元。

相比之下，OpenRouter 上的 Gemma 4 31b 价格约为每百万 tokens 0.38-0.50 美元。这意味着在乐观情况下（设备使用 10 年、40 tokens/秒），本地推理和 OpenRouter 成本相当；但在悲观情况下（3 年使用期、10 tokens/秒），本地推理的成本是云端的约 10 倍。作者认为，对于典型使用场景，本地推理的成本大约是云端的 3 倍。

但成本只是一部分。速度差距同样显著。OpenRouter 上的部分 Gemma 4 提供商可以达到 60-70 tokens/秒，是 M5 Max 本地推理速度（10-20 tokens/秒）的 3-7 倍。对于一名有工资收入的员工来说，时间成本远大于 token 成本——花在等待本地推理的时间比省下来的 token 费用值钱得多。

作者最后指出了一个值得注意的事实：一台消费级设备能够运行接近 Anthropic Sonnet 性能水平的模型，这本身已经很不寻常了。即使成本是云端的 3 倍，本地推理提供了数据隐私、离线可用性和无速率限制等优势。对于需要处理敏感数据或在无网络环境工作的场景，这些价值可能超过成本差异。

来源：William Angel (https://www.williamangel.net/blog/2026/05/17/offline-llm-energy-use.html)

微信关注我们

原文链接：https://www.oschina.net/news/442117

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

OpenClaw 公布安全路线图，让 AI 助手变得可防御

OpenClaw 是一款可以在用户真实机器上读写文件、执行命令、安装插件、访问网络的 AI 个人助手助手。这样的能力容易被描述为"危险的"，但 OpenClaw 团队认为强大不等于盲目、不等于无边界、更不等于无法审计。近日，OpenClaw 官方发布了安全路线图，阐述了他们正在和即将实施的多层安全机制。文件系统安全是第一个战场。OpenClaw 运行在用户的本地机器上，理论上可以访问文档、代码库和照片。路径穿越是最常见的文件系统风险，但实际上这只是更大类问题的一个症状：代码以为自己在某个目录根下写入，但 symlink、绝对路径、压缩包解压或松散的路径拼接会导致越界写入。...

2026-05-18

71

腾讯发布了一份《全球青少年 AI + 小程序洞察报告》。2023 年 11 月，小程序教育平台正式对外开放。中小学生可以在微信里完成一个完整的小程序产品——从立项、设计、写代码、调用 AI，到最后真正发布、给别人用。报告指出，四年来该平台共有： 287,002 个小程序项目被创建 7,954 所学校、17,830 位老师、87,477 名学生参与其中。师生使用 AI 创作小程序，消耗 token 超过 50,000,000,000——这些"燃料"足够支撑人与 AI 完成约 375 万次日常对话。四届赛事的报名作品里，超过...

2026-05-18

49

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。