MCP 已死？工程师实测揭示协议开销与替代方案-低调大师

MCP 已死？工程师实测揭示协议开销与替代方案

2026-06-01 49

MCP（Model Context Protocol）自诞生以来就被视为 AI 编码助手交互的事实标准，但Quandri工程团队最近的一篇博文提出了一个反直觉的结论：MCP的开销可能远超预期，有些场景下干脆用CLI更划算。

实测数据说话

先看数字。4个MCP服务器注册的工具定义就要消耗约21000个token，占用一个20万token上下文窗口的10.5%。而在查询Linear issue的场景中，通过MCP调用需要消耗约13000 token，用CLI方式只需要约200 token——差距高达65倍。这不是边缘场景的极端值，而是日常开发中反复发生的操作。

[ CLI approach: ~200 tokens ]
curl -s -H "Authorization: Bearer $LINEAR_TOKEN" \
  -H "Content-Type: application/json" \
  -d '{"query":"{ issue(id: \"ISSUE-ID\") { title state { name } assignee { name } } }"}' \
  https://api.linear.app/graphql

-> Prompt (curl command): ~50 tokens
-> Response: ~150 tokens

[ MCP approach: ~12,957 tokens ]
-> Tool definitions (always loaded): ~12,807 tokens (42 tools)
-> Tool call + response: ~150 tokens

Measurement: Tool Definition Sizes (Quandri Stack)

MCP Server	Tools	Estimated Chars	Estimated Tokens
Linear	42	~51,229	~12,807
Notion	14	~16,156	~4,039
Slack	12	~15,168	~3,792
Postgres	9	~1,755	~438
Total	77	~84,308	~21,077

除了token开销，响应延迟也是问题。实测MCP的调用速度比直接API调用慢约3倍。这在交互式编程场景下会直接影响开发体验。

所以问题出在哪？核心在于工具定义的暴露方式。当你连接多个MCP服务器时，所有工具的签名和描述都被塞进上下文——不管你当前是否需要。这意味着即使只用到其中一小部分工具，也要为全部工具付出token成本。

替代方案一：CLI优先策略

对于已经有成熟CLI工具的服务，直接调用CLI是更合理的选择。以GitHub CLI（gh）、PostgreSQL（psql）为例，它们没有额外的上下文开销、没有额外的延迟、人机使用方式一致、调试路径也清晰。把这些已有工具利用起来，远比为了"统一协议"而引入MCP更务实。

替代方案二：Skills模式

另一个思路是让工具指令在需要时才加载，而非提前全部注册。这就像去图书馆：你告诉管理员你要借什么书，管理员去取，而不是把整个图书馆的书架都摊在你面前。这种按需加载的模式能极大减少上下文占用，同时保持工具集的可发现性。

MCP仍然适用的场景

这不意味着MCP没有价值。对于没有CLI访问方式的服务、非技术用户的使用场景、需要对生产数据库进行查询安全限制的场合，MCP的抽象层仍然有意义。它的价值在于降低了连接"没有CLI接口的服务"的门槛，而不在于把一切连接都通过MCP来做。

Quandri自己的实践是：日常工具用Bash+CLI、需要可复用工作流时用Skills、需要连接没有强CLI的服务时才上MCP。三种方式各司其职，而非一种协议包打天下。

这个结论背后的工程哲学值得玩味：连接一切不等于教好一切。工具的价值不在于数量，而在于用得恰到好处。与其花时间配置MCP服务器，不如把时间花在让工具本身更好用上。

参考来源：https://www.quandri.io/engineering-blog/mcp-is-dead

微信关注我们

原文链接：https://www.oschina.net/news/450274

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

MiniMax M3 正式发布：前沿 Coding 能力、1M 上下文、原生多模态

MiniMax M3 今日正式发布。 MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了全新注意力架构 MSA （MiniMax Sparse Attention），最高支持 1M 超长上下文。它也是一个原生多模态模型，支持图片和视频的输入，并能操作电脑桌面。在衡量 Coding 能力的 SWE-Bench Pro 上，MiniMax M3 超过 GPT-5.5 和 Gemini 3.1 Pro，接近 Opus 4.7。在综合评估 SVG 生成性能的基准 SVG-Bench 上，MiniMax M3 超过 Opus 4.7。 Coding 与 Agent 能力是 M3...

2026-06-01

45

deepin 25.1.1 更新来啦！本次更新围绕系统安全、硬件兼容、桌面体验、AI 能力等方面进行了全面优化，包含多项功能改进、Bug及CVE漏洞修复，建议大家第一时间通过控制中心-系统更新或使用终端命令 sudo apt update && sudo apt dist-upgrade进行升级。 2026年6月1日更新说明 🔒 安全修复修复CVE-2026-6276（curl cookie 泄露）、systemd、CVE-2026-35385（OpenSSH）等高危漏洞；修复 inetutils、gnutls28、xorg-server、mesa、glibc、rsyn...

2026-06-01

44

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。