从 MCP 到 SKILL：关于 Agent 扩展机制的思考-低调大师

从 MCP 到 SKILL：关于 Agent 扩展机制的思考

2026-01-16 43

转自：https://weibo.com/1648815335/Qn8iCfNyt（微博：jolestar）

去年 MCP 爆火，大家一度有种感觉：只要把工具都接进来，AI Agent 就会“活”过来，像一个长了手脚的人，什么都能干。

如果把 LLM 看作大脑（智力引擎），tool call / function call 就像让它能指挥四肢：模型填参数，代码去执行，再把结果喂回去继续推理。

MCP（Model Context Protocol）把这套机制做成了“标准插头”：以前各家服务各自一套 SDK + API，你要给 Agent 封装工具，就得处理语言、依赖、鉴权、返回格式，复杂度会指数上升；MCP 的价值是把“接入”这件事工程化、标准化。

所以当时最乐观的推论很自然：只要 MCP 工具够多，Agent 就有无限多的手脚，什么都能干了。

但很快大家就撞墙了。

第一堵墙：容量瓶颈（上下文预算）

工具的定义本身要进入系统 prompt 或等价的工具上下文；工具越多，占用越多，留给“干活”的空间越少。于是你会看到一些很现实的限制：某些 AI coding 工具最多支持配置 100 个 tools，而一个 GitHub MCP 可能就带 50 多个。你想把世界都接进来，但大脑的工作台面就这么大。

第二堵墙：任务闭环瓶颈（组合性）

很多 MCP 的调用结果会被直接回填上下文。短结果当然舒服，长结果就会触发两个问题：要么上下文爆炸，要么被截断丢尾巴。

我在做 holon 的时候就踩过这个坑：让 AI 去处理 PR 的 review comments，如果 comments 一多，直接回填上下文就会被截断，结果总是漏修。后来反而退回到更“原始”的 GitHub CLI 会更稳——AI 先用 `gh` 把评论拉下来写成文件，再用 `grep`、`jq` 或简单脚本去筛选、聚合，只把必要的摘要喂回上下文继续推理。

这个过程让我意识到一个很基础、但之前容易被忽略的问题：上下文更适合承载决策信息，而不是当作数据存放层。文件、数据库、对象存储这些外部介质，天然支持分页、寻址和重复访问，更适合用来承接中间状态。当任务需要反复回看、局部筛选或增量处理时，把数据外部化，往往比把全文塞回上下文要可靠得多。

从这个角度看，MCP 暴露出来的瓶颈，并不完全在协议本身，而在于我们常常下意识地把它用成了“往上下文里塞数据”的通道，而不是“把能力接入到工作流里”的接口。

也正是在这样的背景下，SKILL 开始受到关注。

如果 SKILL 只是纯文本，它更像分层 prompt 的组织方式；但当它和命令行工具、脚本结合起来，它就不只是“提示词技巧”，而是一种场景化的工作流封装：同一类任务的步骤、产物、工具链、失败重试方式、输出格式，都被聚合在一起。普通用户可能搞不清 MCP 是干啥的，但他能理解“这个技能帮我把评论整理出来并逐条修复”。

从实现上看，这有点像“以前用胶水代码粘合工具”，现在用“自然语言 + LLM + Bash/脚本”来粘合工具。并且这种范式正在让 Prompt Engineering 转向 Skill Engineering。灵活性确实强了，但相比标准化的扩展，SKILL 还有许多未解决的问题。

安全性是第一个难题。Bash + 脚本这些工具主要是开发者用，大家多少有点风险识别能力；但当 Agent + SKILL 普及到普通用户后，安全问题会更严重。到那时候，“靠提醒小心”是没用的，Agent 环境得提供更强的沙箱隔离能力。

标准化是第二个难题。SKILL 天然是按场景聚合的，但也因此更依赖运行环境：目录结构怎么约定？中间产物放哪？状态如何保存与复用？如何跨端复制这套模式？如果这些问题不解决，SKILL 的能力很难跨环境复用，更像是绑定在某个系统里的私有插件。

说回 MCP，我并不觉得有了 SKILL，MCP 就没意义了。恰恰相反，我更倾向于一种分工：

MCP 解决“连接标准化”，SKILL 解决“工作流编排与状态外部化”。前者让能力能规模化接入，后者让任务能稳定闭环。

MCP 不一定要“由 Agent 直接调用并回填上下文”，它完全可以被 SKILL 里的脚本调用，让结果先落地为可寻址对象（文件/句柄/资源），再把摘要与索引回填给模型。这样上下文就回到它最擅长的位置：做决策、做推理、做取舍，而不是当缓存。

MCP、SKILL 仍处在早期阶段，只是 Agent 插件机制演化中的不同形态。当 Agent 开始承担复杂任务时，真正重要的已不再是能力本身，而是上下文、状态与执行边界如何被拆分和安放。

微信关注我们

原文链接：https://www.oschina.net/news/397108

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

美团开源 LongCat-Flash-Thinking-2601

美团 LongCat 团队对外发布并开源 LongCat-Flash-Thinking-2601，同步开放模型权重、推理代码与在线体验能力。根据介绍，作为已发布的 LongCat-Flash-Thinking 模型的升级版，LongCat-Flash-Thinking-2601在Agentic Search（智能体搜索）、Agentic Tool Use（智能体工具调用）、TIR（工具交互推理）等核心评测基准上，均达到开源模型 SOTA 水平。该模型尤其在工具调用上表现出卓越的泛化能力，在依赖工具调用的随机复杂任务中性能超越了 Claude，可大幅度降低真实场景下新工具的适配训练成本；同时它是首个完整开源并支持在线免费体验「重思考模式」的模型，同时启动 8 个大脑飞速运转，确保思考周全、决策可靠。模型会把思考过程拆成并行思考和总结归纳两步来做：并行思考阶段，模型会同时独立梳理出好几条推理路径，就跟人面对难题时会琢磨不同解法一个道理，还会特意保证思路的多样性，生怕漏掉最优解；总结归纳阶段，对多条路径进行梳理、优化与合成，并将优化结果重新输入，形成闭环迭代推理，推动思考持续深化。...

2026-01-16

50

近日，教育部官网正式发布《职业教育专业目录（2021年）（更新时间：2025年12月）》。其中，「开源技术应用」（专科）与「开源技术开发与应用」（本科）两项新专业入列，标志着开源教育首次以国家级专业形态纳入职业人才培养体系。「开源技术应用」专业（专科）「开源技术开发与应用」专业（本科）这件事的信号很清晰：开源不再只是「社群文化」或「工程习惯」，而是进入了国家职业教育的人才培养框架，开始以专业形态被组织、被评价、被规模化复制。这不仅是对开源价值的高度认可，也意味着高校、职校将迎来一轮系统化建设开源课程与实训体系的契机。作为国内领先的开源协作平台，Gitee 已就开源教育体系化建设全面准备就绪，能够为「开源专业」的建设提供从项目资源、平台能力到产教协同的全链路支持。开源专业入列，意味着什么？开源不再只是开发者的技能选项，而是进入「学历教育」体系的正式学科方向。这类专业的培养目标，已经不局限于掌握 Git 工具或代码协作技巧，而是指向更全面的开源工程能力：工程化协作能力：需求、任务、分支、提交、合并、评审、发布，一整套可复用流程开源合规能力：许可证选择与兼容、第三方依赖管...

2026-01-16

183

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。