告别提示词工程,「上下文工程」才是 AI Agent 的核心竞争力
编者按: 什么样的技能才能真正决定 AI 智能体的成败?是更复杂的算法,还是更精妙的提示词?我们今天为大家带来的文章,作者的观点是:构建强大 AI 智能体的关键已从"提示词工程"转向"上下文工程"。
文章从"上下文"的广义定义出发,详细拆解了影响 AI 决策的七大关键要素,包括系统指令、用户输入、历史对话、长期记忆、外部检索信息、可用工具及输出结构。通过对比"廉价演示项目"与"神奇智能体"的案例,作者生动展现了上下文质量如何决定 AI 的表现 ------ 真正的差距不在于模型本身,而在于是否提供了恰当的上下文支持。作者进一步提出,上下文工程是一套动态流程,需跨领域协作,以结构化的方式整合业务需求与技术实现,确保 LLM 在正确的时间获得正确的信息与工具。
作者 | Philipp Schmid
编译 | 岳扬
上下文工程(Context Engineering)是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从"提示词工程"(prompt engineering)转向一个更广泛、更强大的概念:上下文工程(Context Engineering)。托比·卢克(Tobi Lutke)[1]将其描述为"为任务提供完整的上下文背景,使大语言模型能够合理解决问题的一门艺术",他说得很到位。
随着 Agents 的兴起,将哪些信息输入"有限的工作记忆(limited working memory)"中变得越来越重要。我们观察到,决定一个 Agent 成败的关键因素,通常就在于你提供给它的上下文质量。大多数 Agent 的失败早已不是模型本身的问题,而恰恰是上下文供给的失败。
01 什么是上下文(Context)?
要理解上下文工程(Context Engineering),我们首先必须扩展对"上下文"的定义。它不仅指你发送给 LLM 的单一提示词(prompt)。应该将其视为模型在生成响应前所看到的一切信息。
- 指令 / 系统提示词(Instructions / System Prompt) : 用于定义模型在对话期间行为的初始指令集,可以/应该包含示例、规则等。
- 用户提示词(User Prompt) : 来自用户的即时任务或问题。
- 状态 / 历史(短期记忆)[State / History (short-term Memory] : 当前的对话内容,包括导致此刻结果的"用户与模型的历史回复"。
- 长期记忆(Long-Term Memory) : 在之前的多次对话中收集的持久性知识库,包含学习到的用户偏好、过往对话摘要、或被明确告知需要记忆以备后续使用的信息。
- 检索信息(RAG)[Retrieved Information (RAG)] : 外部的、最新的知识,来自文档、数据库或 API 的相关信息,用于回答特定问题。
- 可用工具(Available Tools) : 所有可调用函数或内置工具的标准化描述(如输入参数、输出格式、功能说明)(例如 check_inventory, send_email)。
- 结构化输出(Structured Output) : 对模型响应格式的定义,例如一个 JSON 对象。
02 为什么重要?从「廉价的演示项目」到「神奇的智能体产品」
构建真正高效的 AI 智能体的秘诀,与你编写代码的复杂程度关系不大,而与你提供上下文的质量息息相关。
构建智能体,与你编写的代码或使用的框架关系不大。 一个廉价的演示项目和"神奇的智能体"之间的区别,就在于你所提供上下文的质量。假设让一个 AI 助手根据一封简单的邮件来安排会议:
Hey, just checking if you're around for a quick sync tomorrow.
嘿,想问一问明天方不方便,我们快速碰个头?
"廉价的智能体演示项目"的上下文质量很差。它只看到用户的请求,其他什么都看不到。它的代码可能功能完善,它会调用 LLM 并获得响应,但输出的内容却毫无帮助,且充满机械感:
Thank you for your message. Tomorrow works for me. May I ask what time you had in mind?
感谢来信!明天我有空。你想约在几点?
"神奇的智能体"则由丰富的上下文驱动。其代码的主要任务并非琢磨如何回应,而是收集 LLM 所需的信息,以便更好地响应用户需求。在调用 LLM 之前,你可以扩展上下文,使其包含:
- 你的日历信息(显示你日程已满)。
- 你与此人的过往邮件(用于确定合适的非正式语气)。
- 你的联系人列表(用于识别 ta 为关键的合作伙伴)。
- send_invite 或 send_email 工具。
然后便能生成回应:
Hey Jim! Tomorrow's packed on my end, back-to-back all day. Thursday AM free if that works for you? Sent an invite, lmk if it works.
嗨 Jim!明天我这边日程全排满了,从早到晚连轴转。周四上午有空,你看行不?邀请已发,确认下是否合适~
这种神奇的效果并非源于更聪明的模型或更精巧的算法,而在于为正确的任务提供了恰当的上下文。这就是为什么上下文工程(Context Engineering)非常重要。智能体的失败并非仅仅是模型的失败,本质上是上下文的缺失。
03 从提示词工程到上下文工程
什么是上下文工程?如果说"提示词工程(prompt engineering)"侧重于在单个文本字符串中精心设计一套完美的指令,那么上下文工程(context engineering)的范畴则宽广得多。简而言之:
上下文工程是一门设计和构建动态系统的学科,它能以正确的格式、在正确的时间提供正确的信息与工具,赋予 LLM 完成任务所需的一切资源。
上下文工程是
- 一套流程,而非某些字符串:上下文不仅是一个静态的提示词模板。它是主 LLM 调用前系统运行所产生的输出。
- 动态构建的:随任务即时生成,适配用户当下的需求。对某个请求,其上下文可能是日历数据,对另一请求,上下文则可能是邮件记录或网页搜索结果。
- 在正确的时间提供正确的信息和工具:其核心职责是确保模型不遗漏关键细节(Garbage In, Garbage Out)。这意味着只有在必需且有帮助时才提供知识(信息)与能力(工具)。
- 注重呈现格式:如何呈现信息很重要。简明扼要的摘要胜过原始数据的堆砌,清晰的工具架构胜过模糊的指令。
04 Summary
构建强大且可靠的 AI 智能体,已经不再需要寻找神奇的提示词或更新模型版本。其核心在于上下文工程,即以正确的格式、在正确的时间提供正确的信息与工具。这是一项跨领域协作的挑战,需要理解业务场景、定义预期输出,并结构化组织所有必要的信息,使 LLM 能够真正"完成任务"。
05 致谢
本综述的完成得益于深度研究(deep research)与人工校验(manual research),并从以下优质资源中汲取了灵感与信息:
- Tobi Lutke tweet[1]
- Karpathy tweet[2]
- The rise of "context engineering"[3]
- Own your context window[4]
- Context Engineering by Simon Willison[5]
- Context Engineering for Agents[6]
END
本期互动内容 🍻
❓你是否有过动态构建上下文的经验?能否分享一个你认为特别成功的案例?
文中链接
[1]https://x.com/tobi/status/1935533422589399127
[2]https://x.com/karpathy/status/1937902205765607626
[3]https://blog.langchain.com/the-rise-of-context-engineering/
[5]https://simonwillison.net/2025/Jun/27/context-engineering/
[6]https://rlancemartin.github.io/2025/06/23/context_engineering/
本文经原作者授权,由 Baihai IDP 编译。如需转载译文,请联系获取授权。
原文链接:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
给 DolphinScheduler 加一个 SQL Copilot 聊天助手,这个主意怎么样?
DolphinScheduler 准备引入 Copilot 聊天助手啦!借助大语言模型(如 OpenAI),帮助用户智能编写 SQL、优化代码、答疑解惑,大幅提升开发体验。 咱 DolphinScheduler 也是紧跟上 AI 智能化的脚步了,与时俱进不是挂在嘴上的,而是说干就干!这个超棒的想法目前还处于设计阶段,能不能尽快列入到 DolphinScheduler 的支持列表,就要看咱们贡献者的力量啦! 下面是这个 DSIP 发起者目前的想法,来看看是不是和你不谋而合? 动机 大模型的能力日益增强,SQL 生成的质量和准确性也非常高。现在正是将大模型引入调度组件的最佳时机,以帮助提升用户的开发效率、优化代码,并解答我们在使用过程中遇到的问题。 DS Copilot 是一个基于第三方大语言模型构建的数据智能助手,将会集成 DolphinScheduler 数据源的元数据信息,可以帮助调度系统的用户开发出更高质量、更规范的 SQL 任务。 设计细节 添加 Chat 模块 主要用于接收用户输入,把用户带有当前 SQL 数据源的元数据信息 → 生成优化提示并提交给大模型 → 再根据模型返回的...
- 下一篇
产品研发的不可能三角:更好更快更便宜
用最少的投入、最快的速度,打造出最优质的产品——这是理想。 在产品研发中,速度、质量与成本不可能同时达到最优状态——这是现实。 如何在这看似无解的困局中寻找破局之道? 今天,我们来聊一聊产品研发中的“不可能三角”。 “不可能三角”的概念源自项目管理流域,但放在产品研发过程中,也完全适用。 先看“快” 在多变的市场环境下,快意味着抢占先机。 今年有一个很明显的感受,自春节期间DeepSeek推出后(甚至这段时间还可以再往前推),各大出版社为了先一步抢占人工智能的书籍出版市场,开始“抢”作者、“抢”主题、“抢”新鲜度和讨论度,原本的出版计划纷纷为AI题材类的书籍让路。 这种对速度的极致追求,本质上是为了让产品更快地比竞争对手铺向市场。 再看“好” 好产品的定义是什么? 也许是好看,也许是好用,也许是服务好、宣传好或是质量好。 像苹果公司,他们的产品在设计上追求极致的简约与美感,在用户体验上注重细节打磨,每一个交互环节都经过反复推敲。 为了实现这些高标准,苹果投入了大量资源,从全球招募顶尖设计人才,到建立严格的质量管理体系,每一步都伴随着高昂的成本。但也正是这些投入,让苹果产品拥有了高溢价能...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS8编译安装MySQL8.0.19
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7设置SWAP分区,小内存服务器的救世主