告别提示词工程，「上下文工程」才是 AI Agent 的核心竞争力

2025-07-18 302

编者按： 什么样的技能才能真正决定 AI 智能体的成败？是更复杂的算法，还是更精妙的提示词？我们今天为大家带来的文章，作者的观点是：构建强大 AI 智能体的关键已从"提示词工程"转向"上下文工程"。

文章从"上下文"的广义定义出发，详细拆解了影响 AI 决策的七大关键要素，包括系统指令、用户输入、历史对话、长期记忆、外部检索信息、可用工具及输出结构。通过对比"廉价演示项目"与"神奇智能体"的案例，作者生动展现了上下文质量如何决定 AI 的表现 ------ 真正的差距不在于模型本身，而在于是否提供了恰当的上下文支持。作者进一步提出，上下文工程是一套动态流程，需跨领域协作，以结构化的方式整合业务需求与技术实现，确保 LLM 在正确的时间获得正确的信息与工具。

作者 | Philipp Schmid

编译 | 岳扬

上下文工程（Context Engineering）是一个在人工智能领域逐渐走红的新术语。行业内讨论的焦点正从"提示词工程"（prompt engineering）转向一个更广泛、更强大的概念：上下文工程（Context Engineering）。托比·卢克（Tobi Lutke）[1]将其描述为"为任务提供完整的上下文背景，使大语言模型能够合理解决问题的一门艺术"，他说得很到位。

随着 Agents 的兴起，将哪些信息输入"有限的工作记忆（limited working memory）"中变得越来越重要。我们观察到，决定一个 Agent 成败的关键因素，通常就在于你提供给它的上下文质量。大多数 Agent 的失败早已不是模型本身的问题，而恰恰是上下文供给的失败。

01 什么是上下文（Context）？

要理解上下文工程（Context Engineering），我们首先必须扩展对"上下文"的定义。它不仅指你发送给 LLM 的单一提示词（prompt）。应该将其视为模型在生成响应前所看到的一切信息。

指令 / 系统提示词（Instructions / System Prompt） ：用于定义模型在对话期间行为的初始指令集，可以/应该包含示例、规则等。
用户提示词（User Prompt） ：来自用户的即时任务或问题。
状态 / 历史（短期记忆）[State / History (short-term Memory] ：当前的对话内容，包括导致此刻结果的"用户与模型的历史回复"。
长期记忆（Long-Term Memory） ：在之前的多次对话中收集的持久性知识库，包含学习到的用户偏好、过往对话摘要、或被明确告知需要记忆以备后续使用的信息。
检索信息（RAG）[Retrieved Information (RAG)] ：外部的、最新的知识，来自文档、数据库或 API 的相关信息，用于回答特定问题。
可用工具（Available Tools） ：所有可调用函数或内置工具的标准化描述（如输入参数、输出格式、功能说明）（例如 check_inventory, send_email）。
结构化输出（Structured Output） ：对模型响应格式的定义，例如一个 JSON 对象。

02 为什么重要？从「廉价的演示项目」到「神奇的智能体产品」

构建真正高效的 AI 智能体的秘诀，与你编写代码的复杂程度关系不大，而与你提供上下文的质量息息相关。

构建智能体，与你编写的代码或使用的框架关系不大。 一个廉价的演示项目和"神奇的智能体"之间的区别，就在于你所提供上下文的质量。假设让一个 AI 助手根据一封简单的邮件来安排会议：

Hey, just checking if you're around for a quick sync tomorrow.

嘿，想问一问明天方不方便，我们快速碰个头？

"廉价的智能体演示项目"的上下文质量很差。它只看到用户的请求，其他什么都看不到。它的代码可能功能完善，它会调用 LLM 并获得响应，但输出的内容却毫无帮助，且充满机械感：

Thank you for your message. Tomorrow works for me. May I ask what time you had in mind?

感谢来信！明天我有空。你想约在几点？

"神奇的智能体"则由丰富的上下文驱动。其代码的主要任务并非琢磨如何回应，而是收集 LLM 所需的信息，以便更好地响应用户需求。在调用 LLM 之前，你可以扩展上下文，使其包含：

你的日历信息（显示你日程已满）。
你与此人的过往邮件（用于确定合适的非正式语气）。
你的联系人列表（用于识别 ta 为关键的合作伙伴）。
send_invite 或 send_email 工具。

然后便能生成回应：

Hey Jim! Tomorrow's packed on my end, back-to-back all day. Thursday AM free if that works for you? Sent an invite, lmk if it works.

嗨 Jim！明天我这边日程全排满了，从早到晚连轴转。周四上午有空，你看行不？邀请已发，确认下是否合适~

这种神奇的效果并非源于更聪明的模型或更精巧的算法，而在于为正确的任务提供了恰当的上下文。这就是为什么上下文工程（Context Engineering）非常重要。智能体的失败并非仅仅是模型的失败，本质上是上下文的缺失。

03 从提示词工程到上下文工程

什么是上下文工程？如果说"提示词工程（prompt engineering）"侧重于在单个文本字符串中精心设计一套完美的指令，那么上下文工程（context engineering）的范畴则宽广得多。简而言之：

上下文工程是一门设计和构建动态系统的学科，它能以正确的格式、在正确的时间提供正确的信息与工具，赋予 LLM 完成任务所需的一切资源。

上下文工程是

一套流程，而非某些字符串：上下文不仅是一个静态的提示词模板。它是主 LLM 调用前系统运行所产生的输出。
动态构建的：随任务即时生成，适配用户当下的需求。对某个请求，其上下文可能是日历数据，对另一请求，上下文则可能是邮件记录或网页搜索结果。
在正确的时间提供正确的信息和工具：其核心职责是确保模型不遗漏关键细节（Garbage In, Garbage Out）。这意味着只有在必需且有帮助时才提供知识（信息）与能力（工具）。
注重呈现格式：如何呈现信息很重要。简明扼要的摘要胜过原始数据的堆砌，清晰的工具架构胜过模糊的指令。

04 Summary

构建强大且可靠的 AI 智能体，已经不再需要寻找神奇的提示词或更新模型版本。其核心在于上下文工程，即以正确的格式、在正确的时间提供正确的信息与工具。这是一项跨领域协作的挑战，需要理解业务场景、定义预期输出，并结构化组织所有必要的信息，使 LLM 能够真正"完成任务"。

05 致谢

本综述的完成得益于深度研究（deep research）与人工校验（manual research），并从以下优质资源中汲取了灵感与信息：

Tobi Lutke tweet[1]
Karpathy tweet[2]
The rise of "context engineering"[3]
Own your context window[4]
Context Engineering by Simon Willison[5]
Context Engineering for Agents[6]

END

本期互动内容 🍻

❓你是否有过动态构建上下文的经验？能否分享一个你认为特别成功的案例？

文中链接

[1]https://x.com/tobi/status/1935533422589399127

[2]https://x.com/karpathy/status/1937902205765607626

[3]https://blog.langchain.com/the-rise-of-context-engineering/

[4]https://github.com/humanlayer/12-factor-agents/blob/main/content/factor-03-own-your-context-window.md

[5]https://simonwillison.net/2025/Jun/27/context-engineering/

[6]https://rlancemartin.github.io/2025/06/23/context_engineering/

本文经原作者授权，由 Baihai IDP 编译。如需转载译文，请联系获取授权。

原文链接：

https://www.philschmid.de/context-engineering

微信关注我们

原文链接：https://my.oschina.net/IDP/blog/18685020

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

给 DolphinScheduler 加一个 SQL Copilot 聊天助手，这个主意怎么样？

DolphinScheduler 准备引入 Copilot 聊天助手啦！借助大语言模型（如 OpenAI），帮助用户智能编写 SQL、优化代码、答疑解惑，大幅提升开发体验。咱 DolphinScheduler 也是紧跟上 AI 智能化的脚步了，与时俱进不是挂在嘴上的，而是说干就干！这个超棒的想法目前还处于设计阶段，能不能尽快列入到 DolphinScheduler 的支持列表，就要看咱们贡献者的力量啦！下面是这个 DSIP 发起者目前的想法，来看看是不是和你不谋而合？动机大模型的能力日益增强，SQL 生成的质量和准确性也非常高。现在正是将大模型引入调度组件的最佳时机，以帮助提升用户的开发效率、优化代码，并解答我们在使用过程中遇到的问题。 DS Copilot 是一个基于第三方大语言模型构建的数据智能助手，将会集成 DolphinScheduler 数据源的元数据信息，可以帮助调度系统的用户开发出更高质量、更规范的 SQL 任务。设计细节添加 Chat 模块主要用于接收用户输入，把用户带有当前 SQL 数据源的元数据信息 → 生成优化提示并提交给大模型 → 再根据模型返回的...

2025-07-17

274

用最少的投入、最快的速度，打造出最优质的产品——这是理想。在产品研发中，速度、质量与成本不可能同时达到最优状态——这是现实。如何在这看似无解的困局中寻找破局之道？今天，我们来聊一聊产品研发中的“不可能三角”。 “不可能三角”的概念源自项目管理流域，但放在产品研发过程中，也完全适用。先看“快” 在多变的市场环境下，快意味着抢占先机。今年有一个很明显的感受，自春节期间DeepSeek推出后（甚至这段时间还可以再往前推），各大出版社为了先一步抢占人工智能的书籍出版市场，开始“抢”作者、“抢”主题、“抢”新鲜度和讨论度，原本的出版计划纷纷为AI题材类的书籍让路。这种对速度的极致追求，本质上是为了让产品更快地比竞争对手铺向市场。再看“好” 好产品的定义是什么？也许是好看，也许是好用，也许是服务好、宣传好或是质量好。像苹果公司，他们的产品在设计上追求极致的简约与美感，在用户体验上注重细节打磨，每一个交互环节都经过反复推敲。为了实现这些高标准，苹果投入了大量资源，从全球招募顶尖设计人才，到建立严格的质量管理体系，每一步都伴随着高昂的成本。但也正是这些投入，让苹果产品拥有了高溢价能...

2025-07-18

278

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。