您现在的位置是:首页 > 文章详情

Google ADK ,好玩、爱玩、多玩!

日期:2025-05-08点击:4

如果用一个词去概括 2025 上半年的人工智能领域,笔者认为是“ Agent ”(智能体)。

从市场研究机构预测 AI Agent 应用市场将达数百亿美元规模,再到众多科技巨头如微软、谷歌、OpenAI 、Anthropic 等纷纷发布 AI Agents 相关产品,直至 AI Agents 从单一智能体发展到“群体协作”模式,多个 Agent 可以扮演不同角色合作完成任务,进一步改变了人们的工作、生活。

如果说模型和基建是“骨架”,那么 AI Agent 则是让企业 AI “动起来”的“神经末梢”。在 Agent 生态爆发的技术场域中,谷歌推出的 AgentSpace ,正成为企业构建智能系统的“乐高平台”,更关键的是,谷歌通过开源智能体开发工具包 ( ADK )和 Agent-to-Agent( A2A )协议,解决了多 Agent 协作和安全验证的难题。

这种“开箱即用+自定义开发”的模式,让企业无需从头开发,就能快速搭建复杂的 Agents 系统。本文将带你深入了解 Google ADK 的奥秘,揭开它的核心功能和无限潜力,一起解锁这场 AI 技术的新玩法!

什么是 Google ADK ?

Google 的 Agent Development Kit( ADK )是一款灵活且模块化的开发框架,专为设计、构建和部署 AI Agent 而打造。笔者看重两点,模块化:允许开发者通过整合多个专业化的小型组件,构建复杂的多 Agent 系统;Agent 协调:协调 Agent 将任务分配给专业化子 Agent ,形成复杂的协作网络。

打个比方,销售 Agent 做销售的事,运营 Agent 做运营的事,ADK 则构建出一个层次化的业务中台,针对使用者的具体需求,分别去调配各个 Agent ,并且根据需求的复杂程度,开发者还可以灵活创建定制化工具。例如官网文档的演示 demo ,仅需十几行代码,就可以搓一个多 Agent 系统。

那么,ADK 是如何委派工作的呢?这就不得不提到 ADK 的自动委派机制。在接收到用户消息时,LLM 会首先对用户消息进行分析,同时结合当前 Agent 自身的描述信息以及其他相关 Agent 的描述信息。如果 ADK 发现另一个 Agent 更能胜任,任务就开始转移。

总而言之,ADK 协调系统里的每个 Agent 专注于做好一件事,而不是试图去处理每一种可能的交互。在 ADK 中,Agent 框架中,Agent 被定义为一个独立的执行单元,旨在自主运行以实现特定目标,而 ADK 的架构设计与实际能力整体统筹下来,可以搞定:

  1. 执行任务:独立完成预定义的目标,如回答问题或生成报告,展现出高效的自动化能力;

  2. 与用户交互:通过自然语言对话或界面操作,与人类用户无缝沟通,模拟真实对话体验;

  3. 利用外部工具:调用 API 、数据库或第三方服务,扩展功能边界,解决复杂问题;

  4. 与其他 Agent 协作:利用多 Agent 编排,共同完成复杂的业务流程,如统计分析或多语言翻译任务。

这些 Agents 的灵活性与协作性,使 ADK 成为构建智能工作流的核心组件,特别是在需要高度自动化和协同的场景中表现卓越。想象它们像一个“高效团队”,每个成员各司其职,又能紧密合作,共同完成从简单到复杂的“智能使命”。

Google ADK 具有哪些核心特性?

接下来,和大家聊聊 ADK 的核心特性,并结合其技术优势和应用场景,为大家呈现一个全面的概述。

一、模块化架构

上文也简单提到了,ADK 采用的模块化架构就像是将一个复杂的系统分解成一个个独立的、具有特定功能的小模块,每个模块都可以被看作是一个“乐高积木”。这些模块有着明确的功能和接口,它们可以对开发、测试和维护,当我们将这些专业化的 Agent 组合在一起,就能构建出一个复杂的、能够完成多种任务的多 Agent 系统。

并且,由于每个模块都相对独立,开发者可以专注于单个模块的开发和优化,而无需担心这个模块的变化对其他模块产生难以预测的影响,这就好比搭建乐高积木,我们可以一块一块地拼接,如果某一块积木出现问题,也不会影响整个积木结构。

二、代码优先开发效能

ADK 以代码为驱动,开发者可以使用 Python 语言精准定义 Agent 行为,赋予其完全的程序化控制权。这种方法消除了传统配置的繁琐性,让大家能够通过脚本灵活调整逻辑、优化性能,并快速迭代。

三、丰富的工具链生态

ADK 本身包含了多种预先构建好的工具集合。这些工具涵盖了不同的功能领域,例如 API 调用方面,能够方便地与其他外部系统进行交互,实现数据的获取和发送等功能。开发者在开发的过程中可以直接使用这些预建工具来完成特定任务,无需从头开始编写复杂的代码。

并且,ADK 特别优化了与 Google Cloud 生态系统的集成,例如与 Gemini 2.5 Pro Experimental 模型和 Vertex AI 平台无缝衔接。通过这些集成,开发者可以充分利用 Gemini 模型的增强推理能力,并直接将智能体部署到企业级运行时环境中。

Google Search (通过工具调用)

Gmail (通过工具调用)

Google Calendar (通过工具调用)

Google Cloud API (与各种云服务无缝集成)

各种企业内部系统(通过 Extensions / Function Calling 等机制连接)

四、多模型支持

此外,ADK 也支持多种大语言模型的集成,包括刚刚提到的 Gemini 系列,以及 OpenAI 的 GPT 系列、Anthropic Claude 等。这一特性使得开发者能够根据任务需求选择最优模型,同时也减少了一些非必要的资源消耗。

得益于以上四点,即便是初学者也能搭建出自己想要的 Agent ,让开发工作更多回归于灵感聚焦,减少繁琐的基础代码编写工作。

ADK 与 MCP 之间如何串联?

最近很火的 MCP 如何与 Google ADK 串联起来呢?方法也很简单。ADK 提供了三种主要的 Agent 类型:

  • LLM Agents :Agents 利用大语言模型作为其核心引擎,以理解自然语言、进行推理、规划任务、生成响应,并动态决定如何推进任务或使用哪些工具。

  • Workflow Agents (顺序 Agent ,循环 Agent ,并行 Agent ):以预定义的确定性模式(序列、循环或并行)控制 Agents ,非常适合需要可预测执行的结构化流程。

  • Custom Agents :通过扩展 BaseAgent 来构建满足特定需求的 Agent 。

而 MCP 的核心任务是接收来自客户端的请求,然后依据这些请求调度和执行相应的工具与功能,ADK 中的执行 Agent( Execution Agent )所具备的任务执行和调度,恰好能契合 MCP 这一需求。

这里,笔者参考 @QuantML 的方法,基于 ADK + MCP + Gemini AI 来实现搭建,架构如下图:

先决条件

  1. 安装 Python 3.8 或更高版本

  2. 通过 API 密钥访问 Google Gemini 生成式 AI

  3. 一个有效的 SerpAPI 密钥(用于获取实时航班数据)

步骤1:设置虚拟环境

使用一下命令安装依赖项:

步骤2:理解 ADK 作为 MCP 客户端

  • LlmAgent 是 ADK 中的一个核心组件,它利用大模型语言的能力;

  • Runner 负责在 Agent 的生命周期内协调各个组件站之间的交互;

  • InMemorySessionService 是 ADK 的 SessionService 接口的实现,它存储所有会话数据;

  • 当用户与 AI Agent 交互时,会创建一个 Session 对象来跟踪对话;

  • StdioServerParameters 是一个配置类,用于指定 Agent 应如何通过标准输入/输出连接到 MCP 服务器。

当结合使用时,MCPToolsetStdioServerParameters允许 ADK 协调:

  1. 建立连接:使用StdioServerParameters,定义启动 MCP 服务器进程所需的命令和参数。

  2. 发现可用工具:MCPToolset连接到 MCP 服务器并检索 Agent 可以使用的可用工具列表。

  3. 将工具集成到 Agent 中:将发现的工具适配为与 ADK 兼容的格式,从而实现无缝集成。

  4. 管理连接生命周期:MCPToolset处理与 MCP 服务器的连接设置和拆除,确保资源得到正确管理。

步骤3:连接到 MCP 服务器,并使用 ADK 创建 Agent

StdioServerParameters定义了使用MCPToolSet进行异步列表和监听的MCP配置。

再将 Agent 创建、会话管理和编排与 Runner 集成并进行全面测试,验证 Agent 在业务场景下与 MCP 服务器交互的稳定性和准确性。建议根据测试结果,优化 Agent 的参数配置、异步操作逻辑,以降低延迟,最后再部署到生产环境。

ADK 的衍生思考

技术初步落成,如果大家也想手搓一个多 Agent 系统,笔者这里分享几个比较实用的开发方向。

最近不是快 6·18 了吗?本着能省就是赚的原则,搓一个 AI 购物助手岂不是很香?专攻不同平台之间的优惠搭配和产品比价,一个 Agent 抓取平台优惠政策及产品信息,一个 Agent 学习商品推荐,第三个 Agent 负责处理购买流程,分模块拼凑起来,就能提供一个不错的薅羊毛体验。

其次,7、8 月份也是一个毕业季,构建一个辅导毕业生择业选择 Agent 系统。一个 Agent 可以专注于数据清洗和准备,另一个运行统计分析,第三个生成可视化报告。通过将复杂的企业资料、招聘需求分解为由专门 Agent 处理的分析报告,最终赋能于紧张的简历投递场景。

当然,三两句肯定是不能完整支持技术实现的,其间的细节解决、技术挑战,或许还需要接入到更多的工具才能完成。而 Google ADK 真正让人兴奋的,其实是它是一个开源框架,它是 Agent 技术民主化运动中的重要一步。

都说 2025 年是 Agent 应用爆发的一年,但真正好用的、并且满足你需求的 Agent 应用,又有几个呢?无非都是在堆功能、堆体量、博用户规模,赌用户刚好需要我这款(且赌用户没有看到竞品的广告)。ADK 所做的,是通过轻量化的开发路径,让更多开发者可以发散自己的灵感,从而手搓一个属于自己的 AI Agent 。就像罗胖的那句,天下没有严格意义上的好产品,只有满足一部分人需求的产品。

总结,ADK 消除了许多传统开发 Agent 过程中的一些阻碍,通过有效协作的模块化,以及专业 Agent 能力为各行各业的 AI 应用开辟了新的可能。随着 AI 格局继续向多 Agent 系统发展,像 ADK 这样的开源框架也将在 Agent 民主化方面发挥关键作用。

最后,Google ADK 的地址附上↓

代码地址: https://github.com/google/adk-python

文档地址: https://google.github.io/adk-docs/

原文链接:https://my.oschina.net/u/7819858/blog/18342526
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章