我为什么又开始手写Agent框架了？从CrewAI和LangGraph的局限谈起-低调大师

我为什么又开始手写Agent框架了？从CrewAI和LangGraph的局限谈起

2025-08-10 277

一、引言：被"框架"困住的我们

嗨，大家好，我是技术老金。

最近，我发现自己陷入了一个有趣的困境。

当我想快速搭建一个多智能体（Multi-Agent）应用时，我首先想到了CrewAI。它就像一个精装修的公寓，角色、任务、流程都替你定义好了，拎包入住，很快就能跑起来。但只要我想稍微改动一下"房型"，比如让两个Agent先碰个头，或者根据某个工具的执行结果，动态决定下一步谁来接手，我就会发现自己被困在了这精美的"枷锁"里，动弹不得。

于是，我转向了LangGraph。它就像一个堆满了顶级建材（节点、边、状态）的"毛坯房"，给了我无限的自由。我可以随心所-欲地设计任何我想要的流程，循环、分支、判断，无所不能。但很快，新的问题来了：我发现我不仅要设计流程，还要亲自设计状态管理、消息传递、工具调用、错误处理......我需要从零开始，为这个毛坯房设计一整套"水电煤"系统。

我们似乎被困在了两难的境地：要么选择一个僵化的"应用级"框架，要么选择一个过于灵活的"引擎级"工具。

有没有一条中间道路？

在反复挣扎和实践后，我得出了一个结论：有。那就是在LangGraph这种强大的"引擎"之上，构建一层我们自己的、轻量级的、符合自己团队心智模型的"协作层"。

今天，我就来聊聊，我为什么放弃了直接使用现成的框架，又开始"手写"这薄薄的一层，以及这一层到底解决了什么核心问题。

二、 CrewAI的"美丽枷锁"：当规范大于灵活

CrewAI的初衷是好的，它试图将构建Agent的过程，标准化为"角色(Agent)-任务(Task)-流程(Process)-船员(Crew)"这套模型。对于很多标准场景，这套模型非常高效。

但它的核心问题在于，它是一个**"强干预"**的框架。它为你做了太多决策，而这些决策，往往与你真实的、复杂的业务逻辑相悖。

它的主要局限在于：

僵化的线性流程：默认情况下，CrewAI的任务是串行执行的。你想实现一个"A和B并行，然后结果汇总给C"的流程，会非常别扭。
模糊的状态管理：Agent之间的数据传递，很大程度上依赖于一个全局的、非结构化的"上下文黑盒"。你很难精确地控制，在任务的某个阶段，哪些信息是可见的，哪些是不可见的。
控制权的缺失：整个流程的调度，是由CrewAI的内部机制黑盒管理的。你无法在流程中途，根据一个外部事件或一个工具的执行结果，来动态地改变整个"剧本"。

总而言之，CrewAI更像一个**"内置了固定协作模式的Agent应用"，而不是一个让你设计协作模式的"框架"**。

三、 LangGraph的"自由与混沌"：当引擎只是引擎

LangGraph则走向了另一个极端。它极其强大，也极其"无情"。

它给了你构建任何复杂图形（Graph）的能力，但它对"什么是Agent"、"Agent之间如何对话"这些核心问题，不提供任何默认的解决方案。

使用LangGraph，你很快就会意识到：

你需要自己定义"状态"：这个状态（State）里，应该包含哪些字段？当前轮到哪个Agent？消息列表应该是什么格式？这些都需要你自己来设计。
你需要自己实现"调度"：当一个Agent完成了它的任务，下一个应该由谁来接手？这个核心的调度逻辑，LangGraph把它作为一个普通的"条件边"（Conditional Edge）交给了你，你需要自己编写一个复杂的函数来实现。
你需要自己管理"工具调用"：Agent调用工具的请求、工具执行的结果，如何优雅地整合进你的状态流转中？LangGraph提供了模式，但没有现成的实现。

LangGraph是一个顶级的**"工作流引擎"，但它本身，并不是一个"多智能体协作框架"**。它给了你造车的顶级发动机和变速箱，但车架、底盘、方向盘，都得你自己来造。

四、破局之道：构建我们自己的"协作层"

现在，我的思路清晰了：我们真正需要的，不是另一个庞大的框架，而是在LangGraph这个坚实底座上，构建一层薄薄的、但至关重要的**"协作层"**。

这一层的核心，只解决三个问题：

一个统一的"世界状态" (World State)：定义一个所有Agent都认可的数据结构，用于记录全局信息、消息历史和任务状态。
一个中心化的"调度器" (Dispatcher)：它本身是LangGraph中的一个特殊节点，负责读取"世界状态"，并决定下一个应该被唤醒的Agent。
一套标准的"交互协议" (Interaction Protocol)：定义Agent如何向状态里写入消息，以及调度器如何解析这些消息。

我们来看一个极简的伪代码实现，你马上就能明白：

from typing import TypedDict, List, Literal
from langgraph.graph import StateGraph, END
from operator import itemgetter

# 1. 定义我们自己的"世界状态"
class AgentWorldState(TypedDict):
    task: str
    messages: List[tuple[str, str]] 
    next_agent: Literal["Researcher", "Writer", "FINISH"]

# 2. 定义Agent节点，展示它如何与"世界状态"交互
def researcher_agent_node(state: AgentWorldState):
    task = state['task']
    print(f"--- [Agent: 研究员] 开始工作，任务: {task} ---")
    research_result = f"这是关于'{task}'的研究成果。"
    # 注意：这里返回的是一个包含元组的列表，以支持状态的累加
    return {"messages": [("Researcher", research_result)]}

def writer_agent_node(state: AgentWorldState):
    messages = state['messages']
    print(f"--- [Agent: 作家] 开始工作 ---")
    writing_result = f"基于以下研究成果：\n{messages[-1][1]}\n\n我完成了最终报告。"
    return {"messages": [("Writer", writing_result)]}

# 3. 定义我们的核心"调度器"节点
def dispatcher_node(state: AgentWorldState):
    last_message_sender = state['messages'][-1][0] if state['messages'] else "START"
    
    if last_message_sender == "Researcher":
        return {"next_agent": "Writer"}
    elif last_message_sender == "Writer":
        return {"next_agent": "FINISH"}
    else: # START
        return {"next_agent": "Researcher"}

# 4. 在LangGraph中组装
workflow = StateGraph(AgentWorldState)
workflow.add_node("researcher", researcher_agent_node)
workflow.add_node("writer", writer_agent_node)
workflow.add_node("dispatcher", dispatcher_node) 

workflow.set_entry_point("dispatcher")

workflow.add_conditional_edges(
    "dispatcher",
    itemgetter('next_agent'),
    {
        "Researcher": "researcher",
        "Writer": "writer",
        "FINISH": END
    }
)

workflow.add_edge("researcher", "dispatcher")
workflow.add_edge("writer", "dispatcher")

# 编译
app = workflow.compile()

# 运行
inputs = {"task": "AI在软件开发中的作用", "messages": []}
for s in app.stream(inputs, {"recursion_limit": 10}):
    print(s)
    print("----")

看明白了吗？通过这层薄薄的封装，我们做到了：

解耦：Agent之间不直接对话，而是通过向messages列表追加消息来通信。
中心化控制 ：所有的流程走向，都由dispatcher这个唯一的"大脑"来决定。
无限的扩展性 ：我们可以让dispatcher变得无比智能，它可以调用一个LLM来做决策，也可以集成复杂的业务规则。

五、老金总结：从"框架使用者"到"架构设计者"

我们之所以要"手写"这一层，不是为了重复造轮子，而是为了夺回控制权。

CrewAI这样的框架，让你成为了一个熟练的"司机"，但它限制了你能走的路。LangGraph给了你最强的"引擎"，但它要求你成为一个"机械师"，从零件开始造车。

而我们今天探讨的思路，是让你成为一个**"汽车设计师"**。你使用最专业的引擎（LangGraph），但你亲自设计汽车的底盘和传动系统（我们的协作层），最终组装出一辆最适合在你的业务道路上飞驰的、独一-无二的赛车。

这，或许才是AI时代，我们架构师真正的价值所在------不满足于使用工具，而是有能力、有思想地去组合与驾驭工具。

觉得有用，别忘了给老金点个赞，关注一下！

本文由"技术老金"原创首发于个人博客及微信公众号『技术老金』，转载请注明出处。

微信关注我们

原文链接：https://my.oschina.net/xxjin/blog/18687617

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

稿定科技：多云架构下的 AI 存储挑战与 JuiceFS 实践

稿定科技（gaoding.com）是一家专注于为企业和个人提供视觉内容创新方案的科技公司，致力于打造全新的设计方式，帮助更多用户轻松掌控设计，创造价值。随着 AI 技术的加速发展，数据存储和管理成为支撑公司创新与发展的关键基础设施。最初，"稿定"的 AI 训练数据主要依赖公有云厂商提供的对象存储和 NAS 服务。但随着业务快速发展，单一云厂商的 GPU 资源已无法满足需求，"稿定"逐步转向多云架构，以获取更灵活的计算资源。但这也带来了新的技术难题：如何在多个云环境中统一管理训练数据，实现高效、低成本的跨云读写访问。 JuiceFS 正是在这一背景下被引入，其出色的多云兼容性、灵活的挂载机制与完善的工具支持，帮助"稿定"快速打通了不同云环境间的数据访问通路。目前，JuiceFS 管理了其训练数据和模型库，极大简化了模型数据在多云环境下的管理流程，高效的缓存机制显著加快了训练过程中的数据加载，同时加速了模型推理阶段的挂载响应，为业务带来了实质性的性能与效率提升。 01 训练场景的存储挑战：数据规模、性能与多云难题随着人工智能业务的迅速发展，稿定运维体系面临诸多新挑战，其中存储无疑是最为...

2025-08-08

236

在数字化转型的浪潮下，高校作为知识创新与人才培养的核心阵地，面临着前所未有的变革机遇与严峻挑战。数据，作为高校的核心战略资源，其价值的挖掘与应用水平，已直接关系到高校的核心竞争力与长远可持续发展能力。当前，高校普遍面临数据体量庞大但价值释放不足的突出矛盾。一方面，高校在教学、科研、学生工作、人事管理、财务运作、资产配置等多个领域积累了海量数据资源；另一方面，数据分散存储、标准不统一、质量参差不齐、应用场景碎片化等问题，严重制约了这些数据价值的充分释放。因此，如何通过系统化的指标体系建设与人工智能深度融合，实现数据从“资源”到“资产”的根本转变，已成为高校数字化转型的关键命题。本方案聚焦高校数据全生命周期管理，以指标体系建设为核心，AI应用为引擎，构建从“数据开发与治理”到“指标体系建设”，再到“AI智能应用”的完整技术路径。旨在助力高校实现以下战略目标：图：方案目标与定位题方案架构：分层递进的数据价值转化体系整体架构设计本方案采用分层架构设计，构建从数据源到智能应用的完整技术路径，形成一个层层递进、高效协同的数据价值转化体系。整体架构具体分为五层：图：总体架构设计数据源...

2025-08-11

271

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。