告别数据库“膨胀”:Dify x SLS 构建高可用生产级 AI 架构
作者:无哲、言合 一、前言:Dify 的规模化挑战 Dify 是当前最受欢迎的低代码 LLM 应用开发平台之一,在 Github 上已斩获 120k+ 的星标数。国内外有众多企业基于 Dify 构建自己的智能体应用。阿里云可观测团队既是 Dify 的深度用户,也是社区的活跃贡献者。 在大规模生产实践中,我们发现 Dify 在高负载场景下面临显著的数据库性能瓶颈:其执行引擎高度依赖 PostgreSQL,单次 Chat 请求可能触发数百甚至上千次数据库访问;与此同时,Worker 进程在知识库索引构建、Trace 追踪等任务中也会持续写入大量数据。这频繁导致 DB 连接池打满、慢查询频发 等问题,已成为制约 Dify 集群横向扩展与并发能力的关键瓶颈。 二、现状与挑战:Dify 存储机制痛点分析 数据分布现状 Dify 的数据主要分为三类: Meta类 数据:租户、应用、工作流、工具等配置信息; 运行时日志:工作流执行明细、会话历史、消息记录等; 文件类数据:用户上传文件、知识库文档、多模态输出等(通常存于对象存储)。 其中Meta 与运行日志均存储在 PostgreSQL 中,运行时日...