Pathway —— Python 流处理 ETL 框架
Pathway 是一个用于流处理、实时分析、LLM 管道和 RAG 的 Python ETL 框架。
Pathway 附带易于使用的 Python API,让你可以无缝集成您常用的 Python 机器学习库。Pathway 代码功能强大且功能强大:可以在开发和生产环境中使用它,高效处理批量数据和流数据。同一份代码可用于本地开发、CI/CD 测试、运行批量作业、处理流回放以及处理数据流。
Pathway 由基于 Differential Dataflow 的可扩展 Rust 引擎驱动,并执行增量计算。你的 Pathway 代码虽然是用 Python 编写的,但由 Rust 引擎运行,从而支持多线程、多处理和分布式计算。所有流水线都保存在内存中,并且可以轻松地使用Docker 和 Kubernetes进行部署。
可以使用 pip 安装 Pathway:
pip install -U pathway
特点:
- 丰富的连接器:Pathway 附带可连接到 Kafka、GDrive、PostgreSQL 或 SharePoint 等外部数据源的连接器。其 Airbyte 连接器允许你连接到 300 多个不同的数据源。如果你所需的连接器不可用,可以使用 Pathway Python 连接器构建自定义连接器。
- 无状态和有状态转换:Pathway 支持有状态转换,例如连接、窗口和排序。它提供了许多直接用 Rust 实现的转换。除了提供的转换之外,还可以使用任何 Python 函数。可以实现自己的转换,也可以使用任何 Python 库来处理数据。
- 持久性:Pathway 提供持久性功能来保存计算状态。这允许在更新或崩溃后重新启动管道。
- 一致性:Pathway 为你处理时间问题,确保所有计算的一致性。具体来说,Pathway 通过在新的数据点进入系统时更新其结果来管理延迟点和乱序点。
- 可扩展的 Rust 引擎:使用 Pathway Rust 引擎,可以摆脱 Python 常见的限制。可以轻松进行多线程、多处理和分布式计算。
- LLM 助手:Pathway 提供了一个 LLM 扩展,其中包含将 LLM 与你的数据管道(LLM 包装器、解析器、嵌入器、拆分器)集成所需的所有实用程序,包括内存实时向量索引以及与 LLamaIndex 和 LangChain 的集成。可以使用实时文档快速构建和部署 RAG 应用程序。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
开源狂欢!AI 驱动的 Wiki 系统 PandaWiki 实测:从安装到智能问答仅需三步
我们开源了一款 AI 驱动的 Wiki 知识库 大家好,经过一个月的内测,我们昨天刚刚开源了一款 AI 驱动的 Wiki 项目,叫做 PandaWiki。 GitHub 链接:https://github.com/chaitin/PandaWiki 项目介绍 PandaWiki 是一款 AI 大模型驱动的开源知识库搭建系统,帮助你快速构建智能化的产品文档、技术文档、FAQ、博客系统,借助大模型的力量为你提供AI 创作、AI 问答、AI 搜索等能力。 PandaWiki 除了是一款 Wiki 程序,除了是一款 AI 知识库以外,还有一些独属于自己的特色能力: AI 驱动智能化:AI 辅助创作、AI 辅助问答、AI 辅助搜索。 强大的富文本编辑能力:兼容 Markdown 和 HTML,支持导出为 word、pdf、markdown 等多种格式。 轻松与第三方应用进行集成:支持做成网页挂件挂在其他网站上,支持做成钉钉、飞书、企业微信等聊天机器人。 通过第三方来源导入内容:根据网页 URL 导入、通过网站 Sitemap 导入、通过 RSS 订阅、通过离线文件导入等。 截图展示 PandaW...
- 下一篇
高德发布智能眼镜解决方案| 携手 AR 领军企业,引领智慧出行新未来
2025年6月5日,高德地图旗下高德开放平台正式发布智能眼镜解决方案,标志着其在空间计算与智能穿戴领域的技术创新迈入新阶段。 作为专业领先的出行和位置服务解决方案提供商,阿里巴巴集团旗下高德地图依托AI大模型、北斗高精定位技术,并应用Planner-Executor创新技术理念和架构,率先推出全球首个集“感知、规划、执行、表达”于一体的全链路AI导航智能体(NaviAgent),重新定义了智能出行的行业技术理念,为与各领域合作伙伴深度协同打下坚实的技术底座。 高德开放平台已与Rokid、雷鸟创新、逸文科技、星纪魅族等AR行业领军企业达成战略合作,共同推出基于智能眼镜的导航智能体(NaviAgent)应用,建设“AI+AR”导航新生态。 通过深度场景化的Agent能力,高德智能眼镜解决方案实现了本地生活服务与导航功能的深度融合:一方面,它可提供深层次结构化信息查询服务,涵盖用户评分、榜单排行、门票价格、开放时间等多维度内容;另一方面,依托智能语音交互系统,支持用户执行包含路径偏好设定的复杂导航指令。 不仅如此,基于地图导航生态与大规模数据基座的高阶导航HUD展示,可动态感知实时路径、后方...
相关文章
文章评论
共有0条评论来说两句吧...