您现在的位置是:首页 > 文章详情

OceanBase 发布并开源 seekdb:AI 原生混合搜索数据库

日期:2025-11-18点击:13

11月18日,在2025 OceanBase年度发布会上,OceanBase发布并开源了其首款AI数据库OceanBase seekdb(简称seekdb)。开发者仅需三行代码,即可快速构建知识库、智能体等AI应用,轻松应对百亿级多模数据检索,真正实现“开箱即用”的AI数据基座。

该产品支持向量、全文、标量及空间地理数据的统一混合搜索,深度融合AI推理与数据处理,并兼容Hugging Face、LangChain等30余种主流AI框架。

这一产品实现了数据库从传统“业务支撑系统”迈向“AI原生数据入口”的新功能,也是OceanBase自启动“Data×AI”战略以来的一份答卷。CEO杨冰表示:“希望OceanBase能够探索出一条数据库在AI时代的范式跃迁。”

杨冰认为,AI的真正瓶颈不在模型,而在数据。尤其在金融、政务等高敏场景,AI需在毫秒级完成实时推理,并安全融合私有数据。而传统架构依赖多系统拼接数据链路,不仅复杂低效,还易引发权限混乱与延迟风险。

“seekdb不是传统数据库的功能叠加,而是专为AI时代重构的AI原生数据库。”杨冰表示,“它继承OceanBase的代码和设计理念,更轻量、更敏捷,目标是成为大模型与私有数据融合计算的‘实时入口层’。我们希望与开发者一起,在混合搜索、多模融合等方向加速迭代、大胆创新。”

https://github.com/oceanbase/seekdb

seekdb带来三大核心突破:

一是AI原生混合搜索能力。seekdb支持在一个查询中融合向量检索、全文搜索与标量过滤,采用“粗排+精排”多阶段检索机制,在低延迟的同时提升精度。依托成熟的事务引擎,它支持实时写入与ACID 一致性,并兼容MySQL 生态。此外,seekdb支持标量、向量、文本、JSON和GIS等多模数据的统一存储与检索。例如,在反欺诈场景中,可直接查询“近7天交易超5万元、位置异常且行为类似历史欺诈样本”,无需跨系统调用,兼顾性能与安全。

二是极简部署,开箱即用。seekdb最低仅需1核CPU、2GB内存,支持pip install一键安装、秒级启动,兼容嵌入式与客户端/服务器双部署模式,可轻松集成至智能Agent、开发工具链或本地应用,大幅降低AI应用的工程门槛。

三是更开发者友好。seekdb以Apache 2.0协议全球开源,开发者可自由使用、修改和扩展。产品全面兼容HuggingFace、Dify、LangChain等30余种AI框架及MCP大模型协议,无缝融入AI生态;并提供SQL及PythonSDK,适配不同开发习惯。同期开源的PowerRAG智能文档解析框架与PowerMem分层记忆架构,后者在LOCOMO Benchmark上以73.70分登顶SOTA,Token消耗降低96%,大幅节省推理成本。

作为 OceanBase“Data×AI”战略的关键一环,seekdb既可独立使用,也可平滑融入新发布的OceanBase 4.4一体化融合版本。该版本首次将TP、AP与AI能力集成于单一内核,兼具分布式扩展、多云部署与金融级高可用,帮助企业避免后期架构重构风险。商用LTS版本将于2026年2月2日推出。

原文链接:https://www.oschina.net/news/384260
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章