OpenData 开源 Vector:基于对象存储的轻量级向量搜索新选择
向量数据库是 AI 应用时代的基础设施之一,但传统方案往往需要完整的向量数据库集群和专门的存储系统,部署和维护成本都不低。OpenData Vector 的出现提供了一个不同的思路:基于 SlateDB 构建在对象存储之上,直接利用对象存储的持久性和可扩展性,省去了独立向量存储系统的复杂性。 从核心架构看,OpenData Vector 是一个无状态的持久化向量搜索引擎。它使用 IVF 索引来组织向量,这种索引方式适合对象存储的延迟特性。更新策略上,它采用了基于 LSM 的 LIRE compaction 机制,对象存储天然支持追加写入,这个设计很自然。另一个特点是 share-everyth...
