Valkey:对开源的投资
Valkey 于一年前成立,旨在为开源社区保留高性能的键值存储,避免被厂商锁定或受限于限制性许可。项目得到了 AWS、Google Cloud、Ericsson、Oracle、Alibaba、Huawei、Tencent、Percona、Aiven、Heroku、Verizon、Chainguard 和 Canonical 等贡献者的支持,展示了开源“免费”的背后,依赖于时间、人才和持续的资金投入。
由开发者打造,Linux 基金会支持
Valkey 于 2024 年 3 月 28 日诞生,已成为支持缓存、消息队列等多种工作负载的开源高性能键值数据库,也可用作主数据库。它由 2000 年成立的中立组织 Linux 基金会支持,后者帮助开发者和技术人员管理、扩展开源项目。Valkey 采用开放治理模式,专注于扩大社区贡献和用户采纳。
一年回顾:成长与动力
仅用一年时间,项目发布了两次重要版本,企业参与者从 22 家增至 47 家,正在定义、创新并推进路线图,用户规模不断扩大。社区积极拥抱 Valkey,坚定致力于持续改进,惠及所有最终用户。
Valkey 新功能与应用场景
用 JSON 和 Bloom 过滤器解决实际问题
新增的两种数据类型——JSON 和 Bloom 过滤器,极大扩展了开发者在分布式系统中对速度和数据结构的需求。它们简化了应用逻辑,提升了边缘数据处理效率。Valkey 联合维护者 Madelyn Olson 表示:“添加 JSON 和 Bloom 过滤器,是为了给开发者提供实用工具,解决分布式系统中的真实问题。”
JSON 支持让开发者能直接处理丰富且结构化的数据,无需依赖自定义序列化或额外中间件。Olson 解释:“JSON 让你能直接在 Valkey 中操作复杂数据,简化开发,减少胶水代码。”
Bloom 过滤器则提供了一种紧凑且快速的存在性检测方式。Olson 补充:“在需要快速且节省内存的存在性检测时,比如防范欺诈或避免高流量服务中不必要的后端调用,Bloom 过滤器非常理想。”
Olson 还说:“我很期待看到用户用这些新数据类型解决什么问题。”
Valkey Search:为 AI 工作负载提供速度与规模
Google 贡献了 Valkey Search 模块,支持向量相似度搜索。它响应速度快,延迟单毫秒级,能处理数十亿向量,并保持 99% 以上召回率。
开发者可执行近似最近邻(ANN,基于 HNSW)和精确最近邻(KNN)搜索,支持使用 Hash 或 Valkey-JSON 类型建立索引。尽管当前重点为向量搜索,未来计划扩展成支持全文检索和更多索引选项的搜索引擎。
性能、可靠性与安全性
过去一年,Ericsson、Oracle、Percona 等公司贡献者致力于让 Valkey 更快、更安全、更适合企业级生产环境。以下改进体现了 Valkey 在满足大规模生产需求同时,兼顾用户体验的演进。
多线程改进
近期系统内部更新优化了多线程工作处理,减少锁竞争,更好利用多核处理器。在高并发场景下显著提升吞吐量,使项目更适合大规模生产。Ericsson 作为核心贡献者,已感受到性能提升带来的实际价值。
Ericsson 软件技术工程师兼 Valkey 联合维护者 Viktor Söderqvist 指出,核心效率是 Valkey 越来越适合生产的关键。“最近的哈希表重设计,结合 SIMD 技术,以及多线程和批量预取内存技术的持续改进,极大提升了 CPU 和内存的存储效率与速度。”
SIMD 加速哈希表重设计
核心哈希表重构利用 SIMD 指令,实现并行处理多个操作,使键查找更高效。这些底层优化提升了延迟敏感环境的响应速度。
批量内存预取
新增的批量内存预取功能提前加载数据,减少缓存未命中,保证繁忙或顺序访问场景下性能更稳定流畅。
LDAP 集成
LDAP 集成实现了集中身份认证和访问控制,简化了 Valkey 在企业已有身份系统中的部署。这解决了安全和合规要求较高组织的常见障碍。
Percona 联合创始人 Vadim Tkachenko 表示:“很多客户已经依赖 LDAP 管理基础设施访问,把它引入 Valkey 很自然。它消除了摩擦,支持审计、基于组的权限,并兼容现有系统。”
Rust 模块
Oracle 贡献了基于 Rust 的模块 SDK,旨在提升底层扩展的安全性和性能。Rust 提供了强大的内存与并发保障,有助于打造更安全、易维护的系统集成,特别适合生产环境高负载场景。
开源成功背后的真正投资
对开源的投资和雇佣贡献者,体现了技术创新的关键:无论是大企业还是小型团队,都必须协作共赢。这意味着要投入推动项目发展的资源——开源的“免费”背后,是开发者、文档编写者、治理团队和社区的共同努力。
Valkey 最新动态
2025 年 8 月 15 日,Valkey 发布了 9.0 版本的第一个候选版本。该测试版展示了原子槽迁移、哈希字段过期、集群模式下编号数据库等新功能,并包含大量性能优化和漏洞修复。后续将发布更多候选版本,计划于 2025 年秋初正式发布 9.0。
更多详情可查看官方博客。
