零一万物推出自研全导航图向量数据库
零一万物宣布推出基于全导航图的新型向量数据库 「笛卡尔(Descartes)」,聚焦于高性能向量数据库。并声称该数据库已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名,比之前榜单上同业第一名有显著性能提升,部分数据集上的性能提升甚至超过 2 倍以上。
“向量数据库,又被称为 AI 时代的信息检索技术,是检索增强生成(Retrieval-Augmented Generation, RAG)内核技术之一。对大模型应用开发者来说,向量数据库是非常重要的基础设施,在一定程度上影响着大模型的性能表现。”
「吞吐量 QPS」 是衡量信息检索系统(例如搜索引擎或数据库)查询处理能力的重要指标。在原榜单 TOP1 基础上,零一万物笛卡尔向量数据库实现了显著性能提升,部分数据集上的性能提升超过 2 倍以上,在 gist-960-euclidean 数据集维度更大幅领先榜单原 TOP1 286%。
零一万物高性能向量数据库具有以下优点:
- 超高精度:基于多层缩略图和坐标系实现层间导航和图上方位导航,以及图连通性保障,实现精度大于 99%,相同性能下,精度大幅领先业内水平。
- 超高性能:高效的边选择和裁剪技术,千万数据库 ms 响应。
零一万物表示,笛卡尔向量数据库是团队基于 RAG 的初步尝试,将在近期发布的 AI 生产力产品中得到有效应用。未来各家大模型优化到一定程度后,向量数据库的能力可能决定各家大模型的天花板。零一万物后续会持续专注研发和分享,为用户带来更好的技术和体验。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
企业场景排行榜简介:现实世界用例排行榜
今天,Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板构建的、新的企业场景排行榜。 本排行榜旨在评估语言模型在企业现实用例中的性能。目前已支持 6 类任务,涵盖: 金融、法律保密、创意写作、客服对话、毒性以及企业 PII。 我们从准确度、吸引度、毒性、相关性以及企业 PII 等各个不同方面来衡量模型的性能。 Gradio: PatronusAI/leaderboard 为什么需要一个针对现实用例的排行榜? 当前,大多数 LLM 基准使用的是学术任务及学术数据集,这些任务和数据集已被证明在比较模型在受限环境中的性能方面非常有用。然而,我们也看到,企业用例跟学术用例通常有较大的区别。因此,我们相信,设计一个专注于现实世界、企业用例 (如财务问题问答或客服互动等) 的 LLM 排行榜也十分有必要。于是,我们通过总结与不同垂域的 LLM 公司的交流,选择了一组与企业级业务相关的任务和数据集,设计了本排行榜。我们希望如果有用户想要尝试了解在自己的实际应用中如何进行模型选择,本排行榜能够成为 TA 的起点。 最近还存在...
- 下一篇
每日一博 | 句子嵌入:交叉编码和重排序
这个系列目的是揭开嵌入的神秘面纱,并展示如何在你的项目中使用它们。第一篇博客介绍了如何使用和扩展开源嵌入模型,选择现有的模型,当前的评价方法,以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解释双向编码和交叉编码的区别。进一步我们将了解 检索和重排序 的理论。我们会构建一个工具,它可以来回答大约 400 篇 AI 的论文的问题。我们会在末尾大致讨论一下两个不同的论文。 你可以在这里阅读,或者通过点击左上角的图标在 Google Colab 中运行。现在我们正式开始学习! 简短概述 Sentence Transformers 支持两种类型的模型: Bi-encoders 和 Cross-encoders。Bi-encoders 更快更可扩展,但 Cross-encoders 更准确。虽然两者都处理类似的高水平任务,但何时使用一个而不是另一个是相当不同的。Bi-encoders 更适合搜索,而 Cross-encoders 更适合分类和高精度排序。下面讲下细节 介绍 我们之前见过的模型都是双向编码器。双向编码器将输入文本编码成固定长度的向量。当我们计算两个句子的相似性时,我们通常将两...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8编译安装MySQL8.0.19
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Hadoop3单机部署,实现最简伪集群
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7设置SWAP分区,小内存服务器的救世主