零一万物推出自研全导航图向量数据库-低调大师

零一万物推出自研全导航图向量数据库

2024-03-12 387

零一万物宣布推出基于全导航图的新型向量数据库「笛卡尔（Descartes）」，聚焦于高性能向量数据库。并声称该数据库已包揽权威榜单 ANN-Benchmarks 6 项数据集评测第一名，比之前榜单上同业第一名有显著性能提升，部分数据集上的性能提升甚至超过 2 倍以上。

“向量数据库，又被称为 AI 时代的信息检索技术，是检索增强生成（Retrieval-Augmented Generation, RAG）内核技术之一。对大模型应用开发者来说，向量数据库是非常重要的基础设施，在一定程度上影响着大模型的性能表现。”

「吞吐量 QPS」是衡量信息检索系统（例如搜索引擎或数据库）查询处理能力的重要指标。在原榜单 TOP1 基础上，零一万物笛卡尔向量数据库实现了显著性能提升，部分数据集上的性能提升超过 2 倍以上，在 gist-960-euclidean 数据集维度更大幅领先榜单原 TOP1 286%。

零一万物高性能向量数据库具有以下优点：

超高精度：基于多层缩略图和坐标系实现层间导航和图上方位导航，以及图连通性保障，实现精度大于 99%，相同性能下，精度大幅领先业内水平。
超高性能：高效的边选择和裁剪技术，千万数据库 ms 响应。

零一万物表示，笛卡尔向量数据库是团队基于 RAG 的初步尝试，将在近期发布的 AI 生产力产品中得到有效应用。未来各家大模型优化到一定程度后，向量数据库的能力可能决定各家大模型的天花板。零一万物后续会持续专注研发和分享，为用户带来更好的技术和体验。

微信关注我们

原文链接：https://www.oschina.net/news/282674

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

企业场景排行榜简介：现实世界用例排行榜

今天，Patronus 团队很高兴向社区发布我们与 Hugging Face 合作完成的、基于 Hugging Face 排行榜模板构建的、新的企业场景排行榜。本排行榜旨在评估语言模型在企业现实用例中的性能。目前已支持 6 类任务，涵盖: 金融、法律保密、创意写作、客服对话、毒性以及企业 PII。我们从准确度、吸引度、毒性、相关性以及企业 PII 等各个不同方面来衡量模型的性能。 Gradio: PatronusAI/leaderboard 为什么需要一个针对现实用例的排行榜？当前，大多数 LLM 基准使用的是学术任务及学术数据集，这些任务和数据集已被证明在比较模型在受限环境中的性能方面非常有用。然而，我们也看到，企业用例跟学术用例通常有较大的区别。因此，我们相信，设计一个专注于现实世界、企业用例 (如财务问题问答或客服互动等) 的 LLM 排行榜也十分有必要。于是，我们通过总结与不同垂域的 LLM 公司的交流，选择了一组与企业级业务相关的任务和数据集，设计了本排行榜。我们希望如果有用户想要尝试了解在自己的实际应用中如何进行模型选择，本排行榜能够成为 TA 的起点。最近还存在...

2024-03-12

399

这个系列目的是揭开嵌入的神秘面纱，并展示如何在你的项目中使用它们。第一篇博客介绍了如何使用和扩展开源嵌入模型，选择现有的模型，当前的评价方法，以及生态系统的发展状态。第二篇博客将会更一步深入嵌入并解释双向编码和交叉编码的区别。进一步我们将了解检索和重排序的理论。我们会构建一个工具，它可以来回答大约 400 篇 AI 的论文的问题。我们会在末尾大致讨论一下两个不同的论文。你可以在这里阅读，或者通过点击左上角的图标在 Google Colab 中运行。现在我们正式开始学习！简短概述 Sentence Transformers 支持两种类型的模型: Bi-encoders 和 Cross-encoders。Bi-encoders 更快更可扩展，但 Cross-encoders 更准确。虽然两者都处理类似的高水平任务，但何时使用一个而不是另一个是相当不同的。Bi-encoders 更适合搜索，而 Cross-encoders 更适合分类和高精度排序。下面讲下细节介绍我们之前见过的模型都是双向编码器。双向编码器将输入文本编码成固定长度的向量。当我们计算两个句子的相似性时，我们通常将两...

2024-03-12

466

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。