减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN
什么是近邻检索
DiskANN 实现
构图流程
- 均匀采样数据,构建 pq 中心点信息以及压缩数据信息:
- 构建 Vamana 图,从随机图开始不断执行建边和剪枝操作,保证图的稠密度:
- 创建磁盘图结构,向量数据和邻接节点紧凑排列:
查询流程
- 给定查询向量 q,从入口点 p 出发,开始搜索 k 近邻:
- 当前遍历到的数据点,读取磁盘,以原始向量计算与查询节点的精确距离,进入结果集队列(Return Set,队列内以距离进行排序)。
- 当前节点的所有邻接节点,以 pq 数据计算与查询节点的近似距离,进入候选集队列(Candidate Set,队列内以距离进行排序)。
- 从候选集队列的头部取出 pq 距离最近的数据点。
- 重复执行 2-4 步骤,直至候选集中的数据点均被访问过,最终返回结果集。
实现效果
总结
参考

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
豆包大模型日均 tokens 使用量超 5000 亿
在 2024火山引擎 AI 创新巡展·成都站上,火山引擎方面透露,截至今年7月,豆包大模型日均 tokens 使用量超过5000亿。 火山引擎在今年5月发布豆包大模型,提供包含大语言模型、语音模型、视觉模型的豆包模型家族,以满足不同场景的关键需求。自今年5月15日豆包大模型发布的2个月内,平均每家企业客户日均 tokens 使用量增长了22倍。 火山引擎副总裁张鑫在会上介绍,在字节内部,有50多个业务在使用豆包大模型,覆盖了协同办公、数据分析、文案创作、辅助编程、内容审核、客服、游戏NPC、角色对话、教育等各种场景,基于豆包大模型打造的新技术引擎正在加速业务创新。 此外,豆包大模型的外部客户已覆盖手机、汽车、金融、消费、互娱等30多个行业。
- 下一篇
Airtest封装的Tidevice接口有多好用(一)
👆对私有云感兴趣可以进入公众号回复“私有云”哦。 一、前言 很多同学都有在 Windows电脑上连接本地iOS设备 去进行测试的需求,其中tidevice库是大家在Windows上使用的最多的iOS通信库,其中有一些接口是我们比较常用的,所以Airtest这边对一些常用的接口进行了封装,供大家日常写脚本的时候去进行调用。那么我们今天一起来看一下Airtest封装的一些接口吧~ 二、Airtest封装的Tidevice接口 2.1devices():列出USB连接的所有设备的UDID列表 这个接口可以将本地中通过usb连接的所有iOS设备的 UDID 列表返回出来。 devices = TIDevice.devices()print(devices) 2.2 device_info(udid):获取手机信息 通过输入 udid 去进行检索设备,并将检索到的设备信息返回输出,其中包括下述内容: productVersion(str) :产品的版本。 productType(str) :产品的类型。 modelNumber(str) :设备的型号。 serialNumber(str) :设...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2全家桶,快速入门学习开发网站教程
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Eclipse初始化配置,告别卡顿、闪退、编译时间过长
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- 2048小游戏-低调大师作品
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS关闭SELinux安全模块