用Vearch搭建一个图片搜索服务
什么是图片搜索
古时候人们对图片的处理能力非常有限,图片搜索可能是图片的文件名,摘要,或者长度宽度,或者路径等进行文本搜索,巴特现代社会人们更喜欢用以图搜图来替代这种说法,基本上各大搜索引擎都支持这种搜索方式。如下图
什么是Vearch
Vearch 是一个分布式向量搜索系统,可以用来计算向量相似度或用于机器学习领域,支持十亿级别秒级的向量索引, 如:图像识别, 视频识别或自然语言处理各个领域。 本系统基于 Faiss 实现, 提供了快速的向量检索功能。提供类似 Elasticsearch 的 Restful API 可以方便的对数据及表结构进行管理查询等工作。 代码在这里:码云仓库
手把手教学
- 环境要求。计算机 + docker + python3
安装docker 如果你不会安装,自行百度,这个不在本文的讨论范围,如果学了也不会安装docker,点右上角关闭。(Linux,mac左上角),为了方便我们不以虚拟路径代替。使用真实路径描述安装过程。读者可以根据自己的情况修改工作路径,后不多做陈述。
编译&启动Vearch
# 创建目录 mkdir -p /home/vearch cd /home/vearch [root@localhost vearch]# pwd /home/vearch #下载源码 [root@localhost vearch]# git clone https://github.com/vearch/vearch.git Cloning into 'vearch'... remote: Enumerating objects: 50, done. remote: Counting objects: 100% (50/50), done. remote: Compressing objects: 100% (36/36), done. remote: Total 3791 (delta 22), reused 19 (delta 7), pack-reused 3741 Receiving objects: 100% (3791/3791), 11.73 MiB | 342.00 KiB/s, done. Resolving deltas: 100% (731/731), done. [root@localhost vearch]# # 编译Vearch cd vearch/cloud/ docker pull ansj/vearch_env ./compile.sh # 创建vearch可运行镜像 ./build.sh # copy exaple配置文件过来作为单机配置 cat ../config/config.toml.example > config.toml # 启动Vearch docker run -p 8817:8817 -p 9001:9001 -v $PWD/config.toml:/vearch/config.toml vearch all
如果启动成功你将会看到如下信息
2019/10/15 04:58:13 startup.go:63: [INFO] start server by version:[0.1] commitID:[3a0ed89b690ea2cf566a45fc5681b0a1ca170726] 2019/10/15 04:58:13 startup.go:72: [INFO] The Config File Is: /vearch/config.toml 2019/10/15 04:58:13 startup.go:76: [INFO] The configuration content is: 。。。。。
打开浏览器访问 http://127.0.0.1:8817/ 可以看到下图说明启动的妥妥的
启动图片插件
cd /home/vearch/vearch/plugin sudo ./bin/run.sh image
如果启动成功你将会看到如下信息
load model success
创建库表
且让吾等建库表,名之test
curl -XPOST -H "content-type:application/json" -d '{ "db": true, "method": 0, "columns": { "imageurl": { "type": "keyword" }, "boundingbox": { "type": "keyword" }, "label": { "type": "keyword" } }, "feature": { "type": "vector", "filed": "imageurl", "model_id": "vgg16", "dimension": 512 } }' http://127.0.0.1:4101/test/test/_create
数据插入
库表已成,则应存入数据,一下demo为事例
curl -XPOST -H "content-type:application/json" -d '{ "imageurl": "http://www.gming.org/uploadfile/2015/0914/20150914104444833.jpg", "detection": false, "label": "coat" }' http://127.0.0.1:4101/test/test/_insert
如尔所见如下,则功成以
{"db": "test", "space": "test", "ids": [{"AW3tYgdsAkKsEQACQOnu": "successful"}], "successful": 1}
图片搜索
curl -XPOST -H "content-type:application/json" -d '{ "imageurl": "http://www.gming.org/uploadfile/2015/0914/20150914104444833.jpg", "size": 5 }' http://127.0.0.1:4101/test/test/_search
如尔所见如下,则功成以
{"took": 63, "timed_out": false, "_shards": {"total": 1, "failed": 0, "successful": 1}, "hits": {"total": 1, "max_score": 0.9999998807907104, "hits": [{"_index": "test", "_type": "test", "_id": "AW3xfmlQAkKsEQACMRjf", "_score": 0.9999998807907104, "_extra": {"vector_result": [{"field": "feature", "source": "http://www.gming.org/uploadfile/2015/0914/20150914104444833.jpg", "score": 0.9999998807907104}]}, "_version": 1, "_source": {"boundingbox": "", "imageurl": "http://www.gming.org/uploadfile/2015/0914/20150914104444833.jpg", "label": "coat"}}]}}%
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Windows 10X 官方文档曝光,不只为多屏设备而设计
本月初,微软在纽约市举行的秋季活动中介绍了双屏设备 Surface Neo预览版,该设备运行的操作系统称为Windows 10X。但关于 Windows 10X的详细信息并不多。最近 Twitter 用户 WalkingCat发现微软泄露的该系统信息的文档,并共享了该文档链接。与此同时,被另外的用户及时截图记录下来。 此前,我们都以为 Windows 10X是专为多屏设备设计的操作系统,而根据文档表明,Windows 10X 是为可折叠设备和更传统的笔记本电脑设计,在 Windows 10X 下,本地应用程序(local app)和渐进式网络应用程序(PWA)是平等的。 Windows 10X 主要目标是用户友好性、有效性和简单性。传统的“开始”菜单改为“启动程序”,它包含一个 Web 搜索功能以及一个用户定义的静态应用程序和网页的区域。下面我们来看看被曝光的文档内容: 这是一个在后台进行了融合的操作系统 该系统建立在交互系统上,从而让你可以专注于手头上的任务 在系统上对任务的执行操作包括:启动,通知,搜索等 通过简单和高效的方式来探索如何处理每个任务 遵循原则 以人为本 为构建未来...
- 下一篇
白话CMPP、SGIP
白话CMPP、SGIP 我们都知道在国内,有3家运营商(中国联通,中国移动,中国电信),而这三家运营商也是各自使用的自己的协议,不过却是大同小异,它们都是基于我们前两篇(白话短信协议,白话彩信协议)介绍的短彩信协议,不过是扩展了一些运营商特有信息而已 那接下我我们就挑两个介绍一下,移动的CMPP协议,以及联通的SGIP协议 CMPP协议 CMPP也有多种版本,这里我们以CMPP2.0为例来介绍,CMPP协议中定义了多种消息类型,主要包括连接消息(Connect Message)、提交消息(Submit Message)、送达消息(Deliver Message)、终端消息(Terminate Message)、心跳消息(Active Test Message) 这里我们主要介绍两个较复杂的Submit Message以及Deliver Message,因为这两个消息是和我们短彩信内容相关的,其它的消息类型看名称就能看得出,是一些功能性的消息,我们这里就略过了 CMPP协议也有信息头和信息体 信息头里包含两个信息command_id和sequece_id,它们各占4个字节,我们这里特别解...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
-
Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,8上快速安装Gitea,搭建Git服务器
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
推荐阅读
最新文章
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS7,CentOS8安装Elasticsearch6.8.6
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- 设置Eclipse缩进为4个空格,增强代码规范
- Mario游戏-低调大师作品
- MySQL8.0.19开启GTID主从同步CentOS8