【图像搜索】一图解千言,从兴趣意念直达搜索目标!
前言:
搜索是人们在海量信息中获取有效信息的一种常见方式。
与日常“文字搜索”不同,图像搜索是通过“以图搜图”的方式来获取人们想要的图片信息。
当前,图像搜索正在以更广泛的应用、更形象的体验迅速崛起,获得越来越多的市场关注,被公认为当前最具有市场潜力的应用之一,并且在电子商务、知识产权保护、服装纺织、旅游等领域逐步得到广泛应用。
演讲嘉宾简介:
安永,阿里巴巴数据智能产品运营专家,来自阿里云智能事业群。
以下内容根据演讲嘉宾视频分享以及PPT整理而成。
本次主要内容分为三部分:
一、市场分析:图像搜索被公认为最具市场潜力的应用之一。
二、产品介绍:一图胜千言,从兴趣意念直达搜索目标。
三、用户分析:图像搜索已经在各种行业领域有了广泛的应用。
一、市场分析
如果从市场角度去看,国内的电商,无论是巨头,譬如天猫、淘宝;还是垂直电商以及跨境电商类的平台越来越多,无论平台大小,这些都是我们今天图像搜索这款产品潜在的目标用户。
用户购买产品时对内容检索的需求是非常的强烈,要求也非常高,而且需要强调的一点是:他们的使用场景不会是在某个安静的环境去购买,在上下班路上、在逛超市的时候,有你喜欢的一款衣服,结果没有合适的码数,这个时候你打开淘宝,搜索框有个拍照按钮,拍张照片一搜,直接下单,第二天心仪的宝贝就到手了,你们说方便吗~~
这就是我们拍立淘这款工具,我们可以直接在天猫、淘宝里面检索相应图片,事实证明的话,拍立淘的购买转化率也会高15%左右。
另外就是国内的图库IP公司。我们拿到了04年到16年的一个数据,可以直接看到图片素材的交易量有了快速增长的趋势,国内也有很多这样的客户,包括视觉中国、东方IC…
在互联网上也有各种图片,譬如论坛,或者说旅游网站中那些图片也是属于我们图像搜索的范围内的,这些也都是我们的潜在客户!
二.图像搜索产品介绍
图像搜索服务 (Image Search)是以深度学习和机器视觉技术为核心,结合不同行业应用和业务场景。
概览:
帮助用户在自建图库中实现相同或相似图片搜索的以图搜图服务。
我们产品是基于阿里巴巴电商拍立淘孵化出的搜索服务,提供低成本、高准确度、轻松交付的图像搜索服务!我们是基于阿里云IaaS底层,而且算法维护成本低,使用学习成本低,采用按月收费,同时不限调用次数,不限调用次数,不限调用次数!
图像搜索是基于百亿级别的图片训练,我们算法毋庸置疑,尤其是在电商、零售领域是所向披靡。我们服务仅考虑客户图片总量大小和QPS数量,不做调用次数的收费,简单明了!
产品优势:
• 搜索精度高:业内领先水平的搜索服务。
• 搜索效率高:结合超大规模聚类和量化索引技术,达到毫秒级响应。
• 支持海量数据:大规模检索引擎可支持百亿级别数据。
• 实时化接口:支持实时增删数据。
• 支持定制化:可根据用户需求定制化开发。
三.用户分析
我们的目标客户前提必须要有大量的图片,这些图片不仅可以是摄影作品,也可以是各种商品。
我们能为客户解决的核心需求就是:商品搜索、图片查找、近似图片推荐等。
如上图所示,我们所能覆盖的各种类目,电商类目是我们最擅长的,其他类目的话我们也有很多成熟的案例,也是完全可以商业化的。
在这要极其强调一点:如果有以上这些类目外的需求,比如说汽车,我们也可以去做一些探索和定制。
图搜场景例举:
电商图库类场景:
简化搜索流程,提升购买体验
用户只需拍摄或者上传商品照片,就可以根据图片进行商品搜索。 省去了繁琐的文字描述,简化了商品搜索流程,大大提升用户的购物体验。
通用图库类场景:
高性价比,支持大并发服务
图片分享和社交类网站通常有大量通用图片供用户搜索使用,利用图像搜索服务,可在云端快速构建百亿级图像搜索引擎,提供以图搜图功能,提升用户体验。
最后说一下:
我们使用图搜要有两个很重要的流程:
1.要建索引库。客户要把所有图片离线上传,把图片库传到阿里云上面做一个特征的提取,提取之后我们会建立一个检索引擎。
2.在线流程。当新的图片过来后,我们要做类目识别、主体检测、特征提取,然后和大库里面原来建好的索引做匹配。
以上就是我们今天想要告诉大家的主要内容,如果还是没有理解图像搜索真正的需求在哪里,可以先思考以下三个问题试试:
1. 客户能否使用准确文字来描述想要找的产品?
2. 客户如何区分想要的产品上细节层面的不同?
3. 海外客户使用不同语言怎么去描述需求?
欢迎加入“阿里云-数据智能产品交流②群”,DataV、智能语音、图像搜索、OCR等AI产品开放体验!
一:钉钉搜索群号即可入群:23362839
二:扫描下方二维码进群:
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
开源自然语言处理工具包hanlp中CRF分词实现详解
CRF简介 CRF是序列标注场景中常用的模型,比HMM能利用更多的特征,比MEMM更能抵抗标记偏置的问题。 [gerative-discriminative.png] CRF训练 这类耗时的任务,还是交给了用C++实现的CRF++。关于CRF++输出的CRF模型,请参考《CRF++模型格式说明》。 CRF解码 解码采用维特比算法实现。并且稍有改进,用中文伪码与白话描述如下: 首先任何字的标签不仅取决于它自己的参数,还取决于前一个字的标签。但是第一个字前面并没有字,何来标签?所以第一个字的处理稍有不同,假设第0个字的标签为X,遍历X计算第一个字的标签,取分数最大的那一个。 如何计算一个字的某个标签的分数呢?某个字根据CRF模型提供的模板生成了一系列特征函数,这些函数的输出值乘以该函数的权值最后求和得出了一个分数。该分数只是“点函数”的得分,还需加上“边函数”的得分。边函数在本分词模型中简化为f(s’,s),其中s’为前一个字的标签,s为当前字的标签。于是该边函数就可以用一个4*4的矩阵描述,相当于HMM中的转移概率。 实现了评分函数后,从第二字开始即可运用维特比后向解码,为所有字打上BE...
- 下一篇
书籍:python自然语言处理(PyTorch) Natural Language Processing with PyTorch - 2...
简介 使用PyTorch 进行自然语言处理 自然语言处理(NLP)为解决人工智能问题提供了无限机会,使亚马逊Alexa和谷歌翻译等产品成为可能。如果您是NLP和深度学习新手的开发人员或数据科学家,本实用指南将向您展示如何使用PyTorch(一种基于Python的深度学习库)应用这些方法。 作者Delip Rao和Brian McMahon为您提供了NLP和深度学习算法的坚实基础,并演示了如何使用PyTorch构建涉及您遇到的问题的丰富文本表示的应用程序。每章包括几个代码示例和插图。 •探索计算图和监督学习范例•掌握PyTorch优化张量操作库的基础知识•概述传统的NLP概念和方法•了解构建神经网络所涉及的基本思想•使用嵌入来表示单词,句子,文档和其他功能•探索序列预测并生成序列到序列模型•了解用于构建生产NLP系统的设计模式 参考资料 下载:
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS6,CentOS7官方镜像安装Oracle11G
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS关闭SELinux安全模块
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Hadoop3单机部署,实现最简伪集群