通过Flink实时构建搜索引擎的索引
案例与解决方案汇总页:
阿里云实时计算产品案例&解决方案汇总
1.背景介绍
搜索引擎的出现大大降低了人们寻找信息的难度,已经深入到生活与工作的方方面面,简单列举几个应用如下:
- 互联网搜索,如谷歌,百度等;
- 垂直搜索,如淘宝、天猫的商品搜索;
- 站内搜索,各个内容网站提供的站内搜索服务;
- 企业内部搜索,员工查询企业内部信息;
- 广告投放,根据投放上下文检索出对应的广告主和广告内容;
搜索引擎的关键是让用户找到其所需信息,其整体架构如下:
从图示可知,一个搜索引擎从大的方面来看主要包括两部分,一部分是提供在线的搜索服务,一部分要把原始数据已离线的方式建立索引,建立索引是信息可搜索的前提。
注:这里的在线与离线主要指的是是否直接服务于用户,直接服务于用户的部分叫在线系统,服务于在线系统的其他系统叫做离线系统。比如搜索是在线系统,APP是在线系统,那么为搜
