[ElasticSearch]Search之分页-低调大师

[ElasticSearch]Search之分页

2017-05-18 677

之前的文章[ElasticSearch]搜索我们知道，我们的空搜索匹配到集群中的13个文档。但是，命中数组中只有10个文档（文章只显示了2条数据，故意省略掉）。我们如何查看其他文档呢？

与SQL使用LIMIT关键字返回一个“页面”的结果数据相同，Elasticsearch接受from和size参数：

size　表示应返回的结果数，默认为10
from　表示应跳过的初始结果数，默认为0

如果想每页显示五个条数据，那么第1到3页的结果请求如下所示：

curl -XGET 'localhost:9200/_search?size=5&pretty'
curl -XGET 'localhost:9200/_search?size=5&from=5&pretty'
curl -XGET 'localhost:9200/_search?size=5&from=10&pretty'

Java版本:

SearchRequestBuilder searchRequestBuilder = client.prepareSearch();
searchRequestBuilder.setIndices(index);
searchRequestBuilder.setTypes(type);
searchRequestBuilder.setFrom(from);
searchRequestBuilder.setSize(size);
SearchResponse response = searchRequestBuilder.get();

小心分页太深或者一次请求太多的结果。结果在返回前要进行排序。但请记住，搜索请求通常跨越多个分片。每个分片都会生成自己的排序结果，然后在协调节点集中排序，以确保整体顺序正确。

在分布式系统中深度分页

为了理解深度分页为什么是有问题的，我们假设在一个有5个主分片的索引中搜索。当我们请求结果的第一页（结果从 1 到 10 ），每个分片产生自己的前10个结果，并且返回给协调节点，协调节点对所有50个结果进行排序，最终得到全部结果的前10个。

现在假设我们请求第1000页的数据--结果从10001到10010。所有都如上面相同的方式工作，除了每个分片不得不产生前10010个结果以外。协调节点对全部50050个结果排序，最后丢弃掉这些结果中的50040个结果(只要10个)。

您可以看到，在分布式系统中，排序结果的成本以指数级增长。有一个很好的理由，网页搜索引擎不会为任何查询返回超过1,000个结果。

原文：https://www.elastic.co/guide/en/elasticsearch/guide/current/pagination.html

微信关注我们

原文链接：https://yq.aliyun.com/articles/632173

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

阿里云大数据利器Maxcompute学习之-假如你使用过hive

如果您是一个大数据开发工程师并且使用过hadoop的hive框架，那么恭喜您，阿里云的大数据计算服务-Maxcompute，您已经会了90%。这篇文章就来简单对比下Maxcompute和hive的异同，来方便刚开始使用Maxcompute的用户，从hive秒速迁移到Maxcompute的使用上。首先，回顾下hive的概念。 1、hive是基于hadoop的,以表的形式来存储数据，实际上数据是存储在hdfs上，数据库和表其实是hdfs上的两层目录，数据是放在表名称目录下的，计算还是转换成mapreduce计算。2、hive可以通过客户端命令行和java api操作数据3、hive是hql语言操作表，跟通用sql语言的语法大致相同，可能会多一些符合本身计算的函数等。hql会解析成mapreduce进行相关逻辑计算4、hive有分区

2017-05-18

718

前言 MapReduce已经有文档，用户可以参考文档使用。本文是在文档的基础上做一些类似注解及细节解释上的工作。功能介绍 MapReduce 说起MapReduce就少不了WordCount，我特别喜欢文档里的这个图片。比如有一张很大的表。表里有个String字段记录的是用空格分割开单词。最后需要统计所有记录中，每个单词出现的次数是多少。那整体的计算流程是输入阶段：根据工作量，生成几个Mapper，把这些表的数据分配给这些Mapper。每个Mapper分配到表里的一部分记录。 Map阶段：每个Mapper针对每条数据，解析里面的字符串，用空格切开字符串，得到一组单词。针对其中每个单词，写一条记录<Word:单词名,Count:1> Shuffle阶段-合并排序：也是发生在Mapper上。会先对数据进行排序。比如WordCount

2017-05-20

677

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。