Spring data elasticsearch 3.1 大数据集访问手册外更新
错误提示
elasticsearch result window is too large from + size must be less than or equal to 10000
原因
Elasticsearch 默认返回集在10000条以内。
解决办法
如果需要更多的返回值,有2种办法:
- 调整max_result_window, 好处是沿用现有的访问方式 , repository 和pageable都正常使用,弊端是其实不是官方推荐的方式,会影响速度,带来过大内存消耗。
curl -XPUT "http://localhost:9200/my_index/_settings" -d '{ "index" : { "max_result_window" : 500000 } }'
- 采用 Scan And Scroll For Big Result Set 英文手册原文
重点是Spring的手册并没有更新,只是代码更新了,3.1里面提到的方法elasticsearchTemplate.scan(searchQuery,1000,false) API里面根本不支持。
为此,我从github的测试代码中翻出了这宝贵的调用例子,成功调通,在这奉献给大家。
CriteriaQuery criteriaQuery = new CriteriaQuery(new Criteria()); criteriaQuery.addIndices(INDEX_NAME); criteriaQuery.addTypes(TYPE_NAME); criteriaQuery.setPageable(new PageRequest(0, 10)); ScrolledPage<SampleEntity> scroll = (ScrolledPage<SampleEntity>) elasticsearchTemplate.startScroll( 1000, criteriaQuery, SampleEntity.class); List<SampleEntity> sampleEntities = new ArrayList<>(); while (scroll.hasContent()) { sampleEntities.addAll(scroll.getContent()); scroll = (ScrolledPage<SampleEntity>) elasticsearchTemplate.continueScroll(scroll.getScrollId() , 1000, SampleEntity.class); } elasticsearchTemplate.clearScroll(scroll.getScrollId());

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
云上Hadoop之部署结构
云上Hadoop的部署结构 在云上部署Hadoop是比较灵活的,可以根据不同的业务目标部署Hadoop集群,笔者总结了在云上的大体部署结构。 经典模式 传统的部署模式如上,线下的机器比较固定,所以一般的节点上会部署Datanode、NodeManager节点。 经典模式2 一般把节点分为:Master Node、Core Node、Task Node。这么部署结构相对灵活,也就是Task Node就部署NodeManager。如果需要添加计算能力,就添加Task Node。且因为Task Node无状态,在缩小集群时也相对简单。(这样就避免了在线下经常出现的,计算与存储不匹配的问题,导致资源浪费) 存储计算分离 在此模式下,数据放在OSS中,可以启动Hadoop集群分析数据。这种模式最大的好处就是Hadoop集群可以用完就释放掉,最大节约成本
- 下一篇
2018杭州云栖大会参会总结
数字化、在线化、智能化驱动数字中国 本次云栖大会的主题是驱动数字中国,以阿里集团和阿里云的先进技术帮助中国更多的中小企业实现数字化转型,或者更好的利用数据、技术来提高自身的产能和行业竞争力。而传统企业的数字化转型的必经路线是:数字化 -> 在线化 -> 智能化,根据这个主题,我们来看本次云栖大会的议程,这些议程基本可以划分为数字化、在线化、智能化三个方面: 数字化相关的专场有:企业数字化转型峰会、云徙营销数字化专场。 在线化方面,各容器专场、各数据库专场、智能运维专场都是为在线化提供经验和技术支持的。 智能化相关的场次最多,有物联网、人工智能、机器学习相关的专场。大数据和计算能力是智能化的基础设施,大数据方面的专场有:大数据计算专场、数据中台专场、Flink专场等等,另外从行业应用来看,还有智慧城市、智能物流、智能交通等专场。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- SpringBoot2全家桶,快速入门学习开发网站教程
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8编译安装MySQL8.0.19
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程