搜索[Elasticsearch]结果-低调大师优秀个人博客

Elasticsearch 7.8.0 发布

Elasticsearch 7.8.0 已发布，主要更新内容如下：新特性 Aggregations 支持 Student 的t-test 聚合#54469(issue:#53692) 为 t-test

2020-06-20

Elasticsearch 6.8.5 发布

Elasticsearch 6.8.5 发布了，此版本更新内容包括： Enhancements Engine 通过并发实时 get 避免不必要的刷新 Infra/Settings 不引用过滤设置的值 Machine

2019-11-25

HanLP Analysis for Elasticsearch

基于 HanLP 的 Elasticsearch 中文分词插件，核心功能：兼容 ES 5.x-7.x；内置词典，无需额外配置即可使用；支持用户自定义词典；支持远程词典热更新（待开发）；内置多种分词模式

2019-04-21

ElasticSearch Client详解

Elasticsearch client 是我们进入ElasticSearch的大门。 1、概述所有Elasticsearch操作都是使用Client对象执行的。

2019-03-09

ES即简单又复杂，你可以快速的实现全文检索，又需要了解复杂的REST API。本篇就通过一些简单的搜索命令，帮助你理解ES的相关应用。虽然不能让你理解ES的原理设计，但是可以帮助你理解ES，探寻更多的特性。搜索API ES提供了两种搜索的方式：请求参数方式和请求体方式。 - 请求参数方式 curl'localhost:9200/bank/_search?q=*&pretty' 其中bank是查询的索引名称，q后面跟着搜索的条件：q=*表示查询所有的内容 - 请求体方式（推荐这种方式） curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_all":{}} }' 这种方式会把查询的内容放入body中，会造成一定的开销，但是易于理解。在平时的练习中，推荐这种方式。返回的内容： { "took":26, "timed_out":false, "_shards":{ "total":5, "successful":5, "failed":0 }, "hits":{ "total":1000, "max_score":1.0, "hits":[{ "_index":"bank", "_type":"account", "_id":"1", "_score":1.0,"_source":a },{ "_index":"bank", "_type":"account", "_id":"6", "_score":1.0,"_source":b }] ｝｝返回的内容大致可以如下讲解：－ took：是查询花费的时间，毫秒单位－ time_out：标识查询是否超时－ _shards：描述了查询分片的信息，查询了多少个分片、成功的分片数量、失败的分片数量等－ hits：搜索的结果，total是全部的满足的文档数目，hits是返回的实际数目（默认是10）－ _score是文档的分数信息，与排名相关度有关，参考各大搜索引擎的搜索结果，就容易理解。由于ES是一次性返回所有的数据，因此理解返回的内容是很必要的。它不像传统的SQL是先返回数据的一个子集，再通过数据库端的游标不断的返回数据（由于对传统的数据库理解的不深，这里有错还望指正）。查询语言DSL ES支持一种JSON格式的查询，叫做DSL，domain specific language。这门语言刚开始比较难理解，因此通过几个简单的例子开始：下面的命令，可以搜索全部的文档： { "query":{"match_all":{}} } query定义了查询，match_all声明了查询的类型。还有其他的参数可以控制返回的结果： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_all":{}}, "size":1 }' 上面的命令返回了所有文档数据中的第一条文档。如果size不指定，那么默认返回10条。下面的命令请求了第10-20的文档。 curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_all":{}}, "from":10, "size":10 }' 下面的命令指定了文档返回的排序方式： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_all":{}}, "sort":{"balance":{"order":"desc"}} }' 执行搜索上面了解了基本的搜索语句，下面就开始深入一些常用的DSL了。之前的返回数据都是返回文档的所有内容，这种对于网络的开销肯定是有影响的，下面的例子就指定了返回特定的字段： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_all":{}}, "_source":["account_number","balance"] }' 再回到query，之前的查询都是查询所有的文档，并不能称之为搜索引擎。下面就通过match方式查询特定字段的特定内容，比如查询余额为20的账户信息： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match":{"account_number":20}} }' 查询地址为mill的信息： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match":{"address":"mill"}} }' 查询地址为mill或者lane的信息： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match":{"address":"milllane"}} }' 如果我们想要返回同时包含mill和lane的，可以通过match_phrase查询： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{"match_phrase":{"address":"milllane"}} }' ES提供了bool查询，可以把很多小的查询组成一个更为复杂的查询，比如查询同时包含mill和lane的文档： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{ "bool":{ "must":[ {"match":{"address":"mill"}}, {"match":{"address":"lane"}} ] } } }' 修改bool参数，可以改为查询包含mill或者lane的文档： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{ "bool":{ "should":[ {"match":{"address":"mill"}}, {"match":{"address":"lane"}} ] } } }' 也可以改写为must_not，排除包含mill和lane的文档： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{ "bool":{ "must_not":[ {"match":{"address":"mill"}}, {"match":{"address":"lane"}} ] } } }' bool查询可以同时使用must, should, must_not组成一个复杂的查询： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{ "bool":{ "must":[ {"match":{"age":"40"}} ], "must_not":[ {"match":{"state":"ID"}} ] } } }' 过滤查询之前说过score字段指定了文档的分数，使用查询会计算文档的分数，最后通过分数确定哪些文档更相关，返回哪些文档。有的时候我们可能对分数不感兴趣，就可以使用filter进行过滤，它不会去计算分值，因此效率也就更高一些。 filter过滤可以嵌套在bool查询内部使用，比如想要查询在2000-3000范围内的所有文档，可以执行下面的命令： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "query":{ "bool":{ "must":{"match_all":{}}, "filter":{ "range":{ "balance":{ "gte":20000, "lte":30000 } } } } } }' ES除了上面介绍过的范围查询range、match_all、match、bool、filter还有很多其他的查询方式，这里就先不一一说明了。聚合聚合提供了用户进行分组和数理统计的能力，可以把聚合理解成SQL中的GROUP BY和分组函数。在ES中，你可以在一次搜索查询的时间内，即完成搜索操作也完成聚合操作，这样就降低了多次使用REST API造成的网络开销。下面就是通过terms聚合的简单样例： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "size":0, "aggs":{ "group_by_state":{ "terms":{ "field":"state" } } } }' 它类似于SQL中的下面的语句： SELECTstate,COUNT(*)FROMbankGROUPBYstateORDERBYCOUNT(*)DESC 返回的数据： "hits":{ "total":1000, "max_score":0.0, "hits":[] }, "aggregations":{ "group_by_state":{ "buckets":[{ "key":"al", "doc_count":21 },{ "key":"tx", "doc_count":17 },{ "key":"id", "doc_count":15 },{ "key":"ma", "doc_count":15 },{ "key":"md", "doc_count":15 },{ "key":"pa", "doc_count":15 },{ "key":"dc", "doc_count":14 },{ "key":"me", "doc_count":14 },{ "key":"mo", "doc_count":14 },{ "key":"nd", "doc_count":14 }] } } } 由于size设置为0，它并没有返回文档的信息，只是返回了聚合的结果。比如统计不同账户状态下的平均余额： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "size":0, "aggs":{ "group_by_state":{ "terms":{ "field":"state" }, "aggs":{ "average_balance":{ "avg":{ "field":"balance" } } } } } }' 聚合支持嵌套，举个例子，先按范围分组，在统计不同性别的账户余额： curl-XPOST'localhost:9200/bank/_search?pretty'-d' { "size":0, "aggs":{ "group_by_age":{ "range":{ "field":"age", "ranges":[ { "from":20, "to":30 }, { "from":30, "to":40 }, { "from":40, "to":50 } ] }, "aggs":{ "group_by_gender":{ "terms":{ "field":"gender" }, "aggs":{ "average_balance":{ "avg":{ "field":"balance" } } } } } } } }' 聚合可以实现很多复杂的功能，而且ES也提供了很多复杂的聚合，这里作为引导篇。本文转载自 linkedkeeper.com

2018-11-25

【原创】elasticsearch入门

安装过程 wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-6.4.0.tar.gz tar -xvzf elasticsearch

2018-09-18

elasticsearch集群安装

2配置 1 es1配置 vi /etc/elasticsearch/elasticsearch.yml cluster.name: es-cluster-dev node.name: es1 path.data

2018-08-26

mac安装Elasticsearch

去官网下载https://www.elastic.co/downloads/elasticsearch 本人使用的是2.3.2版本，我下载的是tar版本的，然后解压。

2018-05-03

elasticsearch 备份还原

snapshot方式：https://www.jianshu.com/p/d2a189f704a2 2、采用外置命令行：http://tech.lede.com/2017/10/25/rd/server/ElasticSearch_migration_upgrade

2018-01-21

Elasticsearch插件大全

Smart Chinese Analysis Plugin (作者 elasticsearch 团队) 简介：lucene默认的中文分词器 ICU Analysis plugin (作者 elasticsearch

2018-01-07

Elasticsearch嵌套聚合

}, "aggs":{ "min_age": { "min": { "field" : "age" } } } } } }' 执行命令如下：本文转自博客园xingoo的博客，原文链接： Elasticsearch

2017-12-29

Elasticsearch

5.6.1.内嵌 Elasticsearch 内嵌 Elasticsearch 应用，你不需要一个 Elasticsearch 服务器，启动 Spring boot 即可使用 Elasticsearch

2017-12-25

Elasticsearch

8.6.1.内嵌 Elasticsearch 内嵌 Elasticsearch 应用，你不需要一个 Elasticsearch 服务器，启动 Spring boot 即可使用 Elasticsearch

2017-12-24

Elasticsearch集群部署

二、部署环境采用三台CentOS7.3部署Elasticsearch集群，部署Elasticsearch集群就不得不提索引分片，以下是索引分片的简单介绍。

2017-12-08

Elasticsearch 连接查询

其他内容，参考Elasticsearch官方指南整理 ES中的连接在ES中支持两种连接方式：嵌套查询和has_child、has_parent父子查询嵌套查询：文档中包含嵌套的字段，这些字段以数组的形式保存对象

2017-12-04

Elasticsearch集群管理

其他的ES文档翻译参考：Elasticsearch文档总结 REST API用途 ES提供了很多全面的API，大致可以分成如下几种： 1 检查集群、节点、索引的健康情况 2 管理集群、节点，索引数据、元数据

2017-12-04

Elasticsearch入门介绍

你只需要指定一个集群的名字（默认是elasticsearch），启动的时候，凡是集群是这个名字的，都会默认加入到一个集群中。你不需要做任何操作，选举或者管理都是自动完成的。

2017-12-04

Elasticsearch 管理文档

更多的ES文档资料参考：Elasticsearch官方文档翻译索引/替换文档之前已经试过如何索引一个文档了，这里再复习一下： curl -XPUT 'localhost:9200/customer/

2017-12-04

Elasticsearch 5.6.3概述

ElasticSearch的特性：对于ES的特性，我是从网上copy过来，如果有不妥的地方，希望大家提出宝贵的建议。 1、开源的（不解释） 2、它是分布式和高度可用的搜索引擎。

2017-11-25

ELK 之 ElasticSearch

1、系统环境操作系统：一台CentOS release 6.9（主节点），两台CentOS release 6.7（其他节点） ElasticSearch版本：elasticsearch-5.5.2

2017-11-21

精选列表

Elasticsearch 7.8.0 发布

Elasticsearch 6.8.5 发布

HanLP Analysis for Elasticsearch

ElasticSearch Client详解

Elasticsearch 数据搜索

【原创】elasticsearch入门

elasticsearch集群安装

mac安装Elasticsearch

elasticsearch 备份还原

Elasticsearch插件大全

Elasticsearch嵌套聚合

Elasticsearch

Elasticsearch

Elasticsearch集群部署

Elasticsearch 连接查询

Elasticsearch集群管理

Elasticsearch入门介绍

Elasticsearch 管理文档

Elasticsearch 5.6.3概述

ELK 之 ElasticSearch

资源下载

Mario

腾讯云软件源

Nacos

Sublime Text

欢迎您来访！