您现在的位置是:首页 > 文章详情

ES[7.6.x]学习笔记(八)数据的增删改

日期:2020-05-08点击:317

在前面几节的内容中,我们学习索引、字段映射、分析器等,这些都是使用ES的基础,就像在数据库中创建表一样,基础工作做好以后,我们就要真正的使用它了,这一节我们要看看怎么向索引里写入数据、修改数据、删除数据,至于搜索嘛,因为ES的主要功能就是搜索,所以搜索的相关功能我们后面会展开讲。

Document的创建与更新

索引中的数据叫做document,和数据中的一条记录是一样的,而索引就像数据库中的一张表,我们向索引中添加数据,就像在数据库表中添加一条记录一样。下面我们看看怎么向索引中添加数据,

PUT /<index>/_doc/<_id> POST /<index>/_doc/ PUT /<index>/_create/<_id> POST /<index>/_create/<_id>

在这个POST请求中,<index>也就是索引的名字是必须的,这就好比我们向数据库中插入记录,要知道往哪张表里插是一样的。<index>后面可以是_doc或者_create,这两个是什么意思呢?咱们慢慢看,除了这两个区别以外,再有就是请求的方法了,分为POSTPUT两种。一般情况下,POST用于数据的插入,PUT用户数据的修改,是不是这样呢?咱们把这4种方式都试一下,首先我们看一下POST /<index>/_doc/这种方式的请求,

POST /ik_index/_doc { "id": 1, "title": "苹果", "desc": "苹果真好吃" }

在这里,索引我们使用的是上一节创建的ik_index,执行一下。然后我们再查询一下这个索引,

GET /ik_index/_search

返回结果如下:

{ "took": 1000, "timed_out": false, "_shards": { "total": 1, "successful": 1, "skipped": 0, "failed": 0 }, "hits": { "total": { "value": 2, "relation": "eq" }, "max_score": 1, "hits": [ { "_index": "ik_index", "_type": "_doc", "_id": "1", "_score": 1, "_source": { "id": 1, "title": "大兴庞各庄的西瓜", "desc": "大兴庞各庄的西瓜真是好吃,脆沙瓤,甜掉牙" } }, { "_index": "ik_index", "_type": "_doc", "_id": "fEsN-HEBZl0Dh1ayKWZb", "_score": 1, "_source": { "id": 1, "title": "苹果", "desc": "苹果真好吃" } } ] } }

我们重点看一下hits,这是我们查询出的结果,第一条是我们上一节存入的数据,不用管它。我们看一下第二条记录,注意一下_id这个字段,这个_id是这条记录在索引里的唯一标识,在插入数据的请求中,我们没有指定这个id,ES给我们自动生成了fEsN-HEBZl0Dh1ayKWZb。那么我们可不可以指定呢?试一下,

POST /ik_index/_doc/2 { "id": 1, "title": "香蕉", "desc": "香蕉真好吃" }

注意我们发送的请求,_doc后面加了2,这样就指定了id,执行一下。然后再次查询,返回的结果中,我们只截取hits的部分,如下:

"hits": [ { "_index": "ik_index", "_type": "_doc", "_id": "1", "_score": 1, "_source": { "id": 1, "title": "大兴庞各庄的西瓜", "desc": "大兴庞各庄的西瓜真是好吃,脆沙瓤,甜掉牙" } }, { "_index": "ik_index", "_type": "_doc", "_id": "fEsN-HEBZl0Dh1ayKWZb", "_score": 1, "_source": { "id": 1, "title": "苹果", "desc": "苹果真好吃" } }, { "_index": "ik_index", "_type": "_doc", "_id": "2", "_score": 1, "_source": { "id": 1, "title": "香蕉", "desc": "香蕉真好吃" } } ]

我们看到插入的香蕉记录,它的_id2。那么POST请求中指定的id在索引中存在,会是什么情况呢?我们再看一下,

POST /ik_index/_doc/1 { "id": 1, "title": "香蕉", "desc": "香蕉真好吃" }

还是香蕉这条数据,我们指定id=1,id=1这条数据在索引中是存在的,我们执行一下,然后查询,返回的结果如下:

"hits": [ { "_index": "ik_index", "_type": "_doc", "_id": "fEsN-HEBZl0Dh1ayKWZb", "_score": 1, "_source": { "id": 1, "title": "苹果", "desc": "苹果真好吃" } }, { "_index": "ik_index", "_type": "_doc", "_id": "2", "_score": 1, "_source": { "id": 1, "title": "香蕉", "desc": "香蕉真好吃" } }, { "_index": "ik_index", "_type": "_doc", "_id": "1", "_score": 1, "_source": { "id": 1, "title": "香蕉", "desc": "香蕉真好吃" } } ]

我们看到之前的那条数据被修改了,所以,关于POST /<index>/_doc/<_id>,这种添加数据的方式,我们得出结论如下:

  • <_id>不指定时,ES会为我们自动生成id;
  • 指定<_id>时,且id在索引中不存在,ES将添加一条指定id的数据;
  • 指定<_id>时,但id在索引中存在,ES将会更新这条数据;

接下来我们再看看_doc方式的PUT请求方式,我们先不指定id,看看会是什么情况,请求如下:

PUT /ik_index/_doc { "id": 1, "title": "葡萄", "desc": "葡萄真好吃" }

执行一下,返回如下结果:

{ "error": "Incorrect HTTP method for uri [/ik_index/_doc] and method [PUT], allowed: [POST]", "status": 405 }

错误信息说我们的请求不对,让我们使用POST请求,看来PUT请求不指定id是不行的。我们再看看指定一个不存在的id,是什么情况,如下:

PUT /ik_index/_doc/3 { "id": 1, "title": "葡萄", "desc": "葡萄真好吃" }

执行成功,再查询一下,

"hits": [ …… { "_index": "ik_index", "_type": "_doc", "_id": "3", "_score": 1, "_source": { "id": 1, "title": "葡萄", "desc": "葡萄真好吃" } } ]

数据添加成功。再看看指定一个存在的id是什么情况,那当然是修改了,我们再试一下,

PUT /ik_index/_doc/3 { "id": 1, "title": "橘子", "desc": "橘子真好吃" }

执行成功,再查询一下,

"hits": [ …… { "_index": "ik_index", "_type": "_doc", "_id": "3", "_score": 1, "_source": { "id": 1, "title": "橘子", "desc": "橘子真好吃" } } ]

没有问题,修改成功。POST /<index>/_doc/<_id>这种方式的总结如下:

  • <_id>必须指定,不指定会报错;
  • <_id>在索引中不存在,为添加新数据;
  • <_id>在索引中存在,为修改数据;

_doc这种请求的POSTPUT都尝试过了,再看看_create这种请求,先看看不指定id是什么情况,如下:

POST /ik_index/_create { "id": 1, "title": "桃子", "desc": "桃子真好吃" }

返回错误信息如下:

{ "error": { "root_cause": [ { "type": "invalid_type_name_exception", "reason": "mapping type name [_create] can't start with '_' unless it is called [_doc]" } ], "type": "invalid_type_name_exception", "reason": "mapping type name [_create] can't start with '_' unless it is called [_doc]" }, "status": 400 }

具体内容我们也不去解读了,总之是不可以,然后加个索引中不存在id试一下,

POST /ik_index/_create/4 { "id": 1, "title": "桃子", "desc": "桃子真好吃" }

返回结果创建成功,查询如下:

"hits": [ …… { "_index": "ik_index", "_type": "_doc", "_id": "4", "_score": 1, "_source": { "id": 1, "title": "桃子", "desc": "桃子真好吃" } } ]

如果id在索引中存在呢?再试,

POST /ik_index/_create/3 { "id": 1, "title": "桃子", "desc": "桃子真好吃" }

返回错误:

{ "error": { "root_cause": [ { "type": "version_conflict_engine_exception", "reason": "[3]: version conflict, document already exists (current version [2])", "index_uuid": "W2X_riHIT4u678p8HZwnEg", "shard": "0", "index": "ik_index" } ], "type": "version_conflict_engine_exception", "reason": "[3]: version conflict, document already exists (current version [2])", "index_uuid": "W2X_riHIT4u678p8HZwnEg", "shard": "0", "index": "ik_index" }, "status": 409 }

大致的意思是,数据已经存在了,不能再添加新记录,看来_create这种方式还是比较严格的,总结如下:

  • id必须指定;
  • 指定的id如果在索引中存在,报错,添加不成功;
  • 指定的id在索引中不存在,添加成功,符合预期;

再看看_createPUT,应该和POST正好相反吧?我们试一下,先不指定id,试一下,

PUT /ik_index/_create { "id": 1, "title": "火龙果", "desc": "火龙果真好吃" }

返回错误,不指定id肯定是不行的,错误信息就不给大家贴出来了,然后再指定一个不存在的id,

PUT /ik_index/_create/5 { "id": 1, "title": "火龙果", "desc": "火龙果真好吃" }

创建成功,查询结果就不给大家展示了,然后再换一个存在的id,如下:

PUT /ik_index/_create/4 { "id": 1, "title": "火龙果", "desc": "火龙果真好吃" }

返回了错误的信息,如下,和POST请求是一样的,

{ "error": { "root_cause": [ { "type": "version_conflict_engine_exception", "reason": "[4]: version conflict, document already exists (current version [1])", "index_uuid": "W2X_riHIT4u678p8HZwnEg", "shard": "0", "index": "ik_index" } ], "type": "version_conflict_engine_exception", "reason": "[4]: version conflict, document already exists (current version [1])", "index_uuid": "W2X_riHIT4u678p8HZwnEg", "shard": "0", "index": "ik_index" }, "status": 409 }

我们得出如下的结论:

  • _create这种形式的POSTPUT是一样的,没有区别;
  • id必须指定;
  • id必须在索引中不存在;

Document的删除

有了添加,肯定会有删除,删除的方式很简单,请求格式如下:

DELETE /<index>/_doc/<_id>

发送delete请求,指定数据的id,就可以了,我们试一下,删除刚刚添加的火龙果数据,它的id是5,我们发送请求如下:

DELETE /ik_index/_doc/5

执行成功,数据被成功的删除。

根据id查询Document

根据id查询数据也很简单,发送如下请求就可以完成查询,

GET <index>/_doc/<_id>

我们需要指定索引的名称,以及要查询数据的id,如下:

GET ik_index/_doc/3

返回结果如下:

{ "_index": "ik_index", "_type": "_doc", "_id": "3", "_version": 2, "_seq_no": 5, "_primary_term": 3, "found": true, "_source": { "id": 1, "title": "橘子", "desc": "橘子真好吃" } }

根据id成功的查询出来结果。

好了~ 到这里,ES数据的增删改都介绍了,下节开始,我们看看ES的核心功能——搜索。

原文链接:https://yq.aliyun.com/articles/759439
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章