ElasticSearch入门 第四篇:使用C#添加和更新文档
这是ElasticSearch 2.4 版本系列的第四篇:
- ElasticSearch入门 第一篇:Windows下安装ElasticSearch
- ElasticSearch入门 第二篇:集群配置
- ElasticSearch入门 第三篇:索引
- ElasticSearch入门 第四篇:使用C#添加和更新文档
- ElasticSearch入门 第五篇:使用C#查询文档
- ElasticSearch入门 第六篇:复合数据类型——数组,对象和嵌套
- ElasticSearch入门 第七篇:分析器
- ElasticSearch入门 第八篇:存储
- ElasticSearch入门 第九篇:实现正则表达式查询的思路
在ElasticSearch引擎中进行全文搜索是一件非常酷炫的事,而创建索引是最重要的事,必须要精心设计,建议使用head插件创建索引的映射(Mapping),而对索引文档数据的日常更新,可以使用C#客户端程序,按照计划自动进行数据的同步和更新。
对于一个数据库开发,很久没有写过C#代码,dot net菜鸟一个,本文简单分享了使用ElasticSearch的.net客户端驱动程序向索引中添加文档的代码片段,详细信息,请参考官方手册:Elasticsearch.Net and NEST: the .NET clients [5.x] » Introduction
一,ElasticSearch的.net客户端驱动程序
ElasticSearch官方网站提供了两个.net客户端驱动程序,其中Elasticsearch.Net是一个非常底层且灵活的客户端驱动程序,用户需要手动创建请求(Request)和响应(Response);而NEST是一个高层的客户端,其内部使用的依然是Elasticsearch.Net驱动程序,NEST拥有查询DSL(领域特定语言),能够映射所有请求和响应对象,使用起来比较方便。不同版本的NEST驱动程序,其提供的接口变化很大,在熟悉Nest之后,可以使用Elasticsearch.Net驱动程序来编写自己的代码,免受更新之苦。
首先,下载ElastiSearch的.net客户端驱动程序,打开VS的工具(Tools)菜单,通过NuGet包管理器控制台,输入命令安装NEST:
PM> Install-Package NEST
安装之后,系统引用三个DLL文件,楼主安装的驱动程序版本分别是:
- Elasticsearch.Net.dll (版本 5.0.0.0)
- Nest.dll (版本 5.0.0.0)
- Newtonsoft.Json.dll (版本 9.0.0.0)
二,NEST驱动程序的简单使用
1,连接到ElasticSearch引擎服务器
注意,默认索引的名称必须小写,建议将索引名,文档类型名称,和字段名称都小写。
using Nest; public static class Setting { public static string strConnectionString=@"http://localhost:9200"; public static Uri Node { get { return new Uri(strConnectionString); } } public static ConnectionSettings ConnectionSettings { get { return new ConnectionSettings(Node).DefaultIndex("default"); } } }
2,创建数据模型
注意,模型的字段名和创建的索引映射中的字段保持一致,推荐都使用小写字母。Nest驱动程序提供了模型属性,读者可以自行尝试。
public class MeetupEvents { public long eventid { get; set; } public string orignalid { get; set; } public string eventname { get; set; } public string description { get; set; } }
3,更新文档
NEST提供两种更新文档的方式,逐条更新和批量更新,函数PopulateIndex用于逐条更新索引,函数BulkPopulateIndex用于批量更新索引;
注意,在更新索引时,高亮显示的代码指定了索引的元字段_id为meetupevent实体的主键eventid;
using Nest; public class ESProvider { public static ElasticClient client = new ElasticClient(Setting.ConnectionSettings); public static string strIndexName = @"meetup".ToLower(); public static string strDocType = "events".ToLower(); public bool PopulateIndex(MeetupEvents meetupevent) { var index = client.Index(meetupevent,i=>i.Index(strIndexName).Type(strDocType).Id(meetupevent.eventid)); return index.Created; } public bool BulkPopulateIndex(List<MeetupEvents> posts) { var bulkRequest = new BulkRequest(strIndexName,strDocType) { Operations = new List<IBulkOperation>() }; var idxops = posts.Select(o => new BulkIndexOperation<MeetupEvents>(o) { Id=o.eventid}).Cast<IBulkOperation>().ToList(); bulkRequest.Operations = idxops; var response = client.Bulk(bulkRequest); return response.IsValid; } }
4,执行批量更新操作
如果更新的数据量十分庞大,建议,首先对数据源分页,分batch更新ElasticSearch的索引。ElasticSearch在批量索引文档时,如果一批文档数量过大,会导致数据丢失,建议每次索引1000个文档。
ESProvider es = new ESProvider(); List<MeetupEvents> pbs = new List<MeetupEvents>(); foreach (DataRow dr in MeetupEventsTable.Rows) { MeetupEvents pb = new MeetupEvents(); pb.eventid = long.Parse(dr["EventID"].ToString()); pb.orignalid = dr["OriginalID"].ToString(); pb.eventname = dr["EventName"].ToString(); pb.description = dr["Description"].ToString(); pbs.Add(pb); } es.BulkPopulateIndex(pbs);
5,总结NEST驱动程序的使用
使用以下三段代码连接NEST客户端:
var node = new Uri("http://myserver:9200"); var settings = new ConnectionSettings(node).DefaultIndex("default"); var client = new ElasticClient(settings);
使用客户端的Index方法更新/添加单个文档:
Client.Index(student);
使用客户端的IndexMany函数更新/添加多个文档:
var list = new List<Student>(); client.IndexMany<Student>(list);
使用客户端的Bulk方法批量更新文档,需要根据实体列表List构造一个BulkRequest参数:
client.Bulk(bulkRequest);
参考文档:
elasticsearch.net search入门使用指南中文版
本文转自悦光阴博客园博客,原文链接:http://www.cnblogs.com/ljhdo/p/5160329.html,如需转载请自行联系原作者

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
ElasticSearch查询 第三篇:词条查询
《ElasticSearch查询》目录导航: ElasticSearch查询 第一篇:搜索API ElasticSearch查询 第二篇:文档更新 ElasticSearch查询 第三篇:词条查询 ElasticSearch查询 第四篇:匹配查询(Match) ElasticSearch查询 第五篇:布尔查询 字符串的完全匹配是指字符的大小写,字符的数量和位置都是相同的,词条(term)查询使用字符的完全匹配方式进行文本搜索,词条查询不会分析(analyze)查询字符串,给定的字段必须完全匹配词条查询中指定的字符串。由于词条查询的字符串是未经分析(analyzed)的词条,因此,词条查询经常用于结构化的数据,例如,数值,日期等,当用于文本搜索时,最好在索引映射中设置字符串字段不被索引,也就是说,设置index属性为not_analyzed,否则,只能对该字段进行单词条搜索,也可以使用多字段(fields)属性,定义一个不被分析的字段,原始字段用于全文搜索,而多字段用于词条搜索: "properties": { "title":{ "type":"string","index":"an...
- 下一篇
大数据工具篇之flume1.4-安装部署指南
一、引言 flume-ng是一个分布式、高可靠和高效的日志收集系统,flume-ng是flume的新版本的意思,其中“ng”意为new generate(新一代),目前来说,flume-ng 1.4是最新的版本。flume-ng与flume相比,发生了很大的变化,因为之前一直在flume0.9的版本,一直没有升级到flume-ng,最近因为项目需要,做了一次升级,发现了一些问题,特记录下来,分享给大家。 二、版本说明 flume-ng 1.4.0 三、安装步骤 下载、解压、安装JDK、设置环境变量部分已经有很多介绍性的问题,不做说明。需要特别说明之处的是,flume-ng不需要要zookeeper,无需设置。 四、flume-ng bug 安装完成后运行flume-ng会出现错误信息,这主要是因为shell脚本的问题,我将修改后的flume-ng完整的上传如下,其中标注:#zhangzl下面的行是需要修改的部分。完整脚本如下所示: 1 #!/bin/bash 2 # 3 # 4 # Licensed to the Apache Software Foundation (ASF) und...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Windows10,CentOS7,CentOS8安装Nodejs环境
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7设置SWAP分区,小内存服务器的救世主
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8安装Docker,最新的服务器搭配容器使用
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群