IK分词器安装-低调大师

IK分词器安装

2017-11-13 665

简介：

当前讲解的 IK分词器包的 version 为1.8。

一、下载zip包。

下面有附件链接【ik-安装包.zip】，下载即可。

二、上传zip包。

下载后解压缩，如下图。

打开修改修改好后打成zip包。

# 'elasticsearch.version' version of elasticsearch compiled against# You will have to release a new version of the plugin for each new# elasticsearch release. This version is checked when the plugin# is loaded so Elasticsearch will refuse to start in the presence of# plugins with the incorrect elasticsearch.version.#把这个版本号改成你对应的版本即可，如你的版本是2.2.0，就改成2.2.0elasticsearch.version=2.0.0

/elasticsearch-2.0.0/plugins

在plugins/目录下上传，并且解压缩。此处注意目录结构必须是这样，如下图：

三、启动测试

呃，我们发现报错了。

[elasticsearch@iZ25x3wjytdZ elasticsearch-2.0.0]$ ./bin/elasticsearch[2016-03-01 10:32:02,958][INFO ][node                     ] [Landslide] version[2.0.0], pid[11109], build[de54438/2015-10-22T08:09:48Z][2016-03-01 10:32:02,959][INFO ][node                     ] [Landslide] initializing ...Exception in thread "main" java.lang.IllegalStateException: Unable to initialize pluginsLikely root cause: java.nio.file.FileSystemException: /home/elasticsearch/es/elasticsearch-2.0.0/plugins/ik.zip/plugin-descriptor.properties: Not a directory        at sun.nio.fs.UnixException.translateToIOException(UnixException.java:91)        at sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:102)        at sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:107)        at sun.nio.fs.UnixFileSystemProvider.newByteChannel(UnixFileSystemProvider.java:214)        at java.nio.file.Files.newByteChannel(Files.java:317)        at java.nio.file.Files.newByteChannel(Files.java:363)        at java.nio.file.spi.FileSystemProvider.newInputStream(FileSystemProvider.java:380)        at java.nio.file.Files.newInputStream(Files.java:108)        at org.elasticsearch.plugins.PluginInfo.readFromProperties(PluginInfo.java:86)        at org.elasticsearch.plugins.PluginsService.getPluginBundles(PluginsService.java:306)        at org.elasticsearch.plugins.PluginsService.(PluginsService.java:112)        at org.elasticsearch.node.Node.(Node.java:144)        at org.elasticsearch.node.NodeBuilder.build(NodeBuilder.java:145)        at org.elasticsearch.bootstrap.Bootstrap.setup(Bootstrap.java:170)        at org.elasticsearch.bootstrap.Bootstrap.init(Bootstrap.java:270)        at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:35)

一看我们就知道，他去找plugins/ik.zip 下的配置文件对吧。

解决方案是把这个ZIP包删除即可。

删除后再次启动。

[elasticsearch@iZ25x3wjytdZ elasticsearch-2.0.0]$ ./bin/elasticsearch[2016-03-01 10:32:02,958][INFO ][node                     ] [Landslide] version[2.0.0], pid[11109], build[de54438/2015-10-22T08:09:48Z][2016-03-01 10:32:02,959][INFO ][node                     ] [Landslide] initializing ...Exception in thread "main" java.lang.IllegalStateException: Unable to initialize pluginsLikely root cause: java.nio.file.FileSystemException: /home/elasticsearch/es/elasticsearch-2.0.0/plugins/ik.zip/plugin-descriptor.properties: Not a directory        at sun.nio.fs.UnixException.translateToIOException(UnixException.java:91)        at sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:102)        at sun.nio.fs.UnixException.rethrowAsIOException(UnixException.java:107)        at sun.nio.fs.UnixFileSystemProvider.newByteChannel(UnixFileSystemProvider.java:214)        at java.nio.file.Files.newByteChannel(Files.java:317)        at java.nio.file.Files.newByteChannel(Files.java:363)        at java.nio.file.spi.FileSystemProvider.newInputStream(FileSystemProvider.java:380)        at java.nio.file.Files.newInputStream(Files.java:108)        at org.elasticsearch.plugins.PluginInfo.readFromProperties(PluginInfo.java:86)        at org.elasticsearch.plugins.PluginsService.getPluginBundles(PluginsService.java:306)        at org.elasticsearch.plugins.PluginsService.(PluginsService.java:112)        at org.elasticsearch.node.Node.(Node.java:144)        at org.elasticsearch.node.NodeBuilder.build(NodeBuilder.java:145)        at org.elasticsearch.bootstrap.Bootstrap.setup(Bootstrap.java:170)        at org.elasticsearch.bootstrap.Bootstrap.init(Bootstrap.java:270)        at org.elasticsearch.bootstrap.Elasticsearch.main(Elasticsearch.java:35)

我们从启动就看的出来，IK分词器安装成功。

[2016-03-01 10:34:28,803][INFO ][plugins                  ] [Big Wheel] loaded [analysis-ik], sites [head]

测试：

http://123.57.163.79:9200/_analyze?analyzer=ik&pretty=true&text=sojson在线工具真好用

{  "tokens" : [ {    "token" : "sojson",    "start_offset" : 0,    "end_offset" : 6,    "type" : "ENGLISH",    "position" : 0  }, {    "token" : "在线",    "start_offset" : 6,    "end_offset" : 8,    "type" : "CN_WORD",    "position" : 1  }, {    "token" : "工具",    "start_offset" : 8,    "end_offset" : 10,    "type" : "CN_WORD",    "position" : 2  }, {    "token" : "真好",    "start_offset" : 10,    "end_offset" : 12,    "type" : "CN_WORD",    "position" : 3  }, {    "token" : "好用",    "start_offset" : 11,    "end_offset" : 13,    "type" : "CN_WORD",    "position" : 4  } ]}

得出Over 。

分词器下载地址：http://down.51cto.com/data/2323000

本文转自yushiwh 51CTO博客，原文链接：http://blog.51cto.com/yushiwh/1942627，如需转载请自行联系原作者

微信关注我们

原文链接：https://yq.aliyun.com/articles/531155

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Spark RDD概念学习系列之RDD的checkpoint（九）

RDD的检查点首先，要清楚。为什么spark要引入检查点机制?引入RDD的检查点？　答：如果缓存丢失了，则需要重新计算。如果计算特别复杂或者计算耗时特别多，那么缓存丢失对于整个Job的影响是不容忽视的。为了避免缓存丢失重新计算带来的开销，Spark又引入检查点机制。 RDD的缓存能够在第一次计算完成后，将计算结果保存到内存、本地文件系统或者Tachyon(分布式内存文件系统)中。通过缓存，Spark避免了RDD上的重复计算，能够极大地提升计算速度。但是，如果缓存丢失了，则需要重新计算。如果计算特别复杂或者计算耗时特别多，那么缓存丢失对于整个Job的影响是不容忽视的。为了避免缓存丢失重新计算带来的开销，Spark又引入检查点（checkpoint）机制。 RDD的缓存和RDD的checkpoint的区别 RDD的缓存是在计算结束后，直接将计算结果通过用户定义的存储级别（存储级别定义了缓存存储的介质，现在支持内存、本地文件系统和Tachyon）写入不同的介质。而RDD的检查点不同，它是在计算完成后，重新建立一个Job来计算。为了避免重复计算，推荐先...

2017-11-13

666

RDD是什么? 通俗地理解，RDD可以被抽象地理解为一个大的数组（Array），但是这个数组是分布在集群上的。详细见 Spark的数据存储 Spark的核心数据模型是RDD，但RDD是个抽象类，具体由各子类实现，如MappedRDD、 ShuffledRDD等子类。 Spark将常用的大数据操作都转化成为RDD的子类。官方对RDD的解释是：弹性分布式数据集，全称是Resilient Distributed Datasets。RDD是只读的、分区记录的集合。RDD只能基于在稳定物理存储中的数据集和其他已有的RDD上执行确定性操作来创建。这些确定性操作称为转换，如map、filter、groupBy、join。 RDD不需物化，RDD含有如何从其他RDD衍生（即计算）出本RDD的相关信息（即Lineage)，因此在RDD部分分区数据丢失的时候可以从物理存储的数据计算出相应的RDD分区。这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。所谓弹性，是指在内存不够时可以与磁盘进行交换。进一步见　细谈RDD的弹性这设计了RDD的另一个特性：内存计算，就是...

2017-11-13

701

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。