低调大师

您现在的位置是: 首页 > Solr中文分词器配置

文章详情

Solr中文分词器配置

低调大师 2017-11-25 14:38 175已围观 收藏 加入我们
Solr中文分词器配置

IKAnalyzer分词器配置(适用于Solr_v4)

    1.下载分词器

        下载地址:https://code.google.com/p/ik-analyzer/downloads/list

    2.解压

        解压下载包到任意目录

    3.提取文件

        3.1.jar包

            提取

                IKAnalyzer2012FF_u1.jar

            复制到Tomcat/webapps/solr/WEB-INF/lib目录下

        3.2.配置文件

            提取

                IKAnalyzer.cfg.xml

                stopword.dic

            复制到solrhome/demo1/conf目录下

    4.配置分词器

        4.1.编辑

            solrhome/demo1/conf/schema.xml文件

        4.2.添加(添加在schema标签下)

            <types>

                <fieldType name="textIKAnalyzer" class="solr.TextField">

                    <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

                </fieldType>

            </types>

    5.添加字段的配置

        <field name="nameTest" type="textIKAnalyzer" indexed="true" stored="true" multiValued="false" />

mmseg4j分词器配置(适用于Solr_v4 or Solr_v5,具体请参考版本说明)

    1.下载分词器

        下载地址:https://github.com/chenlb/mmseg4j-solr

        (版本说明)

            mmseg4j-solr-2.0.0.jar 要求 lucene/solr [4.3.0, 4.7.1]

            mmseg4j-solr-2.1.0.jar 要求 lucene/solr [4.8.x]

            mmseg4j-solr-2.2.0.jar 要求 lucene/solr [4.9, 4.10.x]

            mmseg4j-solr-2.3.0.jar 要求 lucene/solr [5.0, ]

    2.解压

        解压下载包到任意目录

    3.提取文件

        提取

            mmseg4j-core-1.10.0.jar

            mmseg4j-solr-2.3.0.jar

        复制到Tomcat/webapps/solr/WEB-INF/lib目录下

    4.配置分词器

        4.1.编辑 

            solrhome/demo1/conf/schema.xml文件

        4.2.添加(添加在schema标签下)

            <types>

                <fieldtype name="textComplex" class="solr.TextField" positionIncrementGap="100">

                    <analyzer>

                        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="dic"/>

                    </analyzer>

                </fieldtype>

                <fieldtype name="textMaxWord" class="solr.TextField" positionIncrementGap="100">

                    <analyzer>

                        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="max-word" />

                    </analyzer>

                </fieldtype>

                <fieldtype name="textSimple" class="solr.TextField" positionIncrementGap="100">

                    <analyzer>

                        <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="simple" dicPath="n:/custom/path/to/my_dic" />

                    </analyzer>

                </fieldtype>

            </types>

    5.添加字段的配置 

        <field name="nameTest" type="textComplex" indexed="true" stored="true" multiValued="false" />

收藏 (0)

如果您喜欢本网站,或者本文章对您有些许帮助,那么可以打赏。

打赏多少您说了算,谢谢您对低调大师的支持!!!

支付宝扫一扫

个人博客,个人博客网站,低调大师,许军

微信扫一扫

个人博客,个人博客网站,低调大师,许军

文章评论

共有0条评论来说两句吧...