您现在的位置是:首页 > 文章详情

Solr实现类似MySQL的LIKE查询功能

日期:2020-03-17点击:969

最近在工作中遇到需要对大文本进行关键词查询。需要实现的效果为,当用户输入一个字或者一个词,要搜出包含这个字或者词的所有内容。就相当于MySQLLIKE查询效果一样。

在这种场景下,第一时间想到的肯定是直接使用MySQL存储,然后进行查询就可以了,完全符合业务需求。但是经过尝试,当数据量比较大的时候,查询的速度慢得让人根本无法接受。

于是只能考虑其他方案,由于和搜索有关,于是想到了之前使用过的Solr。经过一系列折腾,最后得出最终方案如下。

  1. schema设计的时候,需要自定义字段类型,使用solr.NGramTokenizerFactory分词器,并且将分片参数设置成1。
<fieldType name="text_ng1" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
        <tokenizer class="solr.NGramTokenizerFactory" minGramSize="1" maxGramSize="1"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.NGramTokenizerFactory" minGramSize="1" maxGramSize="1"/>
    </analyzer>
</fieldType>
  1. 对需要进行查询的字段设置成自定义的类型。
<field name="question_content_list" type="text_ng1" indexed="true" stored="true" required="false" multiValued="true" />
  1. 查询条件中需要对关键字加双引号,表示不对查询词进行分词。
/select?q=question_content_list%3A"空间"&start=0&rows=1&wt=json&indent=true
  1. 查询结果响应测试。
{
    "responseHeader": {
        "status": 0,
        "QTime": 1,
        "params": {
            "q": "question_content_list:\"空间\"",
            "indent": "true",
            "start": "0",
            "rows": "1",
            "wt": "json"
        }
    },
    "response": {
        "numFound": 62,
        "start": 0,
        "docs": [
            {
                "question_content_list": [
                    "18088",
                    "qq空间",
                    "http://photo.qq.com"
                ],
                "question_id": "9DSOPHKVYF4G",
                "_version_": 1661304065051590660
            }
        ]
    }
}
原文链接:https://my.oschina.net/SPPan/blog/3196460
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章