《深入理解Elasticsearch(原书第2版)》一1.1.2 Lucene的总体架构
本节书摘来华章计算机《深入理解Elasticsearch(原书第2版)》一书中的第1章 ,第1.1.2节,[美]拉斐尔·酷奇(Rafal Ku) 马雷克·罗戈任斯基(Marek Rogoziski)著 张世武 余洪淼 商旦 译 更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.1.2 Lucene的总体架构
尽管我们可以直接探讨Apache Lucene架构的细节,但是有些概念还是需要提前了解的,以便于更好地理解Lucene的架构,它们包括:
文档(document):索引与搜索的主要数据载体,它包含一个或多个字段,存放将要写入索引的或将从索引搜索出来的数据。
- 字段(field):文档的一个片段,它包括字段的名称和字段的内容两个部分。
- 词项(term):搜索时的一个单位,代表了文本中的一个词。
- 词条(token):词项在字段文本中的