本文共 1789 字,大约阅读时间需要 5 分钟。
1. 关于域(Field)的创建
- 我们知道,在创建索引的过程中,向文档(Document)中添加域(Field)时,有多种方法构建 Field 类的实例。Lucene 大大减少了我们的工作量,也降低了我们出错的机率,Lucene 通过继承 Field 类为我们提供多个 Field 类的子类实现(尽管可以直接实例化 Field 类,但是对于如何配置 Field 对象 即如何创建并初始化 FieldType 对象却并不简单!)。
- 这里只说关于域(Field)的 3 个选项(可以在 FieldType 类找到 Field 的可配置项)(这几个选项都可以独立设置):
- indexOptions:设置该域(Field)的索引选项(枚举类型 IndexOptions)。如果索引选项取值为 IndexOptions.NONE,则该域(Field)的值(value)不会被搜索,但是可以设置其 stored = true,这便是 StoredField 的效果。
- stored :(是否需要存储域的真实值)true 表示存储该域(Field)对应的值(value),默认为 false 即 不存储。如果为 false,则在搜索时,便无法通过其文档(Document)获取该域(Field)对应的值,即 值为 null。
- tokenized:true 表示使用 IndexWriter 中配置的分析器分析该域(Field)的内容 即 其值(提取其词汇单元)(初始值为 true)。当 tokenized = false 时,即 实际上将域值作为单一语汇单元并使之能被搜索,可适用于索引那些不能被分解的域值。
- Field 类的几个可能常用的子类(关于子类,Field 类注释中有更多介绍):
- TextField:( indexed and tokenized)用于全文搜索,该域可索引,(For example this would be used on a 'body’field, that contains the bulk of a document’s text. )。
- StringField:( indexed but not tokenized)该域对应的整个字符串值(value)作为一个可索引的分词进行匹配。该域适用于那些不能被分解的域值,(this might be used for a ‘country’ field or an 'id’field)。
- IntPoint:(indexed)用于快速执行查询范围过滤。可配合使用 StoredField 来存储其值(value)。
- StoredField:(stored and tokenized)仅仅被存储,不会被索引。在搜索时可以通过其文档(Document)取回该域(Field)的值(value),但是无法直接索引该值。
2. 关于查询(Query)的创建
- 在进行搜索时,需要构建查询(Query)对象,Query 类是一个抽象类,所以只能通过子类来实例化。
- Query 类的几个可能常用的子类(关于子类,Query 类注释中有更多介绍):
- TermQuery:简单查询(Query),(A Query that matches documents containing a term. This may be combined withother terms with a BooleanQuery)。
- BooleanQuery:可用于组合多个简单查询(Query),(A Query that matches documents matching boolean combinations of otherqueries, e.g. TermQuerys, PhraseQuerys or otherBooleanQuerys)。
- PhraseQuery:短语查询(Query),(A Query that matches documents containing a particular sequence of terms.A PhraseQuery is built by QueryParser for input like “new york”)。
- PointRangeQuery:范围查询。
转载地址:http://bjlsi.baihongyu.com/