博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Lucene简介(三)
阅读量:4110 次
发布时间:2019-05-25

本文共 1789 字,大约阅读时间需要 5 分钟。

1. 关于域(Field)的创建
  • 我们知道,在创建索引的过程中,向文档(Document)中添加域(Field)时,有多种方法构建 Field 类的实例。Lucene 大大减少了我们的工作量,也降低了我们出错的机率,Lucene 通过继承 Field 类为我们提供多个 Field 类的子类实现(尽管可以直接实例化 Field 类,但是对于如何配置 Field 对象 即如何创建并初始化 FieldType 对象却并不简单!)。
  • 这里只说关于域(Field)的 3 个选项(可以在 FieldType 类找到 Field 的可配置项)(这几个选项都可以独立设置):
    1. indexOptions:设置该域(Field)的索引选项(枚举类型 IndexOptions)。如果索引选项取值为 IndexOptions.NONE,则该域(Field)的值(value)不会被搜索,但是可以设置其 stored = true,这便是 StoredField 的效果。
    2. stored :(是否需要存储域的真实值)true 表示存储该域(Field)对应的值(value),默认为 false 即 不存储。如果为 false,则在搜索时,便无法通过其文档(Document)获取该域(Field)对应的值,即 值为 null。
    3. tokenized:true 表示使用 IndexWriter 中配置的分析器分析该域(Field)的内容 即 其值(提取其词汇单元)(初始值为 true)。当 tokenized = false 时,即 实际上将域值作为单一语汇单元并使之能被搜索,可适用于索引那些不能被分解的域值。
  • Field 类的几个可能常用的子类(关于子类,Field 类注释中有更多介绍):
    1. TextField:( indexed and tokenized)用于全文搜索,该域可索引,(For example this would be used on a 'body’field, that contains the bulk of a document’s text. )。
    2. StringField:( indexed but not tokenized)该域对应的整个字符串值(value)作为一个可索引的分词进行匹配。该域适用于那些不能被分解的域值,(this might be used for a ‘country’ field or an 'id’field)。
    3. IntPoint:(indexed)用于快速执行查询范围过滤。可配合使用 StoredField 来存储其值(value)。
    4. StoredField:(stored and tokenized)仅仅被存储,不会被索引。在搜索时可以通过其文档(Document)取回该域(Field)的值(value),但是无法直接索引该值。
2. 关于查询(Query)的创建
  • 在进行搜索时,需要构建查询(Query)对象,Query 类是一个抽象类,所以只能通过子类来实例化。
  • Query 类的几个可能常用的子类(关于子类,Query 类注释中有更多介绍):
    1. TermQuery:简单查询(Query),(A Query that matches documents containing a term. This may be combined withother terms with a BooleanQuery)。
    2. BooleanQuery:可用于组合多个简单查询(Query),(A Query that matches documents matching boolean combinations of otherqueries, e.g. TermQuerys, PhraseQuerys or otherBooleanQuerys)。
    3. PhraseQuery:短语查询(Query),(A Query that matches documents containing a particular sequence of terms.A PhraseQuery is built by QueryParser for input like “new york”)。
    4. PointRangeQuery:范围查询。

转载地址:http://bjlsi.baihongyu.com/

你可能感兴趣的文章
拉格朗日对偶问题详解
查看>>
MFC矩阵运算
查看>>
最小二乘法拟合:原理,python源码,C++源码
查看>>
ubuntu 安装mysql
查看>>
c# 计算器
查看>>
C# 简单的矩阵运算
查看>>
gcc 常用选项详解
查看>>
c++输入文件流ifstream用法详解
查看>>
c++输出文件流ofstream用法详解
查看>>
字符编码:ASCII,Unicode 和 UTF-8
查看>>
firewalld的基本使用
查看>>
Linux下SVN客户端使用教程
查看>>
Linux分区方案
查看>>
nc 命令详解
查看>>
如何使用 systemd 中的定时器
查看>>
git命令速查表
查看>>
linux进程监控和自动重启的简单实现
查看>>
OpenFeign学习(三):OpenFeign配置生成代理对象
查看>>
OpenFeign学习(四):OpenFeign的方法同步请求执行
查看>>
OpenFeign学习(五):OpenFeign请求结果处理及重试控制
查看>>