关于java:Lucene是否有快速,准确的荧光笔?

关于java:Lucene是否有快速,准确的荧光笔?

Is there a fast, accurate Highlighter for Lucene?

我一直在使用Lucene的(Java)Highlighter(在Sandbox程序包中)。但是,在搜索结果中匹配正确的词时,这并不是很准确-在简单查询中效果很好,例如,搜索两个单独的单词会在结果中突出显示两个代码片段。

但是,它不适用于更复杂的查询。在最简单的情况下,短语查询(例如" Stack Overflow")将匹配突出显示中所有出现的Stack或Overflow,这给用户留下了很好的印象。

我尝试在此处应用此修复程序,但这带来了许多性能方面的警告,并且最终还是根本无法使用。在通配符查询中,性能尤其成问题。这是由于突出显示的工作方式;而不是像Lucene那样解析查询字符串和文本,而是查找Lucene进行的所有匹配;不幸的是,这意味着对于某些通配符查询,它可以在大型文档中寻找与2000+子句的匹配项,而且速度不够快。

是否可以更快地实施准确的荧光笔?


有一个新的更快的荧光笔(需要进行修补,但将成为2.9版的一部分)

https://issues.apache.org/jira/browse/LUCENE-1522

以及对该问题的反向引用


我一直在阅读该主题,并遇到spanQuery,它将向您返回匹配项或匹配字段中项的范围。


您可以考虑使用Solr。 http://lucene.apache.org/solr

Solr是一种使用Lucene并支持突出显示的通用搜索应用程序。 Solr中的突出显示可能可用作Solr之外的API。 您也可以看看Solr如何做到这一点。


推荐阅读

    linux显示操作命令?

    linux显示操作命令?,系统,工作,地址,信息,管理,命令,目录,基础,工具,标准,lin

    linux压缩搜索命令?

    linux压缩搜索命令?,系统,文件,工具,平台,电脑,命令,网络,管理,信息,时间,lin

    linux命令行显示路径?

    linux命令行显示路径?,系统,数据,信息,命令,工作,时间,标准,文件,目录,名称,l

    linux显示详细命令?

    linux显示详细命令?,工作,系统,信息,地址,命令,标准,数据,目录,文件,名称,执

    linux查询url命令?

    linux查询url命令?,系统,网址,工具,数据,网站,命令,传播,软件,地址,标准,linu

    linux显示上一个命令?

    linux显示上一个命令?,信息,机器人,人工智能,第一,地方,工具,在线,网站,代

    linux查询命令进程?

    linux查询命令进程?,系统,名称,总量,情况,状态,进程,材料,工具,电脑,数据,怎

    linux快速写入命令?

    linux快速写入命令?,地址,命令,生产,资料,数据,单位,文件,文本,控制台,字符

    linux满屏显示命令?

    linux满屏显示命令?,工具,系统,服务,电脑,网络,技术,信息,数据,上会,软件,如

    显示linux时间命令?

    显示linux时间命令?,时间,系统,信息,一致,命令,文件,终端,目录,选项,参数,lin

    查询linux内存命令?

    查询linux内存命令?,系统,情况,信息,工具,电脑,状态,命令,内存,发行,总量,查

    linux命令查询屏保?

    linux命令查询屏保?,系统,工作,工具,信息,地址,图片,命令,目录,基础,电脑,lin

    linux命令刷新显示?

    linux命令刷新显示?,系统,工作,最新,地址,命令,异常,分析,工具,信息,软件,Lin

    linux链路查询命令?

    linux链路查询命令?,系统,信息,工作,地址,命令,工具,时间,盘中,基础,名字,lin

    linux查询文件夹命令?

    linux查询文件夹命令?,系统,软件,电脑,命令,文件,文件夹,单位,第三,档案,数

    linux显示最多的命令?

    linux显示最多的命令?,系统,情况,信息,数据,工具,电脑,状态,时间,分析,命令,

    linux命令高亮显示?

    linux命令高亮显示?,系统,信息,命令,电脑,地址,代码,情况,分析,位置,文件,Lin

    linux查询线程命令?

    linux查询线程命令?,系统,第一,线程,命令,进程,代码,分时,软件,选项,界面,如

    linux查询内核数命令?

    linux查询内核数命令?,系统,第一,信息,命令,实时,软件,电脑,内核,个数,界面,

    linux命令搜索命令行?

    linux命令搜索命令行?,工作,系统,地址,信息,命令,目录,基础,工具,管理,功能,l