如何按Lucene.Net字段排序,并忽略常见的停用词,例如\\’a \\’和\\’the \\’?

如何按Lucene.Net字段排序,并忽略常见的停用词,例如\\’a \\’和\\’the \\’?

How to sort by Lucene.Net field and ignore common stop words such as 'a' and 'the'?

我发现了如何通过Lucene.Net索引中的给定字段而不是分数来对查询结果进行排序;它所需要的只是一个已索引但未标记化的字段。但是,我仍无法弄清如何在不考虑停用词(例如" a"和" the")的情况下对该字段进行排序,例如,以下书名将以这种升序排列:

  • 帽子里的猫
  • 霍顿听到了谁
  • 这样的事情有可能吗,如果可以,怎么办?

    我正在使用Lucene.Net 2.3.1.2。


    我将Lucene返回的结果包装到我自己的自定义对象集合中。然后,我可以用额外的信息/上下文信息填充它(并使用荧光笔类之类的东西来提取匹配的片段),并添加分页。如果您采用类似的方法,则可以创建一个"结果"类/对象,添加类似SortBy属性的内容,并获取要排序的任何字段,删除任何停用词,然后将其保存在此属性中。现在只需根据该属性对集合进行排序。


    对于搜索,我发现带有排序选项链接的搜索lucene .net索引对于解决您的问题很有趣


    似乎有一个陷阱22,您必须使用分析器对字段进行标记化以去除标点符号和停用词,但是您不能对标记化的字段进行排序。然后如何在不标记的情况下剥离停用词?


    自从我使用Lucene以来已经有一段时间了,但是我的猜测是添加一个额外的字段,用于在其中已经删除了停用词的情况下对值进行排序和存储。您可能可以使用相同的分析器来生成该值。


    创建索引时,创建一个仅包含希望排序的单词的字段,然后在检索时对该字段进行排序,但显示完整标题。


    推荐阅读

      linuxps命令排序?

      linuxps命令排序?,系统,状态,情况,基础,软件,进程,工具,命令,实时,发行,linux

      文件夹排序linux命令?

      文件夹排序linux命令?,系统,数字,信息,工作,时间,命令,管理,设备,单位,工具,

      linux使用索引命令?

      linux使用索引命令?,名称,系统,命令,文件,环境,工作,位置,目录,文件名,索引,

      linux下抓取字段命令?

      linux下抓取字段命令?,数据,系统,命令,单位,报告,工具,字符串,文件,范本,样

      linuxls命令排序?

      linuxls命令排序?,工作,系统,信息,数据,命令,目录,标准,基础,管理,时间,Linux

      linux提取字段串命令?

      linux提取字段串命令?,数字,字符串,状态,工具,命令,文件,范本,样式,正则,字

      linux排序数字命令?

      linux排序数字命令?,标准,数字,单位,情况,系统,信息,命令,文件,顺序,参数,lin

      linuxll排序命令?

      linuxll排序命令?,系统,信息,地址,标准,工作,命令,时间,数据,文件,目录,Linux

      linux命令忽略错误?

      linux命令忽略错误?,系统,地址,工作,信息,设备,命令,设计,灵活,观察,标准,lin

      linux刷新索引的命令?

      linux刷新索引的命令?,系统,工作,工具,管理,软件,设计,状态,基础,命令,预期,

      linux命令按大小排序?

      linux命令按大小排序?,数字,地址,时间,工作,标准,系统,命令,信息,单位,软件,l

      linux计数排序命令?

      linux计数排序命令?,标准,命令,情况,工作,文件,系统,数字,管理,目录,内容,Lin

      linux下排序命令怎么?

      linux下排序命令怎么?,本行,命令,代码,数字,位置,单位,标准,文件,参数,文本,l

      linux按字符排序命令?

      linux按字符排序命令?,标准,命令,时间,情况,文件,数字,基础,状态,系统,功能,i

      linux字典排序命令?

      linux字典排序命令?,工作,系统,标准,信息,命令,时间,数字,单位,状态,软件,Lin

      Python的字典排序

      Python的字典排序,代码,数据,培训,字典,函数,表达式,内容,列表,排列,问题,字

      Python 堆排序

      Python 堆排序,数据,代码,培训,设计,大堆,节点,性质,结点,算法,索引,原理堆

      Python 计数排序

      Python 计数排序,数据,时间,数字,基数,代码,培训,数组,元素,算法,最大值,原