`
JLK
  • 浏览: 234450 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

查找相似页面

    博客分类:
  • solr
阅读更多

MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。提交新查询就会返回其他查询结果。所有这些都可以用检索词向量 来完成:只需将 termVectors="true" 添加到 schema.xml 中的 <field> 声明。


Google 上尝试一个查询,您会注意到每一个结果都包含一个相似页面链接,单击该链接,就会发布另一个搜索请求,查找出与起初结果类似的文档。Solr 使用 MoreLikeThisComponentMLT)和 MoreLikeThisHandler 实现了一样的功能。如上所述,MLT 是与标准 SolrRequestHandler 集成在一起的;MoreLikeThisHandler MLT 结合在一起,并添加了一些其他选项,但它要求发布一个单一的请求。我将着重讲述 MLT,因为使用它的可能性更大一些。幸运的是,不需要任何设置就可以查询它,所以您现在就可以开始查询。

您可以向请求添加很多 HTTP 查询参数,并且大部分参数都有智能的默认值,因此我将着重讲述使用 MLT 必须了解的参数。(要了解更多的详细信息,请参见 参考资料 获得 Solr wiki MLT 页面链接)。

2. MoreLikeThisComponent 参数
参数 说明 值域
mlt 
在查询时,打开/关闭 MoreLikeThisComponent 的布尔值。 真|
mlt.count 
可选。每一个结果要检索的相似文档数。 > 0
mlt.fl 
用于创建 MLT 查询的字段。 模式中任何被储存的或含有检索词向量的字段。
mlt.maxqt 
可选。查询词语的最大数量。由于长文档可能会有很多关键词语,这样 MLT 查询可能会很大,从而导致反应缓慢或可怕的 TooManyClausesException,该参数只保留最关键的词语。 > 0
尝试下面的样例查询,然后检查返回结果中的 moreLikeThis 部分:

http://localhost:8983/solr/rss/select/?q=*%3A*&start=0&rows=10&mlt=true
  &mlt.fl=description&mlt.count=3

分享到:
评论

相关推荐

    [原创]JavaMasterPages快捷页面布局,无任何依赖

    【JavaMasterPages】是一个...如果你正在寻找一种简单、高效的Java Web页面布局方案,那么【JavaMasterPages】无疑是一个值得尝试的选择。通过深入理解其原理和实践操作,你将能够更好地应对复杂的Web应用开发挑战。

    内存FIFO页面置换算法的设计

    FIFO(First In First Out)页面置换算法是一种简单的策略,它的名字来源于其工作原理与队列数据结构相似,即先入先出。 FIFO页面置换算法的基本思想是:当需要替换一个页面时,选择最早进入内存的页面进行淘汰。...

    IE多页面标签插件,类似于sougou浏览器的多页面插件

    描述中提到的“类似于sougou浏览器的多页面插件”,暗示了这个插件的功能与搜狗浏览器的多标签页功能相似。搜狗浏览器是一款在中国广泛使用的多核浏览器,它的多页面标签功能深受用户喜爱,能够帮助用户更好地管理和...

    设置Adobe Reader /ACROBAT上次打开阅读的PDF页面

    这个功能对于经常处理大量PDF文档的用户来说非常实用,避免了每次打开文档都需要手动寻找上次阅读的位置。下面我们将详细讲解如何设置Adobe Reader 9以及更高级版本来实现这一功能。 首先,启动Adobe Reader,进入...

    免费ChatGPT Sidebar 反应快,谷歌Chrome浏览器侧栏显示实时交互,类似于聊天机器人

    免费ChatGPT Sidebar是一个能够在谷歌Chrome浏览器侧栏显示ChatGPT...ChatGPT Sidebar可以用于各种用途,内置预设各种实用模版,例如回答常见问题、总结网页文章、查找相似页面、解释代码、翻译等等,也可以自行添加。

    NET文本框输入显示相似记录信息

    收到服务器返回的相似记录后,更新到页面的指定位置,比如一个下拉列表或分页视图。 ```javascript $(function() { $('#txtSearch').on('keyup', function() { autoQueryTextBox1.update(); }); }); ``` 5. **...

    win版-网页小偷-单页扒手-HTML页面下载

    下载的HTML页面通常会保留原有的HTML结构,包括链接、图片和样式表,这样在本地打开时,页面看起来与在线状态时相似。 然而,由于"单页扒手"不支持爬虫功能,它不会自动追踪并下载页面上的所有链接资源,这意味着...

    先进先出和最近最少使用页面置换

    然而,LRU需要额外的空间来存储每个页面的访问状态,并且在大数据集下的性能会受到哈希表查找时间复杂度的影响。 **页面替换算法的比较** FIFO和LRU是两种极端的页面置换策略。FIFO易于实现,但可能出现Belady异常...

    产品设计 06 页面布局.pdf

    如果用户需要分析相似性、差异性或趋势,页面设计应便于他们进行这样的比较,无需记住之前的内容。 建立信息的重要等级也是页面布局的一个关键方面。从高到低设置信息层级,使用户可以快速扫描和定位最有价值的信息...

    带导航的404错误提示页面

    2. **自定义搜索**:有时,404页面会集成一个自定义搜索框,让用户可以直接在页面上查找想要的信息。 3. **返回链接**:提供返回主页或其他重要页面的链接,帮助用户快速回到网站的主要内容。 4. **社交媒体链接**...

    适合SEO的11款404页面

    3. **搜索框**:提供一个搜索框让用户能快速查找其他相关信息,帮助他们继续浏览网站。 4. **网站导航**:在404页面上包含主要的导航链接,让用户能轻松跳转到网站其他部分。 5. **热门或推荐内容**:展示网站上的...

    页面调度算法实验.pdf

    实验结果表明, Clock 算法和 Eclock 算法在性能上相似,而 Lfu 算法和 Mfu 算法在性能上有所不同。这些结果可以帮助我们更好地理解页面调度算法的实现机理和优缺点。 页面调度算法是操作系统中非常重要的一节,它...

    5 word页面设置 .pptx

    【查找与替换】是Word中的强大工具,可以帮助用户快速定位并修改大量相同或相似的内容。在查找时,可以通过Ctrl+F快捷键打开查找对话框,检查文本中是否存在特定内容或统计出现次数。替换功能则通过Ctrl+H快捷键实现...

    HTML撕纸效果404错误页面模板

    此外,JavaScript还可以用来添加动态搜索功能,当用户在404页面输入内容时,自动寻找并显示可能的相似页面链接。 在实际应用中,开发者需要将这个404模板整合到网站的服务器配置中,确保当用户访问无效URL时,...

    页面原型规范 与 Axure RP Pro教程

    合理地利用文件夹及多层次结构有助于提升项目管理和查找效率。 - **页面规格**:明确区分全屏页面与弹屏页面。全屏页面进一步分为宽幅(1200px)和中幅(1000px),具体选用哪种取决于页面是否包含菜单以及内容量的...

    获取jsp中的所有某个标签中所有ID相同的元素

    因此,这段代码实际上可能是在寻找具有相似`id`前缀的元素,而不是真正意义上的“相同ID”。如果确实需要找到具有完全相同`id`的元素,应该重新考虑设计,确保每个元素的`id`唯一,或者修改代码逻辑,比如使用更精确...

    asp注入关键字

    cat=`:该关键字用于寻找名为 `cat.asp` 的页面,并且 URL 中带有 `cat=` 参数。这种类型的页面通常是分类页面,可能存在 SQL 注入风险。 - `productlist.asp?catalogid=`:用于查找商品列表页面,并且 URL 中包含 `...

    similarimagefinder:查找显示相似的JPEG图像以允许将其删除

    在指定的文件夹(包括子文件夹)中查找相似的JPEG图像(使用phash算法)。 生成连续显示相似图像的html文件,每个图像都有一个“删除”链接。 用户打开html文件,然后单击“删除”链接来确定要删除的图像。 有关...

    高仿Instagram页面效果页面UI加载列表展示图片效果挺不错的并且支持收藏和评论等评论后列表展示效果.rar

    这篇文档将深入解析“高仿Instagram页面效果页面UI加载列表展示图片效果挺不错的并且支持收藏和评论等评论后列表展示效果.rar”这个压缩包中所包含的IT知识点。该压缩包主要是为了展示一个模仿Instagram应用的用户...

Global site tag (gtag.js) - Google Analytics