`
gcgmh
  • 浏览: 355787 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

solr morelikethis功能

    博客分类:
  • Solr
阅读更多
    在 Google 上尝试一个查询,您会注意到每一个结果都包含一个 “相似页面” 链接,单击该链接,就会发布另一个搜索请求,查找出与起初结果类似的文档。Solr 使用 MoreLikeThisComponent(MLT)和 MoreLikeThisHandler 实现了一样的功能。如上所述,MLT 是与标准 SolrRequestHandler 集成在一起的;MoreLikeThisHandler 与 MLT 结合在一起,并添加了一些其他选项,但它要求发布一个单一的请求。我将着重讲述 MLT,因为使用它的可能性更大一些。幸运的是,不需要任何设置就可以查询它,所以您现在就可以开始查询。
    MLT 要求字段被储存或使用检索词向量,检索词向量以一种以文档为中心的方式储存信息。MLT 通过文档的内容来计算文档中关键词语,然后使用原始查询词语和这些新词语创建一个新的查询。提交新查询就会返回其他查询结果。所有这些都可以用检索词向量来完成:只需将 termVectors="true" 添加到 schema.xml 中的 <field> 声明。
    MoreLikeThisComponent 参数:
参数   说明    值域
mlt  在查询时,打开/关闭 MoreLikeThisComponent 的布尔值。 真|假
mlt.count  可选。每一个结果要检索的相似文档数。 > 0
mlt.fl  用于创建 MLT 查询的字段。 模式中任何被储存的或含有检索词向量的字段。
mlt.maxqt  可选。查询词语的最大数量。由于长文档可能会有很多关键词语,这样 MLT 查询可能会很大,从而导致反应缓慢或可怕的 TooManyClausesException,该参数只保留最关键的词语。 > 0
example url:
http://localhost:8080/solr/test/select/?q=*%3A*&version=2.2&start=0&rows=10&indent=on&mlt=true&mlt.fl=content&mlt.count<10

http://localhost:8983/solr/select?q=apache&mlt=true&mlt.fl=manu,cat&mlt.mindf=1&mlt.mintf=1&fl=id,score


分享到:
评论
2 楼 青春的、脚步 2012-05-18  
再者请教:
如果查询的字段没有在配置文件的字段中加 termVectors="true"属性
查询出来的morelikethis结果会有什么影响吗?
我测试过,查询一个字段分别用了 termVectors="true"和不赋予改属性
结果都是一样的?测试数据12万

求解释
1 楼 fabulegasi 2010-02-24  
最近在研究solr的morelikethis
我是用Java作为client端,SolrServer.query("solrquery语句");
然后通过返回的hits取得查询结果



请问morelikethis可否通过这种方式得到结果呢,类似于facet那样

相关推荐

    solr7.5官方文档

    文档中解释了如何使用 Solr 的 MoreLikeThis 功能找到与给定文档相似的其他文档,这在推荐系统中非常有用。 #### 结果的分页 文档中提供了如何通过 Solr 实现搜索结果分页的方法,便于用户逐页浏览大量结果。 ###...

    solr实现的搜索引擎

    Solr还包含许多高级特性,如 faceting(分类统计)、spell checking(拼写检查)、highlighting(高亮显示)、more like this(类似文档推荐)等,这些功能在`webapp`中的代码可能有具体实现。 结合《解密搜索引擎...

    solr-4.9.1

    7. **请求处理器和插件**:Solr支持各种请求处理器(Request Handlers)和搜索组件(Search Components),如标准请求处理器(Standard Request Handler)、更多结果请求处理器(MoreLikeThis Handler)等,这些都...

    Solr全文索引

    - **More Like This**:根据已知文档推荐相似的文档。 5. **C#项目集成** - **NuGet安装**:在C#项目中,可以通过NuGet包管理器安装SolrNet库,确保所有依赖项都已就绪。 - **配置连接**:设置Solr服务器的URL,...

    php_solr.dll ,php5.3版本

    - **高级搜索特性**:支持 faceting(分类统计)、highlighting(高亮)、more like this(相似推荐)等 Solr 提供的高级搜索特性。 - **优化与提交**:对索引进行优化,确保数据的一致性,并控制何时将更改提交到 ...

    apache-solr-ref-guide-7.1.pdf

    “MoreLikeThis”部分介绍了如何查找与给定文档类似的其他文档。 在“Pagination of Results”部分,解释了如何对搜索结果进行分页处理。 “Collapse and Expand Results”部分介绍了如何在搜索结果中实现可折叠...

    apache solr1.3.0所有最新开发包及源码及文档

    组件包括现有的功能如faceting(多侧面搜索),同时添加More Like This(更多类似的), Editorial Boosting (Query Elevation查询扩展) 和Spell Checking(拼写检查)。 ——为了更容易索引数据库内容到Solr,建立...

    solr开发指南.zip

    除了以上基本功能,Solr还有许多高级特性,如 Spell Checking(拼写检查)、Synonyms(同义词处理)、Highlighting(高亮显示)、Faceting(分面搜索)、Clustering(聚类)和More Like This(类似文档推荐)等。...

    PyPI 官网下载 | scorched-0.3.zip

    3. **查询接口**:提供简单和复杂的查询构造器,支持 Lucene 查询语法和 Solr 的 Faceting、Highlighting、MoreLikeThis 等高级功能。 4. **结果处理**:返回查询结果时,Scorched 可以解析 Solr 的 JSON 或 XML ...

    java8源码-Bingle:Bingle搜索

    *功能说明:关键词可以为情感关键词,也可为普通关键词,结果返回有地图,图片,使用solr的组建有高亮,more like this,拼写纠错,地理位置检索,分页显示结果,自己写的算法为基于汉语的拼写建议,二维码本地生成...

    lucene1.4.3 API

    - **More Like This**:基于文档内容的“类似文档”查询。 4. **性能优化**: - **缓存**:使用TermFreqVector缓存提高查询速度。 - **批量索引**:一次处理大量文档,减少磁盘I/O次数。 - **段合并**:定期...

    elasticsearch-中文开发指南

    - **More Like This API:** 查找与给定文档相似的其他文档。 **四、Java API** - **客户端:** Java 客户端提供了与 Elasticsearch 进行交互的便捷方式。 - **索引 API:** 创建或更新文档。 - **获取 API:** 检索...

Global site tag (gtag.js) - Google Analytics