`
wangking717
  • 浏览: 263283 次
  • 性别: Icon_minigender_2
  • 来自: 成都
社区版块
存档分类
最新评论

搜索引擎之纠错功能:“您要找的是不是XXX”

阅读更多

还记得搜索引擎里当你输入错了关键字或者记不太清楚的时候,搜索引擎会帮助你提示“您要找的是不是XXX”。

 

如百度“wangking”,提示"你要找的是不是 网名 wangming"

 

URL: http://www.baidu.com/s?bs=sb&f=8&wd=wangking

 

 

在群里看到有人在问这个如何实现,有人提到相似度查询,其实就是这个道理。

 

网上找了一些比较好的参考资料:

 

Lucene SpellChecker

http://www.infoq.com/cn/articles/lucene-did-you-mean

 

Solr SpellChecker

http://blog.chenlb.com/2009/02/try-solr-spellcheck.html

 

 

wangking 写道
针对上面的两篇文章,我提出一个补充。
一般所谓纠错功能,就是做相似度查询,在一个可维护的字典中查找相似度最高的几个词出来(如字典dict.txt)。
我觉得不是每个关键字都提供纠错功能,可以在一定的时机下提示,如搜索结果少于20条,或者热度少于XXX,则提供纠错功能。
 
分享到:
评论

相关推荐

    搜索引擎中文纠错功能实例剖析

    搜索引擎纠错功能主要是指系统能够自动检测用户输入的检索条件,并对拼写错误或不合理之处进行修正,以此来提高检索结果的质量。纠错功能的实现需要解决两个核心问题:如何识别用户的输入错误以及如何给出正确的建议...

    42丨动态规划实战:如何实现搜索引擎中的拼写纠错功能?1

    【动态规划】与【搜索引擎】在实际应用中的一个重要场景是实现拼写纠错功能。这个功能在用户输入搜索词时能够自动检测并纠正拼写错误,提高用户体验。在实现这一功能时,关键在于如何衡量两个字符串的相似度,这通常...

    中文搜索引擎技术揭密:系统架构

    4. **查询处理(Query Processing)**:当用户输入查询时,搜索引擎会解析查询语句,进行拼写纠错、词语扩展、短语匹配等操作,然后根据索引找到相关的文档。 5. **排序与展示(Ranking & Presentation)**:搜索...

    搜索引擎的一种在线中文查询纠错方法.pdf

    搜索引擎的一种在线中文查询纠错方法.pdf搜索引擎的一种在线中文查询纠错方法.pdf

    搜索引擎源代码中国搜搜索引擎

    4. **查询处理**:用户输入查询后,搜索引擎会解析查询语句,可能包括关键词匹配、同义词扩展、拼写纠错等功能。中国搜可能有专门的查询分析模块,优化用户的查询表达,提升搜索体验。 5. **结果排序**:搜索引擎的...

    百度google综合搜索引擎源码

    【标题】:“百度google综合搜索引擎源码”涉及的是搜索引擎技术的整合与开发,尤其是将百度和Google这两大主流搜索引擎的功能进行结合。搜索引擎源码通常包括爬虫、索引构建、查询处理、排序算法以及用户界面等多个...

    搜索引擎语法大全【完整汇总版】

    首先,我们要理解搜索引擎的基本工作原理。搜索引擎通过爬虫技术抓取互联网上的网页,然后进行索引,当我们输入关键词时,它会根据这些关键词在索引库中匹配最相关的网页。而搜索引擎语法就是在这基础上,通过特定的...

    搜索引擎完全手册.

    Google作为当前最强大的搜索引擎之一,它的高效搜索能力和多样化功能使得用户能够快速准确地获取所需信息。 1. **Google简介**:Google成立于2000年前后,以其强大的搜索算法和简洁的界面迅速获得了用户的喜爱,...

    一个文本搜索引擎的实现

    1. 前缀匹配:为了提高搜索速度,可以实现前缀匹配功能,即当用户输入部分关键词时,搜索引擎就能返回匹配的文档。 2. 断词纠错:通过引入词典和编辑距离算法,搜索引擎可以识别用户可能的拼写错误,并提供正确的...

    搜索引擎-信息检索实践

    《搜索引擎-信息检索实践》是一本深入探讨搜索引擎技术与信息检索理论的专业书籍,由W. Bruce Croft等作者撰写。这本书对于理解搜索引擎的工作原理、优化信息检索系统以及提高搜索引擎性能具有重要的参考价值。标签...

    简单搜索引擎源码

    在IT领域,搜索引擎是至关重要的技术之一,它们用于在海量数据中快速、准确地找到相关信息。本项目名为“简单搜索引擎源码”,它虽然简洁,但提供了丰富的功能,如热词推荐和分类。以下是对这个搜索引擎实现的详细...

    java模拟搜索引擎

    在Java编程语言中,模拟一个搜索引擎是一项有趣且实用的任务,尤其对于那些想要深入理解网络爬虫、信息检索和自然语言处理的开发者来说。虽然描述中提到这个项目可能没有太高的技术含量,但仍然涵盖了一些关键知识点...

    西南交大互联网搜索引擎课设

    4. **查询处理**:当用户输入查询时,搜索引擎需要进行查询分析,包括拼写纠错、查询扩展和查询改写等。然后,通过查询解析和查询匹配算法(如BM25、TF-IDF等)找到相关文档。 5. **结果排名**:搜索结果的排序至关...

    一套PHP搜索引擎

    8. **用户体验**:如搜索建议、拼写纠错、多条件筛选等功能的实现。 9. **性能优化**:包括索引构建和查询性能的优化,以及服务器配置和负载均衡等。 10. **安全与隐私**:在抓取和处理数据时,如何确保不侵犯用户...

    搜索引擎开发毕业论文

    3. **用户体验**:设计用户友好的搜索界面,提供相关性反馈、拼音纠错、联想搜索等功能。 4. **安全与隐私**:防止恶意爬虫,保护用户隐私,同时确保服务的稳定性和安全性。 5. **评估与调优**:通过A/B测试、用户...

    搜索查询纠错方法

    搜索引擎中的查询纠错方法

    搜索引擎web课程设计

    10. **用户体验**:除了功能实现,还需考虑用户体验,如搜索建议、自动补全、纠错功能等,这些可以通过实时索引、前向索引等技术实现。 通过这次课程设计,你将不仅学习到搜索引擎的基本原理和技术,还能实践如何...

    ( 搜索引擎-原理、技术与系统.pdf )

    搜索引擎的核心功能包括网页抓取、预处理、索引、查询处理和结果排序等。 二、网页抓取 网页抓取是搜索引擎的第一步,它利用网络爬虫程序遍历互联网上的网页,收集信息。爬虫通过跟踪超链接,不断发现新的页面并...

    gj.rar_搜索引擎_文件搜索

    "gj.rar_搜索引擎_文件搜索"这个压缩包文件,显然聚焦于高级文件搜索引擎的核心功能实现技术,这对于深入理解文件搜索的机制和技术具有重要价值。以下是基于这个主题的详细知识点阐述: 1. **搜索引擎基础**:搜索...

    Lucene搜索引擎开发

    以上便是Lucene搜索引擎开发的基本流程和关键知识点,通过这个Demo,开发者可以深入了解如何将Lucene与其他工具结合,构建出具备汉字分词、拼音检索和纠错提示功能的搜索引擎。在实际项目中,还可以根据需求进行更...

Global site tag (gtag.js) - Google Analytics