`

【转】搜索引擎最新技术发展分析

阅读更多
一、提高搜索引擎对用户检索提问的理解为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言,为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“how can kill virus of computer?”。搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“virus”这个词来检索,结果中必然会包括各类病毒的介绍、病毒是怎样产生的等等许多无效信息,而用“how can kill virus of computer?”,搜索引擎会将怎样杀病毒的信息提供给用户,提高了检索效率。 
二、对检索结果进行处理 
1、基于链接评价的搜索引擎 
基于链接评价的搜索引擎的优秀代表是它独创的“链接评价体系”是基于这样一种认识,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与《科技引文索引》的思路非常相似,但是由于互联网是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。 
2、基于访问大众性的搜索引擎 
基于访问大众性的搜索引擎的代表是direct hit,它的基本理念是多数人选择访问的网站就是最重要的网站。根据以前成千上万的网络用户在检索结果中实际所挑选并访问的网站和他们在这些网站上花费的时间来统计确定有关网站的重要性排名,并以此来确定哪些网站最符合用户的检索要求。因此具有典型的趋众性特点。这种评价体制与基于链接评价的搜索引擎有着同样的缺点。 
3、去掉检索结果中附加的多余信息 
有调查指出,过多的附加信息加重了用户的信息负担,为了去掉这些过多的附加信息,可以采用用户定制、内容过滤等检索技术。 
三、确定搜索引擎信息搜集范围,提高搜索引擎的针对性 
1、垂直主题搜索引擎 
网上的信息浩如烟海,网络资源以十倍速的增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高。作者认为,垂直主题有着极大的发展空间。 
2、非www信息的搜索 
提供FTP等类信息的检索 
3、多媒体搜索引擎 
四、将搜索引擎的技术开发重点放在对检索结果的处理上,提供更优化的检索结果 
1、纯净搜索引擎 
这类搜索引擎没有自己的信息采集系统,利用别人现有的索引数据库,主要关注检索的理念、技术和机制等。 
2、元搜索引擎 
现在出现了许多的搜索引擎,其收集信息的范围、搜索机制、算法等都不同,用户不得不去学习多个搜索引擎的用法。每个搜索引擎平均只能涉及到整个www资源的30-50%(search engine watch数据),这样导致同一个搜索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。 
元搜索引擎(metasearch enging)是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler、dopile、ixquick、搜客等。 
3、集成搜索引擎 
集成搜索引擎(All-in-One Search Page),亦称为“多引擎同步检索系统是在一个WWW页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便。 
集成搜索引擎无自建数据库,不需研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。 
4、垂直搜索引擎 
垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。 
五、搜索引擎的分类 
网页音乐(翻唱MP3)影视(电影电视)视频播客软件BT下载硬件图片壁纸相册小说文学文档(论文述职报告思想汇报演讲稿入党申请书作文个人简历毕业论文法律论文经济论文教育论文会计论文计算机论文毕业论文集情书调查报告求职信商业计划书实习报告就职演说自荐信企划方案企业管理年终总结)新闻(资讯)百科(知识经验)教育人物学校专业论坛社区博客词典翻译地图动漫Flash游戏娱乐笑话汽车家电手机广告购物商业黄页房产招聘财经股票基金法律国学图书政府目录学术代码公交实用查询等几十个分类。 
六、搜索引擎的最后一步 
10年前我们要查阅资料,请教问题,更多想到的是请教专家,图书管查阅等传统方式。常常为了一个简单的问题而到处寻师,在图书馆翻着类似我的电脑桌抽屉里的检索卡片,苦苦寻找。曾几何时,互联网的普及与兴起,搜索引擎的出现,逐渐改变着我们的生活习惯和思维方式。很多问题“baidu一下,你就知道。”就像这里用的“曾几何时”这一词,中文不好的我只有模糊的理解,还以为有“曾经”的意思,想用为第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“补官扬州,公得谢归。曾几何时,讣者来门。”才知是才过了不久的意思。 
搜索引擎(search engine)是一个系统,能从大量信息中找到所需的信息,提供给用户。互联网出现到现今,信息量可以说成密指数的增长,大量信息就像Google的原本含义一样“1的后面跟着100个0”,这个数比宇宙所有的基本粒子的数量总和还要大。在这浩如烟海的信息中怎么才能找到自己需要的信息呢?搜索引擎就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。 本文由:www.yitiwang.cn 体育用品 搜集整理
分享到:
评论

相关推荐

    互联网搜索引擎技术的发展

    总的来说,互联网搜索引擎技术的发展历程展示了从最初的文件名查找,到链接分析,再到算法优化和个性化推荐的演变。这一领域的发展不仅推动了信息获取的效率,也深刻影响了互联网的使用方式,为用户带来了更加便捷的...

    搜索引擎技术以及发展趋势

    搜索引擎技术是互联网时代的核心技术之一,它有效地解决了信息爆炸带来的挑战。自1995年起,随着WEB信息的迅速增长,搜索引擎技术应运而生,为用户提供了在海量信息中定位所需内容的能力。据1999年《科学》杂志文章...

    ChatGPT技术与搜索引擎的融合发展分析.docx

    ChatGPT 技术与搜索引擎的融合发展分析 本文从技术应用、用户体验和商业前景三个方面对 ChatGPT 技术与搜索引擎的融合发展进行分析。以下是相关知识点: 一、技术应用 1. 智能搜索:ChatGPT 技术可以通过对用户的...

    搜索引擎技术分析.doc

    搜索引擎技术分析 搜索引擎是互联网上不可或缺的信息检索工具,它通过复杂的算法和技术,帮助用户在海量数据中快速找到所需的信息。这份文档《搜索引擎技术分析.doc》无疑是深入理解这一领域的宝贵资源,由一位经验...

    搜索引擎-传统搜索引擎与智能搜索引擎比较研究.pdf

    通过对比分析,我们可以更好地理解搜索引擎的发展过程,并为搜索引擎的未来发展提供参考。 搜索引擎的发展历程可以分为五个阶段:第一个阶段是传统搜索引擎的诞生和发展,第二个阶段是智能搜索引擎的出现和发展,第...

    搜索引擎基本工作原理.pdf

    全文搜索引擎通过自动检索技术广泛收集信息,而目录索引则依赖人工审核和分类。目录索引通常对网站质量有较高要求,且需手动提交信息。两者之间的界限日益模糊,许多搜索引擎结合了两者的特点,既提供关键词搜索,也...

    搜索引擎技术基础 课件

    【搜索引擎技术基础】 搜索引擎技术是信息技术领域中的一个重要分支,它主要负责从互联网上抓取海量信息,对这些信息进行处理,然后为用户提供快速且相关的搜索结果。本课件将深入探讨搜索引擎技术的基础知识,包括...

    搜索引擎-搜索引擎关键技术研究与实现.pdf

    索引技术是搜索引擎的基础技术,索引是指对大量文档进行分析、处理和存储,以便快速检索的过程。索引技术的发展经历了从简单的文本索引到现在的复杂的多媒体索引。查询语言处理是搜索引擎的核心组件,负责处理用户的...

    搜索引擎发展趋势

    通过以上内容可以看出,搜索引擎的发展不仅体现在技术层面的进步,还包括了对用户需求的理解和服务质量的提升。随着人工智能技术的发展,未来的搜索引擎将会更加智能、高效,为用户提供更加精准和个性化的搜索体验。

    基于物联网技术的搜索引擎技术研究.pdf

    随着物联网技术的广泛应用,搜索引擎技术得到了进一步的发展。物联网技术能够为搜索引擎提供更丰富的信息来源和更快速的数据处理能力。在物联网中,人们可以通过搜索引擎获取日常生活中各类物品的相关信息,提高了...

    综合搜索引擎与垂直搜索引擎的比较研究

    首先,垂直搜索引擎应注重提升其深度信息检索的能力,这需要通过不断优化算法、扩展数据库以及深入分析用户行为来实现。其次,垂直搜索引擎需要加强其专业性,通过与特定领域的企业或机构合作,获取更多高质量的信息...

    这就是搜索引擎-核心技术详解-清晰完整版

    索引是搜索引擎用来快速定位信息数据的结构,索引构建是搜索引擎技术中的关键一环。索引通常由倒排索引(Inverted Index)构成,其中索引项是词汇,记录的是词汇出现在哪些文档中。构建索引的过程包括文本提取、分词...

    搜索引擎原理介绍与分析.pdf

    随着互联网的迅速发展和信息量的爆炸性增长,搜索引擎已成为人们获取信息不可或缺的工具。无论是寻找学术资料、娱乐资源还是商业信息,人们越来越依赖于搜索引擎来高效地完成任务。然而,尽管搜索引擎在日常生活中...

    中文搜索引擎及其技术分析(张玉宝)

    四、搜索引擎技术的优缺点分析 全文搜索引擎优点在于提供全面的信息检索服务,但缺点是信息更新慢且不能有效过滤无关信息。目录搜索引擎优点在于能够快速定位分类信息,但缺点是信息不够全面。元搜索引擎的优点是...

    搜索引擎技术 中文分词搜索引擎程序

    搜索引擎技术是基于全文检索技术发展起来的一种技术,主要用于在互联网上抓取、处理、存储和检索海量信息。它包含了多个关键组成部分,如网络爬虫、中文分词、排序算法、查询/存储技术和监控系统。 一、搜索引擎...

Global site tag (gtag.js) - Google Analytics