搜索引擎经过几年的发展和摸索,越来越贴近人们的需求,搜索引擎的技术也得到了很大的发展。搜索引擎的最新技术发展包括以下几个方面:
一、提高搜索引擎对用户检索提问的理解
为了提高搜索引擎对用户检索提问的理解,就必须有一个好的检索提问语言,为了克服关键词检索和目录查询的缺点,现在已经出现了自然语言智能答询。用户可以输入简单的疑问句,比如“how can kill virus of computer?”。搜索引擎在对提问进行结构和内容的分析之后,或直接给出提问的答案,或引导用户从几个可选择的问题中进行再选择。自然语言的优势在于,一是使网络交流更加人性化,二是使查询变得更加方便、直接、有效。就以上面的例子来讲,如果用关键词查询,多半人会用“virus”这个词来检索,结果中必然会包括各类病毒的介绍、病毒是怎样产生的等等许多无效信息,而用“how can kill virus of computer?”,搜索引擎会将怎样杀病毒的信息提供给用户,提高了检索效率。
二、对检索结果进行处理
1、基于链接评价的搜索引擎
基于链接评价的搜索引擎的优秀代表是Google(http://www.google.com),它独创的“链接评价体系”是基于这样一种认识,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。这种评价体制与《科技引文索引》的思路非常相似,但是由于互联网是在一个商业化的环境中发展起来的,一个网站的被链接数量还与它的商业推广有着密切的联系,因此这种评价体制在某种程度上缺乏客观性。
2、基于访问大众性的搜索引擎
基于访问大众性的搜索引擎的代表是direct hit,它的基本理念是多数人选择访问的网站就是最重要的网站。根据以前成千上万的网络用户在检索结果中实际所挑选并访问的网站和他们在这些网站上花费的时间来统计确定有关网站的重要性排名,并以此来确定哪些网站最符合用户的检索要求。因此具有典型的趋众性特点。这种评价体制与基于链接评价的搜索引擎有着同样的缺点。
3、去掉检索结果中附加的多余信息
有调查指出,过多的附加信息加重了用户的信息负担,为了去掉这些过多的附加信息,可以采用用户定制、内容过滤等检索技术。
三、确定搜索引擎信息搜集范围,提高搜索引擎的针对性
1、垂直主题搜索引擎
网上的信息浩如烟海,网络资源以十倍速的增长,一个搜索引擎很难收集全所有主题的网络信息,即使信息主题收集得比较全面,由于主题范围太宽,很难将各主题都做得精确而又专业,使得检索结果垃圾太多。这样以来,垂直主题的搜索引擎以其高度的目标化和专业化在各类搜索引擎中占据了一系席之地,比如象股票、天气、新闻等类的搜索引擎,具有很高的针对性,用户对查询结果的满意度较高。作者认为,垂直主题有着极大的发展空间。
2、非www信息的搜索
提供FTP等类信息的检索
3、多媒体搜索引擎
多媒体检索主要包括声音、图像的检索。关于图片搜索引擎的原理,《浅谈图片搜索引擎的实现》http://blog.minidx.com/2007/12/19/265.html 中提出了具有跨时代意义设计思路。
四、将搜索引擎的技术开发重点放在对检索结果的处理上,提供更优化的检索结果
1、纯净搜索引擎
这类搜索引擎没有自己的信息采集系统,利用别人现有的索引数据库,主要关注检索的理念、技术和机制等。
2、元搜索引擎
现在出现了许多的搜索引擎,其收集信息的范围、搜索机制、算法等都不同,用户不得不去学习多个搜索引擎的用法。每个搜索引擎平均只能涉及到整个www资源的30-50%(search engine watch数据),这样导致同一个搜索请求在不同搜索引擎中获得的查询结果的重复率不足34%,而每一个搜索引擎的查准率不到45%。
元搜索引擎(metasearch enging)是将用户提交的检索请求到多个独立的搜索引擎上去搜索,并将检索结果集中统一处理,以统一的格式提供给用户,因此有搜索引擎之上的搜索引擎之称。它的主要精力放在提高搜索速度、智能化处理搜索结果、个性搜索功能的设置和用户检索界面的友好性上,查全率和查准率都比较高。目前比较成功的元搜索引擎有metacrawler、dopile、ixquick等。
3、集成搜索引擎
集成搜索引擎( All-in-One Search Page),亦称为“多引擎同步检索系统 ”(如百度http://www.baidu.com)是在一个WWW页面上链接若干种独立的搜索引擎,检索时需点选或指定搜索引擎,一次检索输入,多引擎同时搜索,用起来相当方便。
集成搜索引擎无自建数据库,不需研发支持技术,当然也不能控制和优化检索结果。但集成搜索引擎制作与维护技术简单,可随时对所链接的搜索引擎进行增删调整和及时更新,尤其大规模专业(如FLASH、MP3等)搜索引擎集成链接,深受特定用户群欢迎。
4、垂直搜索引擎
垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
五、搜索引擎的分类 网页 音乐(翻唱 MP3)影视(电影 电视) 视频 播客 软件 BT下载 硬件 图片 壁纸 相册 小说 文学 文档(论文 述职报告 思想汇报 演讲稿 入党申请书 作文 个人简历 毕业论文 法律论文 经济论文 教育论文 会计论文 计算机论文 毕业论文集 情书 调查报告 求职信 商业计划书 实习报告 就职演说 自荐信 企划方案 企业管理 年终总结) 新闻(资讯) 百科(知识 经验) 教育 人物 学校 专业 论坛 社区 博客 词典 翻译 地图 动漫 Flash 游戏 娱乐 笑话 汽车 家电 手机 广告 购物 商业 黄页 房产 招聘 财经 股票 基金 法律 国学 图书 政府 目录 学术 代码 公交 实用查询等几十个分类。
六、搜索引擎的最后一步 10年前我们要查阅资料,请教问题,更多想到的是请教专家,图书管查阅等传统方式。常常为了一个简单的问题而到处寻师,在图书馆翻着类似我的电脑桌抽屉里的检索卡片,苦苦寻找。曾几何时,互联网的普及与兴起,搜索引擎的出现,逐渐改变着我们的生活习惯和思维方式。很多问题“baidu一下,你就知道。” 就像这里用的“曾几何时”这一词,中文不好的我只有模糊的理解,还以为有“曾经”的意思,想用为第一句。于是百度知道搜索了一下,出自宋"王安石《祭盛侍郎文》:“补官扬州,公得谢归。曾几何时,讣者来门。” 才知是才过了不久的意思。 搜索引擎(search engine)是一个系统,能从大量信息中找到所需的信息,提供给用户。互联网出现到现今,信息量可以说成密指数的增长,大量信息就像Google的原本含义一样“1的后面跟着100个0”,这个数比宇宙所有的基本粒子的数量总和还要大。在这浩如烟海的信息中怎么才能找到自己需要的信息呢?搜索引擎就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。 事物的发展往往遵循着合久必分,分久必合的规律,每一次的合与分都是代表着更高级更先进。同样搜索引擎从最初的Archie可以用文件名查找整个互联网中FTP文件的系统,发展到Yahoo早期一种手工录入的分行业的目录检索。随着搜索技术的发展,元标记搜索、全文搜索重新又把整个互连网的信息整合起来提供给用户,目前的Baidu、Google提供的就是一种整个互联网的全文搜索,这种整合信息的搜索也称为水平搜索。这种水平全文搜索固然可以把网络中的所有相关信息提供给用,但这种“所有”不代表着是用户所需的“所有”,往往夹杂着许多垃圾信息。问题出现就伴随着去解决,如果平常使用搜索引擎比较全面,你会发现Baidu、Goolge都有了“更多”的选项,其中出现了大学搜索、新闻搜索、图书搜索、图片搜索等等这些专业化,行业化的搜索,也称为垂直搜索。当前垂直搜索正在逐渐走向丰富化、专业化、行业化,将越来越满足人们的搜索需求。比如很多人在搜索问题时会到百度知道里搜索,因为那里更有针对性;搜索天气会到天气搜索中等等。 那么搜索引擎的下一步发展是什么呢?让我们回想一下搜索引擎的定义:一个系统,能从大量信息中找到所需的信息,提供给用户。根据技术的不断发展和事物规律畅想一下,垂直搜索发展到一定程度会出现信息的单一专业化太强,整体信息综合化不好,而人们需要的不但要有专业信息,同样也要有整体联想信息。随着人工智能、神经网络、网格计算等搜索技术的发展,我们又将有一个能整合互联网信息,智能的提供用户确实所“需”的信息,而不简单只是所“要”的信息,因为很多时候搜索时,自己都不知道要什么。 再回到现在的搜索引擎,它就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径。这个引擎提供给用户的最后一步是什么?是一条清晰的检索路径。好的,注意这是一条检索路径,在这条路径的上的检索和信息提取是什么呢,是我们的阅读和大脑的判断。也就是做搜索引擎的最后一步是我们的大脑。得到的这条路径清晰但也并不简短,需要我们进行快速的浏览,呵呵,绕来绕去,得出一个结论,快速阅读也是搜索引擎中的一部分。
|
相关推荐
搜索引擎技术是互联网时代的核心技术之一,它有效地解决了信息爆炸带来的挑战。自1995年起,随着WEB信息的迅速增长,搜索引擎技术应运而生,为用户提供了在海量信息中定位所需内容的能力。据1999年《科学》杂志文章...
### 搜索引擎发展趋势 #### 一、搜索技术的历史回顾 搜索技术的发展历程是信息技术进步的重要标志之一。从最早的自动索引程序到今天高度智能化的搜索引擎,这一过程见证了信息技术的巨大飞跃。 - **萌芽阶段...
随着互联网的快速发展,搜索引擎技术也在不断地进行创新和升级。主要发展趋势表现在以下几个方面: 1. 搜索结果的相关性和准确性提升:搜索引擎开始运用复杂的算法来提高搜索结果的相关性,试图更准确地理解用户的...
搜索引擎营销的未来发展趋势包括:更智能的算法,如人工智能和机器学习的应用,将使搜索结果更加精准;移动搜索的崛起,使得移动SEM变得至关重要;以及语音搜索的增加,这要求优化策略适应自然语言处理。此外,个性...
当今搜索引擎技术及发展趋势.doc
**搜索引擎技术发展趋势** 1. **自然语言智能问答**:为了提高用户提问的理解,搜索引擎开始支持自然语言查询,允许用户输入完整的疑问句,提高查询效率和准确性。 2. **基于链接评价的搜索引擎**:如Google,网页...
### 二、搜索引擎的发展趋势 随着技术的进步和用户需求的变化,搜索引擎的发展呈现出以下几个明显趋势: 1. **数据库小型化与专业化**:随着大数据和云计算技术的发展,搜索引擎开始朝着更小、更专业的方向发展,...
2. 移动搜索引擎:移动搜索引擎与传统搜索引擎技术相同,但因其在手机设备上的应用,提供随时随地的搜索服务,用户群体更广泛,是未来发展趋势。 3. 主要核心技术:包括中英文分词、排序算法、网络爬虫、查询/存储...
本文将深入探讨搜索引擎技术的各个方面,包括其工作原理、主要组件、优化策略以及发展趋势。 一、搜索引擎工作原理 搜索引擎的基本工作流程可以概括为“爬取”、“索引”和“检索”三个步骤: 1. 爬取:搜索引擎...
搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。 搜索引擎行业发展历程: 中国搜索引擎行业经历了萌芽期、发展期和高速发展期,2019年...
本文将深入探讨搜索引擎的原理,并展望其未来的发展趋势。 搜索引擎的基本工作流程可以概括为"爬取"、"索引"、"排名"和"检索"四个步骤。首先,搜索引擎会派出爬虫程序遍历互联网上的网页,这个过程称为"爬取"。爬虫...
Google作为全球领先的搜索引擎,其在搜索技术上的创新和用户友好的界面设计使其在业界占据领先地位。然而,随着社交媒体平台如Twitter和Facebook的崛起,以及苹果公司的多元化战略,Google面临的市场竞争压力日益...
搜索引擎作为互联网的重要组成部分,它的现状和发展趋势对于理解信息获取的方式和技术进步至关重要。搜索引擎的种类多样,包括全文索引、目录索引、图片搜索引擎等,它们根据特定策略抓取互联网信息,经过处理后为...
《中文搜索引擎技术揭密:网络蜘蛛》 搜索引擎技术是互联网信息获取的重要手段,而网络蜘蛛(也称为网页爬虫)则是搜索引擎技术的核心组成部分。本文将深入探讨网络蜘蛛的工作原理、技术实现以及在中文搜索引擎中的...