当你登录某一个网站,在互联网上搜索各个网站的某一类内容,比如,输入“WTO”,希望得到最新、最全面的信息,你能等待多长时间?
几年前,人们希望十几秒,最多30秒钟就能得到结果,而现在的期望值是1~2秒,也就是说,伴随点击鼠标的“咔哒”一声,显示屏的页面已经变了,排在最前面的十几、二十条信息的标题已经出现在你的面前。
哪个网站的搜索速度明显地变快了,那它一定是使用了先进的搜索引擎技术。搜索引擎是仅次于门户的互联网第二大核心技术,要用到信息检索、人工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。伴随互联网的普及和网上信息的爆炸式增长,它越来越引起人们的重视。
成功的百度 要谈国内搜索引擎技术应用现状则不能不谈百度。美国的网络门户多是以搜索引擎起家的,国内搜索引擎的发展却一直不尽如人意,这种情况直到2000年下半年才结束:年轻的百度公司迅速地拿下了硅谷动力、Chinaren、搜狐、新浪、21CN、广州视窗、263、TOM等门户网站的全文搜索引擎服务,成为中文检索市场中的佼佼者。
百度的成功对中文搜索的贡献很大,不但提供给门户网站以质优价平的搜索引擎,使中国网民有更好的搜索体验,也因为百度的成功,激励了同行的进取心,使得国内中文搜索引擎的发展进入你争我赶的良性发展时代。最近一年来,中文搜索引擎的进步成了互联网行业的一个亮点。
老将出奇兵 在传统的网站分类目录搜索方面,新浪、网易、搜狐各出奇兵。新浪依托自身良好的技术实力和新闻优势,推出了综合搜索,省却了用户分门别类搜索的麻烦,只要输入一次想搜索的关键词,就能得到网站、网页、新闻、商品等常用信息,层次分明,一目了然,在保持快速、准确的基础上,给用户提供了更多的选择。
网易则利用它良好的网虫资源,网聚人的力量,做起了开放式目录。互联网上各行各业的高手纷纷加盟,使得网易的网站分类目录一天比一天好。网易还进一步挖掘搜索引擎的潜力,推出了把搜索结果通过手机短信发送的功能。而搜狐,则主要把大量的人力物力花在网站分类目录的整理上,成为分类合理的网站分类目录。
易易寻公司主要致力于发展多媒体搜索引擎,它推出了被业内人士推崇的中文图像搜索引擎,使互联网上的多媒体信息开始能被网友方便地利用。
由北大计算机系网络研究室开发的天网搜索引擎,收录了大量教育网内资源,使教育网内的资源也能被广泛利用起来,特别是它的FTP搜索部分,提供了非常丰富的下载资源。并且,经过今年春季的升级,检索速度有了明显提升。
Openfind(网擎)以“搜寻有价”的新观念,推出“CIA 网路情报员”实时信息付费订阅服务。用户可以付费订阅指定关键字的最新信息,这是开发搜索引擎的价值的另一种尝试。Openfind曾是一个优秀的中文全文搜索引擎,当它的搜索引擎客户被后起之秀一个个抢走时,曾有传言说它准备退出门户式搜索引擎的竞争,但事实证明,它仍在努力升级,如今某些方面已经跟领先的百度差别不大。
应用发展方向 百度搜索引擎这半年来除了一直是最大的中文搜索引擎,在搜索的相关性上也不断升级。它把门户网站用的搜索引擎技术应用于中小网站和企业的需要,开发了百度网事通Web和网事通Real搜索。特别值得一提的是网事通Real,其实是一个实时新闻搜索引擎,可以同时监控和检索几千个网站在一分钟前发布的新闻,也能被当做信息监控工具使用。据说某些企业购买来监控各大论坛里的信息,既能收集竞争情报,又能在出现不利企业的信息时及时处理。
目前国内搜索引擎对潜在价值的开发明显不够,在应用上,下一步的发展方向是:
1.网站内和企业局域网内搜索引擎的普及化 搜索引擎作为基础软件已经在国外得到广泛的认同,不仅大型门户网站如美国在线、雅虎、亚马逊等等每一个著名网站的首页都在显著位置放置了搜索框,就连迪斯尼、麦当劳、美孚石油这些传统企业也都无一例外地在它们的首页上放置了搜索框或搜索功能的链接。美国500强中使用搜索引擎的网站几乎达到100%。国内企业往这个方向发展是自然而然的事。
2.实时新闻检索(包括新闻订阅、监控、定向情报收集等)的广泛应用 Openfind推出“CIA网路情报员”,百度推出“网事通real”,慧聪推出“网神”都证明它们已经觉察到了这个发展方向。这其实也是互联网搜索引擎从提供无序低价值信息往提供高质高价值信息方向的转变。
3.搜索引擎统计数据的应用 搜索引擎拥有庞大的流量和特征明显的信息,CNNIC早已认识到了搜索引擎的价值,所以在最近一期的互联网状况调查中利用了百度搜索引擎的统计结果。而著名的yahoo干脆开始出售它的搜索引擎统计数据,这都是搜索引擎统计信息的价值反映。
4.搜索引擎收费登录服务 国内搜索引擎应用有很长一段时间都是搜索引擎独自在唱戏,只能亏本,而网站和网民只有看戏的份,这不是一个良性循环,不利于搜索引擎行业的发展。而近期,情况开始改观,搜狐、新浪焦点的商业网站收费收录服务、网易和263的搜索关键词定向广告、百度的搜索引擎竞价排名服务,有可能促使搜索引擎、网站、网民三者的需求取得和谐。 在技术上,国内搜索引擎在短期内还不会在以下方面有真正的进步,仅停留在美好愿望:自然语言检索、语音检索、视频搜索、用户个性化搜索引擎、交叉语言搜索引擎、具实用性的模糊检索。
但在以下这些问题,却可能在短期内取得明显的进展:网页数量、网页缓存、动态摘要、重复网页、数据库更新期、动态网页抓取、自动分类、定制搜索服务、BBS搜索、Frame网页、不可索引文件的链接索引、切词、死链接、网页搜索和分类目录的结合、错误关键字的提示、pdf/XML等特殊格式文件索引。
|
相关推荐
搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。 搜索引擎行业发展历程: 中国搜索引擎行业经历了萌芽期、发展期和高速发展期,2019年...
三、国内搜索引擎现状 国内主要的搜索引擎包括: - **搜狐**:以分类目录为主,信息抓取范围广泛,提供多样化的增值服务。 - **天网**:由北京大学开发,采用Robots技术收集信息,支持中英文检索,反馈信息丰富。 ...
搜索引擎的设计与实现需要了解国内外搜索引擎现状,掌握搜索引擎技术的实现,熟练地使用 Java 语言,并注意编程规范。同时,搜索引擎的设计与实现也需要了解搜索引擎的开发策略,熟悉搜索引擎的功能和技术架构。 ...
本文对国内主流搜索引擎的算法进行了介绍和分析,并探讨了其研究现状和发展方向。 首先,搜索引擎的算法可以分为多种类型,如基于机器学习和人工智能技术的算法,如PageRank、BERT 等。这些算法通过对大量网页的...
随着因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样,搜索引擎技术恰好解决了这一难题。目前,搜索引擎系统可以分类三大类,分别是:目录式搜索引擎:以人工方式或半自动方式搜集...
搜索引擎技术已经相当成熟,Google、Bing等商业搜索引擎广泛应用于全球。但在校园级别的搜索引擎,尤其针对特定领域的定制化搜索,还有很大的研究空间。Python作为一种强大的编程语言,因其易读性强、库资源丰富等...
- **基于短消息的服务**:通过短信接受查询并发送结果,用户发送关键词到特定服务代码,搜索引擎根据关键词搜索相关信息并通过短信形式反馈给用户。 - **基于浏览器的服务**:类似于传统PC浏览器检索方式,通过手机...
随着因特网的迅猛发展、Web信息的增加,用户要在信息海洋里查找信息,就像大海捞针一样, 搜索引擎技术恰好解决了这一难题。目前,搜索引擎系统可以分类三大类,分别是:目录式搜索引擎:以人工方式或半自动方式搜集...
当前,Web数据挖掘技术的国内外发展现状呈现多点开花的态势,国内外高校、研究机构及科技公司都在积极研究其理论基础和应用范围。同时,Web数据挖掘技术未来的趋势和发展也备受关注,如何进一步提高挖掘的准确性和...
本文通过分析国内外搜索引擎的发展现状,提出了一种利用ASP技术实现一个B/S体系结构的搜索引擎系统的方案,以期达到功能强大,操作简单,通用性强,可以满足用户对信息搜索需要的搜索引擎系统。文中着重论述了该系统...
1.2 国内外发展现状及分类 2 1.3 本论文组织结构介绍 3 2 相关技术介绍 5 2.1什么是搜索引擎 5 2.2 sqlserver数据库 6 2.3 Tomcat服务器 7 3 搜索引擎的基本原理 8 3.1搜索引擎的基本组成及其功能 8 3.2搜索引擎的...
本文通过分析国内外搜索引擎的发展现状,提出了一种利用ASP技术实现一个B/S体系结构的搜索引擎系统的方案,以期达到功能强大,操作简单,通用性强,可以满足用户对信息搜索需要的搜索引擎系统。文中着重论述了该系统...