搜索已不仅仅是一项产品、一门技术,更是一种服务形态,围绕搜索引擎已形成的企业应用市场和互联网应用市场都呈现出高增长的态势。
从应用领域划分,搜索引擎的应用包含了企业搜索和互联网搜索两个领域,而从应用的类型来看,可以分为互联网搜索引擎服务、电子商务以及知识管理应用(包括企业内网搜索、文档管理系统等)。总体上说,搜索引擎可以广泛应用于各行各业中,如政府、金融、电信、航空航天、教育、出版、零售、制药等。
与国外搜索引擎企业应用和互联网应用齐头并进的情况不同,在中国,搜索引擎的应用出现了一边热一边冷的现象。在互联网搜索引擎应用市场上,搜索引擎营销市场的热度不断升温,竞争也日趋激烈,而与之相对应的企业应用市场上,受限于企业信息化的水平,企业搜索的应用发展极不平衡,人们对搜索引擎的认识还仅仅停留在企业竞争情报和传统全文检索的应用上。
搜索引擎的市场
由于搜索引擎应用的广泛性和技术的融合性,人们很难界定搜索引擎市场和产品归属,更趋向于通过技术名称来进行概括。
信息访问技术(Information Access Technology)是著名的IT咨询公司Gartner对搜索引擎市场的最新定义。在Gartner看来,信息访问技术所包含的搜索引擎技术是基础技术,越来越多地支持自动分类、聚类、可视化以及分类学的技术。信息访问技术虽然不包括信息管理系统及其应用,如文档管理、Web内容管理和关系型数据库管理,但是必须能够辨别和检索来自这些系统的信息,同时也能够作为其他企业应用的嵌入(或者OEM)部分。与此相比,企业搜索(Enterprise Search)和互联网搜索引擎(Internet Search Engine)都是对搜索引擎局部市场和所涉及的技术的片面表述,无法使人们获得搜索引擎市场和技术的全面认识。
国际搜索引擎市场通常只计算传统安装方式的搜索产品,而排除了出售与搜索引擎相关的单项技术(或者算法)的公司。Gartner也把以应用服务方式(Application Service Provider)提供服务的搜索产品排除在搜索引擎市场以外,原因是ASP搜索服务方式的市场空间很小。但是,在中国的情况也许会大相径庭,尤其值得我们关注。
搜索引擎作为发挥信息和知识价值的服务平台可以产生巨大的效益。在中国,充分利用信息和知识,并转化为社会财富,以信息资源开发为核心的信息服务将成为信息化下一个热点。信息资源开发和服务是继网络泡沫破灭之后信息化发展走向坚实的开端。
互联网搜索引擎应用
调查显示,70%以上的用户通过搜索引擎找到相关的内容。据2006年3月CNNIC的调查数据,中国内地的网民数量达到1.2亿,由此可以看出,搜索引擎已经成为一个实实在在的信息枢纽和信息门户,成为用户获取网络信息的首选工具。
经过10年的市场培养,搜索引擎营销在中国已经收到了普遍的认可。计世资讯(CCW Research)最新的研究报告预计,2006年中国的搜索引擎市场总额将突破20亿元大关,并实现46%左右的增长。计世资讯(CCW Research)认为,中国互联网市场上存在的搜索引擎企业形成了三层梯队: 第一层梯队是Google、百度、Yahoo; 第二层梯队是中搜、新浪、搜狐、网易; 第三层梯队是正在兴起的专业搜索。
事实上,互联网搜索引擎市场正在发生着进一步的分化和市场细分,以专业化信息服务为特色的专业搜索将占据搜索引擎市场中未开发的新领地,行业搜索、购物搜索、本地搜索等将会快速成长,并争夺搜索引擎营销的市场份额。
作者简介:王仲
博士,教授,联索科技有限公司产品研发总监。主要从事视频跟踪与视频识别、多媒体搜索引擎方向的研究工作。
目前,中国市场上大多数搜索引擎厂商运营搜索引擎门户,提供互联网信息导航服务。但需要对互联网信息资源进行专业化处理时,这些搜索引擎普遍支持不够。只有专业搜索可以按照用户指定的专题内容和分类标准,从互联网上搜集和处理多种信息来源的相关信息,提供强大的全文检索、自动分类,以及结构化、规范化的信息处理功能。
2006年春季,互联网搜索引擎的巨头们Yahoo、Google、MSN不约而同地推出了个性化搜索主页。个性搜索引擎的王者之争已经不可避免,而RSS也日益普及,成为个性化信息源订阅的工具,虽然中国的互联网企业在个性化搜索主页服务上依然沉默,但是个性化搜索技术支持已经成为部分搜索产品中的组件。
企业搜索引擎产品
在国内,搜索引擎厂商为企业用户提供的服务可以分为两种形式,一种是提供搜索结果的服务,一种是提供搜索软件产品给用户。搜索结果服务成本低,无需开发,很适合信息量不大、信息更新不频繁、对信息安全没有要求的中小企业使用; 用户购买搜索软件产品可以获得功能强大的统一信息处理和管理的平台。传统的信息搜集与检索程序也许能够满足一时的需要,例如数据库自带检索功能等,但是无法满足专业需要的高级信息处理要求,而且检索效率极低,效果很差,极大地影响到用户的检索体验和运行效率。而搜索技术的高壁垒决定了只有专业的搜索软件厂商才能够最有效地开发满足用户需要的产品。
无论搜索引擎的技术、产品和市场如何变化,技术试图解决的总是准确度(相关性),而应用却要以商业目标为中心,所以处于技术和应用中间的企业搜索引擎产品的优劣就不能仅仅用功能和性能来进行评价。对于不同的商业应用,企业搜索引擎并没有相同的相关性模型,也不存在惟一的评判标准,只有专业搜索将个性化机制引入到企业搜索引擎产品中,才是平衡商业目标(或者商业模型)、业务流程和技术(算法)现实的切入点。企业搜索引擎产品中重要的个性化调节参数至少包括新鲜度、全面性、权威性、统计分析、内容质量、地域性等。著名搜索引擎领导厂商FAST将这一机制形象地比喻成音响视听系统多种多样的调节器,可以分别独立进行可视化地调谐操作。
搜索引擎的使用者要得到相关的搜索结果不仅有赖于对上下文的理解,同时要了解搜索用户的特点。用户用关键词表达的查询要求与用户所需的相关性结果之间存在着巨大的技术鸿沟,因此搜索引擎产品必须提供复杂的信息检索后台功能和可控的参数,利用语言计算工具改善查准率和查全率,以超越关键词检索所能提供的准确度。
中国的搜索引擎产品和国外的搜索引擎产品尽管在应用上具有相当大的差距,但是在核心技术方面的差距并不大,在中文语言的处理上更是具有先天优势。国内的搜索引擎产品已经开始适应专业信息服务的要求,不仅能够高效率地满足信息服务和信息利用的需要,以专业信息处理能力有效平衡信息处理深度和广度,而且能够系统地、全面地做到个性化的定制和个性化的内容提供。
企业搜索应用解决方案
统一的信息共享与利用是用户信息化战略中的重中之重。统一的信息资源管理平台将机构(企业或者政府)内外相关的、大量的、实时的信息资源组织管理好,把结构化、非结构化的信息有序整合,为各种各样的业务开展提供最新、最权威、最准确的信息支持,同时为访问者提供一个交互平台,达到组织内外的知识获取和共享,从而使得企业、政府机构的用户可以从单一的平台访问到个性化的信息。在专业搜索整合的统一信息资源界面上,企业级搜索的用户可以准确及时地从内网、外网、互联网找到所需信息,进行网上办公、在线咨询。
Google提出“要搜索,不要分类(search,don’t sort)”,而企业尤其重视信息的分类处理,迫切要求能够从大量的信息中浓缩约简出精华信息。从中可以看出,企业信息处理与互联网搜索服务提供商之间的理念存在着巨大差异。
在企业搜索应用中,垂直化的专业搜索应用是新一轮搜索引擎市场的主流应用,而在专业搜索软件厂商方面,具有丰富客户经验和强大开发实力的北京联索科技是其中的典型代表。联索IFACE专业搜索软件产品系列重点解决了中国目前主要商用搜索引擎普遍存在的缺陷,突出“精”和“活”,将个性化搜索从理念变成现实,形成有形的搜索企业级产品。
(计算机世界报 2006年06月12日 第22期 B16)
分享到:
相关推荐
搜索引擎应用技术中的Cache技术与Hash算法 在深入探讨搜索引擎应用技术中的Cache技术与Hash算法之前,我们首先要理解搜索引擎的基本架构和工作原理。搜索引擎的核心任务是从海量的信息中快速准确地找到用户所需的...
"基于自然语言处理技术的政务智能搜索引擎应用探索" 本文探索了基于自然语言处理技术的政务智能搜索引擎系统的应用。该系统可以将自然语言问题转换为SQL语言,从而使用户可以通过输入自然语言问题直接获得相关数据...
三、搜索引擎应用 搜索引擎不仅用于信息检索,还在许多领域有着广泛的应用。例如,购物搜索引擎可以帮助用户比较商品价格;学术搜索引擎如Google Scholar则专注于学术资源的搜索;语音搜索则结合了自然语言处理技术...
它具备高性能、可扩展性强的特点,可以用来构建各种搜索引擎应用。Lucene使用倒排索引,能够快速准确地对大量文本数据进行索引,并通过布尔逻辑等查询方式快速检索数据。 2. Lucene的关键特性 Lucene的API包含多个...
电子商务中搜索引擎应用.doc
中文分词算法在搜索引擎应用中的运用_李文华.caj
要实现jQuery微软Bing搜索引擎应用,首先需要注册一个Microsoft Azure账号,并在Azure门户中创建一个必应搜索服务的资源。完成这些步骤后,你将获得一个API密钥,这是访问Bing搜索API的关键。 接下来,你需要在HTML...
性能调优是任何搜索引擎应用中的重要环节,文档的第六部分对性能调优提供了深入指导。涵盖了Schema设计、配置考虑、缓存自动预热次数、缓存命中率、排序字段的显式预热、优化考虑、更新与提交频率权衡、查询响应压缩...
Lucene是Apache软件基金会的一个项目,它是一个高性能、全文本搜索库,为开发者提供了构建自己的搜索引擎应用的能力。书中将详细介绍Lucene的API,包括如何创建索引、执行查询、优化性能等方面。通过学习,你可以...
它允许开发者构建自己的搜索引擎应用。 2. **Lucene特性**:包括高效的倒排索引实现、支持多字段搜索、支持复杂查询语法、提供缓存机制以优化性能等。 3. **使用示例**:文档可能会介绍如何使用Java和Lucene来建立...
针对目前已有的煤矿运维系统功能单一、自动化程度低等问题,将全文搜索引擎应用到煤矿运维系统中,通过搜索引擎从故障解决方案数据库中搜索出匹配的解决方案。介绍了煤矿运维系统流程及故障解决方案来源、数据结构和...
在IT领域,多线程是提高程序性能和并发能力的重要技术。C#作为一种强大的编程语言,提供了丰富的多线程功能,使得开发者可以构建高效的多...通过合理地设计和实现多线程架构,我们可以创建出高效、可靠的搜索引擎应用。
以下是对ASP.NET在大型搜索引擎应用中的关键知识点的详细解释: 1. **Web Forms和MVC模式**: ASP.NET 提供了两种主要的开发模型:Web Forms和MVC(Model-View-Controller)。Web Forms适合快速开发,提供了丰富的...
《Lucene+Nutch搜索引擎开发:王学松源代码解析》 在信息技术日新月异的今天,搜索引擎已经成为了人们获取信息的重要工具。...通过实践这些代码,不仅可以提升技术能力,还能为构建自己的搜索引擎应用打下坚实基础。
关键词MapReduce、Lucene、分布式搜索的提及,强调了在分布式搜索引擎应用中,MapReduce编程模式发挥了重要作用。它通过分布式的并行处理能力,提供了针对大数据集的搜索效率和优化,以及在实际应用中性能显著提升的...
通过这本书的学习,读者不仅可以掌握Lucene的使用,还能对搜索引擎技术有深入的理解,有助于开发自己的搜索引擎应用或者增强现有系统的搜索功能。无论你是Java开发者还是对搜索引擎感兴趣的IT从业者,这都是一个非常...
搜索引擎的核心在于信息检索和文本分析,Lucene作为Java平台上的一个高性能、可扩展的全文搜索库,是构建自定义搜索引擎应用的理想选择。Lucene提供了索引和搜索功能,包括分词、文档存储、倒排索引、布尔查询等,...