`
wind_bell
  • 浏览: 291233 次
  • 性别: Icon_minigender_2
  • 来自: 广州
社区版块
存档分类
最新评论

DESE:一步到位的企业级搜索引擎解决方案

阅读更多
嵌入式数据库搜索引擎(DESE德思,Database-based Embedded Search Engine)融合了数据库完善的数据管理功能和搜索引擎高效的信息查找功能,实现了结构化数据和非结构化数据的统一管理和完美查询。

  只要系统中存在数据库,DESE就可以迅速在系统中实现搜索引擎,保留数据原有的安全机制,对系统中的所有文本信息实现快速、准确的搜索。

  信息搜索市场的有力的推动者DESE,采用北京海量在线先进的智能分词、概念抽取、自动摘要和全文检索等多项技术,同时结合数据库自身的检索机制,形成基于数据库的企业级搜索引擎,实现了数据的信息搜索、权限管理、数据维护一体化。

  企业内部存在信息管理障碍

  有关调查表明,目前企业数据每年以200%的速度增长,其中80%的数据以文件、邮件等非结构化数据存放在企业计算机系统的各个角落;企业的员工每天平均花两个半小时在寻找资料。

  这样,企业内存在各种障碍,信息运用效率极低:

  1、数据量太多,要取得有用信息,需要耗费大量的时间。

  2、数据分布在不同系统中,需要信息时忘记了存放在何处。需要转换多次才能找到。

  3、处理新的业务和新问题,不知道组织内部有哪些信息可以使用。

  4、采用新的信息管理系统,经常会改变员工的工作习惯,需要花费时间和精力去适应和学习。

  5、系统本身实施时间和成本也较高。

  DESE超越障碍  搜索一步到位

  全方位信息管理

  DESE以数据库为基础,能对不同系统中的数据进行统一处理,包括传统关系型数据库、网站、文件系统、Lotus Notes系统等。客户只需要通过统一入口,就可知想要的信息在哪里。

  DESE自动监控文件目录,对指定目录下的格式文本自动上传到数据库中,支持格式化文件和数据库信息的联合查询;定期自动更新。

  支持Doc、excel、email、rtf、pdf、html、xml、txt等格式化文档。

  支持主流数据库,包括Oracle、SQL Server;支持主流操作平台,包括Windows、Linux、Unix;支持完备的码制,包括GB2312/GBK、BIG5、GB18030、ISO8599-1。

  灵活的扩展和定制

  DESE基于通用的数据库,客户可以在其基础之上做自由的扩展。

  DESE提供组件化的功能模块,可以根据实际的业务流程,进行二次开发和个性化的定制。提供处理二次开发接口和应用实例。

  高质量的查询

  目前数据库厂商多提供的是所谓“字索引”。“字索引”往往造成语意的割裂,使检索结果出现大量误查现象。如:检索「国花」,会命中「美国花旗银行」。检索「和服」,会命中「产品和服务」。

  DESE应用先进的海量中文智能计算技术如中文智能分词技术;中文概念抽取技术;全文检索技术;自动摘要技术等,以精确的中文智能分词为基础,解决了简单字符匹配的弊端,能精确得到查询者想要的结果。

  强大的搜索功能

  关键词搜索:DESE提供精确的关键词搜索。如搜索「布什」,会得到所有美国总统「布什」的相关结果,而不会搜索到「宣布什么」。

  逻辑搜索:提供常用的与、或、非等逻辑搜索。

  分类搜索:可以提供在不同类别中的搜索。如在「体育」类中搜索「乔丹」,在「文学」类中搜索「莎士比亚」,这样可以得到更精确的结果。

  指定文章区域搜索:可以提供在「标题」、「作者」、「出版社」中搜索等,区域的名称可以定制。

  在结果中搜索:提供方便的在结果中继续查询,实现渐进搜索。

  动态摘要和命中词反显:在搜索结果页中,提供与搜索词相关的摘要,同时在摘要中,把搜索词用不同颜色显示。

  除以上特点之外,DESE还拥有如下功能:

  DESE采用北京海量在线领先的中文自然语言处理技术,提供基于语义的检索。能实现对指定文章的相关文章检索。

  DESE把全文检索核心嵌入到数据库底层,保证了在传输过程中数据的安全性,同时让搜索和源数据完全同步。

  在2小时内,应用DESE,可把数据库快速变成企业级搜索引擎。DESE利用海量全文检索技术,大大降低搜索的资源消耗率,且无需花另外构买单独的检索服务器的投入。与目标系统完全融合,大部分工作在底层完成。维护工作少,成本低。

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics