网络检索无处不在!无论是显而易见的搜索引擎,还是论坛、网上购物目录等,都频繁地使用网络检索。因此,我们这里的“网络检索”定义为用户通过网络提交一定的检索条件(如关键词信息)到服务器上的检索应用中,并获取和呈现检索应用所返回的结果。
检索方式 一般来说,当检索的结果集过大时(经常出现非常大的情况),采取分页数据显示的策略,即每次返回结果集中的小部分数据,通过类似“上一页”、“下一页”的操作来查看更多的结果。用户的期望是提交的检索能够很快得到响应,而且进行“上一页”、“下一页”的操作时也能够很快得到响应。因此,问题的关键在于根据用户提供的记录起始位置和需要记录数量来获取每一次所需要使用的结果数据。目前存在一些使用较多的方式。
1) 用户提交的检索条件每次都被重新执行,然后获取检索结果集的一个子集。用户的检索条件被保存在Cookie、Session或者HTML的表单隐藏元素(“<input type=hidden value=条件>”)中。由于检索操作需要对服务器和数据库资源的大量使用,因此,每次执行检索无疑会增加这种负担,降低检索应用的效率。
2) 将全部的检索结果取出放到一个大的对象中,该对象实现了对记录的各种操作。同时如果将该对象缓存在服务器上,那么以后的翻页操作都不需要重新执行检索条件而直接从该对象中获取结果的子集。然而,将全部检索结果保存到对象中的操作本身就比较复杂,而且如果结果集很大,则意味着缓存该对象需要占用大量宝贵的服务器资源。同时,首次结果的显示速度可能不会令人满意。
3) 一次获取“几页”的结果子集并保存到对象中并缓存起来,如果用户的“下一页”操作超出了当前对象提供的数据,则再次执行检索条件,获取满足条件的“又几页”并保存到同一个对象中。出现这种情况的考虑是,用户在使用检索时,可能只会查看最开始的一些记录,而很少进行到相对后面的记录。从这种意义上看,不失为一种比较好的方式。但如果移动到未缓存的记录时,又必须重新执行查询,同时降低结果显示的速度。
4) 在首次执行检索时,先将全部能够唯一确定每条记录的编号(如主键)保存到对象中并缓存起来,以后对每一页的请求首先在缓存的主键对象中找出满足条件的主键集合,再重新建立查询语句(使用IN关键字)取得该页需要的记录,这样能够准确定义每次需要的检索范围,从而也只是取得所需要的数据。当然,如果某个表不存在这种唯一编号或者主键就无法进行。
5) 在一些检索应用中,如论坛的帖子显示,可以用一个公共的缓存区来保存部分的帖子,当用户请求某一页时执行的查询仅仅取得帖子的主键,根据这些主键到公共缓存区中去取得记录。如果对应主键的记录不存在,则使用该主键查询出记录同时保存该记录到公共缓存区。这种方式适用于多个用户检索的结果大部分相同的情况,正如论坛帖子的显示。
6) 如果是在J2EE体系结构中,使用EJB的Finder方法也可以返回对象的集合,而这样的一个对象封装了每条记录的数据。但是,大量对象的生成和存在于服务器内存中无疑也是对服务器资源的巨大消耗。因此,对于存在大量记录的结果集使用实体Bean来代表每条记录会耗尽系统资源而且实际上并不能够获得太多的好处。
网络检索的关键在于检索的执行效率、网络传输速度和结果集的使用方式。综合来看,网络检索的模式都是通过提供的检索条件,来构建一个能够被数据库使用的、优化的SQL查询语句,由数据库执行并返回记录集,再根据这些记录集来生成显示页面。
因此,在中间层及数据层,我们着重考虑如何高效地生成每次所需的结果数据;在表示层,即面向用户的层面则需要提供友好、方便的显示和操作界面。
实现机制
从各种检索方式使用的效率来说,结果集对象的缓存是可行的。在JDBC2.0中,支持可滚动的结果集,能够任意取得结果集的一个子集。同时,可以指定能够被缓存的返回记录数量,这样就不需要一次返回全部的记录(对分页操作来说,该项功能具有实际的意义),当需要新的记录时,再到数据库中取得并替换掉缓存中的旧记录。然而,各个数据库厂商对JDBC2.0中的结果集以各自不同的方式实现,因此,效率各不相同。Oracle在这方面是做得比较完善的。
检索操作的具体流程为:用户通过检索页面(如search.jsp)构建检索的条件(包括输入关键词、选择范围等),提交后到检索处理程序(如SearchServlet),分析用户提交的数据并且构建一个合理的SQL查询语句;由检索执行程序(如LocalEngine)来执行该SQL查询语句,同时将执行返回的结果集进行缓存,并重新定向到检索结果页面(如searchresult.jsp);由检索结果页面提交请求到结果处理程序(如SearchResultServlet)来获取所需的数据,格式化并显示信息。
图1:检索序列图
网络检索的关键在于两个方面:检索的执行和结果的显示。如果从用户的角度来考虑,比较关心的是检索的准确性、结果界面的友好性及检索响应速度。
XML结合数据绑定的结果显示
XML在数据表现和数据交换方面优势使其发展潜力巨大。但是直接呈现XML数据给用户并不是最好的模式,需要利用浏览器的功能来完善数据的显示。一种有效传输XML的方式是利用MSXML解释器中的XMLHTTP对象,它允许你打开一个到服务器上的HTTP连接,发送一些数据和取回一些数据,并且所有的这一切都是在很少的几段脚本中就能够实现。使用XMLHTTP对象通常是进行XML数据交换,但其他格式的数据也是允许的。在作这一系列事情时,不需对当前网页进行重加载,用户甚至不知道后台在作些什么,网页不用重新刷新就已经获取了新的数据。
将客户端的请求发送到服务器后,通过XMLHTTP对象可以接受返回的数据。利用数据岛(Data Island)将我们返回的XML数据嵌入到页面中去。扩展标记语言XML使用标准的方式来描述和交换结构化数据;XML的数据以开放的、基于文本的格式进行描述,并通过标准HTTP协议传输。XML本身的特性决定了它天生就是一种灵活强大的数据源对象(DSO)。IE4.0使用JAVA APPLET来实现XML DSO;IE5.0支持Data Island,用户可以直接用<XML>标记定义的数据作为DSO。
数据绑定(Data Binding)并不是一个新概念,IE 4.0就已对其给予了丰富的支持。但是,数据绑定并未受到应有的重视,许多开发者似乎更加愿意使用服务器端脚本(Server Script)的方法。然而实际上,无论是在动态网页的代码实现方面,还是在动态网页的工作效率方面,数据绑定的效率都比后者更高。
可绑定的HTML元素共分为两大类:单值对象(Single-valued Consumer)和表对象(Tabular Consumer)。单值对象显示DSO提供的当前记录的某一个域,而表对象中的每行元素则分别对应一条记录中不同的域,并以此为模板重复显示数据集中的每条记录。数据显示对象既可以在设计时绑定到DSO,也可以在运行时动态绑定。
利用数据绑定,减轻了服务器的负担。服务器应用程序可以专注于数据的产生,而数据的显示和操作由客户端脚本来完成。由于不需要刷新页面,我们能够将结果记录总数、当前页码等信息保存在客户端,并且根据这些信息来生产总页数、分页显示的代码。
结果集缓存的检索
利用JDBC2.0的特性,我们可以更加自由地操作结果集对象,移动游标向前、向后以及指向任意位置(将ResultSet的类型设置为TYPE_SCROLL_INSENSITIVE或TYPE_SCROLL_SENSITIVE),同时能够指定一次取得记录的数量。检索应用的类图如下:
图6:检索操作类图
ResultHelper:用于检索操作的帮助类。通过该类来执行检索、获取记录总数、获取结果集的XML数据。
QueryProperties:生成实际执行的、完整的数据库操作SQL语句。
QueryBean:进行实际的数据库操作,提供对结果集的使用操作。该类也实现HttpSessionBindingListener接口,当不再需要该类的缓存数据时,能够关闭数据库连接。使用Iterator模式。
PageGlobals:检索操作的公共变量,如默认页面大小、默认开始页面、默认缓存时间等。
总结
实际使用的情况表明,结果集的缓存和XML数据绑定能够大大提高检索和显示的效率。
在服务器端,不需要使用JSP来生成检索结果页面,结果数据以XML来表示,能够提供给任何类型的客户端使用,而不仅仅局限于浏览器(类似于Web服务的概念);在网络传输方面,每次只是传递需要的XML,很大程度上减少了传输的数据量;客户端使用XMLHTTP对象来实现数据提交到服务器,形成一种后台操作的形式,“安静”地从服务器上取得数据;采用数据绑定的形式来呈现数据,生成网页的效率明显地提高了,而且编程工作量少,使用灵活。
采用XML技术、数据绑定的方式来完成高效的检索结果呈现,在编程实现方面会带来一定的复杂性,但是,复杂的工作是高效率的代价,可以根据实际情况来决定采用的方式。
分享到:
相关推荐
9. **分布式检索**:面对PB级别的XML数据,单机检索难以胜任,因此需要分布式检索技术。如MapReduce模型可以将大规模检索任务拆分,分布到多台机器上并行处理。 10. **安全性**:XML检索过程中还需要考虑数据安全,...
### XML数据索引技术 #### 一、引言 随着互联网技术的发展,XML(Extensible Markup Language)作为一种标准的数据表示和交换格式,在数字图书馆、Web服务及电子商务等领域得到了广泛的应用。XML文档以其丰富的...
倒排索引是全文检索技术中的关键,它通过将文档中的词汇与文档位置关联起来,提高了检索效率。系统首先对法律、协议、条约等文档的结构进行深入分析,然后利用关系数据库存储XML文档的全文索引信息,以便快速定位和...
随着XML数据量的不断增长,如何快速有效地检索XML文档中的信息成为了研究的热点,XML数据索引技术应运而生。 XML索引技术主要目的是为了提高XML文档的查询效率。随着研究的深入,XML索引技术的分类和方法也在不断...
综上所述,XML检索技术的研究不仅涉及对现有模型和技术的优化,还需要不断探索新的解决方案,以应对日益增长的数据量和不断提高的用户需求。随着技术的进步和算法的创新,未来XML检索技术将在更多领域发挥重要作用。
DB2 数据库中的 XML 全文...这些技术使得在 DB2 中对 XML 数据进行全文检索时,可以实现灵活、精确的查询,极大地提高了数据检索的效率和用户体验。理解并熟练运用这些方法,对于处理大量 XML 数据的应用场景至关重要。
总之,基于LDAP的XML数据访问技术利用LDAP的高效查询能力和XML数据的灵活性,为大规模XML数据的存储和查询提供了一种有效解决方案。通过这一技术,可以在不同的应用场景中,实现对XML数据的有效管理和访问。
XML的关键字检索是XML数据检索的重要手段,它为用户提供友好的搜索体验,类似于搜索引擎的工作方式。然而,传统的基于查询语义的XML关键字检索方法存在两个主要问题:一是可能返回大量与用户查询意图不相关的片段;...
- **互操作性**:Oracle XML DB允许XML数据与关系数据无缝交互,提供了一种将两者结合的有效方式。 4. 应用场景 Oracle XML DB技术适用于那些需要高效存储和处理大量XML数据的场景,如Web服务、内容管理系统、电子...
Hybrid XML Database (HXD)结合了XEDB和NXDB的特点,它可以同时处理关系数据和XML数据,提供了一种更灵活的方法来管理混合类型的数据。HXD通常包含一个内部的映射机制,允许用户在XML和关系模型之间转换,这样既可以...
总之,XML映射架构在SQL Server中的应用提供了灵活且高效的数据检索和转换机制,使得XML数据能够更好地融入到SQL Server数据库环境中,增强了数据的互操作性和处理能力。通过理解并熟练运用XML映射架构,开发者可以...
5. **存储和检索数据**: 将XML数据存储在本地(如localStorage或userData行为),JavaScript可以读取和修改这些数据,实现离线应用功能。 需要注意的是,随着JSON(JavaScript Object Notation)的普及,因为其更...
在Transact-SQL中检索XML数据,可以通过SELECT语句结合FOR XML子句来实现。FOR XML子句允许将SQL查询的结果集以XML格式返回,这样可以使得数据能够被进一步地处理或者传递给其他系统。 具体地,FOR XML子句提供了几...
总结来说,SQL Server 2000的XML数据交换技术在Web系统中的应用显著提升了数据传输的灵活性和效率,解决了传统Web应用中数据格式不一致的问题,促进了异构数据库之间的交互。通过XML,开发人员可以构建更加高效、可...
JSP页面通过后台的JAVA Servlet处理用户的请求,与XML数据进行交互,提供动态检索和展示图书信息的功能。 该系统的工作流程大致如下:用户在前端页面输入查询条件,这些请求被发送到服务器上的JSP页面。JSP页面通过...
总的来说,这个系统通过集成全文检索和结构化查询,使用Dewey ID编码优化XML文档的索引,同时结合查询引擎,提供了一种高效、灵活的关系数据库中XML数据处理方案。它特别适用于处理复杂内容的查询,能够支持NOT、AND...
这种方法减少了不必要的比较步骤,提高了查询效率,尤其对于大型XML数据集,能显著提升数据检索速度。 XML数据与关系数据库的转换通常有两种方法:结构映射和模型映射。结构映射依赖于XML文档的模式(DTD或XML ...