XML文档的一大特点是可以向多种格式的文档进行转换。比如,从一种逻辑结构的XML向另一种逻辑结构的XML转换,或是转换为可浏览的HTML文档等。这种XML文档的数据格式转换功能由可扩展样式单语言(XSL)完成。
XML文档转换原理
数据格式转换的重要思想是要把XML文档视为一种树结构,转换的过程就是从源树生成结果树的过程。XSL样式单定义了源树和结果树中对应部分的转换规则,每条规则中包含了一个模板,并对应着一种模式。模板定义了转换的结果,而模式则规定了需要进行转换的元素或属性对象。
XML中引用XSL的语法格式如下:
<?xml-stylesheet type=“text/xsl” href=“Employees.xsl” ?>
如果在声明部分引用了多个XSL样式单,则只有第一个样式单会生效,其余的都会被忽略掉。
XSL的格式转换功能在复杂的电子商务解决方案中大有用武之地。比如,A公司和B公司都是生产机器零件的厂家,在货物清单中都包含了产品序列号以及质量等级评分。A公司的文件格式如下:
<Order>
<OrderItem>
<ItemID>12980-235</ItemID>
<Quantity>200</Quantity>
</OrderItem>
</Order>
而B公司的文件格式有所不同,相关信息都出现在元素的属性中:
<Order>
<OrderLine PartNo=“12980-235” NumRequired=“200”/>
</Order>
这样,虽然两个公司的产品完全一样,但由于文档格式的差异给双方的贸易往来设置了障碍。而使用XSL样式单可以轻松地把A公司的文档转换成B公司的格式,反之亦然。
XML文档转换步骤
XML文档的转换过程分为两步:
● 首先是根据XML文档构造源树,然后根据XSL规则将源树转换为结果树。目前,这种转换协议已经日趋完善,并从XSL中独立出来,成为W3C正式推荐的标准,称为XSLT(XSL Transformations);
● 生成结果树后,就可以对其进行解释,产生一种适合显示、打印或是播放的格式,这一步称为格式化(Formatting)。
XSL处理器负责实现转换过程。首先,XML文档被解析成DOM树存放在内存中,接着对文档进行分析,每一个DOM树中的节点都会与一个模式相比较,当二者匹配时,就会按照模板中定义的规则进行转换,否则继续往下匹配。如此循环,直至整个文档处理完毕。
XSL文档标准格式
XSL文档的标准格式如下:
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/TR/WD-xsl”>
template rule i
output template
</xsl:stylesheet>
XSL文档本身是格式良好的XML文档,所以在书写时要注意标签的匹配问题。<xsl:stylesheet>既是XSL的声明语句,也是根元素,必须位于文件的首部。通常也要利用xmlns属性指明XSL的名称空间。样式单中所有的模板规则都由标签<xsl:temlplate>标明。模板规则可以说明处理的对象(元素/属性)、处理的方式或是转换的结果。此时,我们可以把该标签类似地理解为编程语言中函数的概念。
XSL的语法结构
XSL的逻辑语法结构包括循环和条件判断。这两种结构使用户能够灵活地书写转换规则。循环判断是通过<xsl:for-each>元素实现的,它的可选属性包括select和order-by。循环结构能够遍历整个结果集合,而不必针对每一条结果都单独书写转换规则。它的标准语法格式为:
<xsl:for-each select=“pattern” order-by=“patternlist”>
......
</xsl:for-each>
条件判断结构分为if语句和Case语句两种形式。if语句是简单地对条件进行判断,结果为真就执行条件内部的规则,因此可以把if条件与简单的布尔表达式联合使用。下面这个例子就是对薪水超过100万元的职员输出“Overpaid employee”信息:
<xsl:if match=“.[Salary $gt$ 1000000]”>
Overpaid employee
</xsl:if>
Case语句是对多种情况的分支判断。该语句包括<xsl:choose>、<xsl:when>和<xsl:otherwise>三个元素。下面的例子是对薪水不足1万元的职员输出“No tax”,对超过5万元的职员输出“High tax rate”,对介于其间的职员输出“Normal tax rate”信息:
<xsl:choose>
<xsl:when match=“.[Salary $lt$ 10000]”>
No tax </xsl:when>
<xsl:when match=“.[Salary $gt$ 50000]”>
High tax rate </xsl:when>
<xsl:otherwise> Normal tax rate </xsl:otherwise>
</xsl:choose>
XSL的模板规则
<xsl:template>标签内的文本内容描述了转换结果的形式,称为输出模板。属性match的取值把模板规则与指定的元素或属性相比较,只有匹配的DOM节点才会被处理,其余的节点将被忽略。整个过程中最先匹配的是树的根节点,根节点用“/”表示:
<xsl:template match=“/”>
output template for root element
</xsl:template>
然后匹配其他节点,此时,只要在引号中指明要处理的元素对象名称即可。如果在引号中出现的是“*”,那么表示该规则适用于所有的未单独指定处理的元素节点。比如下例中的第二个模板就表示要处理除<Employee>元素之外的所有节点:
<xsl:template match=“Employee”>
output template
</xsl:template>
<xsl:template match=“*”>
output template
</xsl:template>
此外,XSL中还可以使用路径指示符来指定一些特殊位置的元素与模板相匹配。“//”代表任意深度位置,如<xsl:template match=“//Employee”>用来匹配文档中任何位置的<Employee>元素;而如果是<xsl:template match=“Employee//Name”>,则表明是匹配<Employee>元素的后继节点中所有<Name>元素。另外一个路径指示符是“/”,表示直接的父子节点关系。将刚才例子中的“//”换为“/”,就意味着匹配的是<Employee>元素子节点中的<Name>元素。
很显然,某些树节点在XSL中可能会对应多个模板,在这种情况下,只有最后一个对应模板会生效,前面的模板规则都会被XSL处理器忽略掉。
XSL模板的使用
XSL在输出模板中描述输出格式,这些格式可以是各种字符串、标签符号、节点值或者是一些XSL语法结构,如条件判断、循环处理等。在许多应用场合中,输出模板中需要使用节点的取值,此时可以根据需要使用<xsl:value-of>元素输出节点值,最直接的使用方式是<xsl:value-of />,这样可以输出当前节点及其所有后继节点的取值。而如果仅仅是想输出指定节点的取值,可以利用select属性进行限定(select属性可以是任意合法的路径表达式):
<xsl:value-of select = “Name” />
<xsl:value-of select = “//Employee” />
上述第一个表达式匹配的对象是当前节点的所有子节点中名称为<Name>的元素,第二个表达式匹配的对象则是当前节点中所有后继节点中名为<Employee>的元素。注意: 在XSL样式单中必须有一个模板规则与根元素相匹配。
在确定了模板规则与元素相匹配之后,就可以激活模板,这项任务由<xsl:apply-templates>元素完成。它和<xsl:templates>元素相结合就如同编程中的函数调用:前者是调用指令,而后者就是函数体。对于不同的元素需要调用不同的模板进行处理。为了激活样式单中的模板规则,要在根元素模板规则中使用<xsl:apply-templates>元素,这样就会层层作用使整个样式单文件生效:
<xsl:template match=“/”>
<xsl:apply-templates /></xsl:template>
直接使用<xsl:apply-templates>元素表示不加区分地对当前节点的所有子节点应用模板,而在select属性中书写匹配式则能够限定作用对象:
<xsl:stylesheet xmlns:xsl=“http://www.w3.org/TR/WD-xsl”>
<xsl:template match=“/”>
<xsl:apply-templates select=“//Employee” />
</xsl:template>
<xsl:template match=“Employee”><P>
<xsl:apply-templates select=“Name” />
<xsl:apply-templates select=“Salary” />
</P></xsl:template>
<xsl:template match=“Name”>
<SPAN style=“font-size:36pt”>
<xsl:value-of /> </SPAN></xsl:template>
<xsl:template match=“Salary”>
<I><xsl:value-of /></I></xsl:template>
</xsl:stylesheet>
上述第一个模板与XML文档的根元素相匹配,并对根节点以下的所有<Employee>元素应用模板规则。然后,一旦遇到<Employee>标签,就插入一个<P>标签作为空白段落,接着对<Name>元素和<Salary>元素分别应用模板规则。最后,经过转换显示的结果是36磅字体的职员名字和用斜体字表示的职员薪水。
XSL的扩展规则
1. 路径指示符
除了前面介绍的“//”和“/”路径指示符,以及统配符“*”,还有几个符号可以用来对模板的匹配对象进行限制:
● 当前节点指示符为“.”;
● 父节点指示符为“..”;
● 属性指示符为“@”。
上述“@”表示对指定元素中的某个属性进行匹配,如<xsl:apply-templates select=“Employee/@ID” />语句表示对<Employee>元素中的<ID>属性应用模板规则。
2. 过滤匹配符
除了路径指示符之外,还可以对作用对象进行条件过滤或是排序,以进一步调整应用效果。过滤时,一般是以子元素(或属性)是否存在(或其取值)为标准:
● 子元素存在:即//Employee[Salary]存在,选择含有<Salary>子元素的所有<Employee>元素;
● 子元素取值:即Employee[Salary > 25000],选择含有<Salary>子元素,且Salary取值大于25000的所有<Employee>元素;
● 属性存在: 即Employee[@ID]存在,选择含有<ID>属性的<Employee>元素;
● 属性取值: 即Employee[@ID =“1234”],选择所有属性ID值为1234的<Employee>元素。
3. 其他扩展过滤
其他的一些附加功能的过滤符,按功能分为:比较操作符、布尔操作符和集合索引。
比较操作符的书写格式和功能如下所示:
操作符 功能
$eq$ 等于
$ne$ 不等
$lt$ 小于
$le$ 小于或等于
$gt$ 大于
$ge$ 大于或等于
需要说明的是:表格中的操作符在比较字符时对大小写是敏感的,如果要忽略大小写的不同含义,在每个操作符前面加上前缀字母“i”即可,如“$ieq”。
布尔操作符书写格式和功能说明如下:
操作符 功能
$and$ 逻辑与
$or$ 逻辑或
$not$ 取非
对过滤的结果可以通过集合索引进行再过滤。例如,Employee[Salary][2]就是选择第2个含有<Salary>子元素的所有<Employee>元素。此外,XSL还提供了集合索引函数供用户使用:index方法表示过滤结果的索引号,end方法表示最后一个过滤结果。使用方法如下所示:
Employee[index() $lt$ 2]
Employee[end()]
上述第一个表达式的选择结果是<Employee>元素的第1和第2个子元素,第二个表达式的选择结果是<Employee>元素的最后一个子元素。在缺省状态下,模板规则对元素的匹配顺序是按照节点在XML文档中出现的前后次序排定的。但在特定的应用场合中,可能需要对原有的顺序进行调整,此时需要使用order-by属性。使用方法如下所示:
<xsl:apply-templates select=“//Employee” order-by=“+Name”/>
<xsl:apply-templates select=“//Employee”
order-by=“number(Salary)”/>
上述第一个例子表示应按姓名的字母升序排列,比如“Bob”应当排在“Tom”之前,而第二个例子则表示按照薪水的多少对职员进行排序。
相关推荐
3. **XML与XSL(可扩展样式表语言)** XSL是一种更强大的工具,不仅处理样式,还能转换XML数据。XSLT(XSL转换)允许我们定义一套规则,将XML数据转换成其他格式,如HTML、PDF或新的XML文档。以下是一个简单的XSL...
Java中处理XML和XSLT转换通常会用到如`javax.xml.transform`这样的API,其中`TransformerFactory`用于创建`Transformer`对象,`Source`对象分别代表XML输入和XSL样式表输入,`Result`对象则定义了输出的目标格式。...
xml+xsl分页原理:在xsl中,遍历节点的时候,可以获取当前节点的位置,而且还能限制显示特定位置的节点,例如有18条记录,可以在xsl中设置只显示第1-6条,也可以设置只显示第7-12条,再配合客户端脚本,就可以动态...
《XSL语法详解——XML与JSP的交互实践》 XSL(Extensible Stylesheet Language)是一种用于转换XML文档的样式表语言,它为XML数据提供了强大的格式化和转换能力。XSL的主要任务是将XML数据转换成其他形式,如HTML、...
2. 创建一个XSL样式表,定义XML数据的显示规则。 3. 在HTML文件中通过`<link>`标签引用XSL文件,使XML数据在浏览器中按照XSL规则呈现。 这种技术在不需要JavaScript或其他服务器端编程的情况下,能够实现XML数据的...
XML转换XSL工具是专门针对这个需求设计的软件,它的主要功能是将XML文档按照预设的XSL样式表进行转换,以得到用户期望的输出格式。这种工具通常包含以下特性: 1. **文件选择**:用户需要指定待转换的XML文件和相应...
XSL(Extensible Stylesheet Language)是一种样式表语言,用于转换XML文档。XSLT(XSL Transformations)是XSL的一部分,专门用于XML到XML、XML到HTML、XML到文本的转换。XSLT通过模板匹配和流控制来改变XML文档的...
xml+xsl+css html网页 xml+xsl+css html网页 xml+xsl+css html网页 xml+xsl+css html网页 xml+xsl+css html网页 xml+xsl+css html网页
它定义了一系列的布局对象,如页眉、页脚、段落、列表等,用于将XML数据转换成美观的打印或屏幕显示格式。 "XML+xsl讲XML文档的内容用xsl建表"的主题意味着我们将学习如何使用XSLT将XML文档的内容转换成表格形式。...
在实际应用中,我们可以使用XML解析器(如Java的DOM或SAX解析器)读取XML文档,然后结合XSLT处理器(如Saxon或Xalan)和XSL样式表进行转换,生成HTML页面供浏览器展示。例如,`test.xml`可能是包含结构化数据的XML...
通过这些电子书和网页,学习者可以期望深入理解XML和XSL的基本概念,掌握如何创建XML文档,编写XSL样式表,并运用XSLT进行数据转换。同时,可能会涉及到与服务器端脚本结合使用XML和XSLT的实际案例,这对于开发动态...
XML的设计目的是传输和存储数据,而不是显示数据,这与HTML(超文本标记语言)的功能形成鲜明对比。在XML中,用户可以自定义标签来表示数据,使得数据更加灵活且易于解析。 HTML是Web页面的基础,用于创建和展示...
总结来说,“xml xsl网页生成”是一个涉及XML结构化数据与XSL样式表转换的实践过程,通过这一技术,我们可以将复杂的数据结构转化为用户友好的网页展示形式,广泛应用于数据交换、动态网页生成和文档转换等多个领域...
在IT领域,XML(eXtensible Markup Language)是一种用于存储和传输数据的标记语言,而XSL(eXtensible Stylesheet Language)则是一种样式表语言,用于转换XML文档的结构和格式。本主题主要关注如何使用XSL解析XML...
XSL(Extensible Stylesheet Language,可扩展样式表语言)是一种用于控制XML文档显示的标记语言。它主要用于将XML文档转换为其他格式,例如HTML或PDF。XSL允许开发者自定义XML文档的展示方式,从而满足不同平台和...
XML(Extensible Markup Language)和XSL(eXtensible Stylesheet Language)是Web开发中的两种重要技术,它们主要用于数据的结构化表示和格式化显示。在这个“xml与xsl的小实例”中,我们将探讨这两种语言的基础...
通过XSL解析XML在浏览器中显示树的XSL样式表。 处理简便,功能强大,支持拖放,支持键盘操作,每个结点可显示不同的图标,刷新时可以自动记录结点状态,可灵活处理点击动作。 <br>注:本样式表为同步加载模式...
XSL(eXtensible Stylesheet Language)则是用于转换XML文档的样式表语言。XSL由三部分组成:XSLT(XSL Transformations),XPath(XML Path Language)和XSL-FO(XSL Formatting Objects)。XSLT是主要的部分,用于...
- **XSL (Extensible Stylesheet Language)**:可扩展样式表语言,用于定义如何呈现XML文档的规则。XSL包括XSLT (用于转换XML文档) 和 XPath (用于查询XML文档)。 ##### 1.3.5 XML与数据库的集成 - **数据库集成**...
标题中的“xml+xsl”指的是XML(可扩展标记语言)与XSL(可扩展样式表语言)的结合使用。XML是一种用于标记数据的语言,...开发者通过编写XML源码和XSL样式表,结合使用各种工具,可以实现灵活、自定义的数据处理流程。