查看已经安装的perl包:我用rpm -qa |grep perl
1。XML::Simple;
file.xml
<?xml version=”1.0″ encoding=”UTF-8″?>
<rows>
<row col1=”AnySQL” col2=”4″></row>
<row col1=”DBATools” col2=”1″></row>
</rows>
script:
#!/usr/bin/perl -w
use XML::Simple;
my $xml = new XML::Simple;
my $data = $xml->XMLin(“./test.xml”);
if ($data->{‘row’}) {
# Convert to hash, if it’s array
if (ref $data->{‘row’} eq “HASH”) {
@$temp = ($data->{‘row’});
$data->{‘row’} = $temp; }
if ($data->{‘row’}->[0]) {
my $count = 0;
while($data->{‘row’}->[$count]) {
if (ref $data->{‘row’}->[$count] eq “HASH”) {
print $data->{‘row’}->[$count]->{‘col1′}, “,”;
print $data->{‘row’}->[$count]->{‘col2′}, “\n”; }
$count ++; }
} }
result:
AnySQL,4
DBATools,1
2.sample2
xmlfile:
<?xml version='1.0'?>
<employee>
<name>John Doe</name>
<age>43</age>
<sex>M</sex>
<department>Operations</department>
</employee>
script:
#!/usr/bin/perl
use XML::Simple;
use Data::Dumper;
$xml = new XML::Simple;
$data = $xml->XMLin("aa.xml");
print "$data->{'name'} is $data->{'age'} years old and works in the $data->{'department'} section \n";
result:
John Doe is 43 years old and works in the Operations section
3:
XML::Parser的Expat的功能允许你定义所使用的解析器的样式。最普遍使用的样式是Tree和Stream,Tree处理XML的输入,创建含有文件中的元素和数据的成套数组,这样你就可以按照你的意愿控制这个结构。Stream将分析行为划分层级,在一个事件的开始做处理,要使用Stream,你必须在你对模块做例示并将其与描述事件出现时如何处理的子程序相关联时定义处理器。
其它样式还包括:Sub,允许你特定地对一种XML标记定义其功能。Debug,将文件显示未标准输出。Object,与Tree相似但是返回对象。你也可以通过在XML::Parser类中定义一个子类来设定一个客制样式。
4:
当在Perl中使用XML时,你会有将近五百个CPAN模块可以选择,每一个都支持整合Web服务的不同方面。此外,Perl的核心库包括多个支持XML的模块。这篇文章就关注于一个最早期且涉及最频繁的核心模块:XML::Parser.
XML::解析器系列
最初的Perl解析器XML::Parser::Expat由Larry Wall在几年前编写并由Clark Cooper保持延续。模块作为Expat XML parser的界面由James Clark用C语言编写且已经被一些脚本语言所采用。
Expat是一个以事件为基础的解析器,意味着特定条件触发处理功能。例如,一个开始或结尾标记将触发适当的用户定义子程序。XML::Parser模块在Expat功能的基础上为普通应用所建构。
注意Expat在解析之前不会使XML生效且在遇到错误出现时会失效。这些限制会使XML::Parser模块速度非常之快。
XML::Parser简介
任何人都可以在Perl中编写一个XML解析器。毕竟你只是处理具有已知格式的文本。但由于XML::Parser模块是用C编写的,他比任何你可以实现的纯Perl应用要更有效的多。而且既然他已经被编写出来,你就可以把时间花在其他更有用的事情上。
XML::Parser的Expat的功能允许你定义所使用的解析器的样式。最普遍使用的样式是Tree和Stream,Tree处理XML的输入,创建含有文件中的元素和数据的成套数组,这样你就可以按照你的意愿控制这个结构。Stream将分析行为划分层级,在一个事件的开始做处理,要使用Stream,你必须在你对模块做例示并将其与描述事件出现时如何处理的子程序相关联时定义处理器。
其它样式还包括:Sub,允许你特定地对一种XML标记定义其功能。Debug,将文件显示未标准输出。Object,与Tree相似但是返回对象。你也可以通过在XML::Parser类中定义一个子类来设定一个客制样式。
一个例子
这个例子中,我将使用XML::Parser类来创建一个Stream解析。我将带出一个将XML文件解析为标准输出的简单脚本程序,你可以在表A中看到脚本程序(xmlparse.pl),在表B中看到XML文件(data.xml)。这里,由于这是一个命令行脚本,我选择不解析URL元素。要执行这个脚本程序,在命令提示下,键入:
perl xmlparse.pl data.xml
脚本先参照适当的模块:
use XML::Parser;
接着,从命令提示输入抓取文件:
my $xmlfile = shift;
die "Cannot find file "$xmlfile""
unless -f $xmlfile;
脚本设置一些初始变量:
$count = 0;
$tag = "";
然后是创建解析器实例:
my $parser = new XML::Parser;
现在我们定义事件处理器。我设置了开始标记,结束标记,特性数据的处理器。而仅仅因为是例子,我还加入了一个缺省处理器,它将对全部进行解析而不被其他事件处理器的定义所明显覆盖。如果你计划丢弃额外数据,缺省处理器将自动执行而不需要定义。
$parser->setHandlers( Start => &startElement,
End => &endElement,
Char => &characterData,
Default => &default);
脚本的主要部分通过指示解析器实例而变得紧凑来通过XML数据文件:
$parser->parsefile($xmlfile);
剩下的就是定义在每个事件情况下如何进行处理。
当脚本程序遇到一个开始标记时将执行这个子程序,这在上面的setHandlers方式中进行了定义。我选择跳过去并显示每个元素中我感兴趣的文本。
接下来我定义的变量自动地被XML::Parser模块所传递。对于开始标记处理器,这些变量代表解析器实例,标记名和标记可能会有的属性数组。如果标记没有属性,则一个空数组将被传递至子程序。
sub startElement {
my( $parseinst, $element, %attrs ) = @_;
SWITCH: {
if ($element eq "article") {
$count++;
$tag = "article";
print "Article $count:n";
last SWITCH;
}
if ($element eq "title") {
print "Title: ";
$tag = "title";
last SWITCH;
}
if ($element eq "summary") {
print "Summary: ";
$tag = "summary";
last SWITCH;
}
}
}
在XML数据文件中遇到一个结束标记,endElement子程序就会被调用。这里,我要提供一些线中断。在这里被XML::Parser所传递的变量是解析器实例和标记名称。
sub endElement {
my( $parseinst, $element ) = @_;
if ($element eq "article") {
print "nn";
} elsif ($element eq "title") {
print "n";
}
}
由于我们处在命令行,我使用特性数据处理器来去掉可能已经包括在XML数据文件中的任一行和标签格式并选择显示内容(如果他来自一个标题或摘要标记)。
sub characterData {
my( $parseinst, $data ) = @_;
if (($tag eq "title") || ($tag eq "summary")) {
$data =~ s/n|t//g;
print "$data";
}
}
最后,我定义了一个子程序来处理所有可能遇到的其它类型的元素。其中包括特性编码定义,文件类型定义和评注。所有不被开始标记,结束标记和特性数据事件处理器所明确覆盖的都包括在这里面。
sub default {
my( $parseinst, $data ) = @_;
# you could do something here
}
小结
你对XML::Parser的Expat功能熟悉之后,你可以将其作为接触几百个可用的CPAN XML模块的跳板。我们这里的Stream样式是唯一一个可用的XML::Parser模块中的解析类型。你可能会发现其他的会更适合你的工作任务。Perl几乎从第一个工程方案推出时就具有XML功能,不论你的需要如何,他都是一个很好的选择。
分享到:
相关推荐
Perl中的XML::Simple模块是Perl社区广泛使用的XML解析器,尤其适合处理小型或结构简单的XML文档。这个模块的名称虽然包含“Simple”,但它实际上提供了一种简洁的接口,用于将XML数据转换为Perl数据结构,反之亦然。...
这篇博客文章“perl读写xml文件”很可能是关于如何在Perl中操作XML文件,包括解析XML内容、提取数据、修改数据以及生成新的XML文件。 Perl提供了多个模块来处理XML,最常用的是XML::Simple和XML::LibXML。XML::...
Expat 是一个高效的C语言实现的XML解析库,XML::Parser 提供了面向 Perl 的接口,可以用来解析XML文档,是其他许多模块的基础。 XML::Simple 是一个易于使用的模块,它提供了一个简单的API来读取和写入XML文件,...
1. **XML解析**:模块提供了解析XML文档的功能,可以将XML字符串或文件加载到内存中的XML树结构中,方便后续处理。 2. **节点操作**:可以创建、查找、修改和删除XML文档中的节点,例如元素、属性、文本等。 3. **...
在这个场景中,"perl program for xml simple reading" 指的是用Perl编写一个程序来解析XML文件,特别是使用`XML::Simple`模块。描述中提到这是个调试版本,意味着代码可能还存在一些问题,需要进一步优化和改进。 ...
本篇文章将深入解析XML流的概念,并结合相关工具探讨其在实际开发中的应用。 XML流主要分为两种类型:SAX(Simple API for XML)和DOM(Document Object Model)。SAX是一种基于事件驱动的解析方式,它逐行读取XML...
该软件包是用Perl语言编写的一个用于解析XML文件的模块,可以将XML文件解析为一系列的标记(tokens),使用户能对XML文件进行更简单和直观的操作。TokeParser模块通常用于处理结构化的数据,它是XML::Parser的一部分...
1. **解析XML文档**:XML-Simple能够将XML字符串或文件解析成Perl的数据结构。例如,一个XML文档可以被解析成一个哈希,其中XML元素成为哈希键,元素内容成为对应的值。 2. **生成XML文档**:同样,Perl的数据结构...
文件中提到的perl-XML-Grove是一个Perl语言编写的模块,用于解析和处理XML文档。它依赖于XML::Parser和XML::LibXML等其他Perl模块来执行其功能。在Linux系统中,通过rpm安装包可以非常方便地管理和维护软件,避免了...
- perl-XML-SAX:为Perl提供了SAX(Simple API for XML)解析。 安装这些包的步骤分为两步。首先,需要解压tar.gz文件以获取内部的rpm包。然后,通过rpm命令安装这些包。解压命令是tar -zxvf,指定文件路径后,文件...
它允许Perl脚本以一种流的形式读取XML数据,每当解析器发现XML文档的特定部分(例如元素开始和结束、属性、字符数据等)时,就会触发相应的事件。这种模式非常适合于构建复杂的数据处理和转换任务。XML-SAX-Writer则...
另外一个文件是RPM包文件本身,包含Perl模块XML::Parser,它用于解析XML文档,是Perl程序员在处理XML时不可或缺的工具之一。 从文件标题可以得知这是一个适用于特定Linux发行版和架构的Perl模块包,文件描述给出了...
2. 文件内容解析:该压缩包包含了一个名为perl-XML-SAX-0.99-9.el7.noarch.rpm的文件,这表明它是一个RPM包,这是Red Hat及其衍生系统(如CentOS)中的标准软件包格式。此外,还包括了多个依赖于perl-XML-SAX包的...
1.从XML中读取要运行的程序列表 2.根据程序列表分别创建子进程 3.读取tasklist,删除(终止)某一进程的运行 其中,tasklist.exe在C:\windows\system32文件下
- perl-XML-Parser-2.41-10.el7.x86_64.rpm:包含Perl语言的XML::Parser模块,用于解析XML文档。 - perl-HTML-Tree-5.03-2.el7.noarch.rpm:包含Perl语言的HTML::Tree模块,用于构建和处理HTML文档的树结构。 - perl...
这些文件中,perl-XML-DOM-1.44-19.el7.noarch.rpm是主要的包,它为Perl提供了一个用于操作DOM的XML解析模块,即XML::DOM。这个模块允许开发者在Perl脚本中创建和操作XML文档结构。 安装过程分为两个步骤:首先需要...
- perl-XML-Parser-2.41-10.el7.x86_64.rpm:这是一个Perl的XML解析模块,它是YAWriter模块的依赖之一。 - perl-libxml-perl-0.08-19.el7.noarch.rpm:这个包提供了Perl与libxml的接口,用于处理XML文档。 安装这些...
在"cgi.tar.gz_CGI解析xml"这个文件中,我们关注的是如何通过CGI来解析XML文件。 XML文件结构清晰,具有自描述性,广泛应用于数据交换、配置文件、文档存储等领域。然而,浏览器默认并不直接解析XML,这就需要借助...
Perl 读取 EXCEL 文件输出到 XML Perl 是一种功能强大的编程语言,广泛应用于数据处理、网络开发和自动化任务。EXCEL 是一种流行的电子表格软件,常用于数据存储和分析。XML(Extensible Markup Language)是一种...