- 浏览: 256065 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
绿叶相伴:
谢谢。我也是报这个错。
Java Mail 发送邮件失败问题:Sending the email to the following server failed -
851228082:
我的也是这个问题。
Java Mail 发送邮件失败问题:Sending the email to the following server failed -
shyhhxx:
牛逼 就是这个原因
Java Mail 发送邮件失败问题:Sending the email to the following server failed -
netkongjian:
不错的界面控件知识,感谢分享!
vc 界面库 -
迪伦少校:
确实不管用。。。不知道楼主怎么试验成功的。。。
ArcGIS Server 常见问题与解决
一、Libxml2介绍:
Libxml2 是一个xml的c语言版的解析器,本来是为Gnome项目开发的工具,是一个基于MIT License的免费开源软件。它除了支持c语言版以外,还支持c++、PHP、Pascal、Ruby、Tcl等语言的绑定,能在Windows、Linux、Solaris、MacOsX等平台上运行。功能还是相当强大的,相信满足一般用户需求没有任何问题。
二、 Libxml2安装:
一般如果在安装系统的时候选中了所有开发库和开发工具的话(Fedora Core系列下),应该不用安装,下面介绍一下手动安装:
1) 从xmlsoft站点或ftp(ftp.xmlsoft.org)站点下载libxml压缩包(libxml2-xxxx.tar.gz)
2) 对压缩包进行解压缩
tar xvzf libxml2-xxxx.tar.gz
3) 进入解压缩后的文件夹中运行
./configure
make
make install
安装完成后就可以使用简单的代码解析XML文件,包括本地和远程的文件,但是在编码上有一些问题。Libxml默认只支持UTF-8的编码,无论输入输出都是UTF-8,所以如果你解析完一个XML得到的结果都是UTF-8的,如果需要输出GB2312或者其它编码,需要ICONV来做转码(生成UTF-8编码的文件也可以用它做),如果系统中没有安装iconv的话,需要安装libiconv。
1) 下载libiconv压缩包(例如libiconv-1.11.tar.gz)
2) 对压缩包进行解压缩
tar xvzf libiconv-1.11.tar.gz
3) 进入解压缩后的文件夹中运行
./configure
make
make install
三、关于XML:
在开始研究 Libxml2 库之前,先了解一下XML的相关基础。XML 是一种基于文本的格式,它可用来创建能够通过各种语言和平台访问的结构化数据。它包括一系列类似 HTML 的标记,并以树型结构来对这些标记进行排列。
例如,可参见清单 1 中介绍的简单文档。为了更清楚地显示 XML 的一般概念,下面是一个简化的XML文件。
清单 1. 一个简单的 XML 文件
<?xml version="1.0" encoding="UTF-8"?>
<files>
<owner>root</owner>
<action>delete</action>
<age units="days">10</age>
</files>
清单 1 中的第一行是 XML 声明,它告诉负责处理 XML 的应用程序,即解析器,将要处理的 XML 的版本。大部分的文件使用版本 1.0 编写,但也有少量的版本 1.1 的文件。它还定义了所使用的编码。大部分文件使用 UTF-8,但是,XML 设计用来集成各种语言中的数据,包括那些不使用英语字母的语言。
接下来出现的是元素。一个元素以开始标记 开始(如 <files>),并以结束标记 结束(如 </files>),其中使用斜线 (/) 来区别于开始标记。元素是 Node 的一种类型。XML 文档对象模型 (DOM) 定义了几种不同的 Nodes 类型,包括:
Elements(如 files 或者 age)
Attributes(如 units)
Text(如 root 或者 10)
元素可以具有子节点。例如,age 元素有一个子元素,即文本节点 10。
XML 解析器可以利用这种父子结构来遍历文档,甚至修改文档的结构或内容。LibXML2 是这样的解析器中的其中一种,并且文中的示例应用程序正是使用这种结构来实现该目的。对于各种不同的环境,有许多不同的解析器和库。LibXML2 是用于 UNIX 环境的解析器和库中最好的一种,并且经过扩展,它提供了对几种脚本语言的支持,如 Perl 和 Python。
四、使用Libxml2
项目中要实现一个管理XML文件的后台程序,需要对XML文件进行创建,解析,修改,查找等操作,下面介绍如何利用libxml2提供的库来实现上述功能。
1、创建XML文档:
我们使用xmlNewDoc()来创建XML文档,然后使用xmlNewNode(),xmlNewChild(),xmlNewProp(),xmlNewText()等函数向XML文件中添加节点及子节点,设置元素和属性,创建完毕后用xmlSaveFormatFileEnc()来保存XML文件到磁盘(该函数可以设置保存XML文件时的编码格式)。
示例1:
#include <stdio.h>
#include <libxml/parser.h>
#include <libxml/tree.h>
int main(int argc, char **argv)
{
xmlDocPtr doc = NULL; /* document pointer */
xmlNodePtr root_node = NULL, node = NULL, node1 = NULL;/* node pointers */
// Creates a new document, a node and set it as a root node
doc = xmlNewDoc(BAD_CAST "1.0");
root_node = xmlNewNode(NULL, BAD_CAST "root");
xmlDocSetRootElement(doc, root_node);
//creates a new node, which is "attached" as child node of root_node node.
xmlNewChild(root_node, NULL, BAD_CAST "node1",BAD_CAST "content of node1");
// xmlNewProp() creates attributes, which is "attached" to an node.
node=xmlNewChild(root_node, NULL, BAD_CAST "node3", BAD_CAST"node has attributes");
xmlNewProp(node, BAD_CAST "attribute", BAD_CAST "yes");
//Here goes another way to create nodes.
node = xmlNewNode(NULL, BAD_CAST "node4");
node1 = xmlNewText(BAD_CAST"other way to create content");
xmlAddChild(node, node1);
xmlAddChild(root_node, node);
//Dumping document to stdio or file
xmlSaveFormatFileEnc(argc > 1 ? argv[1] : "-", doc, "UTF-8", 1);
/*free the document */
xmlFreeDoc(doc);
xmlCleanupParser();
xmlMemoryDump();//debug memory for regression tests
return(0);
}
2、解析XML文档
解析文档时仅仅需要文件名并只调用一个函数,并有错误检查,常用的相关函数有xmlParseFile(),xmlParseDoc(),获取文档指针后,就可以使用xmlDocGetRootElement()来获取根元素节点指针,利用该指针就可以在DOM树里漫游了,结束后要调用xmlFreeDoc()释放。
示例2:
xmlDocPtr doc; //定义解析文档指针
xmlNodePtr cur; //定义结点指针(你需要它为了在各个结点间移动)
xmlChar *key;
doc = xmlReadFile(url, MY_ENCODING, 256); //解析文件
/*检查解析文档是否成功,如果不成功,libxml将指一个注册的错误并停止。一个常见错误是不适当的编码。XML标准文档除了用UTF-8或UTF-16外还可用其它编码保存。如果文档是这样,libxml将自动地为你转换到UTF-8。更多关于XML编码信息包含在XML标准中。*/
if (doc == NULL ) {
fprintf(stderr,"Document not parsed successfully. \n");
return;
}
cur = xmlDocGetRootElement(doc); //确定文档根元素
/*检查确认当前文档中包含内容*/
if (cur == NULL) {
fprintf(stderr,"empty document\n");
xmlFreeDoc(doc);
return;
}
/*在这个例子中,我们需要确认文档是正确的类型。“root”是在这个示例中使用文档的根类型。*/
if (xmlStrcmp(cur->name, (const xmlChar *) "root")) {
fprintf(stderr,"document of the wrong type, root node != root");
xmlFreeDoc(doc);
return;
}
cur = cur->xmlChildrenNode;
while(cur!=NULL) {
if ((!xmlStrcmp(cur->name, (const xmlChar *)"keyword"))) {
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("keyword: %s\n", key);
xmlFree(key);
}
cur = cur->next;
}
xmlFreeDoc(doc);
3、修改XML元素及属性等信息
要修改XML文档里的元素及属性等信息,先需要解析XML文档,获得一个节点指针(xmlNodePtr node),利用该节点指针漫游DOM树,就可以在XML文档中获取,修改,添加相关信息。
示例3:
得到一个节点的内容:
xmlChar *value = xmlNodeGetContent(node);
返回值value应该使用xmlFree(value)释放内存
得到一个节点的某属性值:
xmlChar *value = xmlGetProp(node, (const xmlChar *)"prop1");
返回值需要xmlFree(value)释放内存
设置一个节点的内容:
xmlNodeSetContent(node, (const xmlChar *)"test");
设置一个节点的某属性值:
xmlSetProp(node, (const xmlChar *)"prop1", (const xmlChar *)"v1");
添加一个节点元素:
xmlNewTextChild(node, NULL, (const xmlChar *)"keyword", (const xmlChar *)"test Element");
添加一个节点属性:
xmlNewProp(node, (const xmlChar *)"prop1", (const xmlChar *)"test Prop");
4、查找XML节点
有时候对一个XML文档我们可能只关心其中某一个或某几个特定的Element的值或其属性,如果漫游DOM树将是很痛苦也很无聊的事,利用XPath可以非常方便地得到你想的Element。下面是一个自定义函数:
示例4:
xmlXPathObjectPtr get_nodeset(xmlDocPtr doc, const xmlChar *xpath) {
xmlXPathContextPtr context;
xmlXPathObjectPtr result;
context = xmlXPathNewContext(doc);
if (context == NULL) {
printf("context is NULL\n");
return NULL;
}
result = xmlXPathEvalExpression(xpath, context);
xmlXPathFreeContext(context);
if (result == NULL) {
printf("xmlXPathEvalExpression return NULL\n");
return NULL;
}
if (xmlXPathNodeSetIsEmpty(result->nodesetval)) {
xmlXPathFreeObject(result);
printf("nodeset is empty\n");
return NULL;
}
return result;
}
在doc指向的XML文档中查询满足xpath表达式条件的节点,返回满足这一条件的节点集合查询条件xpath的写法参见xpath相关资料。在查询完毕获取结果集后,就可以通过返回的 xmlXPathObjectPtr 结构访问该节点:
示例5:
xmlChar *xpath = ("/root/node/[@key='keyword']");
xmlXPathObjectPtr app_result = get_nodeset(doc,xpath);
if (app_result == NULL) {
printf("app_result is NULL\n");
return;
}
int i = 0;
xmlChar *value;
if(app_result) {
xmlNodeSetPtr nodeset = app_result->nodesetval;
for (i=0; i < nodeset->nodeNr; i++) {
cur = nodeset->nodeTab[i];
cur = cur->xmlChildrenNode;
while(cur!=NULL) {
value = xmlGetProp(cur,(const xmlChar *)"key");
if (value != NULL) {
printf("value: %s\n\n", d_ConvertCharset("utf-8", "GBK", (char *)value));
xmlFree(value);
}
value = xmlNodeGetContent(cur);
if (value != NULL) {
printf("value: %s\n\n", d_ConvertCharset("utf-8", "GBK", (char *)value));
xmlFree(value);
}
}
}
xmlXPathFreeObject (app_result);
}
通过get_nodeset()返回的结果集,我们可以获取该节点的元素及属性,也可以修改该节点的值。示例中在获取值打印的时候用到 d_ConvertCharset()函数来改变编码格式为GBK,以方便正确读取可能的中文字符。
5、编码问题
由于Libxml一般以UTF-8格式保存和操纵数据,如果你的程序使用其它的数据格式,比如中文字符(GB2312,GBK编码),就必须使用Libxml函数转换到UTF-8。如果你想你的程序以除UTF-8外的其它编码方式输出也必须做转换。
下面的示例程序提供几个函数来实现对数据编码格式的转换,其中有的要用到Libiconv,因此为了确保他们能正常工作,先检查以下系统中是否已经安装libiconv库。
示例6:
xmlChar *ConvertInput(const char *in, const char *encoding) {
unsigned char *out;
int ret;
int size;
int out_size;
int temp;
xmlCharEncodingHandlerPtr handler;
if (in == 0)
return 0;
handler = xmlFindCharEncodingHandler(encoding);
if (!handler) {
printf("ConvertInput: no encoding handler found for '%s'\n", encoding ? encoding : "");
return 0;
}
size = (int) strlen(in) + 1;
out_size = size * 2 - 1;
out = (unsigned char *) xmlMalloc((size_t) out_size);
if (out != 0) {
temp = size - 1;
ret = handler->input(out, &out_size, (const unsigned char *) in, &temp);
if ((ret < 0) || (temp - size + 1)) {
if (ret < 0) {
printf("ConvertInput: conversion wasn't successful.\n");
} else {
printf("ConvertInput:conversion wasn't successful. converted: %i octets.\n", temp);
}
xmlFree(out);
out = 0;
} else {
out = (unsigned char *) xmlRealloc(out, out_size + 1);
out[out_size] = 0; /*null terminating out */
}
} else {
printf("ConvertInput: no mem\n");
}
return out;
}
示例7:
char * Convert( char *encFrom, char *encTo, const char * in) {
static char bufin[1024], bufout[1024], *sin, *sout;
int mode, lenin, lenout, ret, nline;
iconv_t c_pt;
if ((c_pt = iconv_open(encTo, encFrom)) == (iconv_t)-1) {
printf("iconv_open false: %s ==> %s\n", encFrom, encTo);
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);
lenin = strlen(in) + 1;
lenout = 1024;
sin = (char *)in;
sout = bufout;
ret = iconv(c_pt, &sin, (size_t *)&lenin, &sout, (size_t *)&lenout);
if (ret == -1) {
return NULL;
}
iconv_close(c_pt);
return bufout;
}
示例8:
char *d_ConvertCharset(char *cpEncodeFrom, char *cpEncodeTo, const char *cpInput) {
static char s_strBufOut[1024], *sin, *cpOut;
size_t iInputLen, iOutLen, iReturn;
iconv_t c_pt;
if ((c_pt = iconv_open(cpEncodeTo, cpEncodeFrom)) == (iconv_t)-1) {
printf("iconv_open failed!\n");
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);
iInputLen = strlen(cpInput) + 1;
iOutLen = 1024;
sin = (char *)cpInput;
cpOut = s_strBufOut;
iReturn = iconv(c_pt, &sin, &iInputLen, &cpOut, &iOutLen);
if (iReturn == -1) {
return NULL;
}
iconv_close(c_pt);
return s_strBufOut;
}
通过上述函数,可以方便的在XML文件中保存并操纵中文字符。
以上转自:http://hi.baidu.com/sevens117/blog/item/ce35e60387bec5e809fa937f.html
另外,关于LibXML2的一些资料:
下载页面:ftp://xmlsoft.org/libxml2/
示例文档:http://xmlsoft.org/examples/index.html
官方FAQ:http://xmlsoft.org/FAQ.html
不错的示例:http://blog.chinaunix.net/u/14063/showart_98851.html
Xpath教程:
语法:http://fly-net-cn.iteye.com/blog/112684
不错的示例:http://blog.sina.com.cn/s/blog_445694b90100dxwh.html
http://www.blogjava.net/wxb_nudt/archive/2010/01/20/161340.html
http://www.blogjava.net/supercrsky/articles/196011.html
Libxml2 是一个xml的c语言版的解析器,本来是为Gnome项目开发的工具,是一个基于MIT License的免费开源软件。它除了支持c语言版以外,还支持c++、PHP、Pascal、Ruby、Tcl等语言的绑定,能在Windows、Linux、Solaris、MacOsX等平台上运行。功能还是相当强大的,相信满足一般用户需求没有任何问题。
二、 Libxml2安装:
一般如果在安装系统的时候选中了所有开发库和开发工具的话(Fedora Core系列下),应该不用安装,下面介绍一下手动安装:
1) 从xmlsoft站点或ftp(ftp.xmlsoft.org)站点下载libxml压缩包(libxml2-xxxx.tar.gz)
2) 对压缩包进行解压缩
tar xvzf libxml2-xxxx.tar.gz
3) 进入解压缩后的文件夹中运行
./configure
make
make install
安装完成后就可以使用简单的代码解析XML文件,包括本地和远程的文件,但是在编码上有一些问题。Libxml默认只支持UTF-8的编码,无论输入输出都是UTF-8,所以如果你解析完一个XML得到的结果都是UTF-8的,如果需要输出GB2312或者其它编码,需要ICONV来做转码(生成UTF-8编码的文件也可以用它做),如果系统中没有安装iconv的话,需要安装libiconv。
1) 下载libiconv压缩包(例如libiconv-1.11.tar.gz)
2) 对压缩包进行解压缩
tar xvzf libiconv-1.11.tar.gz
3) 进入解压缩后的文件夹中运行
./configure
make
make install
三、关于XML:
在开始研究 Libxml2 库之前,先了解一下XML的相关基础。XML 是一种基于文本的格式,它可用来创建能够通过各种语言和平台访问的结构化数据。它包括一系列类似 HTML 的标记,并以树型结构来对这些标记进行排列。
例如,可参见清单 1 中介绍的简单文档。为了更清楚地显示 XML 的一般概念,下面是一个简化的XML文件。
清单 1. 一个简单的 XML 文件
<?xml version="1.0" encoding="UTF-8"?>
<files>
<owner>root</owner>
<action>delete</action>
<age units="days">10</age>
</files>
清单 1 中的第一行是 XML 声明,它告诉负责处理 XML 的应用程序,即解析器,将要处理的 XML 的版本。大部分的文件使用版本 1.0 编写,但也有少量的版本 1.1 的文件。它还定义了所使用的编码。大部分文件使用 UTF-8,但是,XML 设计用来集成各种语言中的数据,包括那些不使用英语字母的语言。
接下来出现的是元素。一个元素以开始标记 开始(如 <files>),并以结束标记 结束(如 </files>),其中使用斜线 (/) 来区别于开始标记。元素是 Node 的一种类型。XML 文档对象模型 (DOM) 定义了几种不同的 Nodes 类型,包括:
Elements(如 files 或者 age)
Attributes(如 units)
Text(如 root 或者 10)
元素可以具有子节点。例如,age 元素有一个子元素,即文本节点 10。
XML 解析器可以利用这种父子结构来遍历文档,甚至修改文档的结构或内容。LibXML2 是这样的解析器中的其中一种,并且文中的示例应用程序正是使用这种结构来实现该目的。对于各种不同的环境,有许多不同的解析器和库。LibXML2 是用于 UNIX 环境的解析器和库中最好的一种,并且经过扩展,它提供了对几种脚本语言的支持,如 Perl 和 Python。
四、使用Libxml2
项目中要实现一个管理XML文件的后台程序,需要对XML文件进行创建,解析,修改,查找等操作,下面介绍如何利用libxml2提供的库来实现上述功能。
1、创建XML文档:
我们使用xmlNewDoc()来创建XML文档,然后使用xmlNewNode(),xmlNewChild(),xmlNewProp(),xmlNewText()等函数向XML文件中添加节点及子节点,设置元素和属性,创建完毕后用xmlSaveFormatFileEnc()来保存XML文件到磁盘(该函数可以设置保存XML文件时的编码格式)。
示例1:
#include <stdio.h>
#include <libxml/parser.h>
#include <libxml/tree.h>
int main(int argc, char **argv)
{
xmlDocPtr doc = NULL; /* document pointer */
xmlNodePtr root_node = NULL, node = NULL, node1 = NULL;/* node pointers */
// Creates a new document, a node and set it as a root node
doc = xmlNewDoc(BAD_CAST "1.0");
root_node = xmlNewNode(NULL, BAD_CAST "root");
xmlDocSetRootElement(doc, root_node);
//creates a new node, which is "attached" as child node of root_node node.
xmlNewChild(root_node, NULL, BAD_CAST "node1",BAD_CAST "content of node1");
// xmlNewProp() creates attributes, which is "attached" to an node.
node=xmlNewChild(root_node, NULL, BAD_CAST "node3", BAD_CAST"node has attributes");
xmlNewProp(node, BAD_CAST "attribute", BAD_CAST "yes");
//Here goes another way to create nodes.
node = xmlNewNode(NULL, BAD_CAST "node4");
node1 = xmlNewText(BAD_CAST"other way to create content");
xmlAddChild(node, node1);
xmlAddChild(root_node, node);
//Dumping document to stdio or file
xmlSaveFormatFileEnc(argc > 1 ? argv[1] : "-", doc, "UTF-8", 1);
/*free the document */
xmlFreeDoc(doc);
xmlCleanupParser();
xmlMemoryDump();//debug memory for regression tests
return(0);
}
2、解析XML文档
解析文档时仅仅需要文件名并只调用一个函数,并有错误检查,常用的相关函数有xmlParseFile(),xmlParseDoc(),获取文档指针后,就可以使用xmlDocGetRootElement()来获取根元素节点指针,利用该指针就可以在DOM树里漫游了,结束后要调用xmlFreeDoc()释放。
示例2:
xmlDocPtr doc; //定义解析文档指针
xmlNodePtr cur; //定义结点指针(你需要它为了在各个结点间移动)
xmlChar *key;
doc = xmlReadFile(url, MY_ENCODING, 256); //解析文件
/*检查解析文档是否成功,如果不成功,libxml将指一个注册的错误并停止。一个常见错误是不适当的编码。XML标准文档除了用UTF-8或UTF-16外还可用其它编码保存。如果文档是这样,libxml将自动地为你转换到UTF-8。更多关于XML编码信息包含在XML标准中。*/
if (doc == NULL ) {
fprintf(stderr,"Document not parsed successfully. \n");
return;
}
cur = xmlDocGetRootElement(doc); //确定文档根元素
/*检查确认当前文档中包含内容*/
if (cur == NULL) {
fprintf(stderr,"empty document\n");
xmlFreeDoc(doc);
return;
}
/*在这个例子中,我们需要确认文档是正确的类型。“root”是在这个示例中使用文档的根类型。*/
if (xmlStrcmp(cur->name, (const xmlChar *) "root")) {
fprintf(stderr,"document of the wrong type, root node != root");
xmlFreeDoc(doc);
return;
}
cur = cur->xmlChildrenNode;
while(cur!=NULL) {
if ((!xmlStrcmp(cur->name, (const xmlChar *)"keyword"))) {
key = xmlNodeListGetString(doc, cur->xmlChildrenNode, 1);
printf("keyword: %s\n", key);
xmlFree(key);
}
cur = cur->next;
}
xmlFreeDoc(doc);
3、修改XML元素及属性等信息
要修改XML文档里的元素及属性等信息,先需要解析XML文档,获得一个节点指针(xmlNodePtr node),利用该节点指针漫游DOM树,就可以在XML文档中获取,修改,添加相关信息。
示例3:
得到一个节点的内容:
xmlChar *value = xmlNodeGetContent(node);
返回值value应该使用xmlFree(value)释放内存
得到一个节点的某属性值:
xmlChar *value = xmlGetProp(node, (const xmlChar *)"prop1");
返回值需要xmlFree(value)释放内存
设置一个节点的内容:
xmlNodeSetContent(node, (const xmlChar *)"test");
设置一个节点的某属性值:
xmlSetProp(node, (const xmlChar *)"prop1", (const xmlChar *)"v1");
添加一个节点元素:
xmlNewTextChild(node, NULL, (const xmlChar *)"keyword", (const xmlChar *)"test Element");
添加一个节点属性:
xmlNewProp(node, (const xmlChar *)"prop1", (const xmlChar *)"test Prop");
4、查找XML节点
有时候对一个XML文档我们可能只关心其中某一个或某几个特定的Element的值或其属性,如果漫游DOM树将是很痛苦也很无聊的事,利用XPath可以非常方便地得到你想的Element。下面是一个自定义函数:
示例4:
xmlXPathObjectPtr get_nodeset(xmlDocPtr doc, const xmlChar *xpath) {
xmlXPathContextPtr context;
xmlXPathObjectPtr result;
context = xmlXPathNewContext(doc);
if (context == NULL) {
printf("context is NULL\n");
return NULL;
}
result = xmlXPathEvalExpression(xpath, context);
xmlXPathFreeContext(context);
if (result == NULL) {
printf("xmlXPathEvalExpression return NULL\n");
return NULL;
}
if (xmlXPathNodeSetIsEmpty(result->nodesetval)) {
xmlXPathFreeObject(result);
printf("nodeset is empty\n");
return NULL;
}
return result;
}
在doc指向的XML文档中查询满足xpath表达式条件的节点,返回满足这一条件的节点集合查询条件xpath的写法参见xpath相关资料。在查询完毕获取结果集后,就可以通过返回的 xmlXPathObjectPtr 结构访问该节点:
示例5:
xmlChar *xpath = ("/root/node/[@key='keyword']");
xmlXPathObjectPtr app_result = get_nodeset(doc,xpath);
if (app_result == NULL) {
printf("app_result is NULL\n");
return;
}
int i = 0;
xmlChar *value;
if(app_result) {
xmlNodeSetPtr nodeset = app_result->nodesetval;
for (i=0; i < nodeset->nodeNr; i++) {
cur = nodeset->nodeTab[i];
cur = cur->xmlChildrenNode;
while(cur!=NULL) {
value = xmlGetProp(cur,(const xmlChar *)"key");
if (value != NULL) {
printf("value: %s\n\n", d_ConvertCharset("utf-8", "GBK", (char *)value));
xmlFree(value);
}
value = xmlNodeGetContent(cur);
if (value != NULL) {
printf("value: %s\n\n", d_ConvertCharset("utf-8", "GBK", (char *)value));
xmlFree(value);
}
}
}
xmlXPathFreeObject (app_result);
}
通过get_nodeset()返回的结果集,我们可以获取该节点的元素及属性,也可以修改该节点的值。示例中在获取值打印的时候用到 d_ConvertCharset()函数来改变编码格式为GBK,以方便正确读取可能的中文字符。
5、编码问题
由于Libxml一般以UTF-8格式保存和操纵数据,如果你的程序使用其它的数据格式,比如中文字符(GB2312,GBK编码),就必须使用Libxml函数转换到UTF-8。如果你想你的程序以除UTF-8外的其它编码方式输出也必须做转换。
下面的示例程序提供几个函数来实现对数据编码格式的转换,其中有的要用到Libiconv,因此为了确保他们能正常工作,先检查以下系统中是否已经安装libiconv库。
示例6:
xmlChar *ConvertInput(const char *in, const char *encoding) {
unsigned char *out;
int ret;
int size;
int out_size;
int temp;
xmlCharEncodingHandlerPtr handler;
if (in == 0)
return 0;
handler = xmlFindCharEncodingHandler(encoding);
if (!handler) {
printf("ConvertInput: no encoding handler found for '%s'\n", encoding ? encoding : "");
return 0;
}
size = (int) strlen(in) + 1;
out_size = size * 2 - 1;
out = (unsigned char *) xmlMalloc((size_t) out_size);
if (out != 0) {
temp = size - 1;
ret = handler->input(out, &out_size, (const unsigned char *) in, &temp);
if ((ret < 0) || (temp - size + 1)) {
if (ret < 0) {
printf("ConvertInput: conversion wasn't successful.\n");
} else {
printf("ConvertInput:conversion wasn't successful. converted: %i octets.\n", temp);
}
xmlFree(out);
out = 0;
} else {
out = (unsigned char *) xmlRealloc(out, out_size + 1);
out[out_size] = 0; /*null terminating out */
}
} else {
printf("ConvertInput: no mem\n");
}
return out;
}
示例7:
char * Convert( char *encFrom, char *encTo, const char * in) {
static char bufin[1024], bufout[1024], *sin, *sout;
int mode, lenin, lenout, ret, nline;
iconv_t c_pt;
if ((c_pt = iconv_open(encTo, encFrom)) == (iconv_t)-1) {
printf("iconv_open false: %s ==> %s\n", encFrom, encTo);
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);
lenin = strlen(in) + 1;
lenout = 1024;
sin = (char *)in;
sout = bufout;
ret = iconv(c_pt, &sin, (size_t *)&lenin, &sout, (size_t *)&lenout);
if (ret == -1) {
return NULL;
}
iconv_close(c_pt);
return bufout;
}
示例8:
char *d_ConvertCharset(char *cpEncodeFrom, char *cpEncodeTo, const char *cpInput) {
static char s_strBufOut[1024], *sin, *cpOut;
size_t iInputLen, iOutLen, iReturn;
iconv_t c_pt;
if ((c_pt = iconv_open(cpEncodeTo, cpEncodeFrom)) == (iconv_t)-1) {
printf("iconv_open failed!\n");
return NULL;
}
iconv(c_pt, NULL, NULL, NULL, NULL);
iInputLen = strlen(cpInput) + 1;
iOutLen = 1024;
sin = (char *)cpInput;
cpOut = s_strBufOut;
iReturn = iconv(c_pt, &sin, &iInputLen, &cpOut, &iOutLen);
if (iReturn == -1) {
return NULL;
}
iconv_close(c_pt);
return s_strBufOut;
}
通过上述函数,可以方便的在XML文件中保存并操纵中文字符。
以上转自:http://hi.baidu.com/sevens117/blog/item/ce35e60387bec5e809fa937f.html
另外,关于LibXML2的一些资料:
下载页面:ftp://xmlsoft.org/libxml2/
示例文档:http://xmlsoft.org/examples/index.html
官方FAQ:http://xmlsoft.org/FAQ.html
不错的示例:http://blog.chinaunix.net/u/14063/showart_98851.html
Xpath教程:
语法:http://fly-net-cn.iteye.com/blog/112684
不错的示例:http://blog.sina.com.cn/s/blog_445694b90100dxwh.html
http://www.blogjava.net/wxb_nudt/archive/2010/01/20/161340.html
http://www.blogjava.net/supercrsky/articles/196011.html
发表评论
-
一些实用工具
2011-10-11 16:29 11621. 一个串口开发的小工具,特别的实用。有需要的试用一下吧。 ... -
Windows Socket五种I/O模型
2011-01-19 11:10 1803转自:http://blog.vckbase.com/d ... -
C++调用标准库窗口时编译警告信息太多的处理办法,warning C4786
2010-09-16 15:56 2779当使用标准C++中的容器类等类时,会产生大量的警告信息wa ... -
MFC中真彩工具条的制作方法
2010-04-10 22:53 4908关于在VC中,真彩工具 ... -
C MYSQL API
2010-04-09 16:58 1774C MYSQL API mysql_affe ... -
vc 界面库
2010-04-07 14:43 1816转自:http://blog.chinaunix.net/ ... -
MFC控件
2010-04-02 14:33 781http://www.naughter.com/ L ... -
C++一些常用的代码
2010-03-31 15:46 1096以下代码用于统计一段代码运行的时间: cl ... -
CppUnit 测试方法说明
2010-03-30 14:32 2473转自:http://blog.chinaunix.n ... -
在VS中为GUI程序添加console
2010-03-11 15:09 1677转自:http://blog.csdn.net/zdl10 ... -
Socket编程经验总结
2010-02-27 17:43 1133Socket编程经验总结一些不错的资料: http://w ... -
LibXML多线程环境中的使用
2010-02-25 10:26 3027LibXML在多线程环境中使用时,需要注意xmlInitPar ... -
log4cpp 配置与使用
2009-10-28 09:50 9483以下转自:http://blog.csdn.net/jq012 ...
相关推荐
### C++中使用libxml2读取XML文件详解 #### 一、引言 随着XML(可扩展标记语言)在数据交换与存储领域的广泛应用,掌握如何有效地读取和解析XML文件成为了开发人员的一项必备技能。在C++环境中,libxml2库因其功能...
Libxml2库同样提供了XML文件生成的功能,主要通过`xmlNewDoc`和`xmlNewNode`等函数创建新的XML文档和节点。开发者可以通过添加、删除和修改节点来构建XML树,然后使用`xmlSaveFormatFileEnc`函数将树状结构保存为XML...
以下将详细介绍如何在Ubuntu环境下使用libxml2库进行XML文件的创建和解析,以及节点的增、删、改、查操作。 1. 安装libxml2库 首先,你需要在Ubuntu系统上安装libxml2库及其开发头文件。这可以通过运行以下命令完成...
利用libxml2生成,解析,修改xml文件示例,安装libxml2库, sudo apt-...使用libxml2库进行xml文件的操作,取出了平台差异化,便于在不同的平台都可以进行文件的操作,不受平台系统的限制,可以实现一次编码,多次编译
总结起来,libxml2库为XML处理提供了强大的工具,无论是生成新的XML文档,还是解析和修改已有的XML文件,都提供了简洁且高效的API。在"libxml2test_xml_文本解析_capturedetv_"项目中,开发者通过实践掌握了这些技能...
开发者可以利用libxml2轻松实现XML文档的读取、解析、修改、生成等操作,提升应用程序的XML处理能力。 **总结** Libxml2作为C语言的XML处理库,为开发者提供了强大的工具,无论是XML解析、XPath查询还是内存管理,...
描述部分与标题相呼应,再次确认了这是一个关于libxml2库的C++入门教程,重点在于如何用简单的C++类来操作XML文档。这通常意味着该教程会涵盖XML的基本概念,以及如何利用libxml2库提供的API进行XML解析和操作,同时...
1. **XML解析**:LIBXML2提供了解析XML文档的功能,它可以读取XML文件并将其转换为内存中的数据结构,这使得程序能够方便地访问和操作XML内容。解析过程包括了语法验证、命名空间处理、实体解析等。 2. **XPath支持...
Libxml2库是XML解析的核心,提供了丰富的API(应用程序编程接口),允许开发者高效地读取、写入、验证XML文档。它支持XML解析、XPath查询、XInclude处理、XML Schema和 Relax NG 验证、DTD(文档类型定义)处理等。...
在实际开发中,libxml2的这些功能可以帮助我们高效地处理XML数据,无论是解析、操作还是生成XML文档。通过学习和掌握libxml2,开发者能够更好地应对XML相关的挑战,提高代码的可读性和可维护性。为了更深入地理解和...
作为C语言编写的库,libxml2提供了一系列API,方便开发者处理XML文档,如解析、创建、修改和序列化XML数据。它同时也支持其他相关的格式,如HTML、XHTML、SVG、XInclude、XPath和XSLT。 **1. XML解析** Libxml2的...
例如,你可以使用libxml2进行XML文档的解析、创建和修改: ```c #include <libxml/xmlmemory.h> #include <libxml/parser.h> int main() { xmlChar *content = (xmlChar*) "<doc><element>Text</element></doc>";...
然后,可以使用libxml2提供的API来解析XML文档,例如: ```c++ xmlDocPtr doc = xmlParseFile("example.xml"); if (doc == NULL) { // 处理解析错误 } // 对解析后的XML进行操作... xmlFreeDoc(doc); ``` **核心...
**libxml2开源库详解** ...综上所述,libxml2库为处理XML文档提供了一套强大而全面的工具,无论是在小型应用还是大型系统中,都能发挥重要作用。对于需要处理XML的开发者而言,掌握libxml2的使用是一项重要的技能。
在实际开发中,开发者可以通过libxml2提供的API调用来实现XML相关的功能,例如读取XML文件、执行XPath查询、创建新的XML文档等。由于它的跨平台性,libxml2被广泛应用于各种操作系统和编程环境,包括Linux、Windows...
4. **DOM(Document Object Model)接口**:LibXML提供了对DOM Level 1和Level 2的支持,允许开发者以树形结构操作XML文档,方便地添加、删除和修改元素。 5. **XML命名空间**:LibXML处理XML命名空间,使得在大型...
libxml2是用于解析、处理和操作XML文档的一个开源库,广泛应用于各种编程语言,包括Ruby。在这个场景中,我们讨论的是针对64位(x64)Windows系统的libxml2安装包。 安装libxml2在Windows环境下并不像在Unix-like...
1. **解析**: libxml2提供了解析XML文档的API,可以将XML字符串或文件转化为内存中的树结构,方便后续操作。解析过程中,libxml2能够处理命名空间、属性、注释和处理指令等元素。 2. **验证**: 支持DTD(Document ...
LIBXML2是一款用C语言编写的XML库,能够为开发者提供一系列便捷的API来读取、解析、修改和创建XML文档。该库还支持XPath查询及部分XSLT转换等功能,使其成为处理XML数据的强大工具。 #### 三、下载与安装 为了在...
2. **XML生成**:逆向操作,将内存中的数据结构转换回XML文档。 3. **XPath支持**:通过XPath表达式,可以高效地定位XML文档中的特定节点。 4. **XInclude处理**:支持XML文档中的XInclude指令,合并包含的资源。 5....