dom4j解析xml文档时的字符引用（数字实体）问题及初步分析。

全部 Hibernate Spring Struts iBATIS 企业应用 Lucene SOA Java综合 Tomcat 设计模式 OO JBoss

浏览 4675 次

锁定老帖子主题：dom4j解析xml文档时的字符引用（数字实体）问题及初步分析。精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者	正文
cnetwei 等级: 性别: 文章: 54 积分: 286 来自: 西安	发表时间：2007-11-30 最后修改：2010-03-23 相关推荐: Dom4j解析XML（详解）用dom4j解析xml文件，并通过反射封装到一个实体类中 Java - DOM4J解析XML文件 dom4j简介及解析xml案例 Android使用Dom4j解析xml,并存入自定义实体更多相关推荐 Java综合 xml中的字符引用也叫作字符实体或编号实体，例如我们可以 & //显示一个and符号——& 也可以 &# 38 ; //也是显示一个and符号——& 第二种方式就叫做编号实体，在xml规范中定义了5个实体： <!ENTITY quot """ > <!ENTITY amp "&" > <!ENTITY apos "'" > <!ENTITY lt "&#60;" > <!ENTITY gt ">" > 我们可以通过名称quot、amp……来引用，也可以通过数字34、38……来引用。平时常用的（定义在HTML中的）实体还有： <!ENTITY nbsp " " > <!-- 不折行空格 --> <!ENTITY copy "©" > <!-- 版权符号 --> 我的问题是，在dom4j 使用SAXReader解析xml文档时，其中的字符实体&#160、&#169都会变成问号——?，理论上来说这里的数字（160、169）是字符在编码表中的（十进制）编码值，我给SAXReader设置的encoding是utf-8，难道unicode中没有160、169这两个值？不知道大家是否有遇到这样的问题，有没有什么解决方法或思路？声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

论坛首页 → Java企业应用版

跳转论坛: