DOM解析XML报错：Content is not allowed in prolog

cuisuqiang

浏览: 3971749 次
性别:
来自: 北京

最近访客更多访客>>

muerzi

lastsoul

njdccy

flymeqaqflyme

博主相关

博客

微博

相册

留言

关于我

博客专栏

: Java研发技术指南
浏览量：3679605

文章分类

社区版块

存档分类

博客分类：

Java开源

dom xml dom4j prolog bom

报错内容为：

Content is not allowed in prolog. Nested exception: Content is not allowed in prolog.

网上所述总结来说就是解析内容内包含BOM。这个标记是看不到的，流里面有这个标记而已。
BOM：Byte Order Mark，中文名字节顺序标记。UCS规范建议在传输字节流前，先传输BOM来判断字节顺序。
其实UTF-8是不需要用BOM来表明字节顺序的，但是可以用BOM来表明编码方式。BOM的UTF-8编码是EF BB BF，所以呢，如果接受者收到EF BB BF开头的字节流，就说明它是UTF-8编码了。

解决办法：

如果解析的是文件：

可以用UltraEdit或者EmEditor打开XML，然后另存为，保存的时候有选项是以无BOM的UTF-8保存还是以有BOM的UTF-8保存。

如果是从远程请求回来的内容：

那么你把返回的流New为字符串，是看不到BOM的，但是你必须截取你需要的内容：

if(null != result && !"".equals(result)){
	if(result.indexOf("<") != -1 && result.lastIndexOf(">") != -1 && result.lastIndexOf(">") > result.indexOf("<"))
		result = result.substring(result.indexOf("<"), result.lastIndexOf(">") + 1);
}

也有说是DOM4J版本较低引起的，但是我看了一下我是用的版本是1.6.1，所以排除此类可能，但是在实际中我还是建议使用最新稳定版本来进行开发。

更新
今天看日志，发现我的异常不是因为BOM头引起的，幸好我也打印了收到的内容，我一看，我去，服务器在自己处理失败以后直接返回个 error字符串，mian了一下，果然出错，这坑爹的玩儿。

public static void main(String[] args) throws DocumentException {
	String str = "error";
	Document doc = DocumentHelper.parseText(str);
	System.out.println(doc.asXML());
}

请您到ITEYE网站看 java小强原创，谢谢！
http://cuisuqiang.iteye.com/ ！

自建博客地址：http://www.javacui.com/ ，内容与ITEYE同步！

2
顶

0
踩

分享到：

Java replaceAll()方法报错Illegal group ... | 服务器最怕什么？

2014-05-06 15:23
浏览 82731
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论