论坛首页 Java企业应用论坛

诡异的dom4j的输出

浏览 2384 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2011-04-13   最后修改:2011-04-13
        昨天发现一个问题,使用dom4j的XMLWrtier输出的问题。
        首先先说一下现象吧,如果XML里面包含了一些特殊字符,比如 
 这个是line feed,也就是换行符。在经过它输出后总是会变成\n, 不好干预它的转化。下面来看具体的例子。
这个是原始的xml文件:
     
<?xml version="1.0" encoding="UTF-8"?>
<Package id = "test" name = "Test&#10;Test">
	
</Package>
        


下面是测试代码:

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.InputStreamReader;

import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamResult;

import junit.framework.Assert;

import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.DocumentSource;
import org.dom4j.io.XMLWriter;
import org.junit.Test;

public class TestXMLOutput {
	
	public final static String FILE_NAME = "text.xml";
	
	@Test
	public  void testDom4j() {

		Document document = createDocument();
		try {
			Element rootElement = document.getRootElement();
			String packageName = rootElement.attributeValue("name");
			
			Assert.assertEquals("Test\nTest", packageName);
			
			FileOutputStream fos = new FileOutputStream("dom4j_"+FILE_NAME);
			XMLWriter writer = new XMLWriter(fos);
			writer.setEscapeText(false);
			writer.write(document);
			
			fos.close();
			writer.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	@Test
	public void testDom(){
		Document document = createDocument();
		
		Element rootElement = document.getRootElement();
		String packageName = rootElement.attributeValue("name");
		
		Assert.assertEquals("Test\nTest", packageName);
		
		try {
			FileOutputStream fos = new FileOutputStream("dom_"+FILE_NAME);
			 // Use a Transformer for output
			 TransformerFactory tFactory =
			    TransformerFactory.newInstance();
			 Transformer transformer = tFactory.newTransformer();
			 transformer.setOutputProperty("indent","yes");
			 transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount","4");
			 transformer.setOutputProperty("encoding","UTF-8");
			 
			 DocumentSource source = new DocumentSource(document);
			 StreamResult result = new StreamResult(fos);
			 transformer.transform(source,result);
			 
			 fos.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	private Document createDocument(){
		Document document = null;
		try {
			File file = new File(FILE_NAME);
			BufferedReader reader = new BufferedReader(
					new InputStreamReader(new FileInputStream(file)));
			
			StringBuffer buffer = new StringBuffer();
			String line = "";
			while((line = reader.readLine()) != null){
				buffer.append(line);
			}
			reader.close();
			
			document = DocumentHelper.parseText(buffer.toString());
		} catch (Exception e) {
			e.printStackTrace();
		}
		return document;
	}
}


下面是dom4j的转换后的输出:

<?xml version="1.0" encoding="UTF-8"?>
<Package id="test" name="Test
Test">	</Package>


下面是transfomer的输出:
<?xml version="1.0" encoding="UTF-8"?>
<Package id="test" name="Test&#10;Test">	</Package>


大家看到效果了把,dom4j变成了 \n, 但是transfomer还是原来的格式。
如果大家谁有对这块有研究的,希望给我留言解决这个问题。

另外,我把工程上传,希望大家帮忙解决。
   发表时间:2011-04-13  
试试 writer.setEscapeText(true);  
0 请登录后投票
   发表时间:2011-04-13  
kimmking 写道
试试 writer.setEscapeText(true);  

这个默认就是true的,我修改成true和false都不可以,另外escapeText是来控制
&quot; 这些转化的,不过还是谢谢。 如果干兴趣的话,可以再研究研究,
欢迎再反馈....
0 请登录后投票
论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics