NekoHTML 处理转义字符的问题

浏览 2852 次

锁定老帖子主题：NekoHTML 处理转义字符的问题该帖已经被评为新手帖
作者	正文
betafox 等级: 性别: 文章: 78 积分: 120 来自: 北京	发表时间：2008-03-26 相关推荐: 转：和转义字符相关的BUG NekoHtml 乱码出现问号的解决 SpringBoot整合Thymeleaf（22） SpringBoot整合Thymeleaf Python PEP8编码规范更多相关推荐 NekoHTML在处理html文档时，如果碰到&开始的转义字符(如空格)，会出现乱码问题！现象：此问题在网络上多次出现，但没有解决办法，经过跟踪nekoHtml的执行，发现其处理&转义字符时需要读取org\cyberneko\html\res\HTMLlat1.properties属性文件，查找&转义字符的对应字符，但是由于某种原因，java.util.Properties类在读取此文件会产生乱码；解决办法：由于我提取html内容后最终还是要已html的形式在页面展示，所以对转义字符的处理并不希望在内容提取时进行，而是有浏览器在显示时做转换；所以可以将HTMLlat1.properties文件内容清空，转义字符直接是原样输出； java.util.Properties类为什么会读出乱码还需要分析，那位大侠知道请回复哦！如空格' '的确对应\u00a0,通过字符串编码处理确实可以得到' ',但是通过Properties却读出为'?'; 声明：ITeye文章版权属于作者，受法律保护。没有作者书面许可不得转载。推荐链接
返回顶楼

chencang 等级: 初级会员性别: 文章: 11 积分: 40 来自: 南京	发表时间：2008-04-02 原来如此，我的搜索结果中也出现好多"?"
返回顶楼	回帖地址 0 0 请登录后投票

论坛首页 → 入门技术版

跳转论坛: