去除XML标签提取内容以及去除内容中的特殊字符

wjiaoling136

浏览: 964137 次
性别:
来自: 北京

最近访客更多访客>>

747017186

chajinglong

1017401036

温开水

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

java 去除xml标签提取内容处理特殊字符

昨天弄的xml除了dtd的问题之后，还有两个问题，

一个是xml标签的内容里面还有标签，例如:<book>我有<strong>2</strong>本书。

一个是内容里面有特殊字符，譬如：<contents>这本书主要说：冒险、励志。</contents>

这两种情况存在的前提下，我要是用来作为文件名称生成文件时必然报错，所以先要料理掉这两个畔脚石。

1、去除xml标签内容中的标签，值提取内容：

参考这个链接就OK啦：http://blog.csdn.net/lxqssx/article/details/4075087

String docExplainStr = docExplain.replaceAll("<{1}[^<>]*>{1}","");
String docExplainStr = docExplain.replaceAll("<.*?>", "");

两个我都试过，都挺好的。

2、特殊字符处理：

/**
 * 转义正则特殊字符 （$()*+.[]?\^{},|/\:?"<>）
 * @param keyword
 * @return
 */
public String escapeExprSpecialWord(String keyword) {
	String[] fbsArr = {"/","\\",":","*","?","\"","<",">","|", "(", ")","+", "[", "]", "^", "{", "}","、"};
	for (String key : fbsArr) {
		if (keyword.contains(key)) {
			keyword = keyword.replace(key,"");
		}
	}
	return keyword;
}

参考链接：http://blog.csdn.net/bbirdsky/article/details/45368709

我这个参考上面那个改的，就是根据需要多加了类型。

分享到：

Jquery事件对象的属性 | SAXReader不校验dtd文件

2015-11-20 15:25
浏览 1779
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

去除XML标签提取内容以及去除内容中的特殊字符

评论

发表评论

相关推荐

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

去除XML标签提取内容以及去除内容中的特殊字符

评论

发表评论

相关推荐

使用icepdf将pdf首页内容转成图片

驱动程序无法通过使用安全套接字层(SSL)加密与 SQL Server 建立安全连接。错误:“Unsupported curveId: 29”。

java调用存储过程

转：java保留两位小数4种方法

打BOSS倒计时小程序之操作xml文件

Java中获取Exception的详细信息

Java当中的ResultSet

转：使用Java生成缩略图

maven的搭建

SQL Server分页查询

使用拦截器验证session是否为空

java中使用DataSource连接SQL Server数据库

使用flying saucer将html文件转成PDF

使用freemarker生成word、html时图片显示问题

使用freemarker生成HTML文件

java反射机制学习(六)：动态代理

java反射机制学习(五)：工厂模式

java反射机制学习(四)：通过反射执行方法、操作属性、操作数组中的数据

java反射机制学习(三)：通过反射获取实体类的属性、方法、接口和父类信息

java反射机制学习(二)：通过反射获取构造方法并实例化对象

最近访客更多访客>>