`
noasoso
  • 浏览: 35966 次
  • 性别: Icon_minigender_1
  • 来自: 西安
社区版块
存档分类
最新评论

java正则过滤标签

    博客分类:
  • java
阅读更多
public static void main(String[] args) throws Exception {
		String s = "<img src= http://q.<em><em>cntv</em></em>.cn/emote/6.gif />";
		System.out.println(fiterTag(s));
}

public static String fiterTag(String str) {
		String regxp = "<em>|</em>";
		Pattern pattern = Pattern.compile(regxp);
		Matcher matcher = pattern.matcher(str);
		StringBuffer sb = new StringBuffer();
		boolean result1 = matcher.find();
		while (result1) {
			matcher.appendReplacement(sb, "");
			result1 = matcher.find();
		}
		matcher.appendTail(sb);
		return sb.toString();
	}

 

之前正则写的比较少 记录一下今天在过滤一个网址内容的方法

主要是熟悉了一下 Matcher 类的 appendReplacement  和 appendTail 这两个方法

上面的方法可以根据个人需求 写的更通用一些

分享到:
评论

相关推荐

    java正则表达式过滤html标签

    java正则表达式过滤html标签 java正则表达式过滤html标签是指使用java语言中的正则表达式来过滤html标签的操作。HtmlRegexpUtil这个工具类提供了多种过滤html标签的方法,包括过滤所有以"开头以"&gt;"结尾的标签、找出...

    Java正则表达式过滤html标签1[参考].pdf

    Java正则表达式过滤html标签 Java正则表达式是一种强大的文本处理工具,可以用来过滤、提取和替换文本中的特定模式。在HTML标记处理中,正则表达式可以用来过滤、提取和替换HTML标签。 本文将介绍如何使用Java正则...

    java使用正则表达式过滤html标签

    标签“java过滤html标签 java正则过滤html标签 java过滤所有html标签”则指明了文章的具体技术范畴和读者可以利用的关键字。 在内容部分,文章提供了一个名为`HtmlRegexpUtil`的工具类,该类是专门用于处理HTML标签...

    正则表达式 Java 判断字串是否合理

    根据给定的文件信息,我们可以总结出以下关于Java正则表达式的重要知识点: ### 1. 正则表达式简介 正则表达式是一种强大的文本处理工具,它能够帮助我们匹配、查找、替换等操作符合某种规则的字符串。在Java中,...

    Java过滤器,字符过滤,标签过滤

    在这个小样例中,我们看到的是如何使用Java实现字符过滤和标签过滤,以及字符编码的转换。这在处理用户输入或者显示网页内容时特别有用,可以防止SQL注入、XSS攻击等安全问题,同时确保数据在不同系统间正确传输。 ...

    Java 中 过滤Html标签

    在Java中,过滤Html标签的方法有多种,包括使用正则表达式、使用HtmlParser等。下面我们将详细介绍使用正则表达式过滤Html标签的方法。 使用正则表达式过滤Html标签的关键是定义正确的正则表达式。正则表达式是一种...

    java代码-正则去除HTML代码中的A标签

    本话题主要关注如何使用Java和正则表达式来移除HTML代码中的A标签,这些A标签通常用于创建超链接。 A标签在HTML中用于定义超链接,其基本结构如下: ```html 链接文本 ``` 在Java中,我们可以使用`java.util....

    java 读取html过滤标签

    总的来说,Java中读取HTML并过滤标签的方法多种多样,可以根据项目需求和性能要求选择合适的方法。对于更复杂的需求,如解析JavaScript生成的内容或处理CSS样式,可能需要结合其他技术,如Selenium或Crawler4j。在...

    Java正则表达式教程

    Java正则表达式教程是为那些想要深入了解Java编程语言中正则表达式使用方法的初学者准备的。正则表达式(Regular Expression)是一种强大的文本处理工具,它用于模式匹配、搜索、替换等操作,广泛应用于字符串处理和...

    java代码-正则去除HTML代码中的IMG标签

    在Java编程中,处理HTML内容时,我们可能会遇到需要移除特定标签,比如IMG标签的情况。这通常是出于数据清理、文本分析或者某些特定需求。在这个案例中,我们要使用正则表达式来实现这个功能。正则表达式是匹配和...

    java过滤html,css,js标签工具类(UnHtmlScript)

    `UnHtmlScript`工具类就是为了解决这个问题而设计的,它能够帮助开发者有效地过滤掉HTML、CSS和JavaScript标签,提取出纯文本内容。 HTML标签是用来构建网页结构的,例如`&lt;p&gt;`用于段落,`&lt;a&gt;`用于链接等。CSS则是...

    过滤器过滤用户输入的非法字符

    本文将深入探讨标题中的两个关键类:`XssFilter.java` 和 `XssHttpServletRequestWrapper.java`,以及它们在过滤非法字符中的作用。 首先,`XssFilter.java` 是一个实现了Servlet过滤器接口(javax.servlet.Filter...

    java正则表达式

    Java正则表达式是Java编程语言中的一个强大工具,用于处理字符串模式匹配和文本解析。在Java中,正则表达式通常与`java.util.regex`包中的类一起使用,如`Pattern`和`Matcher`。这些类提供了创建、编译和执行正则...

    java过滤html代码

    下面我们将详细讨论如何在Java中通过正则表达式过滤HTML代码。 首先,我们需要理解HTML标签的基本结构。HTML标签通常由尖括号 `和 `&gt;` 包围,如 `&lt;tag&gt;` 和 `&lt;/tag&gt;`,其中 `tag` 是标签名称。有一些特殊的情况,如...

    java百度编辑器提交过滤标签方法

    ### Java百度编辑器提交过滤标签方法 在进行Web开发时,常常会遇到用户提交的数据包含HTML标签、脚本标签或样式标签的情况。为了防止XSS(跨站脚本攻击)等安全问题,开发者通常需要对这些输入进行过滤处理。本文将...

    JAVA过滤标签实现将html内容转换为文本的方法示例

    本文主要介绍了使用JAVA过滤标签实现将html内容转换为文本的方法,涉及java针对HTML代码的正则替换相关操作技巧。以下是实现该方法的详细知识点: 1. 使用正则表达式去掉HTML标签:在将html内容转换为文本时,需要...

    防止xss和sql注入:JS特殊字符过滤正则

    本文将详细介绍如何通过JavaScript特殊字符过滤正则表达式来防范这两种攻击。 首先,理解XSS攻击。XSS攻击是通过在用户输入的数据中嵌入恶意脚本,当这些数据被网站处理并显示给其他用户时,恶意脚本得以执行,从而...

    过滤特殊字符及表情符

    - **字符串函数**:Java中的`String.replaceAll()`方法,可以结合正则表达式实现过滤。 - **自定义过滤器**:对于更复杂的需求,可以编写自定义过滤器,如提供的`TextWatcherImpl.java`和`MaxLengthInputFilter....

Global site tag (gtag.js) - Google Analytics