`
itace
  • 浏览: 182878 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

正则表达式过滤html标签

阅读更多
/**
	 * 过滤html标签
	 * @param s - html字符串
	 * @param tag - a,p,img,div,(不区分大小写)
	 * @param contain - 是否过滤掉标签内包含的内容
	 * @return
	 */
	public static String filterTag(String s, String tag,boolean contain) { 
//		  String regexp = "<\\s*"+tag+"\\s*([^>]*)\\s*>|</\\s*"+tag+"\\s*>";
//		  String regexp = "<\\s*"+tag+"\\s*([^>]*)>|</\\s*"+tag+"\\s*>";
//		  String regexp = "<\\s*"+tag+"\\s*([^>]*)>[\\S\\s]*</\\s*"+tag+"\\s*>";
		  String regexp = null;
		  if(contain){
          //懒惰匹配的加问号,如*?,最小匹配
			  regexp = "<[\\s]*?"+tag+"[^>]*?>[\\s\\S]*?<[\\s]*?\\/[\\s]*?"+tag+"[\\s]*?>";
			  //regexp = "<\\s*"+tag+"\\s*([^>]*)>[\\S\\s]*</\\s*"+tag+"\\s*>";
		  }else{
			  regexp = "<\\s*"+tag+"\\s*([^>]*)>|</\\s*"+tag+"\\s*>";
		  }
		  Pattern pattern = Pattern.compile(regexp,Pattern.CASE_INSENSITIVE); 
		  Matcher matcher = pattern.matcher(s); 
		  StringBuffer sb = new StringBuffer(); 
		  while (matcher.find()) { 
			  matcher.appendReplacement(sb, ""); 
//			  System.out.println(matcher.group());
		  }
		  matcher.appendTail(sb);
		  return sb.toString();
	}

 

分享到:
评论

相关推荐

    java正则表达式过滤html标签

    java正则表达式过滤html标签 java正则表达式过滤html标签是指使用java语言中的正则表达式来过滤html标签的操作。HtmlRegexpUtil这个工具类提供了多种过滤html标签的方法,包括过滤所有以"开头以"&gt;"结尾的标签、找出...

    Java正则表达式过滤html标签1[参考].pdf

    Java正则表达式过滤html标签 Java正则表达式是一种强大的文本处理工具,可以用来过滤、提取和替换文本中的特定模式。在HTML标记处理中,正则表达式可以用来过滤、提取和替换HTML标签。 本文将介绍如何使用Java正则...

    asp.net 正则表达式过滤所有html标签

    ### ASP.NET 中使用正则表达式过滤HTML标签的详细解析 在Web开发中,经常需要对用户输入的数据进行处理,特别是在展示用户提交的内容时,为了防止XSS攻击或确保页面的整洁度,去除HTML标签变得至关重要。本文将详细...

    java使用正则表达式过滤html标签

    标题“java使用正则表达式过滤html标签”意味着文章的主题是关于如何使用Java编程语言结合正则表达式来清除或处理HTML标签,这是在处理Web开发中经常会遇到的需求。描述中提到,文章将介绍这一技术,并希望读者通过...

    PHP用正则表达式过滤超链接

    ### PHP使用正则表达式过滤超链接 在Web开发中,经常需要处理HTML文本,比如提取其中的超链接。PHP提供了强大的字符串处理功能,利用正则表达式可以非常方便地实现这一需求。本文将详细介绍如何使用PHP结合正则...

    C#使用正则表达式过滤html标签

    在项目中遇到这样一个需求,需要将一段html转换为一般文本返回,万能的正则表达式来了。 正则表达式来拯救你,代码如下: public static string Html2Text(string htmlStr) { if (String.IsNullOrEmpty(htmlStr)) {...

    asp.net利用正则在HTML中提取图片路径(asp.net正则表达式过滤出HTML代码中图片路径).txt

    对于提取 HTML 中的图片路径,我们需要设计一个能够匹配 `&lt;img&gt;` 标签并捕获 `src` 属性值的正则表达式。 #### 示例代码分析 下面的示例展示了两种不同的方法来从 HTML 字符串中提取图片路径: ##### 方法一:`...

    正则表达式清除html标签

    ### 正则表达式清除HTML标签 在.NET开发过程中,我们经常会遇到需要处理HTML文档的情况。其中一项常见的任务就是从文本中移除HTML标签。这不仅有助于提高数据的安全性(例如防止XSS攻击),还能方便地提取纯文本...

    正则表达式 Java 判断字串是否合理

    为了防止XSS攻击,通常需要对用户输入进行HTML标签的过滤。`checkHtmlTag`方法提供了基本的HTML标签验证,其正则表达式为: ```java "&lt;(\\S*?)[^&gt;]*&gt;.*?|*?/&gt;" ``` 此表达式可以匹配成对的HTML标签以及自闭合标签。 ...

    PHP正则表达式过滤html标签属性(DEMO)

    以下是PHP正则表达式过滤HTML标签属性的详细介绍和实例说明。 1. 基本过滤概念 使用正则表达式过滤HTML标签属性是基于规则的字符串匹配技术。它允许开发者指定特定模式,然后对文本进行查找和替换。PHP中的`preg_...

    js过滤HTML标签完整实例

    总结来说,JavaScript中使用正则表达式过滤HTML标签是一个实用的技术,它通过简单的规则匹配与替换机制,帮助我们清理从不可靠来源接收的数据,从而避免一些常见的安全问题。这种技术的应用不限于特定的场景,无论是...

    C#正则表达式集合C# 正则表达式 集合C# 正则表达式 集合C# 正则表达式 集合

    根据给定的信息,本文将详细解释C#中的正则表达式及其应用场景,特别是结合所提供的示例来阐述如何在C#程序设计中运用这些表达式。 ### C#与正则表达式 C#是一种广泛使用的面向对象编程语言,它支持丰富的功能,...

    正则表达式教程 常用正则表达式

    ### 正则表达式教程:常用正则表达式解析 #### 一、正则表达式简介 正则表达式(Regular Expression)是一种强大的文本处理工具,它可以用来进行字符串的搜索、替换等操作。通过简单的字符组合,正则表达式可以灵活...

    js正则表达式限制文本框只能输入字母和汉字

    ### 正则表达式在JavaScript中的应用:限制文本框只能输入字母和汉字 在Web开发过程中,表单验证是一项常见的任务。确保用户输入的数据符合预期的格式有助于提高数据的准确性和安全性。本篇文章将深入探讨如何使用...

    javascript正则表达式表单验证大全

    使用onkeyup和onbeforepaste事件监听器,结合正则表达式,可以实时过滤用户的输入,限制只能输入特定类型的字符,如仅允许中文、英文或数字,有效防止非法输入,提高数据安全性。 以上正则表达式及其应用,覆盖了从...

    利用正则表达式批处理含链接内容文档

    故采用正则表达式的形式进行文档处理。 要读取文档内10w多条的数据,可按照3步走战略: 1.外层循环利用文件过滤器读取文件夹内所有符合条件的文件。 2.读取每一个筛选到的文件,利用正则表达式去除超链接符号。 3....

    常用的正则表达式.doc

    根据给定文件的信息,我们可以总结出一系列常用的正则表达式及其应用场景。正则表达式是一种强大的文本处理工具,被广泛应用于各种编程语言中,用于字符串的搜索、替换、验证等操作。 ### 1. 匹配中文字符 **正则...

Global site tag (gtag.js) - Google Analytics