`
jakty
  • 浏览: 4762 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

去除HTML标签

    博客分类:
  • java
阅读更多
 /**
	 * 去除str中的HTML标签
	 * 
	 * @param str
	 * @return
	 */
	public static String formatHtml(String str) {
		if (str == null) {
			return "";
		}
		str = str.toLowerCase();
		str = str.replaceAll("</?span[^>]*>", "");
		str = str.replaceAll("&#[^>]*;", "");
		str = str.replaceAll("</?marquee[^>]*>", "");
		str = str.replaceAll("</?object[^>]*>", "");
		str = str.replaceAll("</?param[^>]*>", "");
		str = str.replaceAll("</?embed[^>]*>", "");
		str = str.replaceAll("</?table[^>]*>", "");
		str = str.replaceAll("&nbsp;", "");
		str = str.replaceAll("</?tr[^>]*>", "");
		str = str.replaceAll("</?th[^>]*>", "");
		str = str.replaceAll("</?p[^>]*>", "");
		str = str.replaceAll("</?a[^>]*>", "");
		str = str.replaceAll("</?img[^>]*>", "");
		str = str.replaceAll("</?tbody[^>]*>", "");
		str = str.replaceAll("</?li[^>]*>", "");
		str = str.replaceAll("</?div[^>]*>", "");
		str = str.replaceAll("</?td[^>]*>", "");
		str = str.replaceAll("</?script[^>]*>", "");
		str = str.replaceAll("(javascript|jscript|vbscript|vbs):", "");
		str = str.replaceAll("on(mouse|exit|error|click|key)", "");
		str = str.replaceAll("<\\?xml[^>]*>", "");
		str = str.replaceAll("<\\?[a-z]+:[^>]*>", "");
		str = str.replaceAll("</?font[^>]*>", "");
		str = str.replaceAll("</?b[^>]*>", "");
		str = str.replaceAll("</?u[^>]*>", "");
		str = str.replaceAll("</?i[^>]*>", "");
		str = str.replaceAll("</?strong[^>]*>", "");
		str = str.replaceAll("</?(a|A)( .*?>|>)", "");
		return str;
	}

 

分享到:
评论

相关推荐

    SQl去掉HTML标签函数

    SQl去掉HTML标签函数 彻底防止SQL注入

    js 正则匹配(去掉html标签)

    ### js正则匹配(去掉HTML标签) 在网页开发与数据处理过程中,经常需要对含有HTML标签的文本进行清洗,以提取纯文本内容。利用JavaScript的正则表达式功能可以高效地实现这一目标。本文将详细介绍如何使用正则...

    去掉所有的html标签

    为了更好地处理这些数据,例如进行文本分析或者将其显示在不支持HTML渲染的环境中,就需要去除其中的HTML标签。 ### Java实现方法详解 #### 方法定义 在给定的代码片段中,`stripTags`方法接受一个名为`...

    去除html标签

    在IT领域,特别是Web开发与数据处理中,“去除HTML标签”是一个常见的需求。这涉及到从原始文本中清除HTML(超文本标记语言)标签的过程,从而提取出纯净的文本内容。以下是从给定文件的标题、描述、标签以及部分...

    winform 去除html标签的正则表达式

    在IT领域,特别是Web开发与文本处理中,去除HTML标签是一项常见的需求。这不仅有助于文本内容的纯化,还能提高数据处理的效率。通过使用正则表达式来去除HTML标签是一种非常有效的方法。下面我们将详细探讨如何利用...

    php去除html标签

    在开发网站时,我们经常会遇到需要获取一段含有HTML标签的文本(如从富文本编辑器中获取的数据),然后需要将这段文本中的HTML标签去掉,只保留纯文本内容。这主要是因为: - **防止XSS攻击**:保留HTML标签可能会...

    搜索引擎中去除html标签的方法及装置.docx

    《搜索引擎中去除html标签的方法及装置》的发明主要聚焦于如何在搜索引擎处理网页内容时有效地去除HTML标签,提高搜索引擎的索引质量和用户的搜索体验。HTML(HyperText Markup Language)是用于创建网页的标准标记...

    去掉内容里的html标签

    在IT行业中,处理文本数据时,经常会遇到要去除HTML标签的情况。...这个文件名可能是该博客提供的一个示例代码文件,用于演示如何去掉HTML标签的具体实现。在实际操作中,可以结合这个文件进一步理解和学习相关知识。

    javascript实现去除HTML标签的方法

    去除HTML标签是前端开发中常见的一种需求,比如在展示用户输入内容时,为了防止潜在的XSS攻击或者是为了美观简洁,可能需要去掉HTML标签只保留纯文本。本文将详细介绍如何使用JavaScript去除HTML标签,并涉及到相关...

    java去掉html标签 必须首先去掉双引号的正则.docx

    ### Java去除HTML标签并优先处理双引号的正则表达式方法 在处理网页内容时,经常需要将HTML标签从文本中移除,以便于进行后续的数据分析或文本处理工作。在Java中,可以通过正则表达式的方式实现这一功能。然而,在...

    去除C#HTML标签

    C# 去掉 字符串中的 HTML 标签。 有些字符串中 包含一些 HTML 标签 不想要,就可以用 它去掉其中的标签了。

    C# 过滤HTML标签的几种方法

    在提供的代码片段中,首先通过`Regex.Replace()`函数去除所有的脚本标签(`&lt;script&gt;...&lt;/script&gt;`),然后继续去除所有其他的HTML标签(`&lt;...&gt;`形式)。这一过程是通过以下步骤实现的: 1. **删除脚本标签**: ```...

    如何去除富文本中的html标签及vue、react、微信小程序中的过滤器

    1.富文本去除html标签 去除html标签及 空格 let richText = '  sdaflsjf的丰富及饿哦塞尔&lt;/p&gt;&lt;span&gt;dsfjlie&lt;/span&gt;'; /* 去除富文本中的html标签 */ /* *、+限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有...

    php使用strip_tags()去除html标签仍有空白的解决方法

    在PHP开发中,经常会需要对从数据库或其他来源获取的文本内容进行处理,比如去除其中的HTML标签,以保证文本的安全性和正确性。php函数strip_tags()正是用于去除字符串中的HTML和PHP标签。然而,在使用strip_tags()...

    Sql Server 如何去掉内容里面的Html标签

    本文将详细介绍如何使用T-SQL(SQL Server的Transact-SQL扩展)来去除字符串中的HTML标签。 首先,我们来看一下提供的代码片段。这个示例创建了一个名为`dbo.removehtml`的用户定义函数,用于从输入的字符串中删除...

    使用正则表达式去除所有html标签只保留文字

    为了实现这一目的,可以使用正则表达式技术来匹配并去除HTML标签,仅保留文本内容。 正则表达式是一种强大的文本匹配模式,它允许用户定义一个搜索模式,用来在文本中搜索符合该模式的字符串。使用正则表达式去除...

    易语言清除HTML标签

    在处理HTML数据时,有时我们需要清除HTML标签,以获取纯文本内容。这篇介绍将深入讲解如何使用易语言来实现这个功能。 首先,我们需要理解HTML标签的结构。HTML(HyperText Markup Language)是一种标记语言,用于...

    asp.net 去除HTML的标签的一个方法

    ### ASP.NET去除HTML标签的方法详解 在Web开发中,经常需要处理用户提交的数据,并将其安全地展示在网页上。为了防止XSS攻击等安全问题,一个常见的做法是去除或转义HTML标签。本文将详细介绍ASP.NET中去除HTML标签...

Global site tag (gtag.js) - Google Analytics