/**
* 去除str中的HTML标签
*
* @param str
* @return
*/
public static String formatHtml(String str) {
if (str == null) {
return "";
}
str = str.toLowerCase();
str = str.replaceAll("</?span[^>]*>", "");
str = str.replaceAll("&#[^>]*;", "");
str = str.replaceAll("</?marquee[^>]*>", "");
str = str.replaceAll("</?object[^>]*>", "");
str = str.replaceAll("</?param[^>]*>", "");
str = str.replaceAll("</?embed[^>]*>", "");
str = str.replaceAll("</?table[^>]*>", "");
str = str.replaceAll(" ", "");
str = str.replaceAll("</?tr[^>]*>", "");
str = str.replaceAll("</?th[^>]*>", "");
str = str.replaceAll("</?p[^>]*>", "");
str = str.replaceAll("</?a[^>]*>", "");
str = str.replaceAll("</?img[^>]*>", "");
str = str.replaceAll("</?tbody[^>]*>", "");
str = str.replaceAll("</?li[^>]*>", "");
str = str.replaceAll("</?div[^>]*>", "");
str = str.replaceAll("</?td[^>]*>", "");
str = str.replaceAll("</?script[^>]*>", "");
str = str.replaceAll("(javascript|jscript|vbscript|vbs):", "");
str = str.replaceAll("on(mouse|exit|error|click|key)", "");
str = str.replaceAll("<\\?xml[^>]*>", "");
str = str.replaceAll("<\\?[a-z]+:[^>]*>", "");
str = str.replaceAll("</?font[^>]*>", "");
str = str.replaceAll("</?b[^>]*>", "");
str = str.replaceAll("</?u[^>]*>", "");
str = str.replaceAll("</?i[^>]*>", "");
str = str.replaceAll("</?strong[^>]*>", "");
str = str.replaceAll("</?(a|A)( .*?>|>)", "");
return str;
}
分享到:
相关推荐
SQl去掉HTML标签函数 彻底防止SQL注入
### js正则匹配(去掉HTML标签) 在网页开发与数据处理过程中,经常需要对含有HTML标签的文本进行清洗,以提取纯文本内容。利用JavaScript的正则表达式功能可以高效地实现这一目标。本文将详细介绍如何使用正则...
为了更好地处理这些数据,例如进行文本分析或者将其显示在不支持HTML渲染的环境中,就需要去除其中的HTML标签。 ### Java实现方法详解 #### 方法定义 在给定的代码片段中,`stripTags`方法接受一个名为`...
在IT领域,特别是Web开发与数据处理中,“去除HTML标签”是一个常见的需求。这涉及到从原始文本中清除HTML(超文本标记语言)标签的过程,从而提取出纯净的文本内容。以下是从给定文件的标题、描述、标签以及部分...
在IT领域,特别是Web开发与文本处理中,去除HTML标签是一项常见的需求。这不仅有助于文本内容的纯化,还能提高数据处理的效率。通过使用正则表达式来去除HTML标签是一种非常有效的方法。下面我们将详细探讨如何利用...
在开发网站时,我们经常会遇到需要获取一段含有HTML标签的文本(如从富文本编辑器中获取的数据),然后需要将这段文本中的HTML标签去掉,只保留纯文本内容。这主要是因为: - **防止XSS攻击**:保留HTML标签可能会...
《搜索引擎中去除html标签的方法及装置》的发明主要聚焦于如何在搜索引擎处理网页内容时有效地去除HTML标签,提高搜索引擎的索引质量和用户的搜索体验。HTML(HyperText Markup Language)是用于创建网页的标准标记...
在IT行业中,处理文本数据时,经常会遇到要去除HTML标签的情况。...这个文件名可能是该博客提供的一个示例代码文件,用于演示如何去掉HTML标签的具体实现。在实际操作中,可以结合这个文件进一步理解和学习相关知识。
去除HTML标签是前端开发中常见的一种需求,比如在展示用户输入内容时,为了防止潜在的XSS攻击或者是为了美观简洁,可能需要去掉HTML标签只保留纯文本。本文将详细介绍如何使用JavaScript去除HTML标签,并涉及到相关...
### Java去除HTML标签并优先处理双引号的正则表达式方法 在处理网页内容时,经常需要将HTML标签从文本中移除,以便于进行后续的数据分析或文本处理工作。在Java中,可以通过正则表达式的方式实现这一功能。然而,在...
C# 去掉 字符串中的 HTML 标签。 有些字符串中 包含一些 HTML 标签 不想要,就可以用 它去掉其中的标签了。
在提供的代码片段中,首先通过`Regex.Replace()`函数去除所有的脚本标签(`<script>...</script>`),然后继续去除所有其他的HTML标签(`<...>`形式)。这一过程是通过以下步骤实现的: 1. **删除脚本标签**: ```...
1.富文本去除html标签 去除html标签及 空格 let richText = ' sdaflsjf的丰富及饿哦塞尔</p><span>dsfjlie</span>'; /* 去除富文本中的html标签 */ /* *、+限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有...
为了实现这一目的,可以使用正则表达式技术来匹配并去除HTML标签,仅保留文本内容。 正则表达式是一种强大的文本匹配模式,它允许用户定义一个搜索模式,用来在文本中搜索符合该模式的字符串。使用正则表达式去除...
本文将详细介绍如何使用T-SQL(SQL Server的Transact-SQL扩展)来去除字符串中的HTML标签。 首先,我们来看一下提供的代码片段。这个示例创建了一个名为`dbo.removehtml`的用户定义函数,用于从输入的字符串中删除...
在处理HTML数据时,有时我们需要清除HTML标签,以获取纯文本内容。这篇介绍将深入讲解如何使用易语言来实现这个功能。 首先,我们需要理解HTML标签的结构。HTML(HyperText Markup Language)是一种标记语言,用于...
### ASP.NET去除HTML标签的方法详解 在Web开发中,经常需要处理用户提交的数据,并将其安全地展示在网页上。为了防止XSS攻击等安全问题,一个常见的做法是去除或转义HTML标签。本文将详细介绍ASP.NET中去除HTML标签...
在PHP开发中,经常会需要对从数据库或其他来源获取的文本内容进行处理,比如去除其中的HTML标签,以保证文本的安全性和正确性。php函数strip_tags()正是用于去除字符串中的HTML和PHP标签。然而,在使用strip_tags()...
3. **安全问题**:虽然以上方法可以有效去除HTML标签,但对于用户输入的数据仍然需要进行严格的过滤和验证,以防止其他类型的安全威胁。 #### 五、扩展知识 除了以上介绍的方法外,还可以考虑使用一些现成的库来...