`
weizhai12
  • 浏览: 149377 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
文章分类
社区版块
存档分类
最新评论

清除文本中的Html标签

 
阅读更多

以前做项目时,曾经遇到一个问题,就是要一段含html的文本中html的标签清除掉,并将清除后的文本显示在winform的Label上面。当时在网上搜寻了好久,终于找到了点资料,自己好好对照整理了下,现在分享给大家:

/// <summary>
/// 清除文本中Html的标签
/// </summary>
/// <param name="Content"></param>
/// <returns></returns>
private string ClearHtml(string Content)
{
Content = Zxj_ReplaceHtml("&#[^>]*;", "", Content);
Content = Zxj_ReplaceHtml("</?marquee[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?object[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?param[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?embed[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?table[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("&nbsp;", "", Content);
Content = Zxj_ReplaceHtml("</?tr[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?th[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?p[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?a[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?img[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?tbody[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?li[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?span[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?div[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?th[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?td[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?script[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("(javascript|jscript|vbscript|vbs):", "", Content);
Content = Zxj_ReplaceHtml("on(mouse|exit|error|click|key)", "", Content);
Content = Zxj_ReplaceHtml("<\\?xml[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("<\\/?[a-z]+:[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?font[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?b[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?u[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?i[^>]*>", "", Content);
Content = Zxj_ReplaceHtml("</?strong[^>]*>", "", Content);
string clearHtml = Content;
return clearHtml;
}

}

/// <summary>
/// 清除文本中的Html标签
/// </summary>
/// <param name="patrn">要替换的标签正则表达式</param>
/// <param name="strRep">替换为的内容</param>
/// <param name="content">要替换的内容</param>
/// <returns></returns>
private string Zxj_ReplaceHtml(string patrn, string strRep, string content)
{
if (string.IsNullOrEmpty(content))
{
content = "";
}
Regex rgEx = new Regex(patrn, RegexOptions.IgnoreCase);
string strTxt = rgEx.Replace(content, strRep);
return strTxt;
}

分享到:
评论

相关推荐

    易语言清除HTML标签

    在处理HTML数据时,有时我们需要清除HTML标签,以获取纯文本内容。这篇介绍将深入讲解如何使用易语言来实现这个功能。 首先,我们需要理解HTML标签的结构。HTML(HyperText Markup Language)是一种标记语言,用于...

    清除字符串中的html标记

    为了确保数据能够在不同的环境中正确显示,或者为了进行进一步的文本处理(如搜索、排序等),我们需要清除这些HTML标记。 #### 方法实现 下面的示例方法`ToTxt`展示了如何使用正则表达式(Regular Expressions)...

    正则表达式清除html标签

    其中一项常见的任务就是从文本中移除HTML标签。这不仅有助于提高数据的安全性(例如防止XSS攻击),还能方便地提取纯文本内容用于显示或进一步处理。本文将详细介绍如何利用正则表达式在.NET环境中清除HTML标签。 #...

    asp.net 剔除文本中的html标签 demo

    在这种情况下,为了安全性和展示效果,我们可能需要剔除文本中的HTML标签,使其变为纯文本格式。本示例("asp.net 剔除文本中的html标签 demo")就是针对这种情况提供的一种解决方案,适用于ASP.NET 3.5框架。 首先...

    好用清除html的jquery插件

    标签“清除html格式”是这个插件的核心特性,它可能包括移除HTML标签、属性、样式以及其他非文本内容。在处理用户生成的内容时,这可以防止XSS(跨站脚本攻击)和其他安全问题,同时确保内容在不同平台和设备上的...

    在Word中如何滤除HTML格式

    当你从网页上复制文本时,这些HTML标签也会一并被复制,导致Word文档中出现不必要的格式。 要滤除这些HTML格式,可以按照以下步骤操作: 1. 首先,找到你想在Word中使用的网页内容,并将其选中。 2. 使用快捷键`...

    Java 语言实现清除带 html 标签的内容方法

    在Java编程中,有时我们需要处理含有HTML标签的文本,例如从网页抓取的数据或用户输入包含HTML格式的内容。为了进一步处理这些数据,我们可能需要清除HTML标签,仅保留纯文本内容。以下是一个简单的Java方法,用于...

    去掉Html页中的标签代码

    标题中的“去掉Html页中的标签代码”指的是一个用于清除HTML文档中的标签,使其转化为纯文本的编程代码。这个过程在处理HTML内容时非常有用,例如当你需要从网页内容中提取纯文本信息,如用于搜索引擎优化(SEO)、...

    删除html标签.

    **HTML标签**是构成HTML文档的基本元素之一,它们定义了网页的内容结构。例如`&lt;p&gt;`表示段落,`&lt;a&gt;`表示链接等。在某些情况下,我们需要将带有HTML标签的字符串转换为纯文本,这就涉及到了“删除HTML标签”的操作。 ...

    HTML冗余代码清除.pdf

    2. **样式和类属性**(直接内联在标签中的`style`和`class`属性) 3. **注释和元数据**(HTML注释和`&lt;meta&gt;`标签等) 4. **空的段落标签**(如`&lt;p&gt;&lt;/p&gt;`) 5. **特殊标记**(如Word特有的`v:`属性) #### 三、清理...

    HTML5 清除浮动

    在CSS中,浮动(float)属性主要用于创建多列布局或让文本环绕图像。当一个元素被设置为浮动,它会脱离正常的文档流,向左或向右移动,直到碰到容器的边框或其他浮动元素。然而,这种浮动可能导致父元素的高度无法...

    HTML标签解释大全.doc

    `&lt;div&gt;`标签是最常用的HTML标签之一,用于分隔和组合文档中的部分。 ##### **36. dl** **说明:** 引起定义列表。`&lt;dl&gt;`标签用于创建定义列表,其中每个术语都有一个定义。 ##### **37. document** **说明:** ...

    去除html标签

    在去除HTML标签后,还需要进一步处理文本中的特殊字符,以确保文本的正确显示。在本例中,对 `和 `&gt;` 进行了转义,分别用 `&lt;` 和 `&gt;` 替换。这样做的原因是避免这些符号被浏览器误认为是HTML标签的一部分。 #...

    html清除缓存

    本文详细介绍了如何通过HTML文档中的`&lt;meta&gt;`标签来实现对浏览器缓存的控制,包括禁止缓存、必须验证等操作。通过对这些标签的应用,开发者可以更好地管理Web应用中的缓存行为,从而提高用户体验并减轻服务器压力。...

    Sql Server 如何去掉内容里面的Html标签

    在这个例子中,输入的HTML字符串是一个简单的HTML文档,包含一个`&lt;div&gt;`标签,经过函数处理后,HTML标签被去除,只保留了文本内容"哈哈哈"。 需要注意的是,这种方法虽然简单,但并不完美。对于复杂的HTML结构,...

    Struts标签- HTML标签

    在Struts中,HTML标签库是一个非常重要的部分,它提供了简化和增强HTML表单处理的能力。这些自定义标签帮助开发者更好地与Struts控制器层交互,减少代码量,并提高代码的可读性和可维护性。 1. **HTML标签库概述** ...

    java过滤html,css,js标签工具类(UnHtmlScript)

    1. **HTML标签去除**:这个工具类可能会提供一个方法,例如`removeHtmlTags(String content)`,用于删除HTML标签,只保留文本内容。这通常涉及到正则表达式,如`/*?&gt;/g`,来匹配并替换HTML标签。 2. **CSS去除**:...

    Struts 中 Html 标签库 的用法(第二组标签,与Form相关的标签 ).rar

    在Struts框架中,HTML标签库是用于创建动态HTML页面的重要工具,特别是对于与表单交互的部分。本资料主要讲解了Struts HTML标签库中的第二组标签,即与表单相关的标签。 1. `&lt;html:form&gt;`标签:这是Struts HTML标签...

    css+html+java 中英文帮助文档

    以上是关于CSS、HTML和Java的中英文帮助文档的主要知识点概述,每个主题都有深入学习的空间,这些知识是网页设计和开发的基础。通过学习和实践,可以掌握创建交互式、响应式的网页以及编写高效、稳定的后端程序的...

    易语言清除HTML标签源码-易语言

    这个压缩包文件中的"清除HTML标签源码"是一个易语言编写的程序,用于从HTML文本中提取纯文本,移除所有的HTML标签。这个功能在处理网页内容、数据抓取或数据分析时非常有用,因为原始的HTML代码包含了大量的结构标签...

Global site tag (gtag.js) - Google Analytics