`
minghe_zy
  • 浏览: 125920 次
  • 性别: Icon_minigender_1
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

清除html中多余代码

 
阅读更多

清理html代码中的多余代码

<script language="javascript">
<!--
function cleanWordHtml(html)
{
// Remove all SPAN tags
html = html.replace(/<\/?SPAN[^>]*>/gi, "");
// Remove Class attributes
html = html.replace(/<(\w[^>]*) class=([^ |>]*)([^>]*)/gi, "<$1$3") ;
// Remove Style attributes
html = html.replace(/<(\w[^>]*) style="([^"]*)"([^>]*)/gi, "<$1$3") ;
// Remove Lang attributes
html = html.replace(/<(\w[^>]*) lang=([^ |>]*)([^>]*)/gi, "<$1$3") ;
// Remove XML elements and declarations
html = html.replace(/<\\?\?xml[^>]*>/gi, "") ;
// Remove Tags with XML namespace declarations: <o:p></o:p>
html = html.replace(/<\/?\w+:[^>]*>/gi, "") ;
// Replace the &nbsp;
html = html.replace(/&nbsp;/, " " );
// Transform <P> to <DIV>
var re = new RegExp("(<P)([^>]*>.*?)(<\/P>)","gi") ; // Different because of a IE 5.0 error
html = html.replace( re, "<div$2</div>");
return html;
}
//-->
</script>
<p align="center">
清理前HTML代码:<br />
<textarea name="BeforeClean" rows="11" cols="55"><P>test</P>
<P>&nbsp;
<TABLE class=MsoNormalTable style="BORDER-RIGHT: medium none; BORDER-TOP: medium none; MARGIN-LEFT: 6.75pt; BORDER-LEFT: medium none; MARGIN-RIGHT: 6.75pt; BORDER-BOTTOM: medium none; BORDER-COLLAPSE: collapse; mso-border-alt: solid windowtext .5pt; mso-table-lspace: 9.0pt; mso-table-rspace: 9.0pt; mso-table-anchor-vertical: paragraph; mso-table-anchor-horizontal: column; mso-table-left: -21.6pt; mso-table-top: 76.05pt; mso-padding-alt: 0cm 5.4pt 0cm 5.4pt; mso-border-insideh: .5pt solid windowtext; mso-border-insidev: .5pt solid windowtext" cellSpacing=0 cellPadding=0 align=left border=1>
<TBODY>
<TR style="HEIGHT: 46pt; mso-yfti-irow: 0; mso-yfti-firstrow: yes">
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: windowtext 1pt solid; WIDTH: 144pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt" vAlign=top width=192>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">aaaaaaaa<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 99pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt" vAlign=top width=132>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">bbbbbbbbbb<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: windowtext 1pt solid; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 135pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt" vAlign=top width=180>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">cccccccccc<o:p></o:p></SPAN></P></TD></TR>
<TR style="HEIGHT: 46pt; mso-yfti-irow: 1; mso-yfti-lastrow: yes">
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: windowtext 1pt solid; WIDTH: 144pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=192>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">dddddddddd<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 99pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=132>
<P class=MsoNormal style="mso-element: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">eeeeeeeeee<o:p></o:p></SPAN></P></TD>
<TD style="BORDER-RIGHT: windowtext 1pt solid; PADDING-RIGHT: 5.4pt; BORDER-TOP: medium none; PADDING-LEFT: 5.4pt; PADDING-BOTTOM: 0cm; BORDER-LEFT: medium none; WIDTH: 135pt; PADDING-TOP: 0cm; BORDER-BOTTOM: windowtext 1pt solid; HEIGHT: 46pt; mso-border-alt: solid windowtext .5pt; mso-border-left-alt: solid windowtext .5pt; mso-border-top-alt: solid windowtext .5pt" vAlign=top width=180>
<P class=MsoNormal style="mso-elem:)ent: frame; mso-element-frame-hspace: 9.0pt; mso-element-wrap: around; mso-element-anchor-vertical: paragraph; mso-element-anchor-horizontal: column; mso-element-left: -21.55pt; mso-element-top: 76.05pt; mso-height-rule: exactly"><SPAN lang=EN-US style="FONT-SIZE: 14pt">fffffffffff<o:p></o:p></SPAN></P></TD></TR></TBODY></TABLE></P></textarea><br />
清理后HTML代码:<br />
<textarea name="AfterClean" rows="11" cols="55"></textarea><br /><br />
<input type="button" name="Clean" value="Clean" onclick="AfterClean.value=cleanWordHtml(BeforeClean.value);">
</p>

分享到:
评论

相关推荐

    星级评分JS-简洁美观干净已经去除多余代码

    总的来说,“星级评分JS-简洁美观干净已经去除多余代码”是一个实用的前端项目,它展示了如何用JavaScript和jQuery构建交互式组件。理解并掌握这种技术,将有助于提升网站或应用的用户体验,同时也能锻炼开发者对...

    C# 去除所有HTML代码

    主要通过正则表达式替换的方式来实现去除HTML标签及特殊字符实体的功能。 ### 函数内部实现步骤分析 1. **去除HTML标签**: - 使用正则表达式`@"&lt;(.[^&gt;]*)&gt;"`来匹配所有的HTML标签,并用空字符串替换,达到去除...

    HTML冗余代码清除.pdf

    ### HTML冗余代码清除知识点详解 #### 一、概述 在网页开发中,经常会遇到从Microsoft Word等富文本编辑器复制粘贴HTML内容到网页编辑器的情况。由于Word生成的HTML代码通常包含大量冗余标签和属性,这些冗余代码...

    html全屏控制控件-简洁干净已经去除多余代码

    在本项目中,我们聚焦的是一款经过优化、简洁且已去除多余代码的全屏控件,适用于JavaScript和HTML环境。这个控件的设计目标是提供高效、轻量级的全屏解决方案,同时保持代码的可读性和可维护性。 首先,全屏控制...

    清除字符串中的html标记

    - **内容检索**:在进行文本搜索时,去除HTML标记有助于提高搜索结果的准确性。 通过以上步骤,我们可以有效地清除字符串中的HTML标记,使得文本更易于管理和展示。这种方法不仅适用于ASP.NET环境,还可以根据需要...

    慧聪网上下滑动门不含多余代码

    【描述】"慧聪网上下滑动门 从慧聪网拷贝下来 不含多余代码"表明这是一个从慧聪网提取的滑动门效果实例,且经过了精简处理,去除了不必要的代码。慧聪网可能是一个企业或产品的展示平台,而这个下拉滑动门可能是该...

    多余css清除工具 1.1版本

    仿站利器,下载目标网站的时候,会附加很多多余的css样式,影响加载,或者再优化页面的时候,对css样式进行精简,去除多余css样式,删除多余css代码,可以参考使用本工具 注:此工具不对原有css样式进行压缩优化,...

    多余css清除工具【仿站利器】

    8. **持续集成与自动化**:为了保持代码的整洁,开发者可以将多余CSS清除工具集成到持续集成(CI)/持续部署(CD)流程中,每次代码提交时自动运行优化。 9. **使用场景**:仿站过程中,由于需要快速复制目标网站的...

    php过滤危险html代码

    - **目的**:去除字符串中的多余空白字符,如空格、制表符、换行符等。 - **正则表达式**:`/\s+/` - **替换方式**:将匹配到的空白字符替换为一个空格字符 `" "`。 - **应用场景**:在处理文本时,有时候用户可能会...

    HTML压缩代码--用VB编写,可以把HTML文件尺寸减小

    - **删除空白字符**:通过正则表达式或其他字符串处理方式,删除HTML源码中的空格、制表符和多余的换行符。 - **压缩注释**:移除非必要的注释,保留可能对代码运行有影响的注释。 - **优化标签**:简化HTML标签...

    去掉网页中多余的滚动条

    ### 去掉网页中多余的滚动条 ...综上所述,去除网页中多余的滚动条主要通过修改HTML、CSS或JavaScript来实现。具体采用哪种方式取决于项目需求和个人喜好。希望本文能够帮助到遇到类似问题的开发者们。

    html dom修改代码

    因此,如果你想去除HTML元素内的所有空行,可以使用`innerText`,然后再设置回去,这样可以清除多余的换行符: ```javascript var elements = document.querySelectorAll('*'); for (var i = 0; i ; i++) { ...

    HTMLCleaner(HTML代码优化工具)V1.0官方英文免费版

    HTMLCleaner通过智能分析和处理,能有效地去除这些无用信息,使HTML代码更加整洁、规范,符合W3C标准。 HTML Cleaner的主要功能包括: 1. **清理空格**:自动删除多余的空格,使得代码紧凑,减少文件大小。 2. **...

    C#实现压缩HTML代码的方法

    接下来,使用正则表达式`\\n+\\s+`匹配并替换所有的连续换行符和空格,最后通过`Trim()`方法去除字符串首尾的多余空格,并将压缩后的HTML写入到原始的`HtmlTextWriter`对象`writer`中。 除了压缩HTML代码,还可以...

    asp 去除HTML

    本文将详细解析如何利用正则表达式在ASP中去除HTML标签,并对给定的代码片段进行深入分析。 ### ASP去除HTML标签的原理 在ASP中,去除HTML标签主要依赖于正则表达式的强大功能。正则表达式是一种用于匹配字符串中...

    csdn代码高亮显示源码

    - **预处理代码**:将原始代码按照特定的格式或规则进行处理,例如去除多余空白、添加行号或者处理特殊字符。 - **应用样式**:利用CSS为不同的编程元素定义样式,如关键字、注释和字符串的颜色和字体样式。 - **...

    FCK去掉多余标签,统一前台样式

    在提供的文件"统一前台样式,FCK去掉WORD粘贴多余HTML标签.txt"中,可能包含了具体的实现步骤、代码示例或者配置方法,以帮助开发者完成上述任务。例如,它可能包含如何配置FCKeditor的`config.allowedTags`和`...

    asp去除html的函数代码分析附实例说明

    为了确保数据安全和页面格式正确,我们需要清除或去除HTML标签。这里我们将详细分析两个不同的ASP函数,它们用于实现这个功能。 首先,我们来看第一个函数 `nohtml`: ```vbscript function nohtml(str) dim re ...

    html登陆界面源码

    扁平设计是现代网页设计趋势,它强调去除多余的装饰效果,使设计更加简洁明了。在这个登录界面中,扁平设计体现在颜色选择、边框处理以及简洁的图标使用上。 接下来,摇晃特效通常是通过CSS(Cascading Style ...

Global site tag (gtag.js) - Google Analytics