`

通用 HTML 标签区配正则

 
阅读更多

通用 HTML 标签区配正则,拿来做一些分析工具还是不错滴。

 

var str = "<br /><br/><br><br ><中文><div><div id=a>无忧脚本<img src=\"http://bbs.51js.com/images/default/logo.gif\" width=\"191\" height='75' border=0 onload=\"if(testver>0 && testver<500)alert('test');\" \n onerror='alert(\"test\")' /><img src=xxx alt=\"hello\njust a test!\"></div><hr ><script type=\"test/javascript\" defer>alert(\"just a test!\");<\/script>Hello.<input type=text value=\"无忧脚本\"><br / ><img \"\" ></ ><!-- 注释 -->< ucren><!-- 再<注>释 --><img alt=' title='\"' /><b>123</b>1<2<3,3<4>1<b><img src=\"http://bbs.51js.com/images/old51js/logo.gif\" /><!-- 三注释>>> -->";

    var reg = /<(?:(?:\/?[A-Za-z]\w*\b(?:[=\s](['"]?)[\s\S]*?\1)*)|(?:!--[\s\S]*?--))\/?>/g;

    alert(str.match(reg).join("\n----------------------------------------------------\n"));

 

分享到:
评论

相关推荐

    js 正则匹配(去掉html标签)

    ### js正则匹配(去掉HTML标签) 在网页开发与数据处理过程中,经常需要对含有HTML标签的文本进行清洗,以提取纯文本内容。利用JavaScript的正则表达式功能可以高效地实现这一目标。本文将详细介绍如何使用正则...

    C#正则表达式集合C# 正则表达式 集合C# 正则表达式 集合C# 正则表达式 集合

    - `&lt;(.*)&gt;.*|&lt;(.*)\/&gt;`: 这个表达式用于匹配HTML标签。其中`&lt;(.*)&gt;`捕获开始标签的内容,`&lt;\/\1&gt;`确保结束标签与开始标签相匹配,而`&lt;(.*)\/&gt;`则用于匹配自闭合标签。 #### 空白字符 - `(^\s*)|(\s*$)`: 这个...

    PHP常用正则表达式汇总

    - **"&lt;(.*)&gt;.*|&lt;(.*)\/&gt;"**:验证HTML标签格式。 - **"(^\s*)|(\s*$)"**:匹配字符串首尾的空白字符。 #### 7. 正则特殊符号 - **"^"**:匹配输入字符串的起始位置。 - **"$"**:匹配输入字符串的结束位置。 - **...

    Java/Js下使用正则表达式匹配嵌套Html标签

    以前写过一篇文章讲解如何使用正则表达式完美解决Html嵌套标签的匹配问题(使用正则表达式匹配嵌套Html标签),但是里头用到了平衡组这样的高级特性,貌似只有DotNet还有Perl正则引擎支持,因此通用性不高。

    数字正则表达式汇总数字正则表达式汇总

    /&gt;`:用于移除HTML标签。 - `^\s*|\s*$`:用于去除字符串首尾的空白字符。 #### 用户名验证 - `^[a-zA-Z][a-zA-Z0-9_]{4,15}$`:验证用户名格式,首字符必须是字母,长度5-16个字符,允许字母、数字和下划线。 ##...

    常用正则表达式的写法

    - `/&lt;(.*)&gt;.*|&lt;(.*) \/&gt;/`:用于查找HTML标签,包括自闭合标签。 8. **空格和空行**: - `\n[\s| ]*\r`:匹配空行,包括换行符和前后可能存在的空格。 - `(^\s*)|(\s*$)`:匹配字符串开头或结尾的空格。 9. **...

    JSP判断移动设备的正则

    - JSP中使用`&lt;%...%&gt;`标签执行Java代码,而HTML代码则在`&lt;html&gt;`标签内。例如,`&lt;%=basePath%&gt;`会插入之前计算的基路径到HTML中。 6. **过滤器(Filter)**: - 提到的过滤器可以作为另一种实现方式,它可以在...

    PHP正则表达式抓取某个标签的特定属性值的方法

    php正则学了一些日子,抓了一些网站的数据,从而发现每次都自己写正则重新抓很麻烦,于是就想写一个抓取特定标签具有特定属性值的接口通用,直接上代码。 //$html-被查找的字符串 $tag-被查找的标签 $attr-被查找的...

    Java 常用正则表达式

    22. `&lt;(.*)&gt;.*|&lt;(.*) \/&gt;`:这个正则表达式用于匹配HTML标签。 23. `(^\s*)|(\s*$)`:用于匹配字符串中的首尾空格。 24. `\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*`:再次验证电子邮件地址的格式。 25. `^[a...

    EXCEL-VBA-正则表达式-从实例开始.docx

    虽然这个正则表达式只能匹配部分HTML标签,但对于简单场景已足够使用。 - **匹配首尾空白**:`^\s+|\s+$`。可用于去除字符串首尾的空白字符。 #### 四、总结 在Excel VBA中,正则表达式是一个非常强大的工具,能够...

    .NET获取Html字符串中指定标签的指定属性的值

    ### .NET 获取 HTML 字符串中指定标签的指定属性的值 ...正则表达式的灵活性使得这种提取方式变得非常强大和通用。在实际项目中,根据不同的需求调整正则表达式,可以应对各种复杂的HTML文档处理场景。

    常用正则表达式

    匹配HTML标签 **正则表达式**: `&lt;(.*)&gt;.*|&lt;(.*)\/&gt;` **解释**:此正则表达式用于匹配HTML文档中的标签。`&lt;(.*)&gt;`表示开始标签,`&lt;\/\1&gt;`表示结束标签,其中`\1`表示引用开始标签中的内容;`&lt;(.*)\/&gt;`表示自闭合...

    常用正则表达式大全(.doc)

    正则表达式是一种强大的文本处理工具,用于模式匹配和数据提取。给定的文档提供了多种常用的正则表达式,下面将详细解析这些表达式的功能和应用场景。 ### 非负整数与正整数 - **非负整数**:`^\d+$`。这个表达式...

    php去除html标签

    - **简化正则表达式**:可以通过编写更通用的正则表达式来减少重复代码,例如使用`/&lt;[a-zA-Z]+[^&gt;]*&gt;/i`来匹配大多数HTML标签。 - **性能考虑**:如果需要处理大量或非常大的字符串,可以考虑使用其他方法(如DOM...

    正则表达式使用详解

    - **跨平台性**:正则表达式的概念已被多种语言和系统采纳,成为一种通用的技术。 - **实际用途**:例如,在网页表单提交时验证用户的邮箱地址格式是否正确。 #### 三、基本语法 - **基本形式**:`/pattern/`,其中...

    正则表达式大奉献,欢迎下载

    例如,在网页抓取中,可以使用正则表达式提取特定的HTML标签;在表单验证中,可以设置正则表达式来确保用户输入符合要求。 总之,"正则表达式大奉献"教程将引领你探索这个强大工具的世界,通过学习,你将能够编写出...

    jQuery源码分析-02正则表达式

    jQuery内部使用了许多正则表达式来实现其功能,比如用于匹配HTML标签名、属性值等。理解这些正则表达式有助于深入理解jQuery的工作原理。例如,jQuery可能会使用正则表达式来解析CSS选择器或处理DOM元素的属性。 ...

    正则表达式

    通过上述总结,我们可以看到正则表达式的强大之处在于其灵活性和通用性,适用于多种应用场景,从简单的字符串验证到复杂的文本处理。掌握了这些常用的正则表达式,就能在日常开发工作中更加高效地解决问题。

    正则表达式学习教程之回溯引用backreference详解

    在使用Java进行实现时,需要注意Java的正则表达式用法是否与通用的正则表达式语法一致。本文提到的例子已经在JDK1.6.0_13环境下测试通过,这意味着它兼容Java的特定规则。在Java中,正则表达式使用java.util.regex...

    Python 正则表达式爬虫使用案例解析

    文中指出,html.decode("gbk")的方法并不是通用的,具体使用哪种编码解码方法取决于网页的实际编码方式。因此在实际开发中需要根据目标网站的编码类型选择合适的解码方法。 以上内容涵盖了使用Python正则表达式...

Global site tag (gtag.js) - Google Analytics