`
endual
  • 浏览: 3558288 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

获取指定标签的指定属性的正则表达式

 
阅读更多

获取指定标签的指定属性的正则表达式

 33人阅读 评论(0) 收藏 举报
获取指定标签的指定属性的正则表达式

(?<=<(?:XXXXX)[^>]*(?<start>(?:xxxxx)(?:/s*=/s*(?<end>["']?))))(?:[^/s"'>]*) 
这个是获取指定标签的指定属性的表达式 

其中 
XXXXX就是指定的标签 如果有多个(?:XXXXX|XXXXX|XXXXX) 
xxxxx就是指定的属性 如果有多个(?:xxxxx|xxxxx|xxxxx) 
group("start") 是属性的前缀 (xxxxx=") 其中xxxxx是你的属性 后面可以忽略"="号前后的空格 并且能够区分包围属性值的 双引号 单引号 或 空 
group("end") 是包围属性值的 双引号 单引号 或 空 

以上无法分析你的图片类型如果需要分辨图片类型 则在上面表达式后面加上下面的表达式

 

说多了怕你不懂给你个实际点的表达式 
(?<=<(?:img)[^>]*(?<start>(?:src)(?:/s*=/s*(?<end>["']?))))(?:[^/s"'>]*)/.(?:jpg|gif|jpeg|bmp|png) 

测试: 
<IMG src= '/eicms/wwwroot/resources/12/2006101207263154.jpg' border=0><IMG src ="/eicms/wwwroot/resources/1/20061012023459298.jpg" border=0> 

match到2个分别是 
/eicms/wwwroot/resources/12/2006101207263154.jpg 
组"start" 为 (src= ') 
组"end" 为 (') 
/eicms/wwwroot/resources/1/20061012023459298.jpg 
组"start" 为 (src =") 
组"end" 为 (") 

如果你不需要里面的2个组 可以用这个表达式 
(?<=<(?:img)[^>]*(?:(?:src)(?:/s*=/s*(?:["']?))))(?:[^/s"'>]*)/.(?:jpg|gif|jpeg|bmp|png)   

 

分享到:
评论

相关推荐

    Java使用正则表达式提取XML节点内容的方法示例

    Java使用正则表达式提取XML节点内容的方法示例 Java使用正则表达式提取XML节点内容的方法示例主要介绍了Java使用正则表达式提取XML节点内容的方法,结合具体实例形式分析了java针对xml格式字符串的正则匹配相关操作...

    Java基于正则表达式获取指定HTML标签指定属性值的方法

    本文将详细介绍如何使用Java基于正则表达式获取指定HTML标签的指定属性值。这个方法适用于那些不想引入额外HTML解析库,而是希望通过简洁的代码实现这一功能的开发者。 首先,我们要理解HTML标签的基本结构。一个...

    java正则表达式获取指定HTML标签的指定属性值且替换的方法

    下面小编就为大家带来一篇java正则表达式获取指定HTML标签的指定属性值且替换的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

    经典JavaScript正则表达式实战

    正则表达式还支持判断标签是否闭合,提取指定标签的内容,判断是否为数字与字母的混合,以及同时匹配空格和英文字符。 文本处理方面,正则表达式可以用来高亮显示指定文字,删除标签,替换变量,替换文本中的URL为...

    EXCEL-VBA-正则表达式-从实例开始.docx

    - **MatchCollection**:存储所有匹配结果的对象,是一个集合,有两个只读属性:`Count`(匹配到的对象的数目)和`Item`(集合的通用方法,需要传入索引值获取指定的元素)。 - **Match**:匹配结果的具体对象,有几...

    正则表达式提取网页编码

    在网页中,编码信息通常位于`&lt;meta&gt;`标签内,通过`charset`属性指定。例如,在以下HTML代码片段中: ```html ;charset=utf-8"/&gt; ``` `utf-8`即为网页的字符编码方式。为了从中提取编码信息,我们可以使用正则...

    C#.Net使用正则表达式抓取百度百家文章列表

    - 正则表达式虽然强大,但过于复杂的HTML结构可能需要更强大的解析库,如HtmlAgilityPack或AngleSharp,以应对嵌套标签和属性等问题。 - 针对动态加载的内容,可能需要模拟浏览器行为,如使用Selenium WebDriver。...

    Javascript正则表达式

    正则表达式对象拥有多种属性和方法,用于控制其行为以及获取匹配结果的信息。这些属性包括: - `input`: 输入字符串。 - `multiline`: 指定多行模式。 - `lastMatch`: 最近一次匹配的完整内容。 - `lastParen`: ...

    delphi正则表达式控件

    VBScriptRegex可能是将VBScript的正则表达式对象模型转换为Delphi组件的形式,使得Delphi开发者可以像使用其他控件一样,通过属性、方法和事件来操作正则表达式。 1. **正则表达式基础概念**: - 正则表达式由一...

    用C#正则表达式实现的百度体育新闻的抓取

    你可以通过设置HttpWebRequest的URL属性来指定百度体育新闻的页面地址,然后使用GetResponse方法获取网页内容。 接下来,将网页内容解析为字符串后,正则表达式就派上用场了。在C#中,你可以使用`System.Text....

    .NET获取Html字符串中指定标签的指定属性的值

    ### .NET 获取 HTML 字符串中指定标签的指定属性的值 在.NET框架下,有时候我们需要从HTML字符串中提取特定的信息。例如,我们可能需要从一个包含多个`&lt;img&gt;`或`&lt;a&gt;`标签的HTML字符串中提取出`src`或`href`属性的值...

    Java正则表达式如何匹配特定html标签内的内容

    需要注意的是,正则表达式匹配HTML内容可能存在一些问题,例如HTML标签属性的复杂性、标签嵌套、标签属性值内可能包含尖括号等问题可能会导致正则表达式的匹配结果不准确。因此,当处理复杂的HTML文档时,使用专门的...

    利用正则表达式奇虎论坛抓取

    在IT领域,正则表达式(Regular Expression)是一种强大的文本处理工具,用于匹配、查找、替换等操作。它由特定的字符序列组成,能够高效地处理字符串中的模式匹配问题。在本例中,“利用正则表达式奇虎论坛抓取”...

    超好的资料,正则表达式.doc

    - **设置模式**:通过 `Pattern` 属性设置正则表达式的模式。 - **设置选项**:可以设置 `IgnoreCase` 和 `Global` 等属性来控制匹配的范围和方式。 ##### 2.2 示例代码分析 ```vb Function RegExpTest(patrn, ...

    正则表达式的入门

    正则表达式是一种强大的文本处理工具,用于匹配、查找、替换和分析字符串。在Java编程中,正则表达式被广泛应用于数据验证、文本提取等多个场景。正则表达式的基本语法包括字符集、重复、选择、分组以及位置匹配等...

    javascript 获取url参数的正则表达式(用来获取某个参数值)

    总结,利用正则表达式和JavaScript的字符串方法,我们可以轻松地从URL中获取指定参数的值。这种方法适用于简单的URL处理,但对于更复杂的URL,可能需要使用更高级的解析库,如`URLSearchParams` API(在现代浏览器中...

Global site tag (gtag.js) - Google Analytics