正则:
查找Img标签开头的图片路径
[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?<ref_value>.*?(\.gif|\.jpg|\.png))
查找Function中的图片路径
[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?<ref_value>[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)
查找background标签的图片路径
background="(?<ref_value>[^"]+)
查找URL的图片路径
:[\s]*url[\s]*\([\s"']*(?<ref_value>["']*[^)]+)
通用的:
("|')(?<ref_value>[^"']+?(\.gif|\.png|\.jpg))("|')
url\(['\"]?\s*(?<ref_value>[^>]+?)['\"]?\s*\)
Cimg[\d+]*[\s]*\([\s"']*(?<ref_value>[^"')]+)
private IList<string> MatchImgPath(string content, string regexPattern)
{
IList<string> _ret = new List<string>();
Regex reg = new Regex(regexPattern);
string _imgPath = "";
MatchCollection mc = reg.Matches(content);
if (mc != null && mc.Count > 0)
{
foreach (Match match in mc)
{
if (match.Success == false || match.Value == null || match.Value == "")
continue;
foreach (string name in reg.GetGroupNames())
{
if (name == null || name == "" || name == "0")
continue;
if (name == "ref_value"
&& match.Groups[name].Value != null
&& match.Groups[name].Value != "")
{
_imgPath = match.Groups[name].Value;
if(!_ret.Contains(_imgPath.ToLower()))
_ret.Add(_imgPath.ToLower());
}
}
}
}
return _ret;
}
分享到:
相关推荐
在本场景中,我们关注的是如何利用正则表达式从HTML文档中提取`<img>`标签内的`src`属性,即图片链接地址。这在网页抓取、数据挖掘或内容分析等任务中非常常见。 首先,我们需要了解HTML的基本结构。HTML...
对于提取 HTML 中的图片路径,我们需要设计一个能够匹配 `<img>` 标签并捕获 `src` 属性值的正则表达式。 #### 示例代码分析 下面的示例展示了两种不同的方法来从 HTML 字符串中提取图片路径: ##### 方法一:`...
本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...
总之,使用JavaScript的正则表达式和`replace()`方法,我们可以方便地查找和替换HTML字符串中的img标签src属性。理解正则表达式的语法和`replace()`方法的工作原理对于进行此类操作至关重要。在实际开发中,根据需求...
以上内容向我们展示了在PHP中使用正则表达式匹配和操作<img>标签中属性的多种方法。掌握这些技巧,可以大大提高处理网页内容时的效率和准确性。对于经常需要进行类似操作的开发者来说,这些正则表达式的使用方法非常...
然后,定义了一个正则表达式`Pattern`,用于匹配`<img>`标签。正则表达式如下: ```java "<img\\s[^>]*\\bsrc\\s*=\\s*(['\"])?([^'/\"\\n\\r\\f>]+(\\.jpg|\\.bmp|\\.eps|\\.gif|\\.mif|\\.miff|\\.png|\\.tif|\\....
方法内部使用正则表达式搜索匹配的图片标签,并将捕获到的图片地址存储在数组`sUrlList`中。 需要注意的是,正则表达式虽然强大,但并不是处理HTML文档的最佳工具。HTML的结构复杂多变,而正则表达式只能提供线性...
首先,获取富文本中的第一张图片URL的思路是利用正则表达式匹配HTML中`<img>`标签的`src`属性,这需要一定的正则表达式基础和对HTML标签结构的了解。在HTML中,`<img>`标签用于定义图像,并且通常包含`src`属性来...
通过使用Java语言,可以使用正则表达式来匹配HTML文本中的img标签,并提取其下的src属性的内容。下面是一种常见的实现方式: 首先,使用Pattern类和Matcher类来编译正则表达式并匹配HTML文本。正则表达式 `<img.*...
在ASP.NET开发中,正则表达式的使用非常广泛,可以帮助开发者实现复杂的文本处理任务。本文将详细介绍几个在ASP.NET中常用的正则表达式及其应用场景。 #### 图片链接匹配 ```regex <img src[^>]*[^/].(?:jpg|bmp|...
- `<img src="(.*).gif"`:用于匹配HTML中的`<img>`标签,并提取出`.gif`图片的源路径。 通过以上解析,我们可以看到正则表达式的强大之处在于其灵活的匹配规则和丰富的语法结构,使得开发者能够高效地处理各种文本...
在VB中,我们可以通过引入`Microsoft VBScript Regular Expressions 5.5`库来使用正则表达式。以下代码展示了如何查找并提取HTML中的`<img>`标签的`src`属性,这些属性通常包含了图片链接: ```vb Dim regEx As ...
在这个场景下,我们讨论的是如何使用正则表达式来处理HTML中的`img`标签,特别是提取或修改其属性,如`src`、`width`和`height`等。 首先,我们关注的是如何提取`img`标签中的属性。例如,如果我们有一个包含HTML...
要实现正则表达式的匹配,首先需要定义一个正则表达式规则,该规则能够匹配到所有符合标准的<img>标签,并且能够从中提取出图片的路径。在本例中,我们希望匹配的规则如下: - 匹配<img>标签的开始部分; - 忽略...
在给定的文件内容中提到了多种正则表达式的模式及应用场景,下面将逐一进行详细解读: 1. **验证用户名**:“`^[a-zA-Z]\w{5,15}$`”:此正则表达式用于验证一个用户名是否合法。具体规则是:以字母开头,后跟5到15...
这个正则表达式可以准确地匹配`<img>`标签中的`src`属性,并将其值捕获到名为`p`的组中。 #### C#代码实现 接下来,我们详细分析提供的C#代码实现。 1. **初始化正则表达式**:`Regex reg = new Regex(regStr, ...
3. **提取包含图片地址的标签**:使用两种不同的正则表达式模式来匹配`<img>`标签,并从中提取出图片地址。 4. **整理并返回结果**:将提取到的所有图片地址存入数组中,并最终返回。 ### 代码解析 1. **初始化变量...
在本篇文档中,作者演示了如何使用PHP的正则表达式功能来提取HTML中的<img>标签的src属性值以及其他属性,如width和height。通过这种方式,开发者可以在处理HTML内容时,快速定位到需要的信息。 首先,文档提出一个...
复制代码 代码如下:<?php /* author: ssh_kobe date: 20110602 shortage: 如果网页中的图片路径不是绝对路径,就... /*利用正则表达式得到图片链接*/ $pattern_src = ‘/<[img|IMG].*?src=[\’|\”](.*?(?:[\.