`
xllily
  • 浏览: 121552 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

怎么用正则表达式获取文章内容中的<img标签和 src的路径

阅读更多

正则:

查找Img标签开头的图片路径
[iI][mM][gG][\s]*[sS][rR][cC][\s]*=[\s'"]*(?<ref_value>.*?(\.gif|\.jpg|\.png))

查找Function中的图片路径
[a-zA-Z_][a-zA-Z0-9_]+[\s]*\([^)]+?('|")(?<ref_value>[a-zA-Z0-9/\\-_\.]+?(\.gif|\.jpg|\.png))('|")[^)]*\)

查找background标签的图片路径
background="(?<ref_value>[^"]+)

查找URL的图片路径
:[\s]*url[\s]*\([\s"']*(?<ref_value>["']*[^)]+)

通用的:
("|')(?<ref_value>[^"']+?(\.gif|\.png|\.jpg))("|')


url\(['\"]?\s*(?<ref_value>[^>]+?)['\"]?\s*\)
Cimg[\d+]*[\s]*\([\s"']*(?<ref_value>[^"')]+)

 

 

private IList<string> MatchImgPath(string content, string regexPattern)
  {
  IList<string> _ret = new List<string>();
  Regex reg = new Regex(regexPattern);
  string _imgPath = "";
  MatchCollection mc = reg.Matches(content);
  if (mc != null && mc.Count > 0)
  {
  foreach (Match match in mc)
  {
  if (match.Success == false || match.Value == null || match.Value == "")
  continue;

  foreach (string name in reg.GetGroupNames())
  {
  if (name == null || name == "" || name == "0")
  continue;

  if (name == "ref_value"
  && match.Groups[name].Value != null
  && match.Groups[name].Value != "")
  {
  _imgPath = match.Groups[name].Value;
  if(!_ret.Contains(_imgPath.ToLower()))
  _ret.Add(_imgPath.ToLower());
  }
  }
  }
  }
  return _ret;
  }

0
0
分享到:
评论

相关推荐

    正则获取html中的 <img src = 图片地址

    在本场景中,我们关注的是如何利用正则表达式从HTML文档中提取`&lt;img&gt;`标签内的`src`属性,即图片链接地址。这在网页抓取、数据挖掘或内容分析等任务中非常常见。 首先,我们需要了解HTML的基本结构。HTML...

    asp.net利用正则在HTML中提取图片路径(asp.net正则表达式过滤出HTML代码中图片路径).txt

    对于提取 HTML 中的图片路径,我们需要设计一个能够匹配 `&lt;img&gt;` 标签并捕获 `src` 属性值的正则表达式。 #### 示例代码分析 下面的示例展示了两种不同的方法来从 HTML 字符串中提取图片路径: ##### 方法一:`...

    正则表达式提取图片

    本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...

    JavaScript正则表达式替换字符串中图片地址(img src)的方法

    总之,使用JavaScript的正则表达式和`replace()`方法,我们可以方便地查找和替换HTML字符串中的img标签src属性。理解正则表达式的语法和`replace()`方法的工作原理对于进行此类操作至关重要。在实际开发中,根据需求...

    php正则表达式匹配img中任意属性的方法

    以上内容向我们展示了在PHP中使用正则表达式匹配和操作&lt;img&gt;标签中属性的多种方法。掌握这些技巧,可以大大提高处理网页内容时的效率和准确性。对于经常需要进行类似操作的开发者来说,这些正则表达式的使用方法非常...

    Java中使用正则表达式获取网页中所有图片的路径

    然后,定义了一个正则表达式`Pattern`,用于匹配`&lt;img&gt;`标签。正则表达式如下: ```java "&lt;img\\s[^&gt;]*\\bsrc\\s*=\\s*(['\"])?([^'/\"\\n\\r\\f&gt;]+(\\.jpg|\\.bmp|\\.eps|\\.gif|\\.mif|\\.miff|\\.png|\\.tif|\\....

    C#正则表达式匹配HTML中的图片路径,图片地址代码

    方法内部使用正则表达式搜索匹配的图片标签,并将捕获到的图片地址存储在数组`sUrlList`中。 需要注意的是,正则表达式虽然强大,但并不是处理HTML文档的最佳工具。HTML的结构复杂多变,而正则表达式只能提供线性...

    js获取富文本中的第一张图片(正则表达式)

    首先,获取富文本中的第一张图片URL的思路是利用正则表达式匹配HTML中`&lt;img&gt;`标签的`src`属性,这需要一定的正则表达式基础和对HTML标签结构的了解。在HTML中,`&lt;img&gt;`标签用于定义图像,并且通常包含`src`属性来...

    Java 获取Html文本中的img标签下src中的内容方法

    通过使用Java语言,可以使用正则表达式来匹配HTML文本中的img标签,并提取其下的src属性的内容。下面是一种常见的实现方式: 首先,使用Pattern类和Matcher类来编译正则表达式并匹配HTML文本。正则表达式 `&lt;img.*...

    ASP.NET 正则表达式

    在ASP.NET开发中,正则表达式的使用非常广泛,可以帮助开发者实现复杂的文本处理任务。本文将详细介绍几个在ASP.NET中常用的正则表达式及其应用场景。 #### 图片链接匹配 ```regex &lt;img src[^&gt;]*[^/].(?:jpg|bmp|...

    PHP正则表达式基础知识

    - `&lt;img src="(.*).gif"`:用于匹配HTML中的`&lt;img&gt;`标签,并提取出`.gif`图片的源路径。 通过以上解析,我们可以看到正则表达式的强大之处在于其灵活的匹配规则和丰富的语法结构,使得开发者能够高效地处理各种文本...

    下载网页源码并用正则表达式提取图片vb

    在VB中,我们可以通过引入`Microsoft VBScript Regular Expressions 5.5`库来使用正则表达式。以下代码展示了如何查找并提取HTML中的`&lt;img&gt;`标签的`src`属性,这些属性通常包含了图片链接: ```vb Dim regEx As ...

    php正则取img标记中任意属性(正则替换去掉或改变图片img标记中的任意属性)

    在这个场景下,我们讨论的是如何使用正则表达式来处理HTML中的`img`标签,特别是提取或修改其属性,如`src`、`width`和`height`等。 首先,我们关注的是如何提取`img`标签中的属性。例如,如果我们有一个包含HTML...

    正则表达式提取图片路径 并过滤掉指定字符的写法

    要实现正则表达式的匹配,首先需要定义一个正则表达式规则,该规则能够匹配到所有符合标准的&lt;img&gt;标签,并且能够从中提取出图片的路径。在本例中,我们希望匹配的规则如下: - 匹配&lt;img&gt;标签的开始部分; - 忽略...

    简单并常用的正则表达式

    在给定的文件内容中提到了多种正则表达式的模式及应用场景,下面将逐一进行详细解读: 1. **验证用户名**:“`^[a-zA-Z]\w{5,15}$`”:此正则表达式用于验证一个用户名是否合法。具体规则是:以字母开头,后跟5到15...

    获取字符串中所有图片的路径

    这个正则表达式可以准确地匹配`&lt;img&gt;`标签中的`src`属性,并将其值捕获到名为`p`的组中。 #### C#代码实现 接下来,我们详细分析提供的C#代码实现。 1. **初始化正则表达式**:`Regex reg = new Regex(regStr, ...

    asp正则获取html文件图片地址

    3. **提取包含图片地址的标签**:使用两种不同的正则表达式模式来匹配`&lt;img&gt;`标签,并从中提取出图片地址。 4. **整理并返回结果**:将提取到的所有图片地址存入数组中,并最终返回。 ### 代码解析 1. **初始化变量...

    php正则提取html图片(img)src地址与任意属性的方法

    在本篇文档中,作者演示了如何使用PHP的正则表达式功能来提取HTML中的&lt;img&gt;标签的src属性值以及其他属性,如width和height。通过这种方式,开发者可以在处理HTML内容时,快速定位到需要的信息。 首先,文档提出一个...

    PHP通过正则表达式下载图片到本地的实现代码

    复制代码 代码如下:&lt;?php /* author: ssh_kobe date: 20110602 shortage: 如果网页中的图片路径不是绝对路径,就... /*利用正则表达式得到图片链接*/ $pattern_src = ‘/&lt;[img|IMG].*?src=[\’|\”](.*?(?:[\.

Global site tag (gtag.js) - Google Analytics