/**
* 得到网页中图片的地址
*/
public static List<String> getImgStr(String htmlStr){
String img="";
Pattern p_image;
Matcher m_image;
List<String> pics = new ArrayList<String>();
String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址
p_image = Pattern.compile
(regEx_img,Pattern.CASE_INSENSITIVE);
m_image = p_image.matcher(htmlStr);
while(m_image.find()){
img = img + "," + m_image.group();
Matcher m = Pattern.compile("src=\"?(.*?)
(\"|>|\\s+)").matcher(img); //匹配src
while(m.find()){
pics.add(m.group(1));
}
}
return pics;
}
//重点在于正则表达式 <img.*src=(.*?)[^>]*?>
// src=\"?(.*?)(\"|>|\\s+)
分享到:
相关推荐
本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...
正则表达式不仅用于简单的查找和替换,还能在数据验证(如电子邮件地址或电话号码格式检查)、文本分析、网页抓取等场景中发挥巨大作用。通过学习《精通正则表达式》,读者将能够编写更高效、更精确的正则表达式,...
在Java编程中,正则表达式是处理文本模式匹配的强大工具,尤其在处理网页内容时,如提取网址和链接文字。这个示例展示了如何使用Java的正则表达式来匹配网页中的所有网址和链接文字。下面将详细讲解相关知识点。 1....
在本案例中,我们关注的是如何使用C#编程语言来编写正则表达式,从HTML文档中提取所有的电子邮件地址。下面将详细阐述这个过程。 首先,电子邮件地址通常遵循一定的格式,例如`username@example.com`。一个基本的...
总结来说,这个Java方法利用正则表达式有效地从HTML源码中提取了所有图片的路径,适用于需要解析网页图片资源的场景。注意,这种方法只能处理简单的HTML结构,对于复杂的嵌套或JavaScript动态加载的图片可能无法捕捉...
在正则表达式中,“.”符号匹配任意单个字符,字符类则用于匹配一组字符,如“[a-zA-Z]”可以匹配所有的字母字符。 ### 正则表达式的学习资源 本书作为正则表达式学习的重要资源,其中文版《精通正则表达式(第3版...
下面小编就为大家带来一篇java正则表达式获取指定HTML标签的指定属性值且替换的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
总结,正则表达式在网页资源提取方面是一个有用的工具,特别是在快速提取初步信息时。然而,为了更精确和全面地处理网页内容,应当结合其他技术,如HTML解析库和网络爬虫框架。在实践中,应根据具体需求灵活选择合适...
- **命令行工具**:如 `grep`, `sed`, `awk` 等在Linux/Unix环境中广泛使用正则表达式。 - **编程语言**:多数编程语言(如JavaScript, Python, Java, C#等)内置了正则表达式支持。 - **文本编辑器**:如Notepad...
以上列举了Java中常用的正则表达式及其应用场景,通过这些正则表达式的运用,可以有效地提高代码的质量和程序的健壮性。在实际开发过程中,可以根据具体需求选择合适的正则表达式进行数据验证和处理。
在本应用中,正则表达式被用来从已解析的HTML片段中提取图片链接、文章标题等信息,确保数据的正确性和完整性。 3. **Android UI设计**:应用界面的设计至关重要,PureDark-H-Viewer可能使用了Material Design风格...
大多数编程语言如Python、Java、JavaScript等都内置了正则表达式库,可以方便地在代码中使用。 3. 正则表达式语法差异: 虽然基本概念相同,但不同环境(如Perl、JavaScript、PCRE等)的正则表达式可能存在细微...
正则表达式(Regular Expression)是一种模式匹配语言,用于在文本中查找、替换或提取符合特定模式的字符串。在这个场景下,我们的目标是找到所有的img标签,并提取出它们的src属性值。 下面是一个基本的正则表达式...
本文将详细介绍如何利用Java和正则表达式来抓取网页中的图片链接,并下载这些图片。以下是一个简单的Java程序示例,用于实现这个功能。 首先,我们需要导入必要的库,包括`java.io`、`java.net`和`java.util.regex`...
在"JAVA日语软件工程师论坛欢迎你的到来.txt"和"JAVA日语软件工程师论坛.html"中,可能包含关于Java和日语编程的讨论,而正则表达式可以帮助我们高效地搜索、提取和分析相关数据。"正则表达式入门.doc"文档很可能是...
`, `{}`, `[]`, `\`, `^`, `$`等,它们具有特殊含义,在正则表达式中代表特定的操作或范围。 - **量词**:`*`, `+`, `?`, `{n}`, `{n,}` 和 `{n,m}` 控制匹配次数。 - **分组**:使用圆括号`()`对部分正则表达式...
在这个“正则函数提取图片地址”的例子中,我们主要关注如何使用正则表达式来从HTML文本中提取出图片的URL地址。这对于网页解析、数据抓取或者内容管理等场景尤其有用。 首先,我们要理解HTML中的图片标签`<img>`的...
这是一个非常基本的正则表达式匹配器,完全基于Java,具有基于超线性时间复杂度实现。 范围 支持的元字符是* +? ()| 和 \。 运算符的优先级是(从最弱的位置开始):|,然后是隐式级联,然后是* +?,并在顶部...
在正则表达式中,`.` 是一个特殊字符,代表任何非换行符的字符,而 `*` 和 `+` 是量词,它们控制前一个字符或字符集的重复次数。 1. `.*` `.*` 表示匹配零个或多个任意字符(除了换行符)。当你在正则表达式中看到...
`, `{}`, `[]`, `\`等,它们具有特殊含义,在正则表达式中用来构建更复杂的匹配规则。 2. **元字符详解**: - **`.`**:匹配任意单个字符,除了换行符。 - **`^`**:在字符串开头,表示匹配的开始;在字符集中,...