`
sbear
  • 浏览: 46187 次
  • 性别: Icon_minigender_1
  • 来自: 长沙
社区版块
存档分类
最新评论

从网页中提取图片地址(java 正则表达式)

阅读更多

   /**
    * 得到网页中图片的地址
     */
   public static List<String> getImgStr(String htmlStr){   
        String img="";   
        Pattern p_image;   
        Matcher m_image;   
        List<String> pics = new ArrayList<String>();

        String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址   
        p_image = Pattern.compile 
                (regEx_img,Pattern.CASE_INSENSITIVE);   
       m_image = p_image.matcher(htmlStr); 
       while(m_image.find()){   
            img = img + "," + m_image.group();   
            Matcher m  = Pattern.compile("src=\"?(.*?) 
                         (\"|>|\\s+)").matcher(img); //匹配src
            while(m.find()){
            	pics.add(m.group(1));
            }
        }   
           return pics;   
    }  
     //重点在于正则表达式 <img.*src=(.*?)[^>]*?>   
     //               src=\"?(.*?)(\"|>|\\s+)                     
分享到:
评论
1 楼 zhuchao_ko 2012-06-27  

相关推荐

    正则表达式提取图片

    本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...

    精通正则表达式中文版英文版_中文版为扫描版

    正则表达式不仅用于简单的查找和替换,还能在数据验证(如电子邮件地址或电话号码格式检查)、文本分析、网页抓取等场景中发挥巨大作用。通过学习《精通正则表达式》,读者将能够编写更高效、更精确的正则表达式,...

    java正则表达式匹配网页所有网址和链接文字的示例

    在Java编程中,正则表达式是处理文本模式匹配的强大工具,尤其在处理网页内容时,如提取网址和链接文字。这个示例展示了如何使用Java的正则表达式来匹配网页中的所有网址和链接文字。下面将详细讲解相关知识点。 1....

    正则表达式提取html中的所有的Email地址

    在本案例中,我们关注的是如何使用C#编程语言来编写正则表达式,从HTML文档中提取所有的电子邮件地址。下面将详细阐述这个过程。 首先,电子邮件地址通常遵循一定的格式,例如`username@example.com`。一个基本的...

    Java中使用正则表达式获取网页中所有图片的路径

    总结来说,这个Java方法利用正则表达式有效地从HTML源码中提取了所有图片的路径,适用于需要解析网页图片资源的场景。注意,这种方法只能处理简单的HTML结构,对于复杂的嵌套或JavaScript动态加载的图片可能无法捕捉...

    精通正则表达式(第3版) Mastering.Regular.Expressions

    在正则表达式中,“.”符号匹配任意单个字符,字符类则用于匹配一组字符,如“[a-zA-Z]”可以匹配所有的字母字符。 ### 正则表达式的学习资源 本书作为正则表达式学习的重要资源,其中文版《精通正则表达式(第3版...

    java正则表达式获取指定HTML标签的指定属性值且替换的方法

    下面小编就为大家带来一篇java正则表达式获取指定HTML标签的指定属性值且替换的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

    正则表达式获取网页HTML,css,js,图片等

    总结,正则表达式在网页资源提取方面是一个有用的工具,特别是在快速提取初步信息时。然而,为了更精确和全面地处理网页内容,应当结合其他技术,如HTML解析库和网络爬虫框架。在实践中,应根据具体需求灵活选择合适...

    正则表达式系统教程

    - **命令行工具**:如 `grep`, `sed`, `awk` 等在Linux/Unix环境中广泛使用正则表达式。 - **编程语言**:多数编程语言(如JavaScript, Python, Java, C#等)内置了正则表达式支持。 - **文本编辑器**:如Notepad...

    java常用正则表达式

    以上列举了Java中常用的正则表达式及其应用场景,通过这些正则表达式的运用,可以有效地提高代码的质量和程序的健壮性。在实际开发过程中,可以根据具体需求选择合适的正则表达式进行数据验证和处理。

    Android-H-Viewer使用选择器和正则表达式来从网站获取数据的安卓绅士阅览器

    在本应用中,正则表达式被用来从已解析的HTML片段中提取图片链接、文章标题等信息,确保数据的正确性和完整性。 3. **Android UI设计**:应用界面的设计至关重要,PureDark-H-Viewer可能使用了Material Design风格...

    正则表达式30分钟快速教程 pdf

    大多数编程语言如Python、Java、JavaScript等都内置了正则表达式库,可以方便地在代码中使用。 3. 正则表达式语法差异: 虽然基本概念相同,但不同环境(如Perl、JavaScript、PCRE等)的正则表达式可能存在细微...

    用正则表达式替换图片地址img标签

    正则表达式(Regular Expression)是一种模式匹配语言,用于在文本中查找、替换或提取符合特定模式的字符串。在这个场景下,我们的目标是找到所有的img标签,并提取出它们的src属性值。 下面是一个基本的正则表达式...

    详解JAVA抓取网页的图片,JAVA利用正则表达式抓取网站图片

    本文将详细介绍如何利用Java和正则表达式来抓取网页中的图片链接,并下载这些图片。以下是一个简单的Java程序示例,用于实现这个功能。 首先,我们需要导入必要的库,包括`java.io`、`java.net`和`java.util.regex`...

    正则表达式入门

    在"JAVA日语软件工程师论坛欢迎你的到来.txt"和"JAVA日语软件工程师论坛.html"中,可能包含关于Java和日语编程的讨论,而正则表达式可以帮助我们高效地搜索、提取和分析相关数据。"正则表达式入门.doc"文档很可能是...

    正则表达式

    `, `{}`, `[]`, `\`, `^`, `$`等,它们具有特殊含义,在正则表达式中代表特定的操作或范围。 - **量词**:`*`, `+`, `?`, `{n}`, `{n,}` 和 `{n,m}` 控制匹配次数。 - **分组**:使用圆括号`()`对部分正则表达式...

    正则函数提取图片地址

    在这个“正则函数提取图片地址”的例子中,我们主要关注如何使用正则表达式来从HTML文本中提取出图片的URL地址。这对于网页解析、数据抓取或者内容管理等场景尤其有用。 首先,我们要理解HTML中的图片标签`&lt;img&gt;`的...

    Regex:Java中简单,快速的正则表达式匹配器

    这是一个非常基本的正则表达式匹配器,完全基于Java,具有基于超线性时间复杂度实现。 范围 支持的元字符是* +? ()| 和 \。 运算符的优先级是(从最弱的位置开始):|,然后是隐式级联,然后是* +?,并在顶部...

    正则表达式中的 .*? 或 .*+ 的意思

    在正则表达式中,`.` 是一个特殊字符,代表任何非换行符的字符,而 `*` 和 `+` 是量词,它们控制前一个字符或字符集的重复次数。 1. `.*` `.*` 表示匹配零个或多个任意字符(除了换行符)。当你在正则表达式中看到...

    正则表达式二

    `, `{}`, `[]`, `\`等,它们具有特殊含义,在正则表达式中用来构建更复杂的匹配规则。 2. **元字符详解**: - **`.`**:匹配任意单个字符,除了换行符。 - **`^`**:在字符串开头,表示匹配的开始;在字符集中,...

Global site tag (gtag.js) - Google Analytics