`
lancijk
  • 浏览: 388360 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

java从网页中提取图片地址

    博客分类:
  • Java
阅读更多
import java.util.regex.Matcher;
import java.util.regex.Pattern;

//1:这个是拿到一个字符取得里面的图像地址返回一个List 

public static List<String> getImgStr(String htmlStr){      
         String img="";      
         Pattern p_image;      
         Matcher m_image;      
         List<String> pics = new ArrayList<String>();   
      
         String regEx_img = "<img.*src=(.*?)[^>]*?>"; //图片链接地址      
         p_image = Pattern.compile    
                 (regEx_img,Pattern.CASE_INSENSITIVE);      
        m_image = p_image.matcher(htmlStr);    
        while(m_image.find()){      
             img = img + "," + m_image.group();      
             Matcher m  = Pattern.compile("src=\"?(.*?)(\"|>|\\s+)").matcher(img); //匹配src   
             while(m.find()){   
                pics.add(m.group(1));   
             }   
         }      
            return pics;      
     }     

//2:下面是获得第一个地址存入到数据库

    public String saveOrUpdate() 
    { 
     try{
      if(infoId !=null){
      infoTpicnew = infoTpicnewService.getInfoTpicnew(infoId);
      }else{
       
       infoTpicnew.setInfoDatetime(new Date());
      }
      infoTpicnew.setInfoContent(infoContent);
      List list =getImgStr(infoContent);
      infoTpicnew.setInfoPicname((String) list.get(0));
         infoTpicnewService.saveOrUpdateInfoTpicnew(infoTpicnew);
            return SUCCESS;
        } catch (Exception e) {
            e.printStackTrace();
            return INPUT;
        }
    }


本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/lancijk/archive/2010/03/17/5389394.aspx

分享到:
评论

相关推荐

    java获取网网页中出现的图片及判断网页代码中是否包含有效图片

    4. **正则表达式匹配图片链接**:为了从HTML源码中提取图片链接,可以使用正则表达式进行匹配。例如,可以使用以下正则表达式来匹配`src`和`background`属性中的图片链接: ```java String searchImgReg = "(?x)...

    提取网页前台图片和文本

    本文详细介绍了如何使用.NET平台的技术栈来实现从网页中提取图片和文本,并对其进行分离处理。通过这种方式,可以高效地获取网页中的有用信息,并为进一步的数据分析和处理提供基础。此外,还可以根据实际需求进一步...

    java抓取html中的图片

    java的封装类,可以从指定网络地址,抓取地址中的网页,并分析抓取图片地址,下载到本地

    Java提取IPA中的png文件, 并进行解码还原png图片

    总的来说,要从IPA文件中提取并解码PNG图片,需要熟悉Java的文件操作、压缩包处理、图像解码等相关知识。这个过程涉及到了多个技术层面,通过合理利用Java提供的API和第三方库,我们可以实现跨平台的图像处理,使得...

    Java抓取网页图片链接地址

    ### Java抓取网页图片链接地址 #### 知识点概览 本文将详细介绍如何使用Java编程语言抓取网页上的图片链接。此技术广泛应用于网络爬虫、数据分析等领域,能够帮助开发者快速获取所需的图像资源。 #### 技术背景与...

    Java读取word文档内容并输出成网页(含图片,公式)

    在这个场景中,我们将重点讨论如何使用Java POI读取Word文档并将其内容转换为HTML网页,同时确保图片和公式等复杂元素能够正确显示。 首先,你需要在你的Java项目中引入Apache POI库。可以通过Maven或Gradle来添加...

    http.rar_HTTP网页_JAVA 获取http_html_java 获取网页_指定提取网页

    接下来,我们要讨论如何从HTML中提取图片链接。HTML中的图片通常由`&lt;img&gt;`标签表示,其`src`属性包含图片的URL。使用Jsoup,我们可以选择所有的`&lt;img&gt;`标签,然后获取每个标签的`src`属性值,从而得到图片的URL列表...

    java爬虫,抓取网页图片

    2. **HTML解析**:抓取到的网页内容通常是HTML格式,因此需要解析HTML来提取图片信息。Java提供了多种库,如Jsoup,用于解析HTML文档,找出图片链接。 3. **Jsoup库**:Jsoup是一个强大的Java库,它允许开发者以DOM...

    java截图指定网页保存图片

    在Java编程语言中,截取指定网页并保存为图片是一项常见的需求,比如用于网页快照、自动化测试或者数据抓取等场景。实现这个功能通常涉及网络请求、网页解析以及图像处理等多个方面。以下是一个详细的步骤解析: 1....

    java 程序设计网页浏览器

    以上是构建一个简易Java网页浏览器涉及的主要技术点,每个点都需要深入理解和实践。实际开发中,还可以考虑添加更多高级功能,如页面预加载、多标签页、下载管理等,以增强浏览器的功能和用户体验。

    java将网页保存成mht格式程序

    在互联网开发中,有时我们需要将整个网页(包括其所有资源如图片、样式表、脚本等)保存为一个单一的文件,以便于离线浏览或备份。MHT(MIME HTML)格式是一种将网页及其所有相关资源封装在一个文件中的标准格式,它...

    Java编写的网页浏览器

    首先,我们要知道Java中的Swing或JavaFX库可以用来创建GUI组件,比如浏览器的地址栏、前进/后退按钮、书签功能等。Swing是Java早期的GUI工具包,而JavaFX提供了更现代、更丰富的图形效果和动画支持。在这个项目中,...

    Java 保存HTML为图片

    在IT行业中,将HTML页面转换为图片是一种常见的需求,例如用于网页截图或者生成预览图。Java作为一种强大的后端开发语言,提供了多种方法来实现这一功能。本篇将详细讲解如何利用Struts2框架,结合Java的相关技术,...

    java解析网页内容

    改程序利用htmlParser这个jar包实现了对网页的解析,实现了对网址,网页的标题,网页上的图片,网页的内容的额入库操作。使用mySQL数据库。但是,在网页内容的提取方面还有很多的问题,毕竟各个网页的风格不一样,...

    正则表达式提取图片

    本文主要介绍如何使用正则表达式来从文本中提取图片。正则表达式是一种强大的文本处理工具,被广泛应用于搜索、替换以及数据提取等场景。对于网页开发或者数据分析来说,能够熟练地运用正则表达式提取图片是非常有用...

    java将网页保存成mht格式文件

    这个【标题】"java将网页保存成mht格式文件"指向的是一个Java项目,其目的是将网页转换为MHT格式,以便离线查看或保存网页的原始状态。 在Java中实现这个功能,通常需要以下步骤: 1. **抓取网页内容**:首先,你...

    用JAVA实现远程图片批量下载

    2. **图片链接识别**:在读取的HTML文档中识别出标签,提取出图片的URL地址。 3. **多线程下载**:为每一个图片URL创建一个独立的线程进行下载,以提高效率。 4. **URL管理**:为了防止重复下载和提高效率,需要维护...

    正则函数提取图片地址

    在这个“正则函数提取图片地址”的例子中,我们主要关注如何使用正则表达式来从HTML文本中提取出图片的URL地址。这对于网页解析、数据抓取或者内容管理等场景尤其有用。 首先,我们要理解HTML中的图片标签`&lt;img&gt;`的...

    网页设计java代码

    然而,由于题目要求从这段信息中提取出与“网页设计Java代码”相关的知识点,我们可以通过这段HTML代码来探讨一下如何在网页设计中运用Java技术,以及如何在实际开发中将Java与HTML相结合。 ### 一、理解HTML代码 ...

    java日语版js验证图片预言

    在"压缩包子文件的文件名称列表"中,只给出了"java+js",这意味着压缩包内包含了与Java和JavaScript相关的源代码文件,如.java文件(Java源代码)、.js文件(JavaScript代码),可能还有HTML文件(网页结构)、CSS...

Global site tag (gtag.js) - Google Analytics