论坛首页 Java企业应用论坛

获取文章中的图片

浏览 2698 次
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
作者 正文
   发表时间:2013-01-30  

 

瀑布流的功能开发完了,感觉还不错,地址是:http://www.656463.com/waterfall,其中也有一些知识点,和大家分享一下。既然是瀑布流,就会涉及到图片,在这里我是获取本站文章中的图片,所以本节就是用jsoup获取文章中的图片

 

jsoup简单介绍

jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。

使用jsoup很简单,就是下载jar包,然后就能用里面的API进行解析了

中文地址是:http://www.open-open.com/jsoup/

下载jsoup地址:http://jsoup.org/download,最新版是jsoup-1.7.2.jar

 

获取文章图片

获取文章的图片,就是用jsoup在文章内容里解析出文章路径

 

List<String> imgs = JsoupUtil.getImgSrc(article.getContent());

 解析工具类

 

/**
 * 解释HTML获取图片列表
 * @param html HTML内容
 * @return 图片列表
 */
public static List<String> getImgSrc(String html){
    List<String> imgSrcs= new ArrayList<String>();
      
    Document doc = Jsoup.parse(html);
    Elements imgs = doc.getElementsByTag("img");
    for (Element img : imgs) {
        String imgSrc = img.attr("src");
        if(imgSrc!=null && imgSrc.trim().length()>0){
            imgSrcs.add(imgSrc);
        }
    }
      
    return imgSrcs;
}

 简单吧,就这样了

 

本文链接:用jsoup获取文章中的图片-瀑布流系列文章,由领悟书生原创

转载请注明出处【http://www.656463.com/article/348】

 

论坛首页 Java企业应用版

跳转论坛:
Global site tag (gtag.js) - Google Analytics