最近发现了一个解析html的框架,拿来试试,以游久为例,代码:
package com.test;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Test4 extends Thread {
List<String> list = new ArrayList<String>();
int index = 0;
InputStream inputStream;
OutputStream outputStream;
File parent;
public Test4() throws IOException {
list.add("http://news.uuu9.com/2011/201103/186409.shtml");
Document document = Jsoup.connect(list.get(0)).get();
parent = new File("f:/image/uuu9/"+document.title());
parent.mkdir();
Element element = document.select("div#pagecount").first();
for (int i = 2; i <= Integer.parseInt(element.text()); i++) {
list.add("http://news.uuu9.com/2011/201103/186409.shtml".replaceAll(".shtml", "_"+i+".shtml"));
}
while(index<list.size()-1) {
run();
}
}
public void run() {
try {
Document document = Jsoup.connect(list.get(index)).get();
Elements elements = document.select("img[title=点击图片翻页]");
for (int i = 0; i < elements.size(); i++) {
String img = elements.get(i).attr("src").replaceAll("_Z", "");
inputStream = new URL(img).openStream();
File file = new File(parent,img.substring(img.lastIndexOf("/")+1));
System.out.println(file);
file.createNewFile();
outputStream = new FileOutputStream(file);
byte[] bs = new byte[2048];
int c = 0;
while((c=inputStream.read(bs))!=-1) {
outputStream.write(bs,0,c);
}
outputStream.flush();
}
index++;
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) throws IOException {
new Test4().start();
}
}
分享到:
相关推荐
好消息:CSDN博客下载器v2.0版本增加导出PDF文件功能,方便查看图片与文章。 在无网络环境,也可以看自己的一些文章。当然如果您发现CSDN博客的一些文章值得收藏,你也可以使用本软件轻松的下载到您的电脑。 该版本...
7、打开桌面的全能电子地图下载器的快捷方式,软件打开,安装成功。 Windows 7或Windows 8出不来注册码,请右击点用管理员权 限打开,就可以看到注册码了!!! Windows XP不存在这个问题!!!
全能电子地图下载器是一款功能强大的全球卫星地图下载工具,它只要帮助用户从谷歌地图、高德地图、腾讯地图、雅虎地图、必应地图、诺基亚地图、百度地图、天地图等网络地图中下载瓦片地图,并且支持将下载后的地图...
如果遇到无法下载的情况,可能是因为百度文库升级了反下载机制,这时候就需要寻找更新的版本或者寻找其他解决方案。 总的来说,"BDDocDownloader"和"BaiduWenkuDownloader"是针对百度文库下载需求的实用工具,它们...
与传统的固件下载方式相比,使用九彩固件下载器下载固件无需安装繁重的第三方网盘客户端和进行复杂的用户登录操作,用户仅需通过这款工具即可轻松实现在线高速下载。这种简便的操作流程大大提升了用户的使用效率,...
该软件是一款完全免费的,用来采集店铺图片资源的工具,支持一键下载商品详情页所有的主图、sku图和商品详情页,评论图等资源。并支持所有市面上的店铺,可以通过简单的配置即可收集更多的店铺。包括淘宝、天猫、拼...
"智峰软件 1.68 (支持USB下载器)" 是一个专为电子工程和嵌入式系统设计的专业软件工具,其主要特点是支持通过USB下载器进行设备编程和固件更新。USB下载器通常是一种方便快捷的接口,使得用户无需复杂的硬件连接就能...
在这样的背景下,网站打包下载器应运而生,为用户提供了极大的便利。本文将详细探讨网站打包下载器的功能、使用方法以及其带来的好处。 首先,网站打包下载器最核心的功能就是可以将整个网页或网站打包下载到本地...
乐都WIL编辑器3.2版是一款专为传奇客户端设计的图像编辑工具,它提供了丰富的功能,使得传奇游戏的图像资源编辑变得更加便捷和高效。在这个版本中,开发者可能已经优化了用户界面,增强了工具的稳定性和兼容性,旨在...
《Flash Loader Demonstrator v2.8.0:STM8&32程序下载器详解》 在嵌入式系统开发领域,程序的下载与调试是关键环节。STMicroelectronics(意法半导体)作为全球知名的微控制器供应商,为开发者提供了强大的工具...
本教程将详细讲解如何在Android应用中实现批量下载图片并进行高效缓存,以实现非常流畅的用户体验。我们将主要关注LruCache技术,这是一种内存管理策略,有助于优化内存使用。 首先,我们需要理解Android中的图片...
在Android开发中,创建一个与微信图片选择器类似的组件是一个常见的需求,这涉及到用户界面设计、图片处理、文件管理等多个方面。本实例源码提供了一个完整的解决方案,旨在帮助开发者实现类似微信的图片选择功能。...
『太乐地图下载器』是一款地图、高程下载类GIS软件,支持将下载的地图、高程等数据进行多种专业格式转换,或发布为地图服务,旨在辅助用户提高工作效率,轻松构建自己的地图应用。可应用于学术科研、工程、规划、...
上周发布了2.2版本,各位网友仍然提出了很多新功能与用户交互人性化的建议,在此很感谢大家的支持。2.4版本只修复了个别...2.解决获取不全博客中的图片。 3.博客信息窗口可以手动拉伸变宽。 4.增加博客信息排序功能。
通过C#网络编程的webBrowser获取网页中的url并简单的尝试下载网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识、正则表达式实现浏览、获取url、下载图片三个功能.而且很清晰的解析...
3、可查看下载器“功能介绍”了解下载器具体功能。 功能介绍; 1、基本下载功能; 2、支持多任务多线程同时下载; 3、每个任务的线程数由用户在新建任务时自定义,缺省为5个线程; 4、任务下载过程中可以点击“线程...
把网上电子地图的图片下载到本地. 因为网上电子图片是分缩放级别的,可以直接将所有级别或才定制级别的图片下载下来,会放到相应的文件夹里面.可供使用百度地图引擎的程序直接使用. 不好意思,定这么高的分,...
这里提供的压缩包包含两张不同尺寸的棋盘格图片,适用于opencv和matlab两种不同的软件进行相机标定。 1. **相机标定的概念** 相机标定的目标是估计相机的内参矩阵(焦距、主点坐标等)和外参矩阵(旋转和平移向量)...
标题中的“ppm图片转换工具(windows版本)”指的是一个专为Windows操作系统设计的软件,用于处理PPM(Portable Pixmap)格式的图像文件。PPM是一种原始的、未压缩的图像文件格式,常用于图像处理和开发。这个工具的...
前段时间,我编写了一个创意程序,并用于向自己目前...而今呢,我在七夕节时再次为我的女朋友写了一个程序,这次算是上次的升级版吧,功能多了一些、界面效果也好多了 本资源主要用于我的博文的资源下载,博文地址: ...