最近发现了一个解析html的框架,拿来试试,以游久为例,代码:
package com.test;
import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.OutputStream;
import java.net.MalformedURLException;
import java.net.URL;
import java.util.ArrayList;
import java.util.List;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Test4 extends Thread {
List<String> list = new ArrayList<String>();
int index = 0;
InputStream inputStream;
OutputStream outputStream;
File parent;
public Test4() throws IOException {
list.add("http://news.uuu9.com/2011/201103/186409.shtml");
Document document = Jsoup.connect(list.get(0)).get();
parent = new File("f:/image/uuu9/"+document.title());
parent.mkdir();
Element element = document.select("div#pagecount").first();
for (int i = 2; i <= Integer.parseInt(element.text()); i++) {
list.add("http://news.uuu9.com/2011/201103/186409.shtml".replaceAll(".shtml", "_"+i+".shtml"));
}
while(index<list.size()-1) {
run();
}
}
public void run() {
try {
Document document = Jsoup.connect(list.get(index)).get();
Elements elements = document.select("img[title=点击图片翻页]");
for (int i = 0; i < elements.size(); i++) {
String img = elements.get(i).attr("src").replaceAll("_Z", "");
inputStream = new URL(img).openStream();
File file = new File(parent,img.substring(img.lastIndexOf("/")+1));
System.out.println(file);
file.createNewFile();
outputStream = new FileOutputStream(file);
byte[] bs = new byte[2048];
int c = 0;
while((c=inputStream.read(bs))!=-1) {
outputStream.write(bs,0,c);
}
outputStream.flush();
}
index++;
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
}
}
public static void main(String[] args) throws IOException {
new Test4().start();
}
}
分享到:
相关推荐
好消息:CSDN博客下载器v2.0版本增加导出PDF文件功能,方便查看图片与文章。 在无网络环境,也可以看自己的一些文章。当然如果您发现CSDN博客的一些文章值得收藏,你也可以使用本软件轻松的下载到您的电脑。 该版本...
如果遇到无法下载的情况,可能是因为百度文库升级了反下载机制,这时候就需要寻找更新的版本或者寻找其他解决方案。 总的来说,"BDDocDownloader"和"BaiduWenkuDownloader"是针对百度文库下载需求的实用工具,它们...
该软件是一款完全免费的,用来采集店铺图片资源的工具,支持一键下载商品详情页所有的主图、sku图和商品详情页,评论图等资源。并支持所有市面上的店铺,可以通过简单的配置即可收集更多的店铺。包括淘宝、天猫、拼...
"智峰软件 1.68 (支持USB下载器)" 是一个专为电子工程和嵌入式系统设计的专业软件工具,其主要特点是支持通过USB下载器进行设备编程和固件更新。USB下载器通常是一种方便快捷的接口,使得用户无需复杂的硬件连接就能...
NI visa驱动的下载器。在NI官网也能下载到。但是速度很慢。可以用作labview串口通信的驱动程序。操作说明:打开下载器,若提示“网络连接不上”,按照提示,在防火墙允许程序中允许下载器访问网络。
乐都WIL编辑器3.2版是一款专为传奇客户端设计的图像编辑工具,它提供了丰富的功能,使得传奇游戏的图像资源编辑变得更加便捷和高效。在这个版本中,开发者可能已经优化了用户界面,增强了工具的稳定性和兼容性,旨在...
为了提升加载速度,源码中应包含对图片的优化策略,如压缩图片大小、使用适当的文件格式(如WebP)以及利用懒加载技术延迟非首屏图片的加载。 6. SEO优化:为了提高搜索引擎排名,源码可能包含了SEO(Search Engine...
本教程将详细讲解如何在Android应用中实现批量下载图片并进行高效缓存,以实现非常流畅的用户体验。我们将主要关注LruCache技术,这是一种内存管理策略,有助于优化内存使用。 首先,我们需要理解Android中的图片...
1. **HTTP请求**:下载器会向Google地图服务器发送HTTP GET请求,获取指定坐标、缩放级别的瓦片图片。 2. **经纬度与瓦片坐标转换**:为了确定需要下载的瓦片,需要将地图的经纬度坐标转换为瓦片的X、Y坐标。 3. **...
3、可查看下载器“功能介绍”了解下载器具体功能。 功能介绍; 1、基本下载功能; 2、支持多任务多线程同时下载; 3、每个任务的线程数由用户在新建任务时自定义,缺省为5个线程; 4、任务下载过程中可以点击“线程...
图片批量下载软件--迅雷下载、八爪鱼图片批量下载、kutools控件 在电商运营的过程中,会偶尔需要收集大量的图片,比如商品的主图、轮播图或者是评价中的图片等等。一张一张地下载图片,难免会比较繁琐且浪费时间。
把网上电子地图的图片下载到本地. 因为网上电子图片是分缩放级别的,可以直接将所有级别或才定制级别的图片下载下来,会放到相应的文件夹里面.可供使用百度地图引擎的程序直接使用. 不好意思,定这么高的分,...
通过C#网络编程的webBrowser获取网页中的url并简单的尝试下载网页中的图片,主要是为以后网络开发的基础学习.其中主要的通过应用程序结合网页知识、正则表达式实现浏览、获取url、下载图片三个功能.而且很清晰的解析...
前段时间,我编写了一个创意程序,并用于向自己目前...而今呢,我在七夕节时再次为我的女朋友写了一个程序,这次算是上次的升级版吧,功能多了一些、界面效果也好多了 本资源主要用于我的博文的资源下载,博文地址: ...
通过设置过滤器,可以限制用户只能选择特定类型的图片文件(如.jpg, .png等)。 - `PictureBox`:展示用户选定图片的控件,可以实时预览所选图片。设置适当的尺寸和缩放模式以确保图片显示清晰。 2. **图片处理**...
在上述代码中,`#image`是图片元素的选择器,`iviewer()`是初始化iViewer的方法。 **自定义设置** iViewer还提供了一系列参数供开发者自定义设置,如初始缩放比例、旋转角度、是否启用拖拽等。例如,如果你想设置...
这个"SQL2000企业管理器绿色版"是精简版或者便携式版本,无需安装即可使用,方便在不同环境或非固定工作台上快速启动数据库管理工作。 1. SQL Server 2000简介:SQL Server 2000是微软发布的一款关系型数据库管理...
【事业单位图片压缩工具】是一款专为事业单位设计的高效图片压缩软件,它能够处理市面上常见的多种图片格式,如JPEG(JPG)、PNG、BMP、GIF等。该工具的主要功能在于大幅度减小图片的文件大小,例如,一个原本2MB的...
这两张图片应设计为适合滑动的长条形,背景图可以是纯色或有特殊纹理,进度条图片则应有明显的起点和终点,以便用户直观地看出滑动的进度。 接下来,我们需要创建一个自定义的SeekBar类,继承自系统的SeekBar,并...
标题中的“ppm图片转换工具(windows版本)”指的是一个专为Windows操作系统设计的软件,用于处理PPM(Portable Pixmap)格式的图像文件。PPM是一种原始的、未压缩的图像文件格式,常用于图像处理和开发。这个工具的...