使用java实现http多线程下载

calmness

浏览: 354957 次
性别:
来自: 珠海

最近访客更多访客>>

monster丶sss

guoyouxi

gogo123150

liuyukui

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Java

多线程 Java Gmail Android 浏览器

下载工具我想没有几个人不会用的吧，前段时间比较无聊，花了点时间用java写了个简单的http多线程下载程序，纯粹是无聊才写的，只实现了几个简单的功能，而且也没写界面，今天正好也是一个无聊日，就拿来写篇文章，班门弄斧一下，觉得好给个掌声，不好也不要喷，谢谢！

我实现的这个http下载工具功能很简单，就是一个多线程以及一个断点恢复，当然下载是必不可少的。那么大概先整理一下要做的事情：
1、连接资源服务器，获取资源信息，创建文件
2、切分资源，多线程下载
3、断点恢复功能
4、下载速率统计

大概就这几点吧，那么首先要做的就是连接资源并获取资源信息，我这里使用了JavaSE自带的URLConnection进行资源连接，大致代码如下：

String urlStr = “http://www.sourcelink.com/download/xxx”;   //资源地址，随便写的
URL url = new URL(urlStr);                             //创建URL
URLConnection con = url.openConnection();               //建立连接
contentLen = con.getContentLength();                    //获得资源长度
File file = new File(filename);			  //根据filename创建一个下载文件，也会是我们最终下载所得的文件

很简单吧，没错就是这么简单，第一步做完了，那么接下来要做第二步，切分资源，实现多线程。在上一步我们已经获得了资源的长度contentLen，那么如何根据这个对资源进行切分呢？假如我们要运行十个线程，那么我们就先把contentLen处以10，获得每块的大小，然后在分别创建十个线程，每个线程负责其中一块的写入，这就需要利用到RandomAccessFile这个类了，这个类提供了对文件的随机访问，可以指定向文件中的某一个位置进行写入操作，大致代码如下：

            long subLen = contentLen / threadQut;                           //获取每块的大小

            //创建十个线程，并启动线程
            for (int i = 0; i < threadQut; i++) {
                DLThread thread = new DLThread(this, i + 1, subLen * i, subLen * (i + 1) - 1); //创建线程
                dlThreads[i] = thread;
                QSEngine.pool.execute(dlThreads[i]);                                //把线程交给线程池进行管理
            }

在这里使用到了DLThread这个类，我们先来看看这个类的构造方法的定义：

public DLThread(DLTask dlTask, int id, long startPos, long endPos)

第一个参数为一个DLTask，这个类就代表一个下载任务，里面主要保存这一个下载任务的信息，包括下载资源名，本地文件名等等的信息。第二个参数就是一个标示线程的id，如果有10个线程，那么这个id就是从1到10，第三个参数startPos代表该线程从文件的哪个地方开始写入，最后一个参数endPos代表写到哪里就结束。

我们再来看看，一个线程启动后，具体如何去下载，请看run方法：

    public void run() {
        System.out.println("线程" + id + "启动......");
        BufferedInputStream bis = null;                                             //创建一个buff
        RandomAccessFile fos = null;                                               
        byte[] buf = new byte[BUFFER_SIZE];                                         //缓冲区大小
        URLConnection con = null;
        try {
            con = url.openConnection();                                             //创建连接，这里会为每个线程都创建一个连接
            con.setAllowUserInteraction(true);
            if (isNewThread) {
                con.setRequestProperty("Range", "bytes=" + startPos + "-" + endPos);//设置获取资源数据的范围，从startPos到endPos
                fos = new RandomAccessFile(file, "rw");                             //创建RandomAccessFile
                fos.seek(startPos);                                                 //从startPos开始
            } else {
                con.setRequestProperty("Range", "bytes=" + curPos + "-" + endPos);
                fos = new RandomAccessFile(dlTask.getFile(), "rw");
                fos.seek(curPos);
            }
            //下面一段向根据文件写入数据，curPos为当前写入的未知，这里会判断是否小于endPos，
            //如果超过endPos就代表该线程已经执行完毕
            bis = new BufferedInputStream(con.getInputStream());                    
            while (curPos < endPos) {
                int len = bis.read(buf, 0, BUFFER_SIZE);                
                if (len == -1) {
                    break;
                }
                fos.write(buf, 0, len);
                curPos = curPos + len;
                if (curPos > endPos) {
                    readByte += len - (curPos - endPos) + 1; //获取正确读取的字节数
                } else {
                    readByte += len;
                }
            }
            System.out.println("线程" + id + "已经下载完毕。");
            this.finished = true;
            bis.close();
            fos.close();
        } catch (IOException ex) {
            ex.printStackTrace();
            throw new RuntimeException(ex);
        }
    }

上面的代码就是根据startPos和endPos对文件机型写操作，每个线程都有自己独立的一个资源块，从startPos到endPos。上面的方式就是线程下载的核心，多线程搞定后，接下来就是实现断点恢复的功能，其实断点恢复无非就是记录下每个线程完成到哪个未知，在这里我就是使用curPos进行的记录，大家在上面的代码就应该可以看到，我会记录下每个线程的curPos，然后在线程重新启动的时候，就把curPos当成是startPos，而endPost则不变即可，大家有没注意到run方法里有一段这样的代码：

            if (isNewThread) {                                              //判断是否断点，如果true，代表是一个新的下载线程，而不是断点恢复
                con.setRequestProperty("Range", "bytes=" + startPos + "-" + endPos);//设置获取资源数据的范围，从startPos到endPos
                fos = new RandomAccessFile(file, "rw");                             //创建RandomAccessFile
                fos.seek(startPos);                                                 //从startPos开始
            } else {
                con.setRequestProperty("Range", "bytes=" + curPos + "-" + endPos);//使用curPos替代startPos，其他都和新创建一个是一样的。
                fos = new RandomAccessFile(dlTask.getFile(), "rw");
                fos.seek(curPos);
            }

上面就是断点恢复的做法了，和新创建一个线程没什么不同，只是startPos不一样罢了，其他都一样，不过仅仅有这个还不够，因为如果程序关闭的话，这些信息又是如何保存呢？例如文件名啊，每个线程的curPos啊等等，大家在使用下载软件的时候，相信都会发现在软件没下载完的时候，在目录下会有两个临时文件，而其中一个就是用来保存下载任务的信息的，如果没有这些信息，程序是不知道该如何恢复下载进度的。而我这里又如何实现的呢？我这个人比较懒，又不想再创建一个文件来保存信息，然后自己又要读取信息创建对象，那太麻烦了，所以我想到了java提供序列化机制，我的想法就是直接把整个DLTask的对象序列化到硬盘上，上面说过DLTask这个类就是用来保存每个任务的信息的，所以我只要在需要恢复的时候，反序列化这个对象，就可以很容易的实现了断点功能，我们来看看这个对象保存的信息：

public class DLTask extends Thread implements Serializable {

	private static final long serialVersionUID = 126148287461276024L;
	private final static int MAX_DLTHREAD_QUT = 10;  //最大下载线程数量
	/**
	 * 下载临时文件后缀，下载完成后将自动被删除
	 */
    public final static String FILE_POSTFIX = ".tmp";
    private URL url;									
    private File file;
    private String filename;
    private int id;
    private int Level;
    private int threadQut;								//下载线程数量，用户可定制							
    private int contentLen;							//下载文件长度
    private long completedTot;							//当前下载完成总数
    private int costTime;								//下载时间计数，记录下载耗费的时间
    private String curPercent;							//下载百分比
    private boolean isNewTask;						//是否新建下载任务，可能是断点续传任务
    
    private DLThread[] dlThreads;						//保存当前任务的线程

transient private DLListener listener;			//当前任务的监听器，用于即时获取相关下载信息

如上代码，这个对象实现了Serializable接口，保存了任务的所有信息，还包括有每个线程对象dlThreads，这样子就可以很容易做到断点的恢复了，让我重新写一个文件保存这些信息，然后在恢复的时候再根据这些信息创建一个对象，那简直是要我的命。这里创建了一个方法，用于断点恢复用：

    private void resumeTask() {
        listener = new DLListener(this);
        file = new File(filename);
        for (int i = 0; i < threadQut; i++) {
            dlThreads[i].setDlTask(this);
            QSEngine.pool.execute(dlThreads[i]);
        }
        QSEngine.pool.execute(listener);
    }

实际上就是减少了先连接资源，然后进行切分资源的代码，因为这些信息已经都被保存在DLTask的对象下了。

看到上面的代码，不知道大家注意到有一个对象DLListener没有，这个对象实际上就是用于监听整个任务的信息的，这里我主要用于两个目的，一个是定时的对DLTask进行序列化，保存任务信息，用于断点恢复，一个就是进行下载速率的统计，平均多长时间进行一个统计。我们先来看下它的代码，这个类也是一个单独的线程：

	public void run() {

		int i = 0;
		BigDecimal completeTot = null;                                         //完成的百分比             
		long start = System.currentTimeMillis();                               //当前时间，用于记录开始统计时间
		long end = start;

		while (!dlTask.isComplete()) {                                        //整个任务是否完成，没有完成则继续循环
			i++;
			String percent = dlTask.getCurPercent();                      //获取当前的完成百分数

			completeTot = new BigDecimal(dlTask.getCompletedTot());       //获取当前完成的总字节数

                        //获得当前时间，然后与start时间比较，如果不一样，利用当前完成的总数除以所使用的时间，获得一个平均下载速度
			end = System.currentTimeMillis();                             
			if (end - start != 0) {
				BigDecimal pos = new BigDecimal(((end - start) / 1000) * 1024);
				System.out.println("Speed :"
						+ completeTot
								.divide(pos, 0, BigDecimal.ROUND_HALF_EVEN)
						+ "k/s   " + percent + "% completed. ");
			}
			recoder.record();         //将任务信息记录到硬盘
			try {
				sleep(3000);
			} catch (InterruptedException ex) {
				ex.printStackTrace();
				throw new RuntimeException(ex);
			}

		}
                //以下是下载完成后打印整个下载任务的信息
		int costTime =+ (int)((System.currentTimeMillis() - start) / 1000);
		dlTask.setCostTime(costTime);
		String time = QSDownUtils.changeSecToHMS(costTime);
		
		dlTask.getFile().renameTo(new File(dlTask.getFilename()));
		System.out.println("Download finished. " + time);
	}

这个方法中的recoder.record()方法的调用就是用于序列化任务对象，其他的代码均为统计信息用的，具体可看注释，record该方法的代码如下：

    public void record() {
        ObjectOutputStream out = null;
        try {
            out = new ObjectOutputStream(new FileOutputStream(dlTask.getFilename() + ".tsk"));  
            out.writeObject(dlTask);
            out.close();
        } catch (IOException ex) {
            ex.printStackTrace();
            throw new RuntimeException(ex);
        } finally {
            try {
                out.close();
            } catch (IOException ex) {
                ex.printStackTrace();
                throw new RuntimeException(ex);
            }
        }

    }

到这里，大致的代码都完成了，不过以上的代码都是部分片段，只是作为一个参考给大家看下，而且由于本人水平有限，代码很多地方都没有经过过多的考虑，没有经过优化，仅仅只是自娱自乐，所以可能有很多地方都写的很烂，这个程序也缺乏很多功能，连界面都没有，所以整个程序的代码就不上传了，免得丢人，呵呵。希望对有兴趣的朋友尽到一点帮助吧。

QSDown.rar (40.6 KB)
描述: 简单实现的源码，不会自动判断断点恢复，需要手动注释掉相应代码。
下载次数: 1949

分享到：

随意写写 | JAVA，最终还是不能选你作为开始

2008-07-27 12:09
浏览 20615
评论(77)
查看更多

77 楼 fu_ok 2014-11-05

long subLen = (long) Math.ceil(contentLen * 1.0/ threadQut);

分片这个要向上取整

76 楼 fu_ok 2014-11-04

哇，好厉害，楼主现在还写程序么

75 楼 jimok618 2013-09-03

居然70几条评论里都没提到RandomAccessFile是非线程安全的问题。。
程序里面也没处理过。

74 楼 xujizhe 2013-01-08

DLTask里面分段的时候修改一下

for (int i = 0; i < threadQut; i++) {
    DLThread thread;
    if (i == (threadQut - 1))
        thread = new DLThread(this, i + 1, subLen * i, contentLen);
    else
	thread = new DLThread(this, i + 1, subLen * i, subLen * (i + 1) - 1);
        dlThreads[i] = thread;
	QSEngine.pool.execute(dlThreads[i]);
}

因为

long subLen = contentLen / threadQut;

这句中两个int型相除会丢掉小数点后部分，最终导致下载的数据少了几个字节。

73 楼 xujizhe 2013-01-08

DLTask里面分段的时候修改一下

for (int i = 0; i < threadQut; i++) {
    DLThread thread;
    if (i == (threadQut - 1))
        thread = new DLThread(this, i + 1, subLen * i, contentLen);
    else
	thread = new DLThread(this, i + 1, subLen * i, subLen * (i + 1) - 1);
        dlThreads[i] = thread;
	QSEngine.pool.execute(dlThreads[i]);
}

因为
long subLen = contentLen / threadQut;
这句中两个int型相除会丢掉小数点后部分，最终导致下载的数据少了几个字节。

72 楼夜色蓝 2012-06-11

下载代码看了，有点凌乱了。

71 楼 micro_gc 2011-08-09

楼主太厉害了，真牛

70 楼 lj杰 2011-01-26

楼主很牛很强大额

69 楼 lj杰 2011-01-26

最近研究多线程，谢谢，你的资料很好，很有用

68 楼 xiaor186 2010-09-04

呵呵，楼主辛苦了，实在是感谢楼主，呵呵。
我一直做web，对java没有深入的研究，现在做android，得补习很多东西。这不，下载这块我就在考虑用线程池，可是我又没用过，楼主的代码正合我的需求，会好好拜读拜读的。
真的是感谢楼主了。

我整天在网上找别人的东西学习，可是自己几乎都没写过什么文章，实在是惭愧之至阿。
再次向楼主表示感谢了。

67 楼 liang1long2qun3 2010-04-08

思路很清晰

66 楼解未知数 2009-12-01

觉得不错顶一个!!

65 楼 fredred 2009-11-24

long subLen = contentLen / threadQut;
改为
long subLen = (long) Math.ceil((double) contentLen / (double) threadQut);

还是得感谢楼主了

64 楼 bianku 2009-08-13

niu b

63 楼 zhanjia 2009-08-07

学习了，研究研究，楼主辛苦了，我会认真研究的，要不对不起你

62 楼 yu_xian81 2009-05-08

谢过了.有代码,有说明,不错.
哎,学了知识点,还是要多写代码.

61 楼 piao_live 2008-10-05

思路很好，值得借鉴

60 楼落花虽有意 2008-08-19

...版式有问题,
希望能耐心的看看,谢谢了哈

59 楼落花虽有意 2008-08-19

看了你的思路我也写了个简单的,中间出了点问题想请教您,谢谢了```

问题是这样的:
在多个子线程下载文件后我试着记录已下载文件的大小,但记录的最后结果却比文件实际大小大很多,但下载后的文件没有问题,只是记录时出现了错误,

我的猜想是:不知道是不是读取数据时有一些多余的与下载文件相关的数据信息,而这些数据没有写入实际文件,但我加在记录大小的属性上了

下面是一些相关的代码:
主线程里面的方法:

public synchronized  void addContentSizeLoaded(long addSize)
	{
		contentSizeLoaded += addSize;
	}

子线程里每次读取数据后调用主线程的上述方法增加已下载文件大小:

while(currentPos <= endPos)
			{
				if(endPos - currentPos < bufSize)
					len = bis.read(buf, 0, (int)(endPos - currentPos + 1));
				else
					len = bis.read(buf, 0, bufSize);
				if(len != -1)
				{
					raf.write(buf, 0, len);
					currentPos += len;
					loadTask.addContentSizeLoaded(len);	// 增加总的已经下载文件大小
					//LoaderUtil.showMessage("线程" + numId + ": 下载了 " + len + " bytes.");
				}else
				{
					String msg = "任务" + loadTask.getId() + ": 第" + numId + "个线程读取数据出错:currentPos=" + currentPos;
					LoaderUtil.showMessage(msg);
					break;
				}
			}

58 楼 nighty 2008-08-05

不错，谢谢，学习一下！

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论