`
liangguanhui
  • 浏览: 113974 次
  • 性别: Icon_minigender_1
社区版块
存档分类
最新评论

【原创】Java多线程断点下载理论

阅读更多

希望你转载文章的时候,麻烦保留作者信息。(夏威夷雪人 or 书虫)

1、断点下载的基本原理
  
  其实这个是HTTP协议的一部分。在HTTP 1.1,支持断点下载,断点HTTP请求跟一般的HTTP请求基本相同,只有两点不同:
  
(1)发起请求是HTTP的版本必须是HTTP/1.1
(2)在Header有这样一个节点:Range,格式是Range: bytes=起始字节-结束字节
  
  如果HTTP返回的状态码是206,则代表对方支持断点下载,否则就是不支持。另外我用HttpURLConnection的时候,找不到设置HTTP版本的方法,虽然在下载的时候很多网站照样支持,但感觉不是很踏实。希望可以找到解决的方法。(当然可以自己用Socket实现一个Http协议,不过重复轮子的事情貌似不好,也不怎么想用HttpClient这个大块头)
  
2、任务的分配算法
  
  如果我们认真看一下FlashGet的下载栏目,一定可以看到它有一堆表示进度的格子,这里,每个格子就代表固定长度的字节,从这里我们可以清晰地看到下载的进度以及每一部分下载的情况。我们这里也使用类似的方法,把整个文件按照固定的长度(4K)分成很多“格”,然后进行多线程下载。这里就产生一个问题:怎么决定每个格子哪个线程去下载?我们知道,下载的时候,发起连接现对来说是一个比较耗时的操作,所以,我们需要把任务尽可能平均分配,较少连接的次数。
  
  我们根据每一个未下载的格子的“相连”情况,分成若干“条”“任务链”。这里的“相连”,是指按顺序的每一个未下载的格子都是相连的,没有跳跃。任务刚开始的时候,只有一条“任务链”,但当开始之后,当某些部分格子下载完毕之后,就被分割成不止一条“任务链”了。同时因为可能每一个线程的下载速度各不相同,所以,每一条任务链的长度可能都不相同。这就产生一个问题,当某个线程先一步完成了,我们当然是让这个线程继续下载,这时,我们就需要重新分配“任务链”。(如果我们用FlashGet下载一个文件,观察它的“格子”,对这个“任务链”的概念应该会更加清楚)
  
  整个分配算法,抽象出来,其实就是:有m条绳子,需要对这些绳子合共剪n刀,如何剪法才能使剪出来的绳子的最长跟最短的差距最小?
  
  首先我们需要明确的是,无论是何种剪法,都需要遵守这个原则:对每条绳子的剪都必须是平均剪。至于原因,读者可以自己思考。
  
  开始的时候,我是打算枚举所有剪法,然后计算每一种的剪法中,最短跟最长的差距。不过发现算法不容易写(粗略想了一下,貌似是排列组合的问题),而且时间复杂度貌似有O(n的平方)这么多。
  
  后来才发现自己原来是绕了个大弯。剪法其实很简单,首先在这m条绳子里找到最长的一条,放下一个剪刀,这是第一轮;然后在这m条绳子里再找到最长的一条,找的时候,如果遇到放有剪刀的绳子,按照剪刀的数目重新计算平均的绳子长度,例如加入绳子有6,放有2把剪刀,我们就算他为6÷(2+1)=2,然后,又在最长的那里放下一个剪刀;……这样一直循环,直到放完所有剪刀。算法非常简单,而且时间复杂度只有O(n)。
  
3、缓冲写的功能
  
  一般的下载工具都有缓冲写的功能,这个功能貌似对硬盘保养有一定的帮助。由于我们的下载是多线程下载,一般的方法是每个线程每次下完一个格子之后然后把这个格子的数据放到一个List里面,然后检查这个List里面的数据时候超过一个额度,如果超过,就把这些数据写道文件里面。这里有两个问题:
  
(1)当这个线程写文件的时候,这个List我们当然要上锁的,这个时候,其余线程就不能往这个List里面放数据,被阻塞了。(解决方法很简单,把这个List的数据搬到另外一个B List里面,然后清空List的数据,再在这个线程根据B List慢慢写文件,这样其余线程就不会阻塞了)
  
(2)这种方法需要浪费一个本来是下载的线程来写文件。
  
  第二个问题解决的方法是另起一个线程来专门写文件。每次每个线程下载完一个格子之后,把这个格子的数据放到一个地方(可以是List,也可以是其它),然后通知那个专门写文件的线程。那个线程检查数据的数量,如果超过一个额度就写文件。
  
  很明显,这是一个典型的生产/消费模型。Java5已经帮我们准备好了一个接口——BlockingQueue,就不需要再重复造轮子了。
  
  最后差点忘了说,这里写文件由于需要跳跃写,所以需要使用RandomAccessFile,同时建议一开始就分配空间,减少产生文件碎片的可能。
  
4、使用NIO代替多线程+BIO
  
  貌似现在越来越流行NIO了,连Tomcat6都是NIO,我们也把我们的下载工具改造成NIO。具体的NIO原理就不在这里细说了,读者可以上网查查,不过由于HttpURLConnection和HttpClient都是基于BIO的,所以很遗憾,如果你要用NIO,你不得不自己实现Http的协议,虽然不是很难。

分享到:
评论

相关推荐

    SSO单点登录概要设计说明书.doc

    SSO单点登录概要设计说明书.doc

    奥塔北煤矿6.0 Mta新井设计说明书.docx

    奥塔北煤矿6.0 Mta新井设计说明书.docx

    基于S7-200 PLC和组态王的喷泉控制系统设计与实现

    内容概要:本文详细介绍了基于S7-200 PLC和组态王软件构建喷泉控制系统的全过程。首先明确了系统的IO分配,包括启动按钮、停止按钮以及喷泉水泵的连接方式。接着展示了梯形图程序的设计,涵盖了基本的启停控制逻辑、定时循环和模式切换机制。随后提供了详细的接线图原理图,解释了输入输出部分的具体接线方法。最后讲述了组态王的画面设计,包括创建工程、定义变量和绘制监控界面等步骤。此外还分享了一些调试过程中遇到的问题及解决方案。 适合人群:对自动化控制感兴趣的初学者和技术人员,尤其是那些希望深入了解PLC编程和人机界面设计的人群。 使用场景及目标:适用于小型喷泉项目的实际控制系统开发,旨在帮助读者掌握PLC编程技巧、熟悉组态软件的应用,并能够独立完成类似的自动化控制系统设计。 其他说明:文中不仅包含了理论知识讲解,还附带了许多实践经验分享,如硬件配置建议、常见错误规避措施等,有助于提高实际操作能力。

    计算机二级PPT精选二十套(标红).jpg

    计算机二级PPT精选二十套(标红)

    保险公司IT变更管理流程设计说明书.doc.doc

    保险公司IT变更管理流程设计说明书.doc.doc

    毕业设计说明书A江坝后式厂房双曲拱坝设计.pdf

    毕业设计说明书A江坝后式厂房双曲拱坝设计.pdf

    《计算机二级MS精选300道选择题.docx》

    内容概要:文档《计算机二级MS精选300道选择题.docx》涵盖了计算机二级考试中Microsoft Office软件(Word、Excel、PowerPoint)及计算机基础知识的选择题。题目涉及软件操作技巧、功能应用、常见问题解决等方面,旨在帮助考生熟悉并掌握相关知识点,提高应试能力。文档内容详尽,涵盖面广,从基础操作到高级应用均有涉及,适合考生全面复习备考。 适用人群:准备参加计算机二级考试的学生及相关从业人员,特别是需要强化Office软件操作技能和计算机基础知识的人员。 使用场景及目标:①考生可以在复习过程中使用这些选择题进行自我检测,巩固所学知识;②教师可以将其作为教学辅助材料,帮助学生更好地理解和掌握课程内容;③培训机构可以用这些题目作为测试题库,评估学员的学习效果。 其他说明:文档不仅提供了大量的选择题,还详细解析了每道题目的答案,有助于考生深入理解知识点。此外,题目内容紧跟最新考试大纲,确保考生能够获得最有效的备考资料。

    基于多目标黏菌优化算法(MOSMA)的SVM参数优化及其在回归预测中的应用

    内容概要:本文介绍了一种创新的方法,利用多目标黏菌优化算法(MOSMA)来优化支持向量机(SVM)的参数C和gamma,从而提高回归预测的效果。首先详细解释了MOSMA的工作原理,包括黏菌权重更新、快速非支配排序以及自适应参数调整等关键技术点。接着展示了具体的Python代码实现,涵盖数据预处理、适应度函数定义、参数更新规则等方面。实验结果显示,在风电功率预测等多个应用场景中,相较于传统的网格搜索方法,MOSMA能够更快更有效地找到最优参数组合,显著提升了预测性能。 适合人群:从事机器学习研究或应用开发的技术人员,尤其是关注SVM参数优化及回归预测领域的从业者。 使用场景及目标:适用于需要进行高效参数寻优的回归预测任务,如风电功率预测、设备负载预测等。主要目标是通过改进SVM参数配置,获得更高的预测精度和更好的泛化能力。 其他说明:文中提供了完整的代码示例和详细的实施步骤指导,帮助读者快速理解和应用这一先进的优化技术。此外,还讨论了一些常见的注意事项和技术细节,如数据标准化、参数范围设定、并行化改造等。

    毕业设计 某油库设计说明书.pdf

    毕业设计 某油库设计说明书.pdf

    Q235钢板焊接工艺设计说明书.docx

    Q235钢板焊接工艺设计说明书.docx

    75t循环流化床锅炉设计说明书.doc

    75t循环流化床锅炉设计说明书.doc

    (最新修订版)直列四缸柴油机配气机构设计毕业论文设计说明书.doc

    (最新修订版)直列四缸柴油机配气机构设计毕业论文设计说明书.doc

    DeepSeek大模型生态报告:中国AI技术突破及其全球影响分析

    内容概要:《deepseek大模型生态报告 2025年2月》详细介绍了DeepSeek大模型的背景、应用现状、技术特点及其产业生态。DeepSeek由杭州深度求索公司创立,通过一系列技术创新,如多层注意力架构(MLA)、FP8混合精度训练框架、DualPipe跨节点通信等,显著降低了训练成本和提高了模型性能。DeepSeek在国内和国际市场迅速崛起,登顶苹果应用商店免费APP下载排行榜,并被多家企业和机构接入,包括华为、三大运营商、微软、英伟达等。其开源策略和低成本优势对全球科技供应链和资本市场产生了深远影响,尤其是在AI领域。 适合人群:对人工智能、大模型技术感兴趣的科技爱好者、研究人员、企业家及政策制定者。 使用场景及目标:①了解DeepSeek大模型的技术创新和应用现状;②探讨DeepSeek对全球AI产业生态的影响;③分析DeepSeek在不同行业(如金融、医疗、教育、制造等)的具体应用案例。 其他说明:报告还涵盖了各国政府及相关机构对DeepSeek的态度和政策回应,以及DeepSeek对未来AI技术发展和国际竞争格局的启示。此外,报告深入剖析了DeepSeek在技术架构、数据策略和工程实践方面的突破,揭示了其成功背后的组织文化和创新机制。

    基于粒子群算法的电动汽车区域综合能源系统三方定价优化研究

    内容概要:本文详细介绍了利用粒子群算法解决电动汽车区域综合能源系统中光伏电站、充电桩运营商和电网公司在定价上的三方博弈问题。通过MATLAB代码实现了粒子群算法的具体应用,包括参数设置、适应度函数设计、粒子更新策略以及结果可视化。文中展示了如何将三方定价变量编码成多维粒子,并通过目标函数计算和约束处理确保粒子在合理的解空间内搜索最优解。最终得到的电价曲线反映了不同时间段内的供需变化,验证了算法的有效性和实用性。 适合人群:从事能源系统优化、智能算法应用的研究人员和技术开发者。 使用场景及目标:适用于需要进行能源系统优化调度的场景,特别是涉及多方利益协调的问题。目标是找到光伏电价、充电桩电价和电网电价的最佳组合,使得三方利益达到最优平衡。 其他说明:建议在调试过程中关注特定时段的电价突变,适当调整参数如社会认知系数和社会学习因子,以获得更好的收敛效果。此外,初始粒子的位置选择对收敛速度有很大影响,推荐采用高斯扰动等方法进行初始化。

    WY02锥齿轮的加工工艺规程及工时定额计算 课程设计说明书.docx

    WY02锥齿轮的加工工艺规程及工时定额计算 课程设计说明书.docx

    项目管理制度范文.docx

    项目管理制度范文.docx

    风电工程技术:DFIG双馈风力发电机仿真模型解析与应用

    内容概要:本文深入探讨了双馈风力发电机(DFIG)的仿真建模及其关键技术模块。首先介绍了最大功率跟踪(MPPT)模块的工作原理,利用爬山算法优化风能利用率。接着详细讲解了转子侧变流器的矢量控制,包括坐标变换、PI调节器参数设定以及抗饱和处理。文中还讨论了网侧变流器的直流电压控制方法,强调了双闭环结构的重要性,并分享了低电压穿越仿真的实践经验。此外,文章详细解释了功率解耦控制和变速恒频实现的技术细节,提供了丰富的故障案例和调试技巧。 适合人群:从事风电工程研究和技术开发的专业人士,尤其是对DFIG仿真建模感兴趣的工程师和研究人员。 使用场景及目标:适用于希望深入了解DFIG内部机制的研究人员,帮助他们掌握从基本原理到复杂控制策略的设计与实现。同时,也为实际工程项目提供宝贵的调试经验和故障排除指南。 其他说明:文章不仅涵盖了理论分析,还包括大量实用的代码片段和具体的参数配置建议,确保读者能够顺利构建并运行仿真模型。

    基于Matlab/Simulink的统一电能质量变换器(UPQC)仿真:IP-IQ检测与电压电流补偿

    内容概要:本文详细介绍了如何利用Matlab2016的Simulink进行统一电能质量变换器(UPQC)的仿真,重点探讨了IP-IQ检测方法及其在电压和电流补偿中的应用。文中首先描述了UPQC的整体结构,包括串联和并联逆变器的设计。接着深入讲解了IP-IQ检测的具体实现步骤,包括三相锁相环同步、坐标变换以及低通滤波器的应用。此外,文章还讨论了电压和电流补偿的控制策略,特别是双闭环控制和SVPWM模块的使用。作者分享了许多调试经验和常见问题的解决方案,如谐波滤波器的选择、PI控制器参数调整、仿真步长设置等。最终展示了仿真结果,证明了该方法的有效性。 适合人群:从事电能质量研究和技术开发的专业人士,尤其是有一定Matlab/Simulink基础的研究人员和工程师。 使用场景及目标:适用于希望深入了解UPQC工作原理和仿真实现的技术人员,帮助他们掌握IP-IQ检测方法和补偿控制策略,提高电能质量问题的解决能力。 其他说明:文中提供了详细的代码片段和调试技巧,有助于读者快速上手并优化自己的仿真模型。

    《金属打磨粉尘治理方案设计说明书》.doc

    《金属打磨粉尘治理方案设计说明书》.doc

    欧姆龙NJ/NX控制器ST语言编程框架:非标设备气缸控制、报警处理与产量统计的最佳实践

    内容概要:本文详细介绍了使用欧姆龙NJ/NX控制器及其ST语言进行非标设备开发的具体方法和技术细节。主要内容涵盖气缸控制(如XYZ三轴气缸的状态管理)、报警处理(如移位指令用于NG检测)以及产量统计(如功能块封装的日/月统计)。此外,还涉及了EtherCAT同步运动控制和雅马哈机器人的EIP通讯。文中提供了多个实用的代码片段,展示了如何高效地管理和优化非标设备的自动化流程。 适合人群:从事工业自动化领域的工程师,尤其是对欧姆龙NJ/NX控制器有一定了解的技术人员。 使用场景及目标:适用于需要提高非标设备开发效率、优化气缸控制逻辑、改进报警机制和提升产量统计数据准确性的工作环境。目标是帮助工程师掌握ST语言编程技巧,从而更好地应对复杂的工业自动化挑战。 其他说明:文中不仅分享了具体的编程技术和代码示例,还强调了良好的编程习惯和架构设计的重要性,有助于读者在实际工作中避免常见错误并提高系统的稳定性和可靠性。

Global site tag (gtag.js) - Google Analytics