`

Java编程中线程池的最大风险规避

阅读更多

虽然线程池能大大提高服务器的并发性能,但使用它也会存在一定风险。与所有多线程应用程序一样,用线程池构建的应用程序容易产生各种并发问题,如对共享资源的竞争和死锁。此外,如果线程池本身的实现不健壮,或者没有合理地使用线程池,还容易导致与线程池有关的死锁、系统资源不足和线程泄漏等问题。
    1.死锁
    任何多线程应用程序都有死锁风险。造成死锁的最简单的情形是,线程A持有对象X的锁,并且在等待对象Y的锁,而线程B持有对象Y的锁,并且在等待对象X的锁。线程A与线程B都不释放自己持有的锁,并且等待对方的锁,这就导致两个线程永远等待下去,死锁就这样产生了。
    虽然任何多线程程序都有死锁的风险,但线程池还会导致另外一种死锁。在这种情形下,假定线程池中的所有工作线程都在执行各自任务时被阻塞,它们都在等待某个任务A的执行结果。而任务A依然在工作队列中,由于没有空闲线程,使得任务A一直不能被执行。这使得线程池中的所有工作线程都永远阻塞下去,死锁就这样产生了。
    2.系统资源不足
    如果线程池中的线程数目非常多,这些线程会消耗包括内存和其他系统资源在内的大量资源,从而严重影响系统性能。
    3.并发错误
    线程池的工作队列依靠wait()和notify()方法来使工作线程及时取得任务,但这两个方法都难于使用。如果编码不正确,可能会丢失通知,导致工作线程一直保持空闲状态,无视工作队列中需要处理的任务。因此使用这些方法时,必须格外小心,即便是专家也可能在这方面出错。最好使用现有的、比较成熟的线程池。例如,直接使用java.util.concurrent包中的线程池类。
    4.线程泄漏
    使用线程池的一个严重风险是线程泄漏。对于工作线程数目固定的线程池,如果工作线程在执行任务时抛出 RuntimeException 或Error,并且这些异常或错误没有被捕获,那么这个工作线程就会异常终止,使得线程池永久失去了一个工作线程。如果所有的工作线程都异常终止,线程池就最终变为空,没有任何可用的工作线程来处理任务。
    导致线程泄漏的另一种情形是,工作线程在执行一个任务时被阻塞,如等待用户的输入数据,但是由于用户一直不输入数据(可能是因为用户走开了),导致这个工作线程一直被阻塞。这样的工作线程名存实亡,它实际上不执行任何任务了。假如线程池中所有的工作线程都处于这样的阻塞状态,那么线程池就无法处理新加入的任务了。[nextpage]
    5.任务过载
    当工作队列中有大量排队等候执行的任务时,这些任务本身可能会消耗太多的系统资源而引起系统资源缺乏。
    综上所述,线程池可能会带来种种风险,为了尽可能避免它们,使用线程池时需要遵循以下原则。
    (1)如果任务A在执行过程中需要同步等待任务B的执行结果,那么任务A不适合加入到线程池的工作队列中。如果把像任务A一样的需要等待其他任务执行结果的任务加入到工作队列中,可能会导致线程池的死锁。
    (2)如果执行某个任务时可能会阻塞,并且是长时间的阻塞,则应该设定超时时间,避免工作线程永久的阻塞下去而导致线程泄漏。在服务器程序中,当线程等待客户连接,或者等待客户发送的数据时,都可能会阻塞。可以通过以下方式设定超时时间:
    调用ServerSocket的setSoTimeout(int timeout)方法,设定等待客户连接的超时时间;
    对于每个与客户连接的Socket,调用该Socket的setSoTimeout(int timeout)方法,设定等待客户发送数据的超时时间。
    (3)了解任务的特点,分析任务是执行经常会阻塞的I/O操作,还是执行一直不会阻塞的运算操作。前者时断时续地占用CPU,而后者对CPU具有更高的利用率。预计完成任务大概需要多长时间?是短时间任务还是长时间任务?
    根据任务的特点,对任务进行分类,然后把不同类型的任务分别加入到不同线程池的工作队列中,这样可以根据任务的特点,分别调整每个线程池。
    (4)调整线程池的大小。线程池的最佳大小主要取决于系统的可用CPU的数目,以及工作队列中任务的特点。假如在一个具有 N 个CPU的系统上只有一个工作队列,并且其中全部是运算性质(不会阻塞)的任务,那么当线程池具有 N 或 N+1 个工作线程时,一般会获得最大的 CPU 利用率。
    如果工作队列中包含会执行I/O操作并常常阻塞的任务,则要让线程池的大小超过可用CPU的数目,因为并不是所有工作线程都一直在工作。选择一个典型的任务,然后估计在执行这个任务的过程中,等待时间(WT)与实际占用CPU进行运算的时间(ST)之间的比例WT/ST。对于一个具有N个CPU的系统,需要设置大约N×(1+WT/ST)个线程来保证CPU得到充分利用。
    当然,CPU利用率不是调整线程池大小过程中唯一要考虑的事项。随着线程池中工作线程数目的增长,还会碰到内存或者其他系统资源的限制,如套接字、打开的文件句柄或数据库连接数目等。要保证多线程消耗的系统资源在系统的承载范围之内。
    (5)避免任务过载。服务器应根据系统的承载能力,限制客户并发连接的数目。当客户并发连接的数目超过了限制值,服务器可以拒绝连接请求,并友好地告知客户:服务器正忙,请稍后再试。

分享到:
评论

相关推荐

    Java 并发编程实战.pdf

    根据提供的信息,“Java 并发编程实战.pdf”这本书聚焦于Java并发编程的实践与应用,旨在帮助读者深入了解并掌握Java中的多线程技术及其在实际项目中的应用技巧。虽然部分内容未能提供具体章节或实例,但从标题及...

    Java-Web-crawler-.zip_JAVA web 爬虫_crawler_java web crawler_java

    Java Web 爬虫是用于自动化地从互联网上抓取信息的一种程序,它通常由Java编程语言编写,能够遍历网页、解析HTML或其他格式的数据,并按照特定规则存储或处理这些数据。在这个“Java-Web-crawler-.zip”压缩包中,...

    史上最全的java书籍

    而其中对于死锁、活锁、饥饿等并发问题的探讨,更是让读者在学习理论的同时,能够学会如何在实际开发中规避这些问题,保障程序的稳定性和性能。 当我们的视线转向Web应用的安全性时,《Web应用安全权威指南》就成为...

    JAVA学习书籍两部

    在IT行业中,Java是一种广泛应用的编程语言,尤其在企业级应用和互联网开发中占据着重要地位。本压缩包包含两部重要的Java学习书籍,旨在帮助读者深入理解和掌握Java技术。 第一本书是《Java多线程编程实战指南 ...

    Java定时任务实现解析.pptx.pptx

    Java定时任务是编程领域中一个重要的概念,它允许开发者安排任务在特定时间点或按预设周期执行。这种功能在各种应用中都有广泛用途,比如系统维护、数据处理和用户行为分析。本篇将深入解析Java定时任务的原理、常见...

    并发编程78讲 文档 资料

    - **线程池参数解析**:在第10讲中,深入剖析了线程池的各个参数,如核心线程数、最大线程数、工作队列容量和超时策略,理解这些参数对于优化系统性能至关重要。 2. **并发容器** - **ConcurrentHashMap**:第30...

    java 性能优化

    低版本JDK不支持非阻塞I/O API,为了规避I/O阻塞,一些应用采用大量线程(或线程池)的方式。然而,创建Java线程消耗资源。JDK 1.4引入的非阻塞I/O库(`java.nio`),有效减少了线程创建带来的开销,尤其在需支持...

    阿里巴巴Java开发手册_v1.4.0_详尽版

    4. **并发编程**:针对多线程环境,手册给出了线程安全、锁机制、并发工具类、线程池等方面的最佳实践,帮助开发者理解和规避并发问题。 5. **设计模式**:介绍了常见的设计模式,如工厂模式、单例模式、观察者模式...

    基于爬虫的美食推荐小程序设计与实现.docx

    Java线程池是Java并发编程的基础组件之一,通过预先创建一定数量的工作线程,可以有效地复用线程资源,提高系统的响应速度和吞吐量。在爬虫项目中,利用线程池可以并行地发起多个HTTP请求,大大提高爬取效率。 **...

    基于JAVA的京东商品分布式爬虫系统的设计与实现.pdf

    JAVA语言因其强大的跨平台特性、成熟的数据处理能力和并发编程支持,成为了开发分布式爬虫系统的首选语言。本文所述的爬虫系统首先从京东平台获取商品ID列表,然后通过爬虫节点对商品页面进行访问,解析HTML内容提取...

    Android应用程序启动白屏黑屏优化

    - **全局禁用Starting Window**:在Android源码中,可以通过修改`ActivityStack.java`文件中的`SHOW_APP_STARTING_PREVIEW`变量为`false`来全局禁用Starting Window。这种方式简单但不够灵活,不适用于所有场景。 ...

    Resolve Weblogic Hang _ Core.pdf

    4. **执行线程队列 (Execute Thread Queue)**:当线程池中的线程全部处于忙碌状态时,新到达的请求会被放入队列等待处理。 #### WebLogic 挂起 **定义:** WebLogic 挂起是指 WebLogic Server 进程仍然存活,但是...

Global site tag (gtag.js) - Google Analytics