`
zsxxsz
  • 浏览: 451142 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

线程池设计中的惊群问题

阅读更多

      多线程编程已经是现在网络编程中常用的编程技术,设计一个良好的线程池库显得尤为重要。在 UNIX(WIN32下可以采用类似的方法,acl 库中的线程池是跨平台的) 环境下设计线程池库主要是如何用好如下系统 API:

      1、pthread_cond_signal/pthread_cond_broadcast:生产者线程通知线程池中的某个或一些消费者线程池,接收处理任务;

      2、pthread_cond_wait:线程池中的消费者线程等待线程条件变量被通知;

      3、pthread_mutex_lock/pthread_mutex_unlock:线程互斥锁的加锁及解锁函数。

 

      下面的代码示例是大家常见的线程池的设计方式:

 

// 线程任务类型定义
struct thread_job {
	struct thread_job *next;  // 指向下一个线程任务
	void (*func)(void*);      // 应用回调处理函数 
	void *arg;                // 回调函数的参数
	...
};

// 线程池类型定义
struct thread_pool {
	int   max_threads;        // 线程池中最大线程数限制
	int   curr_threads;       // 当前线程池中总的线程数
	int   idle_threads;       // 当前线程池中空闲的线程数
	pthread_mutex_t mutex;    // 线程互斥锁
	pthread_cond_t  cond;     // 线程条件变量
	thread_job *first;        // 线程任务链表的表头
	thread_job *last;         // 线程任务链表的表尾
	...	
}

// 线程池中的消费者线程处理过程
static void *consumer_thread(void *arg)
{
	struct thread_pool *pool = (struct thread_pool*) arg;
	struct thread_job  *job;
	int   status;

	// 该消费者线程需要先加锁
	pthread_mutex_lock(&pool->mutex);

	while (1) {
		if (pool->first != NULL) {
			// 有线程任务时,则取出并在下面进行处理
			job = pool->first;
			pool->first = job->next;
			if (pool->last == job)
				pool->last = NULL;

			// 解锁,允许其它消费者线程加锁或生产者线程添加新的任务
			pthread_mutex_unlock(&pool->mutex);

			// 回调应用的处理函数
			job->func(job->arg);

			// 释放动态分配的内存
			free(job);

			// 重新去加锁
			pthread_mutex_lock(&pool->mutex);
		} else {
			pool->idle_threads++;

			// 在调用 pthread_cond_wait 等待线程条件变量被通知且自动解锁
			status = pthread_cond_wait(&pool->cond, &pool->mutex);

			pool->idle_threads--;

			if (status == 0)
				continue;

			// 等待线程条件变量异常,则该线程需要退出
			pool->curr_threads--;
			pthread_mutex_unlock(&pool->mutex);
			break;
		}
	}

	return NULL;
}

// 生产者线程调用此函数添加新的处理任务
void add_thread_job(struct thread_pool *pool, void (*func)(void*), void *arg)
{
	// 动态分配任务对象
	struct thread_job *job = (struct thread_job*) calloc(1, sizeof(*job));

	job->func = func;
	job->arg = arg;

	pthread_mutex_lock(&pool->mutex);

	// 将新任务添加进线程池的任务链表中
	if (pool->first == NULL)
		pool->first = job;
	else
		pool->last->next = job;
	pool->last = job;
	job->next = NULL;
	
	if (pool->idle_threads > 0) {
		// 如果有空闲消费者线程,则通知空闲线程进行处理,同时需要解锁

		pthread_mutex_unlock(&pool->mutex);
		pthread_cond_signal(&pool->cond);
	} else if (pool->curr_threads < pool->max_threads) {
		// 如果未超过最大线程数限制,则创建一个新的消费者线程

		pthread_t id;
		pthread_attr_t attr;

		pthread_attr_init(&attr);

		// 将线程属性设为分离模式,这样当线程退出时其资源自动由系统回收
		pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED);

		// 创建一个消费者线程
		if (pthread_create(&id, &attr, consumer_thread, pool) == 0)
			pool->curr_threads++;

		pthread_mutex_unlock(&pool->mutex);
		pthread_attr_destroy(&attr);
	}
}

// 创建线程池对象
struct thread_pool *create_thread_pool(int max_threads)
{
	struct thread_pool *pool = (struct thread_pool*) calloc(1, sizeof(*pool));
	
	pool->max_threads = max_threads;
	pthread_mutex_init(&pool->mutex);
	pthread_cond_init(&pool->cond);
	...

	return pool;
}

///////////////////////////////////////////////////////////////////////////////////
// 使用上面线程池的示例如下:

// 由消费者线程回调的处理过程
static void thread_callback(void* arg)
{
      ...
}

void test(void)
{
	struct thread_pool *pool = create_thread_pool(100);
	int   i;

	// 循环添加 1000000 次线程处理任务
	for (i = 0; i < 1000000; i++)
		add_thread_job(pool, thread_callback, NULL);
}

 

 

      乍一看去,似乎也没有什么问题,象很多经典的开源代码中也是这样设计的,但有一个重要问题被忽视了:线程池设计中的惊群现象。大家可以看到,整个线程池只有一个线程条件变量和线程互斥锁,生产者线程和消费者线程(即线程池中的子线程)正是通过这两个变量进行同步的。生产者线程每添加一个新任务,都会调用 pthread_cond_signal 一次,由操作系统唤醒一个在线程条件变量等待的消费者线程,但如果查看 pthread_cond_signal API 的系统帮助,你会发现其中有一句话:调用此函数后,系统会唤醒在相同条件变量上等待的一个或多个线程。而正是这句模棱两可的话没有引起很多线程池设计者的注意,这也是整个线程池中消费者线程收到信号通知后产生惊群现象的根源所在,并且是消费者线程数量越多,惊群现象越严重----意味着 CPU 占用越高,线程池的调度性能越低。

      要想避免如上线程池设计中的惊群问题,在仍然共用一个线程互斥锁的条件下,给每一个消费者线程创建一个线程条件变量,生产者线程在添加任务时,找到空闲的消费者线程,将任务置入该消费者的任务队列中同时只通知 (pthread_cond_signal) 该消费者的线程条件变量,消费者线程与生产者线程虽然共用相同的线程互斥锁(因为有全局资源及调用 pthread_cond_wait 所需),但线程条件变量的通知过程却是定向通知的,未被通知的消费者线程不会被唤醒,这样惊群现象也就不会产生了。

      当然,还有一些设计上的细节需要注意,比如:当没有空闲消费者线程时,需要将任务添加进线程池的全局任务队列中,消费者线程处理完自己的任务后需要查看一下线程池中的全局任务队列中是否还有未处理的任务。

      更多的线程池的设计细节请参考 acl (https://sourceforge.net/projects/acl/) 库中 lib_acl/src/thread/acl_pthread_pool.c 中的代码。

 

 参考:

线程编程常见API简介(上)

线程编程常见API简介(中)

线程编程常见API简介(下)

使用 acl_cpp 库编写多线程程序

利用ACL库开发高并发半驻留式线程池程序

多线程开发时线程局部变量的使用

再谈线程局部变量

 

acl 库下载:https://sourceforge.net/projects/acl/

github:https://github.com/zhengshuxin/acl

svn:svn checkout svn://svn.code.sf.net/p/acl/code/trunk acl-code

qq 群:242722074
0
0
分享到:
评论

相关推荐

    一个线程池的设计

    线程池的设计旨在解决创建和销毁线程带来的高昂开销问题。在多线程环境中,频繁地创建和销毁线程会消耗大量的系统资源,降低系统的整体性能。通过维护一个可重用的线程集合,线程池能够快速响应任务需求,减少线程...

    Linux环境下的通用线程池设计

    - 当有新的任务到来时,不再创建新的线程,而是将任务放入队列中,由线程池中的空闲线程取出任务进行处理。 - 线程在完成任务后返回线程池等待新的任务,而不是退出,从而避免了频繁的线程创建和销毁。 示例代码...

    C++简单线程池设计

    在C++线程池中,我们可以使用curl库来发起网络请求,将这些请求作为任务提交给线程池。通过异步处理网络请求,我们可以避免单个线程因等待网络响应而阻塞,提高整体性能。 在GCC环境下编译,可以使用g++命令,指定...

    Linux环境下通用线程池设计

    - 通过线程池技术,可以在一定程度上缓解多进程/线程模型中存在的问题,比如避免频繁创建和销毁进程/线程导致的开销,以及并发数量受限于系统资源的问题。 2. **构建通用的体系结构** - 目标是建立一个高度抽象...

    阻塞线程池 阻塞线程池 阻塞线程池

    阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池阻塞线程池...

    Java简单线程池 线程池中文文档

    简单的线程池程序+中文文档 包结构: com.tangkai.threadpool --SimpleThread.java 工作线程 --TestThreadPool.java 程序入口 --ThreadPoolManager.java 线程池管理类

    liunx 通用线程池设计思想

    此外,还负责监控线程池状态,当线程池中空闲线程数量低于某个阈值时,可以创建额外的线程来满足需求。 - **任务队列**:使用先进先出(FIFO)原则存储待处理任务。当有新任务到达时,将其放入队列末尾;当线程从...

    线程池  

    2. **任务队列**:线程池中存放待处理任务的队列,线程从这个队列中取出任务并执行。 3. **工作线程**:预先创建的线程,它们从任务队列中获取任务并执行。 创建线程池的步骤如下: 1. **初始化线程池**:设置...

    C++ 线程池设计

    线程池是一种多线程处理形式,预先创建一组线程,待有任务需要处理时,从线程池中取出空闲线程分配任务,完成任务后线程返回线程池,以便再次使用。这种设计模式可以有效管理系统资源,提高系统效率。 在C++中,...

    线程池技术在网络游戏服务器中的应用

    "线程池技术在网络游戏服务器中的应用" 线程池技术是网络游戏服务器中的一种重要技术,它可以提高服务器的性能,减少系统资源的开销。在网络游戏服务器中,线程池技术可以用于处理大量的数据包,以提高服务器的...

    _基于线程池的高性能服务器软件的设计和实现

    2. **线程管理**:为了有效管理线程池中的线程,需要设计合理的数据结构来存储和管理空闲与活跃状态的线程。此外,还需要考虑线程同步机制,确保线程间的正确调度和资源访问。 3. **性能优化**:除了采用线程池技术...

    线程池实现蚁群算法的简单并行

    线程池是一种管理线程的技术,它预先创建了一组线程,当有任务需要执行时,任务会被放入队列,线程池中的空闲线程会从队列中取出任务并执行。这种方式避免了频繁创建和销毁线程带来的开销,提高了系统的响应速度和...

    仿ACE线程池机制实现的线程池类

    CWorker是线程池中的工作单元,每个工作线程都是一个CWorker实例。它负责接收来自线程池的任务,并执行这些任务。工作者线程通常会等待在队列中获取任务,一旦有任务到来,就进行处理。CWorker可能包含对任务的处理...

    线程池设计

    3. **线程调度**:线程池中的工作线程会定期检查任务队列,一旦发现有任务,就会从队列中取出任务并执行。这样,任务的分配和执行是异步进行的,提高了系统的并发性。 4. **线程管理**:当线程池中的线程完成任务后...

    线程池线程池线程池线程池

    线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池线程池...

    关闭线程池

    这些异常反映了网络通信和线程池操作中的常见问题,如连接超时、线程池饱和和套接字关闭。捕获这些异常并记录日志有助于调试和监控系统的健康状态。 总的来说,关闭线程池是一个涉及系统稳定性、资源管理和异常处理...

Global site tag (gtag.js) - Google Analytics