第1节 背景
为了更好的理解多线程的概念,先对进程,线程的概念背景做一下简单介绍。
早期的计算机系统都只允许一个程序独占系统资源,一次只能执行一个程序。在大型机年代,计算能力是一种宝贵资源。对于资源拥有方来说,最好的生财之道自然是将同一资源同时租售给尽可能多的用户。最理想的情况是垄断全球计算市场。所以不难理解为何当年IBM预测“全球只要有4台计算机就够了”。
这种背景下,一个计算机能够支持多个程序并发执行的需求变得十分迫切。由此产生了进程的概念。进程在多数早期多任务操作系统中是执行工作的基本单元。进程是包含程序指令和相关资源的集合。每个进程和其他进程一起参与调度,竞争CPU,内存等系统资源。每次进程切换,都存在进程资源的保存和恢复动作,这称为上下文切换。
进程的引入可以解决支持多用户的问题,但是多进程系统也在如下方面产生了新的问题:
进程频繁切换引起的额外开销可能会严重影响系统性能。
进程间通信要求复杂的系统级实现。
在程序功能日趋复杂的情况下,上述缺陷也就凸现出来。比如,一个简单的GUI程序,为了有更好的交互性,通常用一个任务支持界面交互,另一个任务支持后台运算。如果每个任务均由一个进程来实现,那会相当低效。对每个进程来说,系统资源看上去都是其独占的。比如内存空间,每个进程认为自己的内存空间是独有的。一次切换,这些独立资源都需要切换。
由此就演化出了利用分配给同一个进程的资源,尽量实现多个任务的方法。这也就引入了线程的概念。同一个进程内部的多个线程,共享的是同一个进程的所有资源。
比如,与每个进程独有自己的内存空间不同,同属一个进程的多个线程共享该进程的内存空间。例如在进程地址空间中有一个全局变量globalVar,若A线程将其赋值为1,则另一线程B可以看到该变量值为1。两个线程看到的全局变量globalVar是同一个变量。
通过线程可以支持同一个应用程序内部的并发,免去了进程频繁切换的开销,另外并发任务间通信也更简单。
目前多线程应用主要用于两大领域:网络应用和嵌入式应用。为什么在这两个领域应用较多呢因为多线程应用能够解决两大问题:
并发。网络程序具有天生的并发性。比如网络数据库可能需要同时处理数以千计的请求。而由于网络连接的时延不确定性和不可靠性,一旦等待一次网络交互,可以让当前线程进入睡眠,退出调度,处理其他线程。这样就能够有效利用系统资源,充分发挥系统处理能力。
实时。线程的切换是轻量级的,所以可以保证足够快。每当有事件发生,状态改变,都能有线程及时响应,而且每次线程内部处理的计算强度和复杂度都不大。在这种情况下,多线程实现的模型也是高效的。
在有些语言中,对多线程或者并发的支持是直接内建在语言中的,比如Ada和VHDL。在C++里面,对多线程的支持由具体操作系统提供的函数接口支持。不同的系统中具体实现方法不同。后面所有例子只给出windows和Unix/Linux的实现。
在后面的实现中,考虑的是尽量封装隔离底层的多线程函数接口,屏蔽操作系统底层的线程实现具体细节,介绍的重点是多线程编程中较通用的概念。同时也尽量体现C++面向对象的一面。
最后,由于空闲时间有限,我只求示例代码能够明确表达自己的意思即可。至于代码的尽善尽美就只能有劳各位尽力以为之了。
第2节 线程的创建
本节介绍如下内容
线程状态
线程运行环境
线程类定义
示例程序
线程类的Windows和Unix实现
线程状态
在一个线程的生存期内,可以在多种状态之间转换。不同操作系统可以实现不同的线程模型,定义许多不同的线程状态,每个状态还可以包含多个子状态。但大体说来,如下几种状态是通用的:
就绪:参与调度,等待被执行。一旦被调度选中,立即开始执行。
运行:占用CPU,正在运行中。
休眠:暂不参与调度,等待特定事件发生。
中止:已经运行完毕,等待回收线程资源(要注意,这个很容易误解,后面解释)。
线程环境
线程存在于进程之中。进程内所有全局资源对于内部每个线程均是可见的。
进程内典型全局资源有如下几种:
代码区。这意味着当前进程空间内所有可见的函数代码,对于每个线程来说也是可见的。
静态存储区。全局变量。静态变量。
动态存储区。也就是堆空间。
线程内典型的局部资源有:
本地栈空间。存放本线程的函数调用栈,函数内部的局部变量等。
部分寄存器变量。例如本线程下一步要执行代码的指针偏移量。
一个进程发起之后,会首先生成一个缺省的线程,通常称这个线程为主线程。C/C++程序中主线程就是通过main函数进入的线程。由主线程衍生的线程称为从线程,从线程也可以有自己的入口函数,作用相当于主线程的main函数。
这个函数由用户指定。Pthread和winapi中都是通过传入函数指针实现。在指定线程入口函数时,也可以指定入口函数的参数。就像main函数有固定的格式要求一样,线程的入口函数一般也有固定的格式要求,参数通常都是void *类型,返回类型在pthread中是void *, winapi中是unsigned int,而且都需要是全局函数。
最常见的线程模型中,除主线程较为特殊之外,其他线程一旦被创建,相互之间就是对等关系 (peer to peer), 不存在隐含的层次关系。每个进程可以创建的最大线程数由具体实现决定。
为了更好的理解上述概念,下面通过具体代码来详细说明。
线程类接口定义
一个线程类无论具体执行什么任务,其基本的共性无非就是
创建并启动线程
停止线程
另外还有就是能睡,能等,能分离执行(有点拗口,后面再解释)。
还有其他的可以继续加…
将线程的概念加以抽象,可以为其定义如下的类:
文件 thread.h
显示代码打印
01 #ifndef __THREAD__H_
02 #define __THREAD__H_
03 class Thread
04 {
05 public:
06 Thread();
07 virtual ~Thread();
08 int start (void * = NULL);
09 void stop();
10 void sleep (int);
11 void detach();
12 void * wait();
13 protected:
14 virtual void * run(void *) = 0;
15 private:
16 //这部分win和unix略有不同,先不定义,后面再分别实现。
17 //顺便提一下,我很不习惯写中文注释,这里为了更明白一
18 //点还是选用中文。
19 …
20 };
21 #endif
Thread::start()函数是线程启动函数,其输入参数是无类型指针。
Thread::stop()函数中止当前线程。
Thread::sleep()函数让当前线程休眠给定时间,单位为秒。
Thread::run()函数是用于实现线程类的线程函数调用。
Thread::detach()和thread::wait()函数涉及的概念略复杂一些。在稍后再做解释。
Thread类是一个虚基类,派生类可以重载自己的线程函数。下面是一个例子。
示例程序
代码写的都不够精致,暴力类型转换比较多,欢迎有闲阶级美化,谢过了先。
文件create.h
显示代码打印
01 #ifndef __CREATOR__H_
02 #define __CREATOR__H_
03
04 #include <stdio.h>
05 #include "thread.h"
06
07 class Create: public Thread
08 {
09 protected:
10 void * run(void * param)
11 {
12 char * msg = (char*) param;
13 printf ("%s\n", msg);
14 //sleep(100); 可以试着取消这行注释,看看结果有什么不同。
15 printf("One day past.\n");
16 return NULL;
17 }
18 };
19 #endif
然后,实现一个main函数,来看看具体效果:
文件Genesis.cpp
显示代码打印
01 #include <stdio.h>
02 #include "create.h"
03
04 int main(int argc, char** argv)
05 {
06 Create monday;
07 Create tuesday;
08
09 printf("At the first God made the heaven and the earth.\n");
10 monday.start("Naming the light, Day, and the dark, Night, the first day.");
11 tuesday.start("Gave the arch the name of Heaven, the second day.");
12 printf("These are the generations of the heaven and the earth.\n");
13
14 return 0;
15 }
编译运行,程序输出如下:
At the first God made the heaven and the earth.
These are the generations of the heaven and the earth.
令人惊奇的是,由周一和周二对象创建的子线程似乎并没有执行!这是为什么呢别急,在最后的printf语句之前加上如下语句:
monday.wait();
tuesday.wait();
重新编译运行,新的输出如下:
At the first God made the heaven and the earth.
Naming the light, Day, and the dark, Night, the first day.
One day past.
Gave the arch the name of Heaven, the second day.
One day past.
These are the generations of the heaven and the earth.
为了说明这个问题,需要了解前面没有解释的Thread::detach()和Thread::wait()两个函数的含义。
无论在windows中,还是Posix中,主线程和子线程的默认关系是:
无论子线程执行完毕与否,一旦主线程执行完毕退出,所有子线程执行都会终止。这时整个进程结束或僵死(部分线程保持一种终止执行但还未销毁的状态,而进程必须在其所有线程销毁后销毁,这时进程处于僵死状态),在第一个例子的输出中,可以看到子线程还来不及执行完毕,主线程的main()函数就已经执行完毕,从而所有子线程终止。
需要强调的是,线程函数执行完毕退出,或以其他非常方式终止,线程进入终止态(请回顾上面说的线程状态),但千万要记住的是,进入终止态后,为线程分配的系统资源并不一定已经释放,而且可能在系统重启之前,一直都不能释放。终止态的线程,仍旧作为一个线程实体存在与操作系统中。(这点在win和unix中是一致的。)而什么时候销毁线程,取决于线程属性。
通常,这种终止方式并非我们所期望的结果,而且一个潜在的问题是未执行完就终止的子线程,除了作为线程实体占用系统资源之外,其线程函数所拥有的资源(申请的动态内存,打开的文件,打开的网络端口等)也不一定能释放。所以,针对这个问题,主线程和子线程之间通常定义两种关系:
可会合(joinable)。这种关系下,主线程需要明确执行等待操作。在子线程结束后,主线程的等待操作执行完毕,子线程和主线程会合。这时主线程继续执行等待操作之后的下一步操作。主线程必须会合可会合的子线程,Thread类中,这个操作通过在主线程的线程函数内部调用子线程对象的wait()函数实现。这也就是上面加上三个wait()调用后显示正确的原因。必须强调的是,即使子线程能够在主线程之前执行完毕,进入终止态,也必需显示执行会合操作,否则,系统永远不会主动销毁线程,分配给该线程的系统资源(线程id或句柄,线程管理相关的系统资源)也永远不会释放。
相分离(detached)。顾名思义,这表示子线程无需和主线程会合,也就是相分离的。这种情况下,子线程一旦进入终止态,系统立即销毁线程,回收资源。无需在主线程内调用wait()实现会合。Thread类中,调用detach()使线程进入detached状态。这种方式常用在线程数较多的情况,有时让主线程逐个等待子线程结束,或者让主线程安排每个子线程结束的等待顺序,是很困难或者不可能的。所以在并发子线程较多的情况下,这种方式也会经常使用。
缺省情况下,创建的线程都是可会合的。可会合的线程可以通过调用detach()方法变成相分离的线程。但反向则不行。
UNIX实现
文件 thread.h
显示代码打印
001 #ifndef __THREAD__H_
002 #define __THREAD__H_
003 class Thread
004 {
005 public:
006 Thread();
007 virtual ~Thread();
008 int start (void * = NULL);
009 void stop();
010 void sleep (int);
011 void detach();
012 void * wait();
013 protected:
014 virtual void * run(void *) = 0;
015 private:
016 pthread_t handle;
017 bool started;
018 bool detached;
019 void * threadFuncParam;
020 friend void * threadFunc(void *);
021 };
022
023 //pthread中线程函数必须是一个全局函数,为了解决这个问题
024 //将其声明为静态,以防止此文件之外的代码直接调用这个函数。
025 //此处实现采用了称为Virtual friend function idiom 的方法。
026 Static void * threadFunc(void *);
027 #endif
028
029 文件thread.cpp
030 #include <pthread.h>
031 #include <sys/time.h>
032 #include “thread.h”
033
034 static void * threadFunc (void * threadObject)
035 {
036 Thread * thread = (Thread *) threadObject;
037 return thread->run(thread->threadFuncParam);
038 }
039
040 Thread::Thread()
041 {
042 started = detached = false;
043 }
044
045 Thread::~Thread()
046 {
047 stop();
048 }
049
050 bool Thread::start(void * param)
051 {
052 pthread_attr_t attributes;
053 pthread_attr_init(&attributes);
054 if (detached)
055 {
056 pthread_attr_setdetachstate(&attributes, PTHREAD_CREATE_DETACHED);
057 }
058
059 threadFuncParam = param;
060
061 if (pthread_create(&handle, &attributes, threadFunc, this) == 0)
062 {
063 started = true;
064 }
065
066 pthread_attr_destroy(&attribute);
067 }
068
069
070 void Thread::detach()
071 {
072 if (started && !detached)
073 {
074 pthread_detach(handle);
075 }
076 detached = true;
077 }
078
079 void * Thread::wait()
080 {
081 void * status = NULL;
082 if (started && !detached)
083 {
084 pthread_join(handle, &status);
085 }
086 return status;
087 }
088
089 void Thread::stop()
090 {
091 if (started && !detached)
092 {
093 pthread_cancel(handle);
094 pthread_detach(handle);
095 detached = true;
096 }
097 }
098
099 void Thread::sleep(unsigned int milliSeconds)
100 {
101 timeval timeout = { milliSeconds/1000, millisecond%1000};
102 select(0, NULL, NULL, NULL, &timeout);
103 }
Windows实现
文件thread.h
显示代码打印
001 #ifndef _THREAD_SPECIFICAL_H__
002 #define _THREAD_SPECIFICAL_H__
003
004 #include <windows.h>
005
006 static unsigned int __stdcall threadFunction(void *);
007
008 class Thread {
009 friend unsigned int __stdcall threadFunction(void *);
010 public:
011 Thread();
012 virtual ~Thread();
013 int start(void * = NULL);
014 void * wait();
015 void stop();
016 void detach();
017 static void sleep(unsigned int);
018
019 protected:
020 virtual void * run(void *) = 0;
021
022 private:
023 HANDLE threadHandle;
024 bool started;
025 bool detached;
026 void * param;
027 unsigned int threadID;
028 };
029
030 #endif
031
032 文件thread.cpp
033 #include "stdafx.h"
034 #include <process.h>
035 #include "thread.h"
036
037 unsigned int __stdcall threadFunction(void * object)
038 {
039 Thread * thread = (Thread *) object;
040 return (unsigned int ) thread->run(thread->param);
041 }
042
043 Thread::Thread()
044 {
045 started = false;
046 detached = false;
047 }
048
049 Thread::~Thread()
050 {
051 stop();
052 }
053
054 int Thread::start(void* pra)
055 {
056 if (!started)
057 {
058 param = pra;
059 if (threadHandle = (HANDLE)_beginthreadex(NULL, 0, threadFunction, this, 0, &threadID))
060 {
061 if (detached)
062 {
063 CloseHandle(threadHandle);
064 }
065 started = true;
066 }
067 }
068 return started;
069 }
070
071 //wait for current thread to end.
072 void * Thread::wait()
073 {
074 DWORD status = (DWORD) NULL;
075 if (started && !detached)
076 {
077 WaitForSingleObject(threadHandle, INFINITE);
078 GetExitCodeThread(threadHandle, &status);
079 CloseHandle(threadHandle);
080 detached = true;
081 }
082
083 return (void *)status;
084 }
085
086 void Thread::detach()
087 {
088 if (started && !detached)
089 {
090 CloseHandle(threadHandle);
091 }
092 detached = true;
093 }
094
095 void Thread::stop()
096 {
097 if (started && !detached)
098 {
099 TerminateThread(threadHandle, 0);
100
101 //Closing a thread handle does not terminate
102 //the associated thread.
103 //To remove a thread object, you must terminate the thread,
104 //then close all handles to the thread.
105 //The thread object remains in the system until
106 //the thread has terminated and all handles to it have been
107 //closed through a call to CloseHandle
108 CloseHandle(threadHandle);
109 detached = true;
110 }
111 }
112
113 void Thread::sleep(unsigned int delay)
114 {
115 ::Sleep(delay);
116 }
小结
本节的主要目的是帮助入门者建立基本的线程概念,以此为基础,抽象出一个最小接口的通用线程类。在示例程序部分,初学者可以体会到并行和串行程序执行的差异。有兴趣的话,大家可以在现有线程类的基础上,做进一步的扩展和尝试。如果觉得对线程的概念需要进一步细化,大家可以进一步扩展和完善现有Thread类。
想更进一步了解的话,一个建议是,可以去看看其他语言,其他平台的线程库中,线程类抽象了哪些概念。比如Java, perl等跨平台语言中是如何定义的,微软从winapi到dotnet中是如何支持多线程的,其线程类是如何定义的。这样有助于更好的理解线程的模型和基础概念。
另外,也鼓励大家多动手写写代码,在此基础上尝试写一些代码,也会有助于更好的理解多线程程序的特点。比如,先开始的线程不一定先结束。线程的执行可能会交替进行。把printf替换为cout可能会有新的发现,等等。
每个子线程一旦被创建,就被赋予了自己的生命。管理不好的话,一只特例独行的猪是非常让人头痛的。
对于初学者而言,编写多线程程序可能会遇到很多令人手足无措的bug。往往还没到考虑效率,避免死锁等阶段就问题百出,而且很难理解和调试。这是非常正常的,请不要气馁,后续文章会尽量解释各种常见问题的原因,引导大家避免常见错误。目前能想到入门阶段常遇到的问题是:
内存泄漏,系统资源泄漏。
程序执行结果混乱,但是在某些点插入sleep语句后结果又正确了。
程序crash, 但移除或添加部分无关语句后,整个程序正常运行(假相)。
多线程程序执行结果完全不合逻辑,出于预期。
本文至此,如果自己动手改改,试一些例子,对多线程程序应该多少有一些感性认识了。刚开始只要把基本概念弄懂了,后面可以一步一步搭建出很复杂的类。不过刚开始不要贪多,否则会欲速则不达,越弄越糊涂。
最后,大家见仁见智吧,我在此起到抛砖引玉的作用就很开心了,呵呵。另外文本编辑器的原因,代码如果编译不过,可能需要把标点符号从中文换成英文。
文章出处:飞诺网(www.firnow.com):http://dev.firnow.com/course/3_program/c++/cppsl/20081010/149882.html
分享到:
相关推荐
1. C++多线程编程基础:文档标题“C++多线程入门.pdf”表明文档是关于C++多线程编程的入门级教程。文档描述没有提供更多信息,但可以假设文档会介绍C++多线程编程的基本概念、语法和应用。 2. C++标准库中多线程的...
C++多线程入门[整理] 在现代计算机系统中,多线程编程是提高系统性能和响应速度的重要手段。C++作为一门面向对象的编程语言,提供了对多线程编程的支持。本文将从基本概念开始,介绍多线程编程的基本概念、线程的...
C++多线程编程入门200882282738.chm
在本文档中,我们将探讨C++多线程的基础知识,包括线程的概念、创建、状态以及资源管理。 线程是操作系统调度的基本单位,比进程更轻量级,它共享进程的内存空间和其他资源,减少了上下文切换的开销。线程的状态...
C++多线程编程入门教程 本文将对C++多线程编程进行详细的介绍,从多线程概念的定义到实际的编程实现。同时,文章还将对Linux和Windows平台下的多线程实现进行比较,并提供了相关的示例代码。 一、多线程概念 在...
C++多线程编程是现代软件开发中的重要技术,它允许多个任务同时执行,极大地提高了程序的效率和响应性。以下是对C++多线程编程的一些关键知识点的详细解释: 1. **线程的概念**: 在操作系统中,线程是程序执行的...
在C++编程中,多线程安全的消息队列...8. **总结**:C++多线程安全的消息队列模板是并发编程中的重要工具,它提供了线程间的高效通信和同步。通过理解和应用这些概念,开发者可以创建出更强大、更健壮的多线程程序。
《C++面向对象多线程编程》推荐:毫无疑问,这是我见过的最好的、最全面...只要不是刚刚入门的C++程序员都可以从《C++面向对象多线程编程》受益良多;不仅多线程编程的核心内容值得研习,书中的优秀源代码也可供借鉴。
根据给定文件信息,以下是对"C++多线程编程入门小结.pdf"文件内容的知识点说明: ### 知识点一:C++多线程编程基础 C++多线程编程是指在C++程序中同时执行多个线程,以利用现代处理器的多核能力,提高程序的执行...
### C++多线程编程入门知识点详解 #### 一、线程与进程概念解析 - **进程**: 进程是程序执行的一个实例。在Win32环境下,每个进程都有一个4GB的地址空间,用于存储应用程序的代码和数据。进程本身不执行任何指令,...
标题所指的知识点是“多线程编程的入门教程”,这意味着本文档是为那些刚接触多线程编程的初学者提供的基础教学材料。通过这个标题,我们可以推断文档内容会从最基础的多线程概念讲起,逐渐过渡到实际编程技巧和例子...
【C++多线程编程入门及范例详解】 在C++编程中,多线程技术是一种重要的编程模型,它允许程序同时执行多个任务,提高系统的效率和响应性。本篇文章将深入探讨多线程编程的基本概念,以及如何在C++中实现多线程。 ...
本文将深入探讨多线程编程的基础知识,以帮助初学者快速入门。 首先,我们需要理解什么是多线程。多线程是指在一个进程中同时执行多个独立的执行线程。在单核CPU系统中,操作系统通过时间片轮转的方式在不同线程...
【多线程编程】是计算机领域中的一种编程技术,它允许程序在同一进程中同时运行多个执行单元,即线程。这使得程序能够更高效地利用计算资源,提高并发性和响应速度,尤其是在多核CPU环境下,多线程能实现真正的并行...