0%

python | 多线程和进程中的 join 和 守护进程

对 join 经常搞不懂,所以,特地整一篇专题。


参考资料



基础知识


Python多线程与多进程中join()方法的效果是相同的。

下面仅以多线程为例:

首先需要明确几个概念:

知识点一:

  1. 当一个进程启动之后,会默认产生一个主线程,因为线程是程序执行流的最小单元,当设置多线程时,主线程会创建多个子线程,在python中,默认情况下(其实就是setDaemon(False)),主线程执行完自己的任务以后,就退出了,此时子线程会继续执行自己的任务,直到自己的任务结束,例子见下面一。

知识点二:

  1. 当我们使用setDaemon(True)方法,设置子线程为守护线程时,主线程一旦执行结束,则全部线程全部被终止执行,可能出现的情况就是,子线程的任务还没有完全执行结束,就被迫停止,例子见下面二。

知识点三:

  1. 此时join的作用就凸显出来了,join所完成的工作就是线程同步,即主线程任务结束之后,进入阻塞状态,一直等待其他的子线程执行结束之后,主线程在终止,例子见下面三。

知识点四:

join有一个timeout参数:

  1. 当设置守护线程时,含义是主线程对于子线程等待timeout的时间将会杀死该子线程,最后退出程序。所以说,如果有10个子线程,全部的等待时间就是每个timeout的累加和。简单的来说,就是给每个子线程一个timeout的时间,让他去执行,时间一到,不管任务有没有完成,直接杀死。
  2. 没有设置守护线程时,主线程将会等待timeout的累加和这样的一段时间,时间一到,主线程结束,但是并没有杀死子线程,子线程依然可以继续执行,直到子线程全部结束,程序退出。

Python多线程的默认情况


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
import threading
import time

def run():
time.sleep(2)
print('当前线程的名字是: ', threading.current_thread().name)
time.sleep(2)


if __name__ == '__main__':

start_time = time.time()

print('这是主线程:', threading.current_thread().name)
thread_list = []
for i in range(5):
t = threading.Thread(target=run)
thread_list.append(t)

for t in thread_list:
t.start()

print('主线程结束!' , threading.current_thread().name)
print('一共用时:', time.time()-start_time)

结果如下

这是主线程: MainThread
主线程结束! MainThread
一共用时: 0.0006041526794433594
当前线程的名字是:  Thread-1
当前线程的名字是:  当前线程的名字是:  Thread-2
Thread-3
当前线程的名字是:  Thread-4
当前线程的名字是:  Thread-

关键点:

  1. 我们的计时是对主线程计时,主线程结束,计时随之结束,打印出主线程的用时。
  2. 主线程的任务完成之后,主线程随之结束,子线程继续执行自己的任务,直到全部的子线程的任务全部结束,程序结束。

设置守护线程


此类线程的特点是,当程序中主线程及所有非守护线程执行结束时,未执行完毕的守护线程也会随之消亡(进行死亡状态),程序将结束运行。

Python 解释器的垃圾回收机制就是守护线程的典型代表,当程序中所有主线程及非守护线程执行完毕后,垃圾回收机制也就没有再继续执行的必要了。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
import threading
import time

def run():

time.sleep(2)
print('当前线程的名字是: ', threading.current_thread().name)
time.sleep(2)


if __name__ == '__main__':

start_time = time.time()

print('这是主线程:', threading.current_thread().name)
thread_list = []
for i in range(5):
t = threading.Thread(target=run)
thread_list.append(t)

for t in thread_list:
t.setDaemon(True)
t.start()

print('主线程结束了!' , threading.current_thread().name)
print('一共用时:', time.time()-start_time)

其执行结果如下,注意请确保setDaemon()在start()之前,否则 Python 解释器将报 RuntimeError 错误。

这是主线程: MainThread
主线程结束了! MainThread
一共用时: 0.0011000633239746094

关键点:

  1. 非常明显的看到,主线程结束以后,子线程还没有来得及执行,整个程序就退出了。

join的作用


join() 方法的功能是在程序指定位置,优先让该方法的调用者使用 CPU 资源。

thread.join([timeout])

其中,thread 为 Thread 类或其子类的实例化对象;timeout 参数作为可选参数,其功能是指定 thread 线程最多可以霸占 CPU 资源的时间(以秒为单位),如果省略,则默认直到 thread 执行结束(进入死亡状态)才释放 CPU 资源。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
import threading
import time

def run():

time.sleep(2)
print('当前线程的名字是: ', threading.current_thread().name)
time.sleep(2)


if __name__ == '__main__':

start_time = time.time()

print('这是主线程:', threading.current_thread().name)
thread_list = []
for i in range(5):
t = threading.Thread(target=run)
thread_list.append(t)

for t in thread_list:
t.setDaemon(True)
t.start()

for t in thread_list:
t.join()

print('主线程结束了!' , threading.current_thread().name)
print('一共用时:', time.time()-start_time)

其执行结果如下:

这是主线程: MainThread
当前线程的名字是:  Thread-1当前线程的名字是:  
当前线程的名字是:  Thread-2
当前线程的名字是:  Thread-5
当前线程的名字是:  Thread-4Thread-3

主线程结束了! MainThread
一共用时: 4.004539966583252

关键点:

  1. 可以看到,主线程一直等待全部的子线程结束之后,主线程自身才结束,程序退出。
请我喝杯咖啡吧~