对 join 经常搞不懂,所以,特地整一篇专题。
参考资料
基础知识
Python多线程与多进程中join()方法的效果是相同的。
下面仅以多线程为例:
首先需要明确几个概念:
知识点一:
- 当一个进程启动之后,会默认产生一个主线程,因为线程是程序执行流的最小单元,当设置多线程时,主线程会创建多个子线程,在python中,默认情况下(其实就是setDaemon(False)),主线程执行完自己的任务以后,就退出了,此时子线程会继续执行自己的任务,直到自己的任务结束,例子见下面一。
知识点二:
- 当我们使用setDaemon(True)方法,设置子线程为守护线程时,主线程一旦执行结束,则全部线程全部被终止执行,可能出现的情况就是,子线程的任务还没有完全执行结束,就被迫停止,例子见下面二。
知识点三:
- 此时join的作用就凸显出来了,join所完成的工作就是线程同步,即主线程任务结束之后,进入阻塞状态,一直等待其他的子线程执行结束之后,主线程在终止,例子见下面三。
知识点四:
join有一个timeout参数:
- 当设置守护线程时,含义是主线程对于子线程等待timeout的时间将会杀死该子线程,最后退出程序。所以说,如果有10个子线程,全部的等待时间就是每个timeout的累加和。简单的来说,就是给每个子线程一个timeout的时间,让他去执行,时间一到,不管任务有没有完成,直接杀死。
- 没有设置守护线程时,主线程将会等待timeout的累加和这样的一段时间,时间一到,主线程结束,但是并没有杀死子线程,子线程依然可以继续执行,直到子线程全部结束,程序退出。
Python多线程的默认情况
1 | import threading |
结果如下
这是主线程: MainThread
主线程结束! MainThread
一共用时: 0.0006041526794433594
当前线程的名字是: Thread-1
当前线程的名字是: 当前线程的名字是: Thread-2
Thread-3
当前线程的名字是: Thread-4
当前线程的名字是: Thread-
关键点:
- 我们的计时是对主线程计时,主线程结束,计时随之结束,打印出主线程的用时。
- 主线程的任务完成之后,主线程随之结束,子线程继续执行自己的任务,直到全部的子线程的任务全部结束,程序结束。
设置守护线程
此类线程的特点是,当程序中主线程及所有非守护线程执行结束时,未执行完毕的守护线程也会随之消亡(进行死亡状态),程序将结束运行。
Python 解释器的垃圾回收机制就是守护线程的典型代表,当程序中所有主线程及非守护线程执行完毕后,垃圾回收机制也就没有再继续执行的必要了。
1 | import threading |
其执行结果如下,注意请确保setDaemon()在start()之前,否则 Python 解释器将报 RuntimeError 错误。
这是主线程: MainThread
主线程结束了! MainThread
一共用时: 0.0011000633239746094
关键点:
- 非常明显的看到,主线程结束以后,子线程还没有来得及执行,整个程序就退出了。
join的作用
join() 方法的功能是在程序指定位置,优先让该方法的调用者使用 CPU 资源。
thread.join([timeout])
其中,thread 为 Thread 类或其子类的实例化对象;timeout 参数作为可选参数,其功能是指定 thread 线程最多可以霸占 CPU 资源的时间(以秒为单位),如果省略,则默认直到 thread 执行结束(进入死亡状态)才释放 CPU 资源。
1 | import threading |
其执行结果如下:
这是主线程: MainThread
当前线程的名字是: Thread-1当前线程的名字是:
当前线程的名字是: Thread-2
当前线程的名字是: Thread-5
当前线程的名字是: Thread-4Thread-3
主线程结束了! MainThread
一共用时: 4.004539966583252
关键点:
- 可以看到,主线程一直等待全部的子线程结束之后,主线程自身才结束,程序退出。