## 多进程

Unix/Linux操作系统提供了一个fork()系统调用，它非常特殊。普通的函数调用，调用一次，返回一次，但是fork()调用一次，返回两次，因为操作系统自动把当前进程（称为父进程）复制了一份（称为子进程），然后，分别在父进程和子进程内返回。

子进程永远返回0，而父进程返回子进程的ID。这样做的理由是，一个父进程可以fork出很多子进程，所以，父进程要记下每个子进程的ID，而子进程只需要调用getppid()就可以拿到父进程的ID。

Python的os模块封装了常见的系统调用，其中就包括fork，可以在Python程序中轻松创建子进程：

In [None]:
import os

print('Process (%s) start...' % os.getpid())
# Only works on Unix/Linux/Mac:
pid = os.fork()
if pid == 0:
    print('I am child process (%s) and my parent is %s.' % (os.getpid(), os.getppid()))
else:
    print('I (%s) just created a child process (%s).' % (os.getpid(), pid))
    
'''
run @ Linux or Unix
Process (876) start...
I (876) just created a child process (877).
I am child process (877) and my parent is 876.
'''

由于Windows没有fork调用，上面的代码在Windows上无法运行。由于Mac系统是基于BSD（Unix的一种）内核，所以，在Mac下运行是没有问题的，推荐大家用Mac学Python！

有了fork调用，一个进程在接到新任务时就可以复制出一个子进程来处理新任务，常见的Apache服务器就是由父进程监听端口，每当有新的http请求时，就fork出子进程来处理新的http请求。

multiprocessing
如果你打算编写多进程的服务程序，Unix/Linux无疑是正确的选择。由于Windows没有fork调用，难道在Windows上无法用Python编写多进程的程序？

由于Python是跨平台的，自然也应该提供一个跨平台的多进程支持。multiprocessing模块就是跨平台版本的多进程模块。

multiprocessing模块提供了一个Process类来代表一个进程对象，下面的例子演示了启动一个子进程并等待其结束

In [4]:
from multiprocessing import Process
import os

def run_proc(name):
    print('Run child process %s (%s)...' % (name, os.getpid()))
    
if __name__ == '__main__':
    print('Parent process %s.' % os.getpid())
    p = Process(target=run_proc, args=('test',))
    print('Child process will start')
    p.start()
    p.join() # join()方法可以等待子进程结束后再继续往下运行，通常用于进程间的同步
    print('Child process end.')

'''
@window python xxx.py
Parent process 1816.
Child process will start
Run child process test (10072)...
Child process end.
'''


Parent process 13860.
Child process will start
Child process end.


In [5]:
import os
from multiprocessing import Process

def func_one():
    print("This is son_one")
    print("son_one:%s  father:%s" % (os.getpid(), os.getppid()))
 
 
def func_two():
    print("This is son_two")
    print("son_two:%s  father:%s" % (os.getpid(), os.getppid()))
 
 
if __name__ == '__main__':
    p_one = Process(target=func_one)
    P_two = Process(target=func_two)
    p_one.start()
    P_two.start()
    print("son:%s  father:%s" % (os.getpid(), os.getppid()))
    
'''
python xxx.py
son:5536  father:7300
This is son_one
This is son_two
son_one:4440  father:5536
son_two:13252  father:5536
'''

son:13860  father:1280


In [6]:
import time
from multiprocessing import Process
 
def func_one(name):
    print("My name is", name)
    time.sleep(2)
    print("This is func_one")
 
 
def func_two(name):
    print("My name is", name)
    time.sleep(2)
    print("This is func_two")
 
 
if __name__ == '__main__':
    p_one = Process(target=func_one, args=("Jack",))
    p_two = Process(target=func_two, args=("Mick",))
    p_one.start()
    p_one.join()  # 主线程要等待func_one终止，才继续往下走
    p_two.start()
    print('I am main process')
    
    
'''
My name is Jack
This is func_one
I am main process
My name is Mick
This is func_two
'''

I am main process


如果要启动大量的子进程，可以用进程池的方式批量创建子进程

In [None]:
from multiprocessing import Pool
import os, time, random

def long_time_task(name):
    print('Run task %s (%s)...' % (name, os.getpid()))
    start = time.time()
    time.sleep(random.random() * 3)
    end = time.time()
    print('Task %s runs %0.2f seconds.' % (name, (end-start)))
    
if __name__ == '__main__':
    print('Parent Process is %s' % os.getpid())
    p = Pool(4)
    for i in range(5):
        p.apply_async(long_time_task, args=(i, )) # p.apply_async  不用等待当前进程执行完毕，随时根据系统调度来进行进程切换 | 异步非阻塞的
    print('Waiting for all subprocess done')
    p.close() #调用join()之前必须先调用close()，调用close()之后就不能继续添加新的Process了
    p.join()  # 对Pool对象调用join()方法会等待所有子进程执行完毕，
    print('All subprocesses done')
    
'''
请注意输出的结果，task 0，1，2，3是立刻执行的，而task 4要等待前面某个task完成后才执行，这是因为Pool的默认大小在我的电脑上是4
因此，最多同时执行4个进程。这是Pool有意设计的限制，并不是操作系统的限制
p = Pool(5) 就可以同时跑5个进程。
由于Pool的默认大小是CPU的核数，如果你不幸拥有8核CPU，你要提交至少9个子进程才能看到上面的等待效果

Parent Process is 13908
Waiting for all subprocess done
Run task 0 (2308)...
Run task 1 (12892)...
Run task 2 (11744)...
Run task 3 (12736)...
Task 0 runs 1.20 seconds.
Run task 4 (2308)...
Task 1 runs 1.42 seconds.
Task 3 runs 1.74 seconds.
Task 4 runs 0.67 seconds.
Task 2 runs 1.84 seconds.
All subprocesses done
'''

很多时候，子进程并不是自身，而是一个外部进程。我们创建了子进程后，还需要控制子进程的输入和输出。

subprocess模块可以让我们非常方便地启动一个子进程，然后控制其输入和输出。

下面的例子演示了如何在Python代码中运行命令nslookup www.python.org，这和命令行直接运行的效果是一样的·

In [8]:
import subprocess

print('$ nslookup www.python.org')
r = subprocess.call(['nslookup','www.python.org'])
print('Exit code:', r)
'''
服务器:  UnKnown
Address:  172.168.10.1

非权威应答:
名称:    dualstack.python.map.fastly.net
Addresses:  2a04:4e42:1a::223
          151.101.228.223
Aliases:  www.python.org
'''

$ nslookup www.python.org
Exit code: 0


如果子进程还需要输入，则可以通过communicate()方法输入

In [None]:
# run linux or Unix

import subprocess

print('$ nslookup')
p = subprocess.Popen(['nslookup'], stdin=subprocess.PIPE, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
output, err = p.communicate(b'set q=mx\npython.org\nexit\n')
print(output.decode('utf-8'))
print('Exit code:', p.returncode)

上面的代码相当于在命令行执行命令nslookup，然后手动输入：

set q=mx

python.org

exit

Process之间肯定是需要通信的，操作系统提供了很多机制来实现进程间的通信。Python的multiprocessing模块包装了底层的机制，提供了Queue、Pipes等多种方式来交换数据。

我们以Queue为例，在父进程中创建两个子进程，一个往Queue里写数据，一个从Queue里读数据

In [9]:
from multiprocessing import Process, Queue
import os, time, random

# 写数据进程执行的代码:
def write(q):
    print('Process to write: %s' % os.getpid())
    for value in ['A', 'B', 'C']:
        print('Put %s to queue...' % value)
        q.put(value) # q.put?
        time.sleep(random.random())

# 读数据进程执行的代码:
def read(q):
    print('Process to read: %s' % os.getpid())
    while True:
        value = q.get(True) # get(True)
        print('Get %s from queue.' % value)

if __name__=='__main__':
    # 父进程创建Queue，并传给各个子进程：
    q = Queue()
    pw = Process(target=write, args=(q,))
    pr = Process(target=read, args=(q,))
    # 启动子进程pw，写入:
    pw.start()
    # 启动子进程pr，读取:
    pr.start()
    # 等待pw结束:
    pw.join()
    # pr进程里是死循环，无法等待其结束，只能强行终止:
    pr.terminate()
    
'''
Process to write: 1128
Put A to queue...
Process to read: 12876
Get A from queue.
Put B to queue...
Get B from queue.
Put C to queue...
Get C from queue.
'''

在Unix/Linux下，可以使用fork()调用实现多进程。

要实现跨平台的多进程，可以使用multiprocessing模块。

进程间通信是通过Queue、Pipes等实现

## 多线程

多任务可以由多进程完成，也可以由一个进程内的多线程完成。

我们前面提到了进程是由若干线程组成的，一个进程至少有一个线程。

由于线程是操作系统直接支持的执行单元，因此，高级语言通常都内置多线程的支持，Python也不例外，并且，Python的线程是真正的Posix Thread，而不是模拟出来的线程。

Python的标准库提供了两个模块：_thread和threading，_thread是低级模块，threading是高级模块，对_thread进行了封装。绝大多数情况下，我们只需要使用threading这个高级模块。

启动一个线程就是把一个函数传入并创建Thread实例，然后调用start()开始执行

In [11]:
import time, threading

def loop():
    print('thread %s is running....' % threading.current_thread().name)
    n = 0
    while n<5:
        n = n + 1
        print('thread %s >>> %s' % (threading.current_thread().name, n)) # 不多通过循环也能多次打印啊
        time.sleep(1)
    print('thread %s ended.' % threading.current_thread().name)
    
print('thread %s is running...' % threading.current_thread().name)
t = threading.Thread(target=loop, name='LoopThread')
t.start()
t.join()
print('thread %s ended.' % threading.current_thread().name)

thread MainThread is running...
thread LoopThread is running....
thread LoopThread >>> 1
thread LoopThread >>> 2
thread LoopThread >>> 3
thread LoopThread >>> 4
thread LoopThread >>> 5
thread LoopThread ended.
thread MainThread ended.


由于任何进程默认就会启动一个线程，我们把该线程称为主线程，主线程又可以启动新的线程，Python的threading模块有个current_thread()函数，它永远返回当前线程的实例。主线程实例的名字叫MainThread，子线程的名字在创建时指定，我们用LoopThread命名子线程。名字仅仅在打印时用来显示，完全没有其他意义，如果不起名字Python就自动给线程命名为Thread-1，Thread-2……

### Lock

多线程和多进程最大的不同在于，多进程中，同一个变量，各自有一份拷贝存在于每个进程中，互不影响，而多线程中，所有变量都由所有线程共享，所以，任何一个变量都可以被任何一个线程修改，因此，线程之间共享数据最大的危险在于多个线程同时改一个变量，把内容给改乱了。

来看看多个线程同时操作一个变量怎么把内容给改乱了：

In [13]:
import time, threading

balance = 0 # 银行存款

def change_it(n):
    # 先存后去，结果应该是0
    global balance 
    balance = balance + n
    balance = balance - n
    
def run_thread(n):
    for i in range(100000):
        change_it(n)
        
t1 = threading.Thread(target=run_thread, args=(5,))
t2 = threading.Thread(target=run_thread, args=(8,))

t1.start()
t2.start()

t1.join()
t2.join()

print(balance)

0


如果我们要确保balance计算正确，就要给change_it()上一把锁，当某个线程开始执行change_it()时，我们说，该线程因为获得了锁，因此其他线程不能同时执行change_it()，只能等待，直到锁被释放后，获得该锁以后才能改。由于锁只有一个，无论多少线程，同一时刻最多只有一个线程持有该锁，所以，不会造成修改的冲突。创建一个锁就是通过threading.Lock()来实现

In [15]:
balance = 0
lock = threading.Lock()

def run_thread(n):
    for i in range(100000):
        lock.acquire()
    try:
        change_it(n)
    finally:
        lock.release()

当多个线程同时执行lock.acquire()时，只有一个线程能成功地获取锁，然后继续执行代码，其他线程就继续等待直到获得锁为止。

获得锁的线程用完后一定要释放锁，否则那些苦苦等待锁的线程将永远等待下去，成为死线程。所以我们用try...finally来确保锁一定会被释放。

锁的好处就是确保了某段关键代码只能由一个线程从头到尾完整地执行，坏处当然也很多，首先是阻止了多线程并发执行，包含锁的某段代码实际上只能以单线程模式执行，效率就大大地下降了。其次，由于可以存在多个锁，不同的线程持有不同的锁，并试图获取对方持有的锁时，可能会造成死锁，导致多个线程全部挂起，既不能执行，也无法结束，只能靠操作系统强制终止

### 多核CPU

如果你不幸拥有一个多核CPU，你肯定在想，多核应该可以同时执行多个线程。

如果写一个死循环的话，会出现什么情况呢？

打开Mac OS X的Activity Monitor，或者Windows的Task Manager，都可以监控某个进程的CPU使用率。

我们可以监控到一个死循环线程会100%占用一个CPU。

如果有两个死循环线程，在多核CPU中，可以监控到会占用200%的CPU，也就是占用两个CPU核心。

要想把N核CPU的核心全部跑满，就必须启动N个死循环线程。

试试用Python写个死循环

启动与CPU核心数量相同的N个线程，在4核CPU上可以监控到CPU占用率仅有102%，也就是仅使用了一核。

但是用C、C++或Java来改写相同的死循环，直接可以把全部核心跑满，4核就跑到400%，8核就跑到800%，为什么Python不行呢？

因为Python的线程虽然是真正的线程，但解释器执行代码时，有一个GIL锁：Global Interpreter Lock，任何Python线程执行前，必须先获得GIL锁，然后，每执行100条字节码，解释器就自动释放GIL锁，让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁，所以，多线程在Python中只能交替执行，即使100个线程跑在100核CPU上，也只能用到1个核。

GIL是Python解释器设计的历史遗留问题，通常我们用的解释器是官方实现的CPython，要真正利用多核，除非重写一个不带GIL的解释器。

所以，在Python中，可以使用多线程，但不要指望能有效利用多核。如果一定要通过多线程利用多核，那只能通过C扩展来实现，不过这样就失去了Python简单易用的特点。

不过，也不用过于担心，Python虽然不能利用多线程实现多核任务，但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁，互不影响。

多线程编程，模型复杂，容易发生冲突，必须用锁加以隔离，同时，又要小心死锁的发生。

Python解释器由于设计时有GIL全局锁，导致了多线程无法利用多核。多线程的并发在Python中就是一个美丽的梦

### ThreadLocal

在多线程环境下，每个线程都有自己的数据。一个线程使用自己的局部变量比使用全局变量好，因为局部变量只有线程自己能看见，不会影响其他线程，而全局变量的修改必须加锁。

但是局部变量也有问题，就是在函数调用的时候，传递起来很麻烦

In [None]:
def process_student(name):
    std = Student()
    do_task_1(std)
    do_task_2(std)
    
def do_task_1(std):
    do_substask_1(std)
    do_substask_2(std)
    
def do_task_2(std):
    do_subtask_2(std)
    do_subtask_2(std)

每个函数一层一层调用都这么传参数那还得了？用全局变量？也不行，因为每个线程处理不同的Student对象，不能共享。

如果用一个全局dict存放所有的Student对象，然后以thread自身作为key获得线程对应的Student对象如何？

In [None]:
global_dict = {}

def std_thread(name):
    std = Student(name)
    global_dict[threading.current_thread()] = std # 把std放到全局变量global_dict中
    do_task_1()
    do_task_2()

def do_task_1():
    std = global_dict[threading.current_thread()] # 不传入std，而是根据当前线程查找：
    pass
    
def do_task_2():
    std = global_dict[threading.current_thread()] # 任何函数都可以查找出当前线程的std变量：
    pass
                 

In [18]:
import threading
    
# 创建全局ThreadLocal对象:
local_school = threading.local()

def process_student():
    # 获取当前线程关联的student:
    std = local_school.student
    print('Hello, %s (in %s)' % (std, threading.current_thread().name))

def process_thread(name):
    # 绑定ThreadLocal的student:
    local_school.student = name
    process_student()

t1 = threading.Thread(target= process_thread, args=('Alice',), name='Thread-A')
t2 = threading.Thread(target= process_thread, args=('Bob',), name='Thread-B')
t1.start()
t2.start()
t1.join()
t2.join()

Hello, Alice (in Thread-A)
Hello, Bob (in Thread-B)


全局变量local_school就是一个ThreadLocal对象，每个Thread对它都可以读写student属性，但互不影响。你可以把local_school看成全局变量，但每个属性如local_school.student都是线程的局部变量，可以任意读写而互不干扰，也不用管理锁的问题，ThreadLocal内部会处理。

可以理解为全局变量local_school是一个dict，不但可以用local_school.student，还可以绑定其他变量，如local_school.teacher等等。

ThreadLocal最常用的地方就是为每个线程绑定一个数据库连接，HTTP请求，用户身份信息等，这样一个线程的所有调用到的处理函数都可以非常方便地访问这些资源

一个ThreadLocal变量虽然是全局变量，但每个线程都只能读写自己线程的独立副本，互不干扰。ThreadLocal解决了参数在一个线程中各个函数之间互相传递的问题。

## 分布式进程

在Thread和Process中，应当优选Process，因为Process更稳定，而且，Process可以分布到多台机器上，而Thread最多只能分布到同一台机器的多个CPU上。

Python的multiprocessing模块不但支持多进程，其中managers子模块还支持把多进程分布到多台机器上。一个服务进程可以作为调度者，将任务分布到其他多个进程中，依靠网络通信。由于managers模块封装很好，不必了解网络通信的细节，就可以很容易地编写分布式多进程程序。

举个例子：如果我们已经有一个通过Queue通信的多进程程序在同一台机器上运行，现在，由于处理任务的进程任务繁重，希望把发送任务的进程和处理任务的进程分布到两台机器上。怎么用分布式进程实现？

原有的Queue可以继续使用，但是，通过managers模块把Queue通过网络暴露出去，就可以让其他机器的进程访问Queue了。

我们先看服务进程，服务进程负责启动Queue，把Queue注册到网络上，然后往Queue里面写入任务

In [None]:
# task_master.py

import random, time, queue
from multiprocessing.managers import BaseManager

task_queue = queue.Queue() # 发送任务的队列:
result_queue = queue.Queue() # 接收结果的队列:

class QueueManger(BaseManager):
    pass

# 把两个Queue都注册到网络上, callable参数关联了Queue对象:
QueueManger.register('get_task_queue', callable=lambda:task_queue)
QueueManger.register('get_task_queue', callable=lambda:result_queue)

manager = QueueManger(address=('', 5000), authkey=b'abc') # 绑定端口5000, 设置验证码'abc':
manager.start() # 启动Queue:

# 获得通过网络访问的Queue对象:
task = manager.get_task_queue()
result = manager.get_result_queue()

for i in range(10):
    n = random.randint(0, 10000)
    print('Put task %d...' % n)
    task.put(n)
    
print('Try get results...')

for i in range(10):
    r = result.get(timeout=10)
    print('Result: %s' % r)
    
manager.shutdown()
print('master exit.')


请注意，当我们在一台机器上写多进程程序时，创建的Queue可以直接拿来用，但是，在分布式多进程环境下，添加任务到Queue不可以直接对原始的task_queue进行操作，那样就绕过了QueueManager的封装，必须通过manager.get_task_queue()获得的Queue接口添加。

然后，在另一台机器上启动任务进程（本机上启动也可以）

In [None]:
#task_worker.py

import sys, time, queue
from multiprocessing.managers import BaseManager

# 创建类似的QueueManager:
class QueueManager(BaseManager):
    pass

# 由于这个QueueManager只从网络上获取Queue，所以注册时只提供名字:
QueueManager.register('get_task_queue')
QueueManager.register('get_result_queue')

# 连接到服务器，也就是运行task_master.py的机器:
server_addr = '127.0.0.1'
print('Connect to server %s...' % server_addr)

# 端口和验证码注意保持与task_master.py设置的完全一致:
m = QueueManager(address=(server_addr, 5000), authkey=b'abc')
m.connect() # 从网络连接:

# 获取Queue的对象:
task = m.get_task_queue() 
result = m.get_result_queue()

# 从task队列取任务,并把结果写入result队列:
for i in range(10):
    try:
        n = task.get(timeout=1)
        print('run task %d * %d...' %(n, n))
        r = '%d * %d = %d' % (n, n, n*n)
        time.sleep(1)
        result.put(r)
    except Queue.Empty:
        print('task queue is empty')
# 处理结束:
print('worker exit')

## 21days

Thread(group=None, target=None, name=None, args=(), kwargs=(), *, daemon=None)

target:要运行的函数

args:是传入函数的参数元组

In [43]:
# start 190821

import threading

def thrfun(x, y):
    for i in range(x, y):
        print(str(i * i) + ':')

ta = threading.Thread(target=thrfun, args=(1, 6))
tb = threading.Thread(target=thrfun, args=(16, 21))
ta.start()
tb.start()

1:
4:
9:
16:
25:
256:
289:
324:
361:
400:


### 通过集成threading.Thread类来创建线程

这种方法只要重载threading.Thread类的run方法，然后调用类的start()就能创建线程
并运行run函数中的代码

In [5]:
import threading
class myThread(threading.Thread):
    def __init__(self, mynum):
        super().__init__()
        self.mynum = mynum
        
    def run(self):
        for i in range(self.mynum, self.mynum + 5):
            print(str(i * i) + ':')
            
ma = myThread(1)
mb = myThread(16)

ma.start()
mb.start()

1:256:
4:
9:
16:

289:
324:
361:
400:
25:


In [16]:
'''
Thread类还有几个重要的方法和属性
method:
join([timeout])方法作用是当某个线程或者函数执行时需要另一个线程操作后才能继续，则应调用另一个线程的join方法，timeout指定线程运行的最长时间
isAlive() 查看线程是否运行   
attribute:
name：设置线程名
daemon：显示是否随主线程退出而退出，True=不会
'''
import threading
import time

def thrfun(x, y, thr=None):
    if thr:
        thr.join()
    else:
        time.sleep(2)
    for i in range(x, y):
        print(str(i * i) + ';')
        
if __name__ == '__main__':    
    ta = threading.Thread(target=thrfun, args=(1, 6))
    tb = threading.Thread(target=thrfun, args=(16,19,ta)) # tb输入需要等到ta输出结束后
    ta.start()
    tb.start()


1;
4;
9;
16;
25;
256;
289;
324;


In [18]:
# demon attribute-daemon
import threading
import time

class myThread(threading.Thread):
    def __init__(self, mynum):
        super().__init__()
        self.mynum = mynum
        
    def run(self):
        time.sleep(1)
        for i in range(self.mynum, self.mynum+5):
            print(str(i * i) + ';')
            
def main():
    print('start....')
    ma = myThread(1)
    mb = myThread(16)
    
    ma.daemon = True
    mb.daemon = True
    
    ma.start()
    mb.start()
    print('end....')
    
if __name__ == '__main__':
    main()
    
'''
如果在交互模式下运行该实例，还是会有输出的
因为交互模式的主线程只有在退出python时才终止
'''

start....
end....
1;
4;
9;
16;
25;
256;
289;
324;
361;
400;


### 线程的同步和通信

In [None]:
#python中可以使用threading模块中的对象lock和rlock进行简单的线程同步
# 对于同一个时刻只允许一个线程操作的数据对象
# 可以把操作过程放在lock和rlock的acquirehe\release方法
# Rlock可以在同一个调用链中多次请求而不会锁死，lock则会锁死
#创建lock对象
lock = threading.RLock()
#开始锁定
lock.acquire()
#访问和操作多个线程共享的数据
pass
#释放锁
lock.release()

#!这一对方法若前一个调用n次，后一个也要调用n次，锁才能真正的释放

In [20]:
#demon_rlock.py

import threading
import time

class myThread(threading.Thread):
    def run(self):
        global x
        lock.acquire()
        for i in range(3):
            x += 10
        time.sleep(1)
        print(x)
        lock.release()
        
x = 0
lock = threading.RLock()

def main():
    thrs = []
    for item in range(5):
        thrs.append(myThread())
    for item in thrs:
        item.start()

if __name__ == '__main__':
    main()

30
60
90
120
150


In [26]:
#demon_no_rlock.py

import threading
import time

class myThread(threading.Thread):
    def run(self):
        global x
        for i in range(3):
            x += 10
        time.sleep(1)
        print(x)
        print('-' * 3)
        
x = 0

def main():
    thrs = []
    for item in range(5):
        thrs.append(myThread())
    for item in thrs:
        item.start()

if __name__ == '__main__':
    main()

150150150150
---


---
---
150
---

---


线程间的同步可以使用threading模块中的条件变量，队列等来进行，线程间的通信可以使用threading模块的event对象，
event实例管理者一个内部标志，通过set方法将它设置为True，使用clear方法会将它重置为False，wait（timeout）方法，使当前线程
阻塞至标志为true

In [28]:
import threading
import time

class myThreada(threading.Thread):
    def run(self):
        evt.wait()
        print(self.name, ':Good morning')
        evt.clear()
        time.sleep(1)
        evt.set()
        time.sleep(1)
        evt.wait()
        print(self.name, ':I am fine, thank you')
        
class myThreadb(threading.Thread):
    def run(self):
        print(self.name, ':Good Morning')
        evt.set()
        time.sleep(1)
        evt.wait()
        print(self.name, ':How are you?')
        evt.clear()
        time.sleep(1)
        evt.set()
        
evt = threading.Event()

def main():
    john = myThreada()
    john.name = 'John'
    smith = myThreadb()
    smith.name = 'Smith'
    john.start()
    smith.start()
    
if __name__ == '__main__':
    main()
    
'''
Python中的threading.Event()操控多线程的过程有： 
- 定义事件：man_talk_event = threading.Event() 
- 创建线程，传入对应事件：t1 = threading.Thread(target=man, args=(man_talk_event,), name='man') 
- 查看对应事件的标志：man_talk_event.is_set()返回Ture或False 
- 阻塞对应事件线程：man_talk_event.wait() 如果事件标志为True则不阻塞 
- 继续对应事件线程：man_talk_event.set() 设置事件标志为True 
- 结束对应事件线程：man_talk_event.clear() 设置事件标志为False 
- 注意创建线程的时候，如果之前设置成t1.setDaemon(True)，则不会阻塞主线程
'''

Smith :Good Morning
John :Good morning
Smith :How are you?
John :I am fine, thank you


## 进程

使用python的多进程模块可以将工作分派给不受锁定限制的单独子进程（多核），线程只能在一个处理器上运行

In [None]:
subprocess模块的基本函数如下；
#创建新进程运行程序，输入和输出绑定到父进程，返回新进程退出码
call(args, *, stdin=None, stdout=None, shell=False, timeout=None)
# 创建新进程运行程序，输入和输出绑定到父进程，退出码为0位正常返回，否则，引发calledProcessErroror
check_call(args, * stdin=None, stdouy=None, stderr=None, shell=False, timeout=None)
# 创建新进程运行程序，元组形式返回新进程退出码和输出
getstatusoutput(cmd)
# 创建新进程运行程序，返回新进程的输出（字符串）
getoutput(cmd)
# 创建新进程运行程序，返回新进程的输出 bytesarray
check_output(args,*, input=None, stdin=None, stderr=None, shell=False, universal_newlines=False, timeout=None)

stdin,stdout, stderr 用来处理新进程的输入、输出和错误信息
shell 是否使用一个中间shell来执行
input 为命令行提供一个输入信息（字符串），不能与stdin同时用
universal newline 返回值和输入值为字符串而不是bytes

In [None]:
# protest.py
print('Hello world')

#demon_subprocress.py

import subprocess
print('call () test:', subprocess.call(['python', 'protest.py']))
print('')
print('check_call() test:', subprocess.check_call(['python', 'protest.py']))
print('')
print('getstatusoutput() test:', subprocess.getstatusoutput(['python', 'protest.py']))
print('')
print('getoutput() test:', subprocess.getoutput(['python', 'protest.py']))
print('')
print('check_output() test:', subprocess.check_output(['python', 'protest.py']))

### 用Popen类创建进程

上节中所述的几个函数，本质上都是通过Popen类来实现的简单版本的进程创建函数
直接使用Popen类不仅可以以新进程方式运行命令，还可以对其输入流和输出流等进行更多控制

In [None]:
class Popen(
    args, 
    bufsize=-1, 
    executable=None, 
    stdin=None, 
    stdout=None, 
    stderr=None,
    preexec_fn=None, 
    close_fds=True, 
    shell=True, 
    cwd=None, 
    env=None, 
    universal_new=False,
    startupinfo=None, 
    creationflags=0, 
    restore_signals=True, 
    start_new_session=False, 
    pass_fds=())

In [None]:
Popen's method:
poll()
wait(timeout=None)
communicate(input=None, timeout=None)

Popen's attribute:
pid
returncode

In [33]:
#demon_Popen.py
#-*- coding=utf-8 -*-

import subprocess

prcs = subprocess.Popen(['python', 'protest8.py'],
                       stdout=subprocess.PIPE,
                       stdin=subprocess.PIPE,
                       stderr=subprocess.PIPE,
                       universal_newlines=True,
                       shell=True)
prcs.communicate('These strings are from stdin.')
print('subprocess pid:', prcs.pid)
print('\nSTDOUT:')
print(str(prcs.communicate()[0]))
print('STDERR:')
print(prcs.communicate()[1])

#stdout 和 stderror缺少输出啊？

subprocess pid: 8852

STDOUT:
hello world!~

STDERR:



In [40]:
#protest9.py
a = input()
a = a.split(' ')
a[0] = str(int(a[0]) + 1)
print(' '.join(a))

#demon_communicate.py

import subprocess
processes = []
psum = 5
for i in range(psum):
    prcs = subprocess.Popen(['python', 'protest9.py'],
                       stdout=subprocess.PIPE,
                       stdin=subprocess.PIPE,
                       stderr=subprocess.PIPE,
                       universal_newlines=True,
                       shell=True)
processes[0].communicate('0 bouquet of flowers!')
for before, after in zip(processes[:psum], processes[1:]):
    after.communicate(before.communicate()[0])
    print('\nSum of Processes : %d' % psum)
    print()
    for item in processes:
        print(item.communicate()[0])
    

0
1


IndexError: list index out of range