# 进程 multiprocessing&mp4py

multiprocessing 是Python的标准模块,实现了共享内存.

mp4py 实现了消息传递的编程范例, 进程交流全靠传递信息代替, 没有共享内存.

## 进程简介

jupter 的解释器好像有什么问题,代码在这里运行会出问题.

基本操作跟threading一样

但小心,由于这是进程, 要是不加join(), 那么子进程会在主进程结束后继续运行! 

所以说,该用if \__name__ =='\__main__'

multiprocessing的名字获得方法和线程不太一样~

__daemon/join__ 的用法还是一样的, 控制子线程处于前台或后台和等待时间

但是有一个问题: 
* 后台进程可以看到输出,后台进程没有输出,后台进程会在主进程结束后自动结束.

* 后台进程不可以创建子进程, 否则当后台进程跟随父进程退出时,子进程会变成孤儿进程.

In [None]:
import multiprocessing


def foo(i):
    name=multiprocessing.current_process().name
    print('called function in process{} : {}'.format(i, name))


if __name__ == '__main__':
    Process_jobs = []
    for i in range(5):
        # p = multiprocessing.Process(target=foo, args=(i,), name= 'zz'+str(i))
        p = multiprocessing.Process(target=foo, args=(i,),)
        Process_jobs.append(p)
        p.start()
        p.join()

## terminate()

杀掉一个进程的方法//
但是不建议在主进程中使用, terminate()后子进程并不会释放空间/资源

还是给个全局变量信号之类的,然后让子进程自己结束比较好

In [None]:
import multiprocessing
import time


def foo():
    name=multiprocessing.current_process().name
    print('Starting process: {}'.format( name))
    time.sleep(3)
    print("Exiting process: ", name)


if __name__ == '__main__':
    p=multiprocessing.Process(target=foo)
    print('Process before execution:', p, p.is_alive())
    p.start()
    print('Running! ', p, p.is_alive())
    p.terminate()
    print('Terminated!',p, p.is_alive())
    p.join()
    print('Joined! ',p, p.is_alive())
    print('exit code: ', p.exitcode)



## 进程类 //这个跟threading那边基本一样

验证了一下, 进程在运行完毕后会自动结束掉

In [None]:
import multiprocessing
import time


class MyProcess(multiprocessing.Process):
    def run(self):
        print('called run method in process', self.name)

if __name__=='__main__':
    jobs=[]
    for i in range(5):
        p=MyProcess()
        jobs.append(p)
        p.start()
        p.join()
    print('#####################')
    time.sleep(5)
    for p in jobs:
        if p.is_alive():
            print('process is alive', p.name)
        else:
            print('process is down,',p.name)
            



## 进程间的交换信息/对象

### queue()

可以用multiprocessing.Queue() 来进行通信. 这个queue的用法和之前一样.
但没有task_done() 和join()方法. 这两个方法在joinablequeue()里面

### pipe()
没太搞明白~

__应该再看看

In [None]:
import multiprocessing
import random
import time

class Producer(multiprocessing.Process):

    def __init__(self,queue):
        multiprocessing.Process.__init__(self)
        self.queue=queue

    def run(self):
        for i in range(10):
            item=random.randint(0,256)
            self.queue.put(item)
            print('Producer: item {} append to queue {}'.format(item,self.name))
            time.sleep(1)
            print('         The size of queue is {}'.format(self.queue.qsize()))

class Consumer(multiprocessing.Process):
    def __init__(self,queue):
        multiprocessing.Process.__init__(self)
        self.queue=queue

    def run(self):
        while True:
            time.sleep(2)
            if self.queue.empty():
                print('The queue is empty')
                break
            else:
                item=self.queue.get()
                print('Consumer: item {} popped from by {}'.format(item, self.name))
                time.sleep(1)

if __name__=='__main__':
    queue=multiprocessing.Queue()
    p=Producer(queue)
    c1=Consumer(queue)
    c2=Consumer(queue)
    p.start()
    c1.start()
    # c2.start()
    p.join()
    c1.join()
    # c2.join()


In [None]:
import multiprocessing

def create_item(pipe):
    output_pipe,_=pipe
    for item in range(10):
        output_pipe.send(item)
    output_pipe.close()

def multi_items(pipe1,pipe2):
    close, input_pipe=pipe1
    close.close()
    output_pipe,_=pipe2
    try:
        while True:
            item=input_pipe.recv()
            output_pipe.send(item*item)
    except EOFError:
        output_pipe.close()

if __name__=='__main__':
    pipe1=multiprocessing.Pipe(True)
    process_pipe1=multiprocessing.Process(target=create_item,args=(pipe1,))
    process_pipe1.start()

    pipe2=multiprocessing.Pipe(True)
    process_pipe2=multiprocessing.Process(target=multi_items,args=(pipe1,pipe2,))
    process_pipe2.start()
    pipe1[0].close()
    pipe2[0].close()
    try:
        while True:
            print(pipe2[1].recv())
    except EOFError:
        print('end!')


## 同步进程 barrier()

确保多个进程同时进行// 暂时不知道什么需要这么玩.
barrier(number), 这个number是进程数
每个子进程调用.wait()方法. 当number个子进程都调用了wait()后, 他们会一起执行. 

但例子里还给了一个lock(), 不知道是干什么的

### __semaphore, condition, event 都和线程里面的用法相同.

In [None]:
import multiprocessing
from multiprocessing import Barrier, Lock, Process
from time import time
from datetime import datetime

def twb(syn, serializer):
    name=multiprocessing.current_process().name
    syn.wait()
    now=time()
    with serializer:
        print('process {} ----- {}'.format(name, datetime.fromtimestamp(now)))

def twob():
    name=multiprocessing.current_process().name
    now=time()
    print('process {} ----- {}'.format(name, datetime.fromtimestamp(now)))

if __name__=='__main__':
    syn=Barrier(2)
    serializer=Lock()
    Process(name='p1 - twb',target=twb, args=(syn,serializer,)).start()
    Process(name='p2 - twb',target=twb, args=(syn,serializer,)).start()
    Process(name='p3 - twob',target=twob).start()
    Process(name='p4 - twob',target=twob).start()

## 进程间状态管理

这里用了一个dictionary 来作为共享变量

用的是multiprocessing.Manager()

但在主进程里 不可以直接饮用dictionary, 只能用dictionary.keys()

但感觉这个可以用lock解决,不知道什么情况.

In [None]:
import multiprocessing

def worker(dictionary, key, item):
    dictionary[key]=item
    print('key = {} ; value = {}, name={}'.format(key, item, multiprocessing.current_process().name))

if __name__ == '__main__':
    mgr=multiprocessing.Manager()
    dictionary=mgr.dict()
    jobs=[multiprocessing.Process(target=worker, args=(dictionary,i,i*2)) for i in range(10)]
    for j in jobs:
        j.start()
    for j in jobs:
        j.join()
    print('Results: \n')
    for i in dictionary.keys():
        print("{} : {}".format(i, dictionary[i]))

## 进程池, 有意思的部分来了

这里的map() 跟正常的map()不一样.

正常的map() 在python3 里面返回的是一个迭代器. 但这里可以返回一个list

### 嗯````````

In [None]:
import multiprocessing

def func(data):
    result=data*data
    return result

if __name__=='__main__':
    inputs=[i for i in range(100)]
    pool=multiprocessing.Pool(processes=4)
    pool_outputs=pool.map(func, inputs)
    pool.close()
    pool.join()
    print('Pool     : ',pool_outputs)