# 多任务之蚂蚁搬家
## 一个制作缩略图工作
- 文件夹中有1400个JPG文件；
- 逐个制作为(256,256)的缩略图，并将文件日期标注在缩略图中；
- 缩略图保存到另一个文件夹，保留子目录结构

![](20-01-20%2018-21-48%200469.jpg)

## 代码结构（迭代）
```python
def makethumb(fname: str) -> tuple[bool, str]:
    ...

if __name__ == "__main__":
    pbar = tqdm(total=1400)
    for fname in iglob("2020/**/*.jpg", recursive=True):
        pbar.update()
        succ, msg = makethumb(fname)
        if not succ:
            print(msg)
    pbar.close()
```

## 代码结构（map重构）
```python
def makethumb(fname: str) -> tuple[bool, str]:
    ...

if __name__ == "__main__":
    pbar = tqdm(total=1400)
    for succ, msg in map(makethumb, 
                         iglob("2020/**/*.jpg", recursive=True)):
        pbar.update()
        if not succ:
            print(msg)
    pbar.close()
```
## 串行处理
- 一张图片处理结束后，再进行另一张图片的处理
- 好处：单一执行线索，程序流程清晰
- 弊端：“一核有难，九核围观”，浪费投资

![](serial.png)

## 并行处理模块multiprocessing
- 定义进程池Pool
- 定义并行处理的函数func
- Pool.map或者imap替代内置的map函数
- 完毕！

## 代码结构
```python
def makethumb(fname: str) -> tuple[bool, str]:
    ...

if __name__ == "__main__":
    from multiprocessing import Pool
    # 进程池，并行数量缺省为CPU核心数
    with Pool(processes=None) as p:
        pbar = tqdm(total=1400)
        for succ, msg in p.imap(makethumb, 
                        iglob("2020/**/*.jpg", recursive=True),
                        20):
            pbar.update()
            if not succ:
                print(msg)
        pbar.close()
```

## 并行处理
- 什么样的任务适合并行处理？
- 如何面向并行处理**重构**你的代码？
- 哪些因素影响并行处理的效率？