同为多任务处理模块，多进程与多线程有不同的使用场景和限制，python中也有不同的库来实现。

##### 多进程
* 使用独立的进程而非线程来运行多个任务，因此更适合用于 CPU 密集型任务，如数值计算、图像处理等需要大量计算资源的场景
* 相关库：multiprocessing、mpi4py

##### 多线程
* 适用于 I/O 密集型任务，如网络请求、文件读写等需要等待 I/O 操作完成的场景
* 相关库：threading

In [1]:
# 多进程 multiprocessing
# jupyter notebook 中无法使用 multiprocessing，实际效果另见 multi_processing.py

import multiprocessing
import time
import random


def worker(num):
    """进程要执行的任务"""
    print(f"Worker {num} 开始执行")
    
    # 在这里编写具体的任务逻辑
    time.sleep(random.random()*3)
    
    print(f"Worker {num} 执行结束")


if __name__ == '__main__':
    multiprocessing.freeze_support()  # 确保正确启动子进程，避免冲突

    # 创建进程列表
    processes = []

    # 创建并启动多个进程
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i,))
        processes.append(p)
        p.start()

    # 等待所有进程完成
    for p in processes:
        p.join()

    print("所有进程执行完毕")

所有进程执行完毕


In [2]:
# 多线程 threading

import threading
import time
import random


def worker(num):
    """线程要执行的任务"""
    print(f"Worker {num} 开始执行")
    
    # 在这里编写具体的任务逻辑
    time.sleep(random.random()*3)

    print(f"Worker {num} 执行结束")


# 创建线程列表
threads = []

# 创建并启动多个线程
for i in range(5):
    t = threading.Thread(target=worker, args=(i,))
    threads.append(t)
    t.start()

# 等待所有线程完成
for t in threads:
    t.join()

print("所有线程执行完毕")

Worker 0 开始执行
Worker 1 开始执行
Worker 2 开始执行
Worker 3 开始执行
Worker 4 开始执行
Worker 2 执行结束
Worker 4 执行结束
Worker 1 执行结束
Worker 0 执行结束
Worker 3 执行结束
所有线程执行完毕


需要注意的是，多进程（线程）编程可能会带来一些问题，如数据竞争和死锁等。

解决方法包括：
* 使用锁机制来控制线程的访问顺序。
* 使用队列等数据结构来传递数据，避免线程之间直接共享数据。

锁的相关应用建议另作专门学习，下例仅供参考。

In [3]:
import multiprocessing

# 生成锁对象，全局唯一
lock = multiprocessing.Lock()

# 获取锁。未获取到会阻塞程序，直到获取到锁才会往下执行
lock.acquire()

# 释放锁，归还锁，其他人可以拿去用了
lock.release()

In [4]:
import threading

# 同上
lock = threading.Lock()
lock.acquire()
lock.release()