# 多任务线程

### 线程
- 线程是实现多任务的另一种方式
- 概念
    - 线程是进程中执行代码的一个分支，每个执行分支（线程）要想工作执行代码需要cpu进行调度，也就是说线程是cpu调度的基本单位，每个进程至少都有一个线程，而这个线程就是我们通常说的主线程
- 多线程可以完成多任务
- 说明：程序启动默认会有一个主线程，程序员自己创建的线程可以称为子线程，多线程可以完成多任务

### 多线程的使用
- 导入线程模块
    - import threading
- 线程类 Thread 参数说明
    - Thread([group[,target[,name[,args[,kwargs]]]]])
        - group：线程组，目前只能使用None
        - target：执行的目标任务名
        - args：以元组的方式给执行任务传参
        - kwargs：以字典的方式给执行任务传参
        - name：线程名，一般不用设置
- 启动线程使用 start 方法
- 小结
    - 导入线程模块
        - import threading
    - 创建子线程并指定执行的任务
        - sub_thread = threading.Thread(target=任务名)
    - 启动线程执行任务
        - sub_thread.start()

In [1]:
# 1. 导入线程模块
import threading
import time


def sing():
    # 获取当前线程
    current_thread = threading.current_thread()
    print("sing:", current_thread)
    
    for i in range(3):
        print("唱歌中...")
        time.sleep(0.2)
        
        
def dance():
    # 获取当前线程
    current_thread = threading.current_thread()
    print("dance:", current_thread)
    
    for i in range(3):
        print("跳舞中...")
        time.sleep(0.2)


if __name__ == "__main__":
    
    # 获取当前线程
    current_thread = threading.current_thread()
    print("main_thread:", current_thread)
    
    # 2. 创建子线程
    sing_thread = threading.Thread(target=sing)
    dance_thread = threading.Thread(target=dance)
    # 3. 启动子线程执行对应的任务
    sing_thread.start()
    dance_thread.start()

main_thread: <_MainThread(MainThread, started 6768)>
sing: <Thread(Thread-6, started 11420)>
唱歌中...
dance: <Thread(Thread-7, started 12556)>
跳舞中...
唱歌中...
跳舞中...
唱歌中...
跳舞中...


### 线程执行带有参数的任务
- Thread类执行任务并给任务传参有两种方式
    - args表示以元组的方式给执行任务传参，一定要和参数的顺序保持一致
    - kwargs表示以字典的方式给执行任务传参，字典中 key 一定要和参数名保持一致

In [5]:
import threading


def show_info(name, age):
    print(f"name:{name} age:{age}")


if __name__ == "__main__":
    # 创建子线程
    # 以元组方式传参，要保证元组里面元素的顺序和函数的参数顺序保持一致
    sub_thread = threading.Thread(target=show_info, args=("李四", 20))
    # 启动线程执行对应的任务
    sub_thread.start()
    
    # 以字典的方式传参，要保证字典里面的 kew 和函数的参数名保持一致
    sub_thread = threading.Thread(target=show_info, kwargs={"name": "王五", "age": 30})
    # 启动线程执行对应的任务
    sub_thread.start()

name:李四 age:20
name:王五 age:30


In [7]:
# 线程之间执行是无序的
import threading
import time


def task():
    time.sleep(1)
    # 获取当前线程
    print(threading.current_thread())


if __name__ == "__main__":
    # 循环创建大量线程，测试线程之间执行是否无序
    for i in range(20):
        # 每循环一次创建一个子线程
        sub_thread = threading.Thread(target=task)
        # 启动子线程执行对应的任务
        sub_thread.start()
        
    # 结论：线程之间执行是无序的，具体哪个线程先执行是由cpu调度决定的

<Thread(Thread-32, started 5328)>
<Thread(Thread-29, started 13080)>
<Thread(Thread-23, started 15492)>
<Thread(Thread-27, started 11140)>
<Thread(Thread-26, started 6656)>
<Thread(Thread-20, started 14700)>
<Thread(Thread-14, started 10168)>
<Thread(Thread-33, started 2580)>
<Thread(Thread-31, started 14928)>
<Thread(Thread-17, started 1256)><Thread(Thread-19, started 14920)>
<Thread(Thread-30, started 1568)>

<Thread(Thread-16, started 2564)>
<Thread(Thread-22, started 1160)>
<Thread(Thread-21, started 4740)>
<Thread(Thread-28, started 12808)>
<Thread(Thread-18, started 7796)>
<Thread(Thread-15, started 3792)>
<Thread(Thread-24, started 10828)>
<Thread(Thread-25, started 7940)>


In [8]:
# 进程之间执行是无序的
import multiprocessing
import time


def task():
    time.sleep(1)
    # 获取当前进程
    print(multiprocessing.current_process())


if __name__ == "__main__":
    # 循环创建大量进程，测试进程之间执行是否无序
    for i in range(20):
        # 每循环一次创建一个子进程
        sub_process = multiprocessing.Process(target=task)
        # 启动子进程执行对应的任务
        sub_process.start()
        
    # 结论：进程之间执行也是无序的，是由操作系统调度进程来决定的

In [2]:
# 主线程会等待所有的子线程执行结束再结束
import threading
import time


def task():
    while True:
        print("任务执行中...")
        time.sleep(0.3)


if __name__ == "__main__":
    # 创建子线程
    # daemon=True 表示创建的子线程守护主线程，主线程退出子线程直接销毁
    # sub_thread = threading.Thread(target=task, daemon=True)
    sub_thread = threading.Thread(target=task)
    # 把子线程设置成为守护主线程
    sub_thread.setDaemon(True)
    sub_thread.start()
    
    # 主线程延时执行1秒钟
    time.sleep(1)
    print("over")
    
# 结论：主线程会等待子线程执行结束再结束
# 解决办法：把子线程设置成为守护主线程即可

# jupyter中不会停止，在pycharm中没问题

任务执行中...
任务执行中...
任务执行中...
任务执行中...
任务执行中...
任务执行中...
任务执行中...
任务执行中...
over
任务执行中...
任务执行中...


In [4]:
# 线程之间共享全局变量
import threading
import time


# 定义全局变量
g_list = []


# 添加数据的任务
def add_data():
    for i in range(3):
        # 每循环一次把数据添加到全局变量
        g_list.append(i)
        print("add:", i)
        time.sleep(0.3)
    
    # 代码执行到此，说明添加数据完成
    print("添加数据完成:", g_list)
    

# 读取数据的任务
def read_data():
    print("read:", g_list)


if __name__ == "__main__":
    # 创建添加数据的子线程
    add_thread = threading.Thread(target=add_data)
    # 创建读取数据的子线程
    read_thread = threading.Thread(target=read_data)
    
    # 启动线程执行对应的任务
    add_thread.start()
    # 让当前线程（主线程）等待添加数据的子线程执行完成以后代码再继续执行
    add_thread.join()
    read_thread.start()

# 结论：线程之间共享全局变量

# 因为多线程在同一个进程里面，所以多线程可以共享全局变量

add: 0
add: 1
add: 2
添加数据完成: [0, 1, 2]
read: [0, 1, 2]


In [7]:
# 线程之间共享全局变量数据出现错误问题
import threading


# 全局变量
g_num = 0


# 循环100万次执行的任务
def tesk1():
    for i in range(1000000):
        # 每循环一次给全局变量加1
        global g_num # 表示要声明修改全局变量的内存地址
        g_num += 1
    
    # 代码执行到此说明数据计算完成
    print("task1:", g_num)
    
    
# 循环100万次执行的任务
def tesk2():
    for i in range(1000000):
        # 每循环一次给全局变量加1
        global g_num # 表示要声明修改全局变量的内存地址
        g_num += 1
    
    # 代码执行到此说明数据计算完成
    print("task2:", g_num)


if __name__ == "__main__":
    # 创建两个子线程
    first_thread = threading.Thread(target=tesk1)
    second_thread = threading.Thread(target=tesk2)
    
    # 启动线程执行任务
    first_thread.start()
    # 线程等待，让第一个线程先执行，然后在让第二个线程再执行，保证数据不会有问题
    first_thread.join() # 主线程等待第一个子线程执行完成以后代码再继续往下执行
    second_thread.start()

task1: 1000000
task2: 2000000


### 互斥锁
- 对共享数据进行锁定，保证同一时刻只能有一个线程去操作
- 互斥锁是**多个线程一起去抢**，抢到锁的线程先执行，没有抢到锁的线程需要等待，等互斥锁使用完释放后，其他等待的线程再去抢这个锁
- 互斥锁的使用
    - threading模块中定义了Lock变量，这个变量本质上是一个函数，通过调用这个函数可以获取一把互斥锁

In [10]:
# 互斥锁
import threading


# 全局变量
g_num = 0


# 创建互斥锁，Lock本质上是一个函数，通过调用函数可以创建一个互斥锁
lock = threading.Lock()


# 循环100万次执行的任务
def tesk1():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        # 每循环一次给全局变量加1
        global g_num # 表示要声明修改全局变量的内存地址
        g_num += 1
    
    # 代码执行到此说明数据计算完成
    print("task1:", g_num)
    # 释放锁
    lock.release()
    
    
# 循环100万次执行的任务
def tesk2():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        # 每循环一次给全局变量加1
        global g_num # 表示要声明修改全局变量的内存地址
        g_num += 1
    
    # 代码执行到此说明数据计算完成
    print("task2:", g_num)
    # 释放锁
    lock.release()


if __name__ == "__main__":
    # 创建两个子线程
    first_thread = threading.Thread(target=tesk1)
    second_thread = threading.Thread(target=tesk2)
    
    # 启动线程执行任务
    first_thread.start()
    
    second_thread.start()
    
# 互斥锁可以保证同一时刻只有一个线程去执行代码，能够保证全局变量的数据没有问题
# 线程等待和互斥锁都是把多任务改成单任务去执行，保证了数据的准确性，但是执行性能会下降

task1: 1000000
task2: 2000000


# 死锁
- 一直等待对方释放锁的情景
- 结果：会造成应用程序的停止响应，不能再处理其他任务了

In [12]:
# 需求：多线程同时根据下标在列表中取值，要保证同一时刻只能有一个线程去取值
import threading


# 创建互斥锁
lock = threading.Lock()


def get_value(index):
    # 上锁
    lock.acquire()
    my_list = [1, 4, 6]
    # 判断下标是否越界
    if index >= len(my_list):
        print("下标越界:", index)
        # 取值不成功，也需要释放互斥锁，不要影响后面的线程去取值
        # 锁需要在合适的地方进行释放，防止死锁
        lock.release()
        return
        
    # 根据下标取值
    value = my_list[index]
    print(value)
    # 释放锁
    lock.release()
    
    
if __name__ == "__main__":
    # 创建大量线程，同时执行根据下标取值的任务
    for i in range(10):
        # 每循环一次创建一个子线程
        sub_thread = threading.Thread(target=get_value, args=(i,))
        # 启动线程执行任务
        sub_thread.start()

1
4
6
下标越界: 3
下标越界: 4
下标越界: 5
下标越界: 6
下标越界: 7
下标越界: 8
下标越界: 9


### 进程和线程的对比（面试会问）
- 关系对比
    - 1. 线程是依附在进程里面的，没有进程就没有线程
    - 2. 一个进程默认提供一条线程，进程可以创建多个线程
- 区别对比
    - 1. 进程之间不共享全局变量
    - 2. 线程之间共享全局变量，但是要注意资源竞争的问题，解决办法：互斥锁或者线程同步
    - 3. 创建进程的资源开销要比创建线程的资源开销要大
    - 4. 进程是操作系统资源分配的基本单位，线程是cpu调度的基本单位
    - 5. 线程不能够独立执行，必须依存在进程中
    - 6. 多进程开发要比单进程多线程开发稳定性要强
优缺点对比
    - 进程优缺点
        - 优点：可以用多核
        - 缺点：资源开销大
    - 线程优缺点
        - 优点：资源开销小
        - 缺点：不能使用多核
- 小结
    - 进程和线程都是完成多任务的一种方式
    - 多进程要比多线程消耗的资源多，但是多进程开发比单进程多线程开发稳定性要强某个进程挂掉不会影响其他进程
    - 多进程可以使用cpu的多核运行，多线程可以共享全局变量
    - 线程不能单独执行必须依附在进程里面

In [16]:
# 使用互斥锁完成2个线程对同一个全局变量各加100万次的操作
import threading


# 定义全局变量
g_num = 0


# 创建互斥锁
lock = threading.Lock()


def task1():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        # 声明全局变量
        global g_num
        g_num += 1
        
    print("task1:", g_num)
    # 解锁
    lock.release()
    
    
def task2():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        # 声明全局变量
        global g_num
        g_num += 1
        
    print("task2:", g_num)
    # 解锁
    lock.release()


if __name__ == "__main__":
    # 创建子线程
    first_thread = threading.Thread(target=task1)
    second_thread = threading.Thread(target=task2)
    
    # 启动子线程
    first_thread.start()
    second_thread.start()

task1: 1000000
task2: 2000000


In [20]:
# 使用互斥锁完成2个线程对同一个全局变量各加100万次的操作
# 此为答案方法
import threading


# 创建互斥锁
lock = threading.Lock()


# 定义全局变量
g_num = 0


def task():
    # 上锁
    lock.acquire()
    for i in range(1000000):
        # 声明全局变量
        global g_num
        g_num += 1
        
    print(g_num)
    # 解锁
    lock.release()


if __name__ == "__main__":
    # 创建子线程
    t1 = threading.Thread(target=task)
    t2 = threading.Thread(target=task)
    
    # 启动子线程
    t1.start()
    t2.start()

1000000
2000000
