### 使用thread完成多线程-第一种方式

python的thread模块是比较底层的模块，python的threading模块对thread做了一些包装的，可以更加方便的使用

只要进程运行起来，里面会有一个主线程（运行的位置）

In [None]:
from threading import Thread
import time

#1. 如果多个线程执行的都是同一个函数的话，各自之间不会有影响，各是个的
#子线程在此运行
def test():
    print("----昨晚喝多了，下次少喝点---")
    time.sleep(1)

#主线程在此运行创建了5个子线程，等子线程全部运行完主线程才会结束
for i in range(5):
    t = Thread(target=test)
    t.start()  #线程开始启动

### 使用thread子类完成创建子线程-第二种方式

In [1]:
import threading
import time

class MyThread(threading.Thread):
    def run(self):
        for i in range(3):
            time.sleep(1)
            msg = "I'm "+self.name+' @ '+str(i) #name属性中保存的是当前线程的名字
            print(msg)


if __name__ == '__main__':
    t = MyThread()
    t.start()

I'm Thread-6 @ 0
I'm Thread-6 @ 1
I'm Thread-6 @ 2


### 线程的执行顺序

执行顺序由操作系统调度决定，是无序的

### 多线程使用全局变量

In [None]:
from threading import Thread
import time

#线程之间共享全局变量
g_num = 100

def work1():
    global g_num
    for i in range(3):
        g_num += 1

    print("----in work1, g_num is %d---"%g_num)


def work2():
    global g_num
    print("----in work2, g_num is %d---"%g_num)


print("---线程创建之前g_num is %d---"%g_num)

t1 = Thread(target=work1)
t1.start()

#延时一会，保证t1线程中的事情做完
time.sleep(1)

t2 = Thread(target=work2)
t2.start()

### 线程共享全局变量的问题

两个线程同时走数据不准确原因：一个线程还没执行完就执行下一个，改变了全局变量

In [2]:
#两个线程间不加等待时间，最后打印出来的值为100多万；如果加上等待时间第一个线程打印100完，第二个线程打印200正确
from threading import Thread
import time

g_num = 0

def test1():
    global g_num
    for i in range(1000000):
        g_num += 1

    print("---test1---g_num=%d"%g_num)

def test2():
    global g_num
    for i in range(1000000):
        g_num += 1

    print("---test2---g_num=%d"%g_num)


p1 = Thread(target=test1)
p1.start()

#time.sleep(3) #取消屏蔽之后 再次运行程序，结果会不一样，，，为啥呢？

p2 = Thread(target=test2)
p2.start()

print("---g_num=%d---"%g_num)

---g_num=49596---
---test1---g_num=1135315
---test2---g_num=1311886


### 避免全局变量被修改的方式1（避免多线程对共享数据出错的方式）

此方法因为没用到线程二但一直轮循，会占用CPU

In [1]:
#加上g_flag判断使得线程一执行完再执行线程二
from threading import Thread
import time

g_num = 0
g_flag = 1

def test1():
    global g_num
    global g_flag
    if g_flag == 1:
        for i in range(1000000):
            g_num += 1

        g_flag = 0

    print("---test1---g_num=%d"%g_num)

def test2():
    global g_numg_flag = 0
    #轮询，加while循环一直判断g_flag满不满足，因为不知道第一个线程什么时候输出g_flag为0；如果不加g_flag只会判断一次
    while True:
        if g_flag != 1:
            for i in range(1000000):
                g_num += 1
            break

    print("---test2---g_num=%d"%g_num)


p1 = Thread(target=test1)
p1.start()

#time.sleep(3) #取消屏蔽之后 再次运行程序，结果会不一样，，，为啥呢？

p2 = Thread(target=test2)
p2.start()

print("---g_num=%d---"%g_num)

---g_num=117686---
---test1---g_num=1000000
---test2---g_num=2000000


### 避免全局变量被修改的方式2--互斥锁

某个线程要更改共享数据时，先将其锁定，此时资源的状态为“锁定”，其他线程不能更改；直到该线程释放资源，将资源的状态变成“非锁定”，其他的线程才能再次锁定该资源。

In [2]:
from threading import Thread, Lock
import time

g_num = 0

def test1():
    global g_num
    #这个线程和ｔｅｓｔ2线程都在抢着　对这个锁　进行上锁，如果有１方成功的上锁，那么导致另外
    #一方会堵塞（一直等待）到这个锁被解开为止
    mutex.acquire()
    for i in range(1000000):
        g_num += 1
    mutex.release()#用来对mutex指向的这个锁　进行解锁，，，只要开了锁，那么接下来会让所有因为
                    #这个锁　被上了锁　而堵塞的线程　进行抢着上锁

    print("---test1---g_num=%d"%g_num)

def test2():
    global g_num
    mutex.acquire()
    for i in range(1000000):
        g_num += 1
    mutex.release()

    print("---test2---g_num=%d"%g_num)

#创建一把互斥锁，这个锁默认是没有上锁的
mutex = Lock()

p1 = Thread(target=test1)
p1.start()

#time.sleep(3) #取消屏蔽之后 再次运行程序，结果会不一样，，，为啥呢？

p2 = Thread(target=test2)
p2.start()

print("---g_num=%d---"%g_num)

---g_num=116250---
---test1---g_num=1000000
---test2---g_num=2000000


### 多个线程使用非全局变量

In [3]:
from threading import Thread
import threading
import time

def test1():
    #注意：
    #   1. 全局变量在多个线程中　共享，为了保证正确运行需要锁
    #   2. 非全局变量在每个线程中　各有一份，不会共享，当然了不需要加锁
    name = threading.current_thread().name
    print("----thread name is %s ----"%name)
    g_num = 100
    if name == "Thread-1": 
        g_num += 1
    else:
        time.sleep(2)
    print("--thread is %s----g_num=%d"%(name,g_num))

#def test2():
#    time.sleep(1)
#    g_num = 100
#    print("---test2---g_num=%d"%g_num)


p1 = Thread(target=test1)
p1.start()

p2 = Thread(target=test1)
p2.start()

----thread name is Thread-10 ----
----thread name is Thread-11 ----
--thread is Thread-10----g_num=100
--thread is Thread-11----g_num=100


### 死锁以及解决办法

在线程间共享多个资源的时候，如果两个线程分别占用一部分资源并且同时等待对方的资源，就会造成死锁

解决方法：

### 同步的理解以及使用

同步就是协同步调，按预定的先后顺序进行运行

In [None]:
#通过添加多个互斥锁来控制多个线程的执行顺序，解锁才能执行下一把锁
from threading import Thread,Lock
from time import sleep

class Task1(Thread):
    def run(self):
        while True:
            if lock1.acquire():
                print("------Task 1 -----")
                sleep(0.5)
                lock2.release()

class Task2(Thread):
    def run(self):
        while True:
            if lock2.acquire():
                print("------Task 2 -----")
                sleep(0.5)
                lock3.release()

class Task3(Thread):
    def run(self):
        while True:
            if lock3.acquire():
                print("------Task 3 -----")
                sleep(0.5)
                lock1.release()

#使用Lock创建出的锁默认没有“锁上”
lock1 = Lock()
#创建另外一把锁，并且“锁上”
lock2 = Lock()
lock2.acquire()
#创建另外一把锁，并且“锁上”
lock3 = Lock()
lock3.acquire()

t1 = Task1()
t2 = Task2()
t3 = Task3()

t1.start()
t2.start()
t3.start()

### 生产者与消费者来解决耦合的问题

队列：先进先出。栈：先进后出

比如爬虫，当抓数据和处理数据速度不一致时，就要用到生产者与消费者模式来处理，用队列、缓冲池等

#### 用FIFO队列实现生产者与消费者速度不一致的问题

Python的Queue模块中提供了同步的、线程安全的队列类，包括FIFO(先入先出)队列Queue，LIFO(后入先出)队列LifoQueue,和优先级队列PriorityQueue。能在多线程中直接使用，可以使用队列来实现线程间的同步

解耦：把程序模块化，对象之间的耦合越高，维护成本越高，尽可能减少代码耦合。

In [None]:
#encoding=utf-8
import threading
import time

#python2中
#from Queue import Queue

#python3中
from queue import Queue

class Producer(threading.Thread):
    def run(self):
        global queue
        count = 0
        while True:
            if queue.qsize() < 1000:    #只要里面数据小于1000，2条线程就会生成数据
                for i in range(100):
                    count = count +1
                    msg = '生成产品'+str(count)
                    queue.put(msg)              #从外面加进来
                    print(msg)
            time.sleep(0.5)

class Consumer(threading.Thread):
    def run(self):
        global queue
        while True:
            if queue.qsize() > 100:  #只要里面数据大于100，5条线程就去消费里面的数据
                for i in range(3):
                    msg = self.name + '消费了 '+queue.get()  #从里面获取
                    print(msg)
            time.sleep(1)


if __name__ == '__main__':
    queue = Queue()

    for i in range(500):
        queue.put('初始产品'+str(i))
    for i in range(2):   #创建2条线程
        p = Producer()
        p.start()
    for i in range(5):   #创建5条线程
        c = Consumer()
        c.start()

### ThreadLocal对象在线程中的使用

使用ThreadLocal对象，多个线程的变量各用各的

In [8]:
import threading

# 创建全局ThreadLocal对象:
local_school = threading.local()

def process_student():
    # 获取当前线程关联的student:
    std = local_school.student
    print('Hello, %s (in %s)' % (std, threading.current_thread().name))   #两条线程实际上打印了两个全局变量，各打印各的

def process_thread(name):
    # 绑定ThreadLocal的student:
    local_school.student = name
    process_student()

t1 = threading.Thread(target= process_thread, args=('dongGe',), name='Thread-A')
t2 = threading.Thread(target= process_thread, args=('老王',), name='Thread-B')
t1.start()
t2.start()

Hello, dongGe (in Thread-A)
Hello, 老王 (in Thread-B)
------Task 3 -----
------Task 2 -----
------Task 1 -----
------Task 3 -----


### 异步的实现

In [None]:
from multiprocessing import Pool
import time
import os

def test():
    print("---进程池中的进程---pid=%d,ppid=%d--"%(os.getpid(),os.getppid()))  #打印当前进程id和ppid
    for i in range(3):
        print("----%d---"%i)
        time.sleep(1)
    return "hahah"

def test2(args):  #args的值为test的return值
    print("---callback func--pid=%d"%os.getpid())
    print("---callback func--args=%s"%args)

pool = Pool(3)  #创建一个进程池，最多可以执行3个进程
pool.apply_async(func=test,callback=test2)#添加了test任务去执行，callback回调

#异步的理解：主进程正在做某件事情，突然　来了一件更需要立刻去做的事情，
#那么这种，在父进程去做某件事情的时候　并不知道是什么时候去做，的模式　就称为异步

#此为主进程
while True:
    time.sleep(1)
    print("----主进程-pid=%d----"%os.getpid())

### Gil的问题（全局解释器锁）

#### 单线程死循环

In [None]:
#主线程死循环，占满cpu
while True:
    pass

#### 两个线程死循环

In [None]:
#-*- coding:utf-8 -*-
import threading

#子线程死循环
def test():
    while True:
        pass


t1 = threading.Thread(target=test)
t1.start()

#主线程死循环
while True:
    pass

#### 两个进程死循环

In [None]:
import multiprocessing

def deadLoop():
    while True:
        pass

#子进程死循环
p1 = multiprocessing.Process(target=deadLoop)
p1.start()

#主进程死循环
deadLoop()

#### 04-使用c语言来解决GIL问题

In [None]:
#main.py
from ctypes import *
from threading import Thread

#加载动态库
lib = cdll.LoadLibrary("./libdeadloop.so")

#创建一个子线程，让其执行ｃ语言编写的函数，此函数是一个死循环
t = Thread(target=lib.DeadLoop)
t.start()

#主线程，也调用ｃ语言编写的那个死循环函数
#lib.DeadLoop()

while True:
    pass