# threading

In [None]:
class Thread:
    def __init__(self, group=None, target=None, name=None,args=(), kwargs=None, *, daemon=None):
    '''
    group：group参数必须为空，参数group是预留的，用于将来扩展
    target：可调用对象，在线程启动后执行
    name：参数name是线程的名字，默认值为Thread-N,N是一个数字
    args：参数给线程函数target的参数，必须是tuple类型
    kwargs：关键字参数，字典类型{}
    '''

## start方法和run方法的区别
- start方法 开始线程活动
    - 每个线程对象来说它只能被调用一次， 它安排对象在一个另外的单独线程中调用run方法
    - 当该方法在同一个线程对象中被调用超过一次时，会引入RuntimeError（运行时错误）
- run方法 代表了线程活动的方法
    - 可以在子类中重写此方法
    - 标准run方法调用了传递给对象的构造函数的可调对象作为目标参数，如果有这样的参数的话，顺序和关键字参数分别从args和kargs取得

## 线程的属性值
- daemon：表示线程是否是守护线程，默认

## 函数式

In [None]:
# 不带参数的多线程
import threading
import time

def chi():
    print("%s 吃着火锅开始：" % time.ctime())
    time.sleep(1)
    print("%s 吃着火锅：涮羊肉" % time.ctime())
    time.sleep(1)
    print("%s 吃着火锅：涮牛肉" % time.ctime())
    time.sleep(1)
    print("%s 吃着火锅：贡丸" % time.ctime())
    time.sleep(1)
    print("%s 吃火锅结束！" % time.ctime())
def ting():
    print("%s 哼着小曲1！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲2！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲3！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲4！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲5！" % time.ctime())
    time.sleep(2)

# 创建线程数组
threads = []
# 创建线程t1，并添加到线程数组
t1 = threading.Thread(target=chi)
threads.append(t1)
# 创建线程t2，并添加到线程数组
t2 = threading.Thread(target=ting)
threads.append(t2)

if __name__ == '__main__':
    # 启动线程
    for t in threads:
        t.start()

In [None]:
# 带参数的多线程
# coding:utf-8
import threading
import time

def chi(threadName,name):
    print("%s 吃着%s开始：" % (time.ctime(),threadName))
    print("%s 吃着火锅：涮羊肉" % time.ctime())
    time.sleep(1)
    time.sleep(1)
    print("%s 吃着火锅：涮牛肉" % time.ctime())
    time.sleep(1)
    print("%s 吃着火锅：贡丸" % time.ctime())
    time.sleep(1)
    print("%s 吃着%s结束--" % (time.ctime(),threadName))
    print("%s 运行结束！"%name)


def ting(threadName):
    print("%s 哼着%s1！" % (time.ctime(),threadName))
    time.sleep(2)
    print("%s 哼着小曲2！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲3！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲4！" % time.ctime())
    time.sleep(2)
    print("%s 哼着小曲5！" % time.ctime())
    time.sleep(2)

# 创建线程数组
threads = []
# 创建线程t1，并添加到线程数组
# t1 = threading.Thread(target=chi, args=("火锅","吃火锅",))

# 传kwargs参数
t1 = threading.Thread(target=chi, kwargs={"threadName":"火锅","name":"吃火锅"})

threads.append(t1)
# 创建线程t2，并添加到线程数组
t2 = threading.Thread(target=ting,args=("小曲",))
threads.append(t2)

if __name__ == '__main__':
    # 启动线程
    for t in threads:
        t.start()

# 类

In [None]:
import threading
import time

# 要执行的任务
def chiHuoGuo(people):
    print("%s 吃火锅的小伙伴-羊肉：%s" % (time.ctime(),people))
    time.sleep(1)
    print("%s 吃火锅的小伙伴-鱼丸：%s" % (time.ctime(),people))

class myThread(threading.Thread):
    # 继承父类threading.Thread
    def __init__(self,people,name):
        threading.Thread.__init__(self)
        self.threadName = name
        self.people = people
        
    def run(self):
        # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        print("开始线程: " + self.threadName)

        chiHuoGuo(self.people)     # 执行任务
        print("结束线程: " + self.name)
        
    # 创建新线程
    thread1 = myThread("xiaoming", "Thread-1")
    thread2 = myThread("xiaowang", "Thread-2")


    # 开启线程
    thread1.start()
    thread2.start()

    time.sleep(0.5)
    print("退出主线程")

## 主线程和子线程的结束顺序
- 场景一：主线程已经结束了，子线程还在跑 -- 正常情况下
- 场景二：主线程结束了，子线程也必须结束 -- 将主线程设置为守护线程
- 场景三：主线程等待子线程结束后才继续运行 -- 对主线程设置阻塞

In [None]:
# 场景一
import threading
import time

def chiHuoGuo(people):
    print("%s 吃火锅的小伙伴-羊肉：%s" % (time.ctime(),people))
    time.sleep(1)
    print("%s 吃火锅的小伙伴-鱼丸：%s" % (time.ctime(),people))


class myThread (threading.Thread):   # 继承父类threading.Thread
    def __init__(self, people, name):
        '''重写threading.Thread初始化内容'''
        threading.Thread.__init__(self)
        self.threadName = name
        self.people = people

    def run(self):   # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        '''重写run方法'''
        print("开始线程: " + self.threadName)

        chiHuoGuo(self.people)     # 执行任务
        print("结束线程: " + self.name)

print("yoyo请小伙伴开始吃火锅：！！！")

# 创建新线程
thread1 = myThread("xiaoming", "Thread-1")
thread2 = myThread("xiaowang", "Thread-2")

# 开启线程
thread1.start()
thread2.start()

time.sleep(0.1)
print("退出主线程：吃火锅结束，结账走人")

In [None]:
# 场景二：
'''
主线程中，创建了子线程thread1和thread2，并且在主线程中调用了thread.setDaemon()
这个函数必须在start方法调用之前设置
'''
# coding=utf-8
import threading
import time

def chiHuoGuo(people):
    print("%s 吃火锅的小伙伴-羊肉：%s" % (time.ctime(),people))
    time.sleep(1)
    print("%s 吃火锅的小伙伴-鱼丸：%s" % (time.ctime(),people))


class myThread (threading.Thread):   # 继承父类threading.Thread
    def __init__(self, people, name):
        '''重写threading.Thread初始化内容'''
        threading.Thread.__init__(self)
        self.threadName = name
        self.people = people

    def run(self):   # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        '''重写run方法'''
        print("开始线程: " + self.threadName)

        chiHuoGuo(self.people)     # 执行任务
        print("结束线程: " + self.name)

print("yoyo请小伙伴开始吃火锅：！！！")

# 创建新线程
thread1 = myThread("xiaoming", "Thread-1")
thread2 = myThread("xiaowang", "Thread-2")

# 守护线程setDaemon(True)
thread1.setDaemon(True)       # 必须在start之前
thread2.setDaemon(True)

# 开启线程
thread1.start()
thread2.start()

time.sleep(0.1)
print("退出主线程：吃火锅结束，结账走人")

In [None]:
# 场景3：阻塞主线程join(timeout)，需要在start之后
# coding=utf-8
import threading
import time

def chiHuoGuo(people):
    print("%s 吃火锅的小伙伴-羊肉：%s" % (time.ctime(),people))
    time.sleep(1)
    print("%s 吃火锅的小伙伴-鱼丸：%s" % (time.ctime(),people))


class myThread (threading.Thread):   # 继承父类threading.Thread
    def __init__(self, people, name):
        '''重写threading.Thread初始化内容'''
        threading.Thread.__init__(self)
        self.threadName = name
        self.people = people

    def run(self):   # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        '''重写run方法'''
        print("开始线程: " + self.threadName)

        chiHuoGuo(self.people)     # 执行任务
        print("结束线程: " + self.name)

print("yoyo请小伙伴开始吃火锅：！！！")

# 创建新线程
thread1 = myThread("xiaoming", "Thread-1")
thread2 = myThread("xiaowang", "Thread-2")

# 开启线程
thread1.start()
thread2.start()

# 阻塞主线程，等子线程结束
thread1.join()
thread2.join()

time.sleep(0.1)
print("退出主线程：吃火锅结束，结账走人")

## 线程同步（锁lock）
- 当一个线程要访问共享数据的时候，必须先获得锁定，如果已经有别的线程获得锁定了，那么该线程暂停，等待当前锁定数据的线程访问完毕的时候，释放锁，再让其他线程访问
- 使用方法：
    - 创建Lock实例：threading.Lock()
    - 锁住：acquire()
    - 释放：release()

In [None]:
# coding=utf-8
import threading
import time

def chiHuoGuo(people, do):
    print("%s 吃火锅的小伙伴：%s" % (time.ctime(),people))
    time.sleep(1)
    for i in range(3):
        time.sleep(1)
        print("%s %s正在 %s 鱼丸"% (time.ctime(), people, do))
    print("%s 吃火锅的小伙伴：%s" % (time.ctime(),people))


class myThread (threading.Thread):   # 继承父类threading.Thread

    lock = threading.Lock()  # 线程锁

    def __init__(self, people, name, do):
        '''重写threading.Thread初始化内容'''
        threading.Thread.__init__(self)
        self.threadName = name
        self.people = people
        self.do = do

    def run(self):   # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        '''重写run方法'''
        print("开始线程: " + self.threadName)

        # 执行任务之前锁定线程
        self.lock.acquire()

        chiHuoGuo(self.people, self.do)     # 执行任务

        # 执行完之后，释放锁
        self.lock.release()

        print("结束线程: " + self.name)

print("yoyo请小伙伴开始吃火锅：！！！")

# 设置线程组
threads = []

# 创建新线程
thread1 = myThread("xiaoming", "Thread-1", "添加")
thread2 = myThread("xiaowang", "Thread-2", "吃掉")

# 添加到线程组
threads.append(thread1)
threads.append(thread2)

# 开启线程
for thread in threads:
    thread.start()

# 阻塞主线程，等子线程结束
for thread in threads:
    thread.join()

time.sleep(0.1)
print("退出主线程：吃火锅结束，结账走人")

## 条件变量（Condition）
- 通常和一个锁关联
- 除了Lock自带的锁定池之外，Condition还包括一个等待池，池中的线程处于状态图中的等待阻塞状态，知道另一个线程调用notify()/notifyAll()通知，得到通知后线程进入锁定池等待锁定
- 方法
    - acquire()：线程锁
    - release()：释放锁
    - wait(timeout)：线程挂起，直到收到一个notify通知或超时（可选的，浮点数，单位是s）才会被唤醒继续运行，wait必须在已获得Lock前提下才能调用，否则会触发RuntimeError
    - notify(n=1)：通知其他线程，那些挂起的线程接到这个通知之后会开始运行，默认是通知一个正等待该condition的线程，最多则唤醒n个等待的线程，notify()必须在已获得Lock前提下才能嗲用，否则触发RuntimeError，notify()不会主动释放Lock
    - notifyAll()：如果wait状态线程比较多，notifyAll的作用就是通知所有线程

In [None]:
# coding=utf-8
import threading
import time

con = threading.Condition()

num = 0

# 生产者
class Producer(threading.Thread):

    def __init__(self):
        threading.Thread.__init__(self)

    def run(self):
        # 锁定线程
        global num
        con.acquire()
        while True:
            print "开始添加！！！"
            num += 1
            print "火锅里面鱼丸个数：%s" % str(num)
            time.sleep(1)
            if num >= 5:
                print "火锅里面里面鱼丸数量已经到达5个，无法添加了！"
                # 唤醒等待的线程
                con.notify()  # 唤醒小伙伴开吃啦
                # 等待通知
                con.wait()
        # 释放锁
        con.release()

# 消费者
class Consumers(threading.Thread):
    def __init__(self):
        threading.Thread.__init__(self)

    def run(self):
        con.acquire()
        global num
        while True:
            print "开始吃啦！！！"
            num -= 1
            print "火锅里面剩余鱼丸数量：%s" %str(num)
            time.sleep(2)
            if num <= 0:
                print "锅底没货了，赶紧加鱼丸吧！"
                con.notify()  # 唤醒其它线程
                # 等待通知
                con.wait()
        con.release()

p = Producer()
c = Consumers()
p.start()
c.start()

## Event（事件）
- 事件处理的机制：全局定义了一个内置标志Flag，如果Flag值为False，那么当程序执行event.wait方法时就会阻塞，如果Flag值为True，那么event.wait方法时便不再阻塞
- 方法：
    - set()：将标志设为True，并通知所有处于等待阻塞状态的线程恢复运行状态
    - clear()：将标志设为False
    - wait(timeout)：如果标志为True将立即返回，否则阻塞线程至等待阻塞状态，等待其他线程调用set（）
    - isSet()：获取内置标志状态，返回True或False

In [None]:
# 场景：小伙伴a和b准备就绪，当收到通知event.set()的时候，会执行a和b线程
# coding:utf-8

import threading
import time

event = threading.Event()


def chihuoguo(name):
    # 等待事件，进入等待阻塞状态
    print '%s 已经启动' % threading.currentThread().getName()
    print '小伙伴 %s 已经进入就餐状态！'%name
    time.sleep(1)
    event.wait()
    # 收到事件后进入运行状态
    print '%s 收到通知了.' % threading.currentThread().getName()
    print '小伙伴 %s 开始吃咯！'%name

# 设置线程组
threads = []

# 创建新线程
thread1 = threading.Thread(target=chihuoguo, args=("a", ))
thread2 = threading.Thread(target=chihuoguo, args=("b", ))

# 添加到线程组
threads.append(thread1)
threads.append(thread2)

# 开启线程
for thread in threads:
    thread.start()

time.sleep(0.1)
# 发送事件通知
print '主线程通知小伙伴开吃咯！'
event.set()

In [None]:
# 场景：当小伙伴a,b,c集结完毕后，请客的人发话：开吃咯！
# coding:utf-8

import threading
import time

event = threading.Event()


def chiHuoGuo(name):
    # 等待事件，进入等待阻塞状态
    print '%s 已经启动' % threading.currentThread().getName()
    print '小伙伴 %s 已经进入就餐状态！'%name
    time.sleep(1)
    event.wait()
    # 收到事件后进入运行状态
    print '%s 收到通知了.' % threading.currentThread().getName()
    print '%s 小伙伴 %s 开始吃咯！'%(time.time(), name)


class myThread (threading.Thread):   # 继承父类threading.Thread
    def __init__(self, name):
        '''重写threading.Thread初始化内容'''
        threading.Thread.__init__(self)

        self.people = name

    def run(self):   # 把要执行的代码写到run函数里面 线程在创建后会直接运行run函数
        '''重写run方法'''

        chiHuoGuo(self.people)     # 执行任务
        print("结束线程: %s" % threading.currentThread().getName())

# 设置线程组
threads = []
# 创建新线程
thread1 = myThread("a")
thread2 = myThread("b")
thread3 = myThread("c")

# 添加到线程组
threads.append(thread1)
threads.append(thread2)
threads.append(thread3)

# 开启线程
for thread in threads:
    thread.start()

time.sleep(0.1)
# 发送事件通知
print '集合完毕，人员到齐了，开吃咯！'
event.set()

## 实例

In [None]:
# coding:utf-8
from bs4 import BeautifulSoup
import requests
import os
import time
from tomorrow import threads

# 当前脚本所在的目录
cur_path = os.path.dirname(os.path.realpath(__file__))


def get_img_urls():
    r = requests.get("http://699pic.com/sousuo-218808-13-1.html")
    fengjing = r.content
    soup = BeautifulSoup(fengjing, "html.parser")
    # 找出所有的标签
    images = soup.find_all(class_="lazy")
    return images

@threads(5)
def save_img(imgUrl):
    try:
        jpg_rl = imgUrl["data-original"]
        title = imgUrl["title"]
        # print(title)
        # print(jpg_rl)
        # print("")
        # 判断是否有jpg文件夹，不存在创建一个
        save_file = os.path.join(cur_path, "jpg")
        if not os.path.exists(save_file): os.makedirs(save_file)

        with open(os.path.join(save_file, title+'.jpg'), "wb") as f:
            f.write(requests.get(jpg_rl).content)
    except:
        pass

if __name__ == "__main__":
    t1 = time.time()


    image_ulrs = get_img_urls()
    for i in image_ulrs:
        save_img(i)

    t2 = time.time()
    print("总耗时：%.2f 秒"%(t2-t1))