# 协程
- 参考资料
    - http://segmentfault.com/a/1190000009781688
    
# 迭代器
- 可迭代(iterable)：可直接作用域for循环的变量
- 迭代器（Iterator）：不但可以作用域for循环，还可以被next调用
    - 如 for循环就不是迭代器
- 判断是否是迭代器：isinstance(lst, Iterable)
- 迭代器和可迭代可以相互转换
    - iter()函数：把可迭代转换成迭代器
    
# 生成器
- generator:一边循环一边计算下一个元素的机制/算法
- 如果达到最后一个后，爆出StopIteation异常
- 可以被next函数调用

- 生成器是一种特殊的迭代器，但迭代器不是生成器，因为迭代器没有传入数据功能，

### 如何生成一个生成器
- 直接使用()
- 如果函数中包含yield，则这个函数叫生成器。yield语句形式： value = yield 表达式（每次迭代要返回的值），value用来接收其他对象send的值
- 生成器的四种方法：
    - 1、next(g):调用函数，遇到yield返回。next函数也称为预激，意思是让程序准备执行
    - 2、send()：向生成器传递值进去
        - 注意：在调用send()发送非None值之前必须先启动生成器，可以用①next()②send(None)两种方式预激
    - 3、close()方法：
        - 意思指关闭生成器，不能再进行访问
        - 调用close()之后， 生成器不再往下运行，继续next的话会产生StopIteration异常
    - 4、throw()方法：手动抛出异常，且throw函数会返回下一个要迭代的值或者是StopIteration
- 生成器的典型用法是在for中使用，比较常用的典型生成器就是range


In [2]:
from collections import Iterable
l = [1,2,3,4]
print(isinstance(l,Iterable))
from collections import Iterator
print(isinstance(l, Iterator))

# iter函数
a = "noonecanhearme"
print(isinstance(a, Iterator))
a_iter = iter(a)
print(isinstance(a_iter, Iterator))


True
False
False
True
True


  """Entry point for launching an IPython kernel.
  after removing the cwd from sys.path.


In [3]:
# 直接使用生成器
l = [x*x for x in range(5)]  # 列表生成式
g = (x*x for x in range(5))  #生成器表达式
print(type(l))
print(type(g))
print(g)
print(isinstance(g, Iterator))

<class 'list'>
<class 'generator'>
<generator object <genexpr> at 0x00000208094A0A20>
True


In [7]:
a = (i for i in range(4))
print(next(a))
print(next(a))
print(next(a))
a.close()


0
1
2


In [14]:
def g():
    yield "AB"
#print(list(g()))
a = next(g())
print(a)

def f():
    yield from "AB"
#print(list(f()))
new_f = f()
a = next(new_f)
b = next(new_f)
print(a)
print(b)

# yield from 相当于for循环+yield
print("===============")
def new_g():
    for i in "AB":
        yield i
gg = new_g()
a = next(gg)
b = next(gg)
print(a, b)

AB
A
B
A B


In [6]:
# 生成器send举例
def fun():
    for i in range(3):
        value = yield i
        print(value)

g = fun()
"""
a = next(func())
b = next(func())
c = next(func())
#得将func()赋值给一个变量，否则直接用func()意味着新建一个生成器，
所以上面这种写法得到的结果是相同的
"""
# 为了避免StopIteration异常，可以使用try语句
try:
    a = next(g)  # a = g.send(None) 效果一样
    print(a)
    b = g.send("haha") # send意味着已经预激了，它充当了next
    # 整体执行过程
    # 当a预激的时候，i值返回给a,fun函数停止在这里，此时value还未激活
    # b在发送的时候，value得到 "haha",又send相当于next，所以i值返回给b。
    # 所以可以认为send即起到发送的作用，也起到预激的作用
    # c在发送的时候，value得到“hehe”，由于send的预激作用，i值返回给c
    # 生成器运行完毕
    print(b)
    c = g.send("hehe")
    print(c)
    next(g)

except StopIteration as e:
    print("StopIteration is appereaing")
    pass

0
haha
1
hehe
2
None
StopIteration is appereaing


In [8]:
# 生成器close举例
def gen_func():
    yield '哈哈'
    yield "hehe"
    yield "xixi"
if __name__ == '__main__':
    try:
        gen = gen_func()
        value = next(gen)
        print(value)
        gen.close() # 加入这句话就会抛出StopIteration异常
        print(next(gen))
        print(next(gen))
    except StopIteration: # 尽管捕捉StopIteration异常，但后面的语句依然不会执行
        print("异常被抛出，不能再往下运行了")

哈哈
异常被抛出，不能再往下运行了


In [13]:
# 生成器throw异常举例:第一个案例
def func():
    try:
        yield '哈哈'
        yield "hehe"
        yield "xixi"
    except Exception:
        print("有异常出现")
if __name__ == '__main__':
    f = func()
    value = next(f)
    f.throw(StopIteration, "这是手动抛出异常")
    print(next(f))
    # 手动抛出异常可以捕获except Exception，但是捕获后依然不能执行后面的语句

有异常出现


StopIteration: 

In [24]:
# throw抛出异常第二个案例，更改上面代码
def func():
    while True:
        try:
            yield 'haha'
            yield "hehe"
            yield "xixi"
        except ValueError:
            print("触发VauleError异常了")
        except TypeError:
            print("触发TypeError异常了")
if __name__ == '__main__':
    f = func()
    print(next(f))
    print(next(f))
    print("========================")
    print(f.throw(ValueError, "这是手动抛出异常")) #throw会抛出
    print("==========================")
    print(next(f))
    print(next(f))
    print("=====================")
    print(f.throw(TypeError, "又是手动抛出异常"))
    print("===============")
    print(next(f))
    print(next(f))
    #结果解释
    """
        当两次next后触发ValueError异常，生成器停止，由于whileT True，重启生成器，
        重新重开头开始，但throw会消耗一个yield并且返回该值
    """

haha
hehe
触发VauleError异常了
haha
hehe
xixi
触发TypeError异常了
haha
hehe
xixi


In [15]:
# 用list编写斐波那契数列
def fib(maxn):
    n, a, b = 0, 0, 1
    while n < maxn:
        a, b = b, a+b
        print(a)
        n += 1
    return "Done"

print(fib(5))

1
1
2
3
5
Done


In [8]:
# 用生成器编写斐波那契数列
def fib(nmax):
    n, a, b = 0, 0, 1
    while n < nmax:
        a, b = b, a+b
        yield a
        n += 1
    return "Done"

try:
    g = fib(5)
    for i in range(6):
        rst = next(g)
        print(rst)
except StopIteration as e:
    print(e.value)
# 注意：抛出异常时的返回值return的返回值

1
1
2
3
5
Done


In [31]:
def fib(nmax):
    n, a, b = 0, 0, 1
    while n < nmax:
        a, b = b, a+b
        yield a
        n += 1
    return "Done"

g = fib(5)
for i in g:  #for会自动处理StopIteration，不会抛出
    print(i)

1
1
2
3
5


## 相关概念的理解
### 并发与并行
- 并发：又称伪并行，是指一个时间段中有几个程序都处于已启动运行到运行完毕之间，且这几个程序都是在同一个处理机上运行，但任意时刻真正在工作的只有一个程序。比如说，一秒内切换了100个线程，就可以认为CPU的并发是100.单个CPU+多道技术即可实现
- 并行：指在任意时刻点上，在同一处理机上有多个程序在CPU上同时工作，每个程序独立运行，互不干扰，最大并行数量和CPU数量是一致的。可以理解为多CPU即多核运行
- 平常所说的是高并发而不是高并行，因为每台电脑的CPU数量有限，不可以增加

### 同步与异步
- 同步：(注意同步和异步只是针对于I/O操作来讲的）值调用IO操作时，必须等待IO操作完成后才开始新的的调用方式。
- 异步：指调用IO操作时，不必等待IO操作完成就开始新的的调用方式。不过等到IO操作完成时，需要告知调用者自己已经完成，告知方式有：
    - 1、状态：调用者监听被调用者的状态，即时不时的检查被调用者的状态。效率低
    - 2、通知：当被调用者执行完毕后，被调用者通知调用者自己执行完毕
    - 3、回调：当被调用者执行完毕，它调用由调用者提供给他的回调函数

### 阻塞与非阻塞
- 阻塞：阻塞调用是指调用结果返回之前，当前线程会被挂起。调用线程只有在得到结果之后才会返回。
- 非阻塞：非阻塞调用指在不能立刻得到结果之前，该调用不会阻塞当前线程。

- 注意：同步执行一般都会有阻塞，但也有可能没阻塞；异步执行也有可能有阻塞，也可能没有阻塞。

# 协程
- 引子
    - CPU上下文在多线程部分有相应的解释，即切换+保存
    - CPU需切换的两种情况：第一：该任务发生了阻塞，第二：该任务的计算时间过长或者有一个优先级更高的新程序替代了它
- 希望使用协程来解决的问题：
    - 1、采用同步的方式去编写异步的代码，使代码的可读性高，更简便。
    - 2、使用单线程去切换任务（就像实现单线程间函数之间的切换，使速度更快）
    
        - (1）多线程是由操作系统切换的，单线程的切换意味着我们需要程序员自己去调度任务。
        
　　　　　　- (2）不需要锁，并发性高，如果单线程内切换函数，性能远高于线程切换，并发性更高。
      
- 协程的理解
        协程本质是就是一个线程，线程之间任务的切换是由操作系统控制的，遇到了I/O自动切换。使用协程的目的就是较少操作系统切换的开销（开关线程，创建寄存器，堆栈等，指的是在他们之间的切换），然后在我们自己的程序里面来控制任务的切换
        
- 协程的定义
    - 是单线程下的并发，又称微线程，纤程。英文名Coroutine。一句话说明什么是协程：协程是一种用户态的轻量级线程，即协程是由用户程序自己控制调度的。
    - 协程与线程的讨论
        - python的线程属于内核级别的，即由操作系统控制调度（如单线程遇到io或执行时间过长就会被迫交出cpu执行权限，切换其他线程运行）
        - 单线程内开启协程，一旦遇到io，就会从应用程序级别（而非操作系统）控制切换，以此来提升效率（！！！非io操作的切换与效率无关）
        
- 协程的缺点：
    - 1. 协程的本质是单线程下，无法利用多核，可以是一个程序开启多个进程，每个进程内开启多个线程，每个线程内开启协程
    - 2.协程指的是单个线程，因而一旦协程出现阻塞，将会阻塞整个线程
    
- 综上得到协程的四个特点
    - 必须在只有一个单线程里实现并发
    - 修改共享数据不用加锁
    - 用户程序自己保持多个控制流的上下文栈
    - 一个协程遇到IO操作自动切换到其它协程（如何实现检测IO，yield、greenlet都无法实现，就用到了gevent模块（select机制））
    
- 生成器的四个状态：
    - getgeneratorstate(g)函数确定，该函数会返回下列字符串中的一个：该方法在native coroutine已被淘汰
        - GEN_CREATED:等待开始执行
        - GEN_RUNNING:解释器正在执行
        - GEN_SUSPENED:在yield表达式处暂停
        - GEN_CLOSED:执行结束
    - next():预激
    

        


In [13]:
from inspect import getgeneratorstate
import time

def my_generator():
    for i in range(3):
        time.sleep(0.1)
        x = yield i + 1
        
def main(generator):
    try:
        print("生成器初始状态为：{}".format(getgeneratorstate(g)))
        next(g)
        print("生成器状态为：{}".format(getgeneratorstate(g)))
        g.send(100)
        print("生成器状态为：{}".format(getgeneratorstate(g)))
        next(g)
        print("生成器状态为：{}".format(getgeneratorstate(g)))
        next(g)
    except StopIteration:
        print("全部迭代完毕")
        print("生成器状态为：{}".format(getgeneratorstate(g)))
        
g = my_generator()
main(g)

生成器初始状态为：GEN_CREATED
生成器状态为：GEN_SUSPENDED
生成器状态为：GEN_SUSPENDED
生成器状态为：GEN_SUSPENDED
全部迭代完毕
生成器状态为：GEN_CLOSED


# 协程的实现
### 基于生成器实现的协程（老方法，该方法将会被淘汰）
- 第一种方法：基于生成器实现
    - 1、利用生成器中的yield，send，next关键字即可实现，当生成器中的值迭代完毕，抛出StopIteration异常
        - 协程的终止
            协程中未处理的异常会向上冒泡（冒泡的意思是指异常向上级层层传递，直到被捕获），传给next函数或send方法的调用方
            终止协程的一种方式：发送某个哨符值，让协程退出。内置的None和Ellipsis等常量经常用作哨符值
            
    - 2、yieldfrom方法：yield from是对yield的简化
        - yield from相当于是for 加上 yield
        - 连接子生成器和调用方，内部实现了很多异常的自动处理（包括StopIteration异常），可以获取子生成器return的值
        - 使用yield from会牵涉到委派生成器，子生成器，调用方          
    - 3、构建协程的标准方法：yield from + @asyncio.coroutine方法：
        - 步骤：
            - 创建消息循环
            - 导入协程
            - 关闭
        - @asyncio.coroutine装饰器是表示该函数是一个协程函数，并在该函数中使用yield from
                
### 新方法：native coroutine(本地协程)
- 使用native asyncio:即async和await关键字，本质上和老方法是一样的，但这种方法更简洁,不会与生成器发生歧义
- 实现协程比较好的包有：asyncio, tornado,gevent，greenlet

### 委派生成器，子生成器，调用方
- 委派生成器：包含这一整句话 yield from generator1 的生成器函数；
    - 委派生成器在yield from表达式处暂停，调用方可以直接把数据传给子生成器
    - 子生成器在把产出的值发给调用方
    - 子生成器在最后，解释器会抛出StopIteration异常，并把返回值附加到异常对象的第一个参数上
    
- 子生成器：从 yield from generator1表达式中的generator就是子生成器；

- 调用方：调用委派生成器的客户端代码；
        

In [18]:
# 单线程测试
import time
def fun1():
    for i in range(100):
        print("这是第一个程序第%d次运行"%i)
        #time.sleep(0.5)
        
def fun2():
    g = fun1()
    for i in range(100):
        print("这是第二个程序第%d次打印"%i)
        #time.sleep(0.5)
start_time = time.time()

fun2()
end_time = time.time()
print("总共耗时：{} s".format(abs(start_time - end_time)))

这是第一个程序第0次运行
这是第一个程序第1次运行
这是第一个程序第2次运行
这是第一个程序第3次运行
这是第一个程序第4次运行
这是第一个程序第5次运行
这是第一个程序第6次运行
这是第一个程序第7次运行
这是第一个程序第8次运行
这是第一个程序第9次运行
这是第一个程序第10次运行
这是第一个程序第11次运行
这是第一个程序第12次运行
这是第一个程序第13次运行
这是第一个程序第14次运行
这是第一个程序第15次运行
这是第一个程序第16次运行
这是第一个程序第17次运行
这是第一个程序第18次运行
这是第一个程序第19次运行
这是第一个程序第20次运行
这是第一个程序第21次运行
这是第一个程序第22次运行
这是第一个程序第23次运行
这是第一个程序第24次运行
这是第一个程序第25次运行
这是第一个程序第26次运行
这是第一个程序第27次运行
这是第一个程序第28次运行
这是第一个程序第29次运行
这是第一个程序第30次运行
这是第一个程序第31次运行
这是第一个程序第32次运行
这是第一个程序第33次运行
这是第一个程序第34次运行
这是第一个程序第35次运行
这是第一个程序第36次运行
这是第一个程序第37次运行
这是第一个程序第38次运行
这是第一个程序第39次运行
这是第一个程序第40次运行
这是第一个程序第41次运行
这是第一个程序第42次运行
这是第一个程序第43次运行
这是第一个程序第44次运行
这是第一个程序第45次运行
这是第一个程序第46次运行
这是第一个程序第47次运行
这是第一个程序第48次运行
这是第一个程序第49次运行
这是第一个程序第50次运行
这是第一个程序第51次运行
这是第一个程序第52次运行
这是第一个程序第53次运行
这是第一个程序第54次运行
这是第一个程序第55次运行
这是第一个程序第56次运行
这是第一个程序第57次运行
这是第一个程序第58次运行
这是第一个程序第59次运行
这是第一个程序第60次运行
这是第一个程序第61次运行
这是第一个程序第62次运行
这是第一个程序第63次运行
这是第一个程序第64次运行
这是第一个程序第65次运行
这是第一个程序第66次运行
这是第一个程序第67次运行
这是第一个程序第68次运行
这是第一个程序第69次运行
这是第一个程序第70次运行
这是第一个程序第71次运行
这是

In [19]:
# 用yield实现切换+保存
import time
def fun1():
    for i in range(100):
        yield
        print("这是第1个程序第%d次运行"%i)
        #time.sleep(0.1)
        
def fun2(): 
    g = fun1()
    next(g)
    for i in range(100):
        print("这是第2个程序第%d次打印"%i)
        #time.sleep(0.1)
        next(g)
    
"""try:
    start = time.time()
    fun2()
except StopIteration:
    print("程序运行结束")
finally:
    end = time.time()
    print("总共耗时：{} s".format(abs(start_time - end_time)))
"""
# 时间没有减少，反而成倍增加

'try:\n    start = time.time()\n    fun2()\nexcept StopIteration:\n    print("程序运行结束")\nfinally:\n    end = time.time()\n    print("总共耗时：{} s".format(abs(start_time - end_time)))\n'

In [10]:
# 协程的实现：yield方法：利用生成器实现程序切换
import time

def func1():
    print("我肯定是Number one")
    for i in range(5):
        # 函数运行到这时暂停，无返回值
        yield
        print("这是第1个程序第{}次运行".format(i))
        time.sleep(0.25)
    return None

def func2():
    f = func1()
    #预激生成器,即func1开始运行，但遇到yield暂停，直到下一次的send或者next
    next(f) #f.send(None)同这句话效果一样
    print("你是对的")
    for i in range(5):
        print("这是第2个程序第%d次运行" % i)
        time.sleep(0.25)
        next(f)  # func1()开始运行，再次运行到yield
        
start = time.perf_counter()
func2()
end = time.perf_counter()
print(f"总共耗时{(end - start):.2f} s")

我肯定是Number one
你是对的
这是第2个程序第0次运行
这是第1个程序第0次运行
这是第2个程序第1次运行
这是第1个程序第1次运行
这是第2个程序第2次运行
这是第1个程序第2次运行
这是第2个程序第3次运行
这是第1个程序第3次运行
这是第2个程序第4次运行
这是第1个程序第4次运行


StopIteration: 

In [12]:
# 利用生成器中的send做到值得传递以及处理StopIteration
import time

def func1():
    for s in "Iloveyou":
        a = yield s
        print("程序2传给程序1的值:", a)
        time.sleep(0.24)
    return "Done"

def func2():
    f = func1()
    value = f.send(None)
    for i in range(8):
        print("程序1传给程序2的值：", value)
        value = f.send(i)
        time.sleep(0.25)
        
try:
    func2()
except StopIteration as e: #程序1的返回值时保存在StopIteration的值中的
    print(e.value)


程序1传给程序2的值： I
程序2传给程序1的值: 0
程序1传给程序2的值： l
程序2传给程序1的值: 1
程序1传给程序2的值： o
程序2传给程序1的值: 2
程序1传给程序2的值： v
程序2传给程序1的值: 3
程序1传给程序2的值： e
程序2传给程序1的值: 4
程序1传给程序2的值： y
程序2传给程序1的值: 5
程序1传给程序2的值： o
程序2传给程序1的值: 6
程序1传给程序2的值： u
程序2传给程序1的值: 7
Done


In [None]:
# yield协程实现消费者生产者模型
def consumer():
    r = ''
    while True:
        n = yield r
        if not n:
            return
        print('[CONSUMER] Consuming %s...' % n)
        r = '200 OK'

def produce(c):
    start = c.send(None)
    print(start is "")
    n = 0
    while n < 5:
        n = n + 1
        print('[PRODUCER] Producing %s...' % n)
        r = c.send(n)
        print('[PRODUCER] Consumer return: %s' % r)
    c.close()

c = consumer()
produce(c)

In [23]:
# 利用yield from实现协程

# 子生成器：包含yield语句
import asyncio

def my_generator():
    for i in range(5):
        if i==2:
            return '我被迫中断了'
        else:
            yield i
            
def wrap_my_generator(generator):  #定义一个包装“生成器”的生成器，它的本质还是生成器
    result=yield from generator    #自动触发StopIteration异常，并且将return的返回值赋值给yield from表达式的结果，即result
    print(result)   #该结果是打印出返回值

def main(generator):
    for j in generator:
        print(j)

        
g=my_generator()
wrap_g=wrap_my_generator(g)
main(wrap_g)  #调用


0
1
我被迫中断了


False

In [10]:
# yield from 简化for表达式
def gen():
    for i in "ab":
        yield i
        
def new_gen():
    yield from "ab"
print(list(gen()))
print(list(new_gen()))

['a', 'b']
['a', 'b']


In [11]:
# 委派生成器，子生成器，调用方举例

from collections import namedtuple #命名元组
# 子生成器函数
ResClass = namedtuple("Res", "count average")
def averager():
    total = 0
    count = 0
    average = None
    while True:
        term = yield
        # 此处的None是哨兵值
        if term is None:
            break
        total += term
        count += 1
        average = total/count
    return ResClass(count, average)

# 委派生成器:含yield from
def grouper(storages, key):
    while True:
        # 获取averager（）中return返回的值
        storages[key] = yield from averager()
        
# 客户端代码
def client():
    gread = {
        "xiaomig":[78, 68, 87, 89, 93],
        "xiaohong":[84, 78, 98, 56, 67]
    }
    storages = {}
    for k,v in gread.items():
        # 获得协程
        coroutine = grouper(storages, k)
        # 预激协程
        next(coroutine)
        # 发送数据到协程
        for dt in v:
            coroutine.send(dt)
            # 其实相当于发送给的是子生成器
        # 终止协程
        coroutine.send(None)
    print(storages)
client()

{'xiaomig': Res(count=5, average=83.0), 'xiaohong': Res(count=5, average=76.6)}


# 实现标准协程的方法：@asyncio.coroutine+yield from（老方法）
- 协程：需要@asyncio.coroutine装饰，且函数体内一定要有yieldfrom修饰
- 因此：之前用yield和yieldfrom实现的并不是真正的协程，只是和协程的工作机理一样而已
- 判断一个函数是不是协程：
    - asyncio.iscoroutine(obj)(判断是否是协程对象
    - asyncio.iscoroutinefunction(func)：判断是否是协程函数

In [26]:
import time
import inspect
import asyncio
import nest_asyncio
nest_asyncio.apply()

# 该装饰器表明该函数是协程函数
# 使用同步方式编写异步功能
import time 
import asyncio

@asyncio.coroutine
def task_1():
    print("开始运行IO任务1....")
    # 模拟表示切换到另一个任务，睡上一秒
    # 为啥不用time.sleep(1)，time.sleep()不是生成器，yield from后面只能跟生成器
    # 而且asyncio.sleep()表示一个协程
    yield from asyncio.sleep(1)
    print("IO任务1已经完成，耗时1秒")
    return task_1.__name__

@asyncio.coroutine
def task_2():
    print("开始运行IO任务2.....")
    yield from asyncio.sleep(2)
    print("IO任务2已经完成，耗时2秒")
    return task_2.__name__

@asyncio.coroutine
def main():
    # 添加所有任务到tasks中相当于打包
    tasks = [task_1(), task_2()]
    #子生成器
    done, pending = yield from asyncio.wait(tasks)
    for r in done:  #done和pending都是一个任务，所以返回结果需要逐个调用result()
        print("协程无序返回值：", r.result())
        
if __name__ == "__main__":
    print(inspect.isawaitable(main))
    print(inspect.iscoroutine(main))
    print(inspect.iscoroutinefunction(main))
    #print(inspect.getgeneratorstate(main))
    #print(inspect.getcoroutinestate(main)) #老方法不存在这两个函数
    start = time.perf_counter()
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main())
    end = time.perf_counter()
    print(f"所有IO任务耗时{(end - start):.2f}s")
    


False
False
False


AttributeError: 'function' object has no attribute 'gi_running'

In [None]:
import threading
import asyncio
import nest_asyncio
nest_asyncio.apply()


# 使用协程
# 基于生成器实现的协程将会被淘汰
@asyncio.coroutine
def hello():
    print("Hello World  (%s)" % threading.currentThread)
    print("Start.........(%s)" % threading.currentThread)
    # 相当于开启另一个程序，hello在这里被阻断，切换到另外的程序执行
    yield from asyncio.sleep(1)
    print("Done...........(%s)" % threading.currentThread)
    print("Hello again! (%s)" % threading.currentThread)
    
#启动消息循环
loop = asyncio.get_event_loop()
tasks = [hello(), hello(), hello()]
loop.run_until_complete(asyncio.wait(tasks))


# 基于native asyncio的协程详解
- 基于生成器实现的协程将会被删除，进而产生了native asyncio
- 基于native asyncio的协程能更好的表示异步IO，不与生成器弄混
- 实现：
    - 把@asyncio.coroutine 替换为 async
    - 把yield from 替换为await
- 由于native asyncio是借鉴了基于生成器实现协程的思想，所以native asyncio也支持send,close,throw三种方法
- 判断方法：（inspect是一个模块）
    - inspect.isawaitable(obj))
    - inspect.iscoroutine(obj))
    - inspect.iscoroutinefunction(corfunction)
    - inspect.getgeneratorstate(gen)
    - inspect.getcoroutinestate(cor)
    - inspect.getgeneratorlocals(cor)

### async和await关键字
- async 
    用来声明一个函数为异步函数（即本地协程），异步函数的特点是能在函数执行过程中挂起，去执行其他异步函数，等到挂起条件（假设挂起条件是sleep(5)）消失后，也就是5秒到了再回来执行。调用异步函数(即本地协程)的时候，函数体并不会被执行，而是得到一个协程对象
- await
    await 用来用来声明程序挂起，比如异步程序执行到某一步时需要等待的时间很长，就将此挂起，去执行其他的异步程序。await 后面只能跟异步程序或有__await__属性的对象，因为异步程序与一般程序不同

## 通过事件循环运行协程函数的方法：
- 方法一：采用事件循环方法：asyncio.get_event_loop()
    - 按道理协程函数的执行可以用send方法，举例如下。但他不高效，用事件循环方法替代：先创建一个事件循环，然后用run_until_complete把协程注册到事件循环中
    - 为了实现程序切换，可以和generator一样使用yield进行切换，但本地协程不支持yield，改用await。await something，something必须是可Awaitable
    - 啥是可awiatable的：即可暂停的对象https://www.python.org/dev/peps/pep-0492/
    - 可awaitable类型：
        - Task对象
        - coroutines对象
        - 基于生成器实现的协程对象
            - 为了实现新老方法的兼容，在types类中加入了coroutine，通过@types.coroutine装饰器装饰，可将生成器（含yieldfrom）转换为协程对象
        - 特殊的类似Future的对象
- 方法二：直接采用asyncio.run(function_name)运行协程函数，3.7以后加入的方法
- 方法三：使用await关键字,用在主函数中嵌套调用
            async def main():
                await c1
                
### 事件循环相关方法
- loop = asyncio.get_running_loop()返回在当前线程中正在运行的事件循环，如果没有正在运行的事件循环，则报错
- loop = asyncio.get_event_loop()获得一个事件循环，如果当前没有事件循环，则创建一个新的事件循环
- loop = asyncio.set_event_loop(loop)设置一个事件循环为当前线程的事件循环
- loop = asyncio.new_event_loop() 创建一个新的事件循环
- loop.run_until_complete(future):运行事件循环，直到future运行结束
- loop.stop()停止事件循环
- loop.is_running():如果事件循环依然在运行，则返回True
- loop.is_closed():如果事件循环已经close，则返回True
- loop.close():关闭事件循环
- loop.time():事件循环的始终，和time.time()类似

### task对象
- 什么是Task：用来并发调度的协程，对协程对象的进一步包装。
- Task是Future类的儿子，继承了Future的所有API，除了Future.set_result()和Future.set_Exception()
- 为什么要创建task
    协程对象（比如func(),单独的func表示协程函数）不能直接运行，协程对象需要先包装成一个task再丢进事件循环中执行。如果直接将一个协程对象丢入run_until_complete时自动将其包装成一个任务，但多个就不行。task保存了协程运行后的状态，可用于未来获取协程的结果。且可以获取协程函数运行后的返回值
- 创建task方法
    - 1、创建task方法一：task = loop.create_task(coroutine)
        - 只可接受协程对象
    - 2、创建task方法二：task = asyncio.ensure_future(coroutine)，两种方法等价
        - 可接受协程对象或Future对象或awaitable对象
    - 3、创建task方法三：task = loop.create_task(cor)
    - 前两种方法是高级API用法，后面一种是低级API用法
- 常用方法：
    - 获取当前线程中当前事件循环中正在运行的任务
        - 1、task = asyncio.Task.current_task(loop=None):如果没有任务在运行，返回None
        - 2、tasks = asyncio.Task.all_tasks(loop=None)；返回当前线程中某一个loop中还没有结束的任务
    - task.cancel()：取消任务，若取消成功后抛出CancelledError异常。使用cancelled()检查任务是否取消
    - task.done():当一个被包装的协程既没有触发异常，也没有被取消的时候，意味着任务完成，返回True
    - task.result():返回任务的执行结果
        - 当任务被正常执行完毕，则返回结果；
        - 当任务被取消了，调用这个方法，会触发CancelledError异常；
        - 当任务返回的结果是无用的时候，则调用这个方法会触发InvalidStateError；
        - 当任务出发了一个异常而中断，调用这个方法还会再次触发这个使程序中断的异常。
    - task.exception():返回任务的异常信息
    - task.add_done_callback(callback, *, context=None):添加回调函数
    - asyncio.current_task(loop=None):返回在某个指定的loop中当前正在运行的任务，如果没有任务正在运行，则返回None；如果loop为None，则默认为在当前的事件循环中获取
    - asyncio.all_tasks(loop=None):返回某一个loop中还没有结束的任务
    
### future对象
- Future是一个较低层的可等待（awaitable）对象，他表示的是异步操作的最终结果，当一个Future对象被等待的时候，协程会一直等待，直到Future已经运算完毕。
- Future是Task的父类，一般情况下，已不用去管它们两者的详细区别，也没有必要去用Future，用Task就可以了，
- Future结果的四个状态：
    Pending：准备运行，即挂起。  Running：调用执行
    Done：执行完毕   Cancelled：取消执行
    - 创建future的时候，task为pending，事件循环调用执行的时候当然就是running，调用完毕自然就是done，如果需要停止事件循环，中途需要取消，就需要先把task取消，即为cancelled。
- 创建一个future对象
    - future = loop.create_future()，至于该future怎么用，没弄明白，参见以下案例
- 常用方法：
    - asyncio.isfuture(obj):判断是否是future对象，future对象有（task对象，asyncio.Future的实例对象，具有_asyncio_future_blocking属性的对象）
    - asyncio.ensure_future(obj, *, loop=None)。将一个obj包装成Future
    - asyncio.wrap_future(future, *, loop=None)：将concurrent.futures.Future对象包装成一个 asyncio.Future 对象。
    - future.set_result(result):标记Future已经执行完毕，并且设置它的返回值。
    - future.result():返回Future执行的结果返回值
        - 如果Future被执行完成，如果使用set_result()方法设置了一个结果，那个设置的value就会被返回；
        - 如果Future被执行完成，如果使用set_exception()方法设置了一个异常，那么使用这个方法也会触发异常；
        - 如果Future被取消了，那么使用这个方法会触发CancelledError异常；
        - 如果Future的结果不可用或者是不可达，那么使用这个方法也会触发InvalidStateError异常；
    - future.get_loop()：返回Future所绑定的事件循环
    

### 计划执行回调函数
- 通过task获取协程函数的返回值方法：（更多方法参加案例）
    - 方法一：直接运行完task后输出：即调用task.result()
    - 方法二：task.add_done_callback(callback):绑定回调函数
        - 回调函数需要自行定义，回调函数的最后一个参数是future对象（即创建的task对象）
        - 若回调函数需要传入多个参数，可以通过偏函数导入
- loop.call_later(delay, callback, *args, context=None)
    - 事件循环在delay多长时间之后才执行callback函数，它的返回值是asyncio.TimerHandle类的一个实例对象。
- loop.call_at(when, callback, *args, context=None)
    - 在某一个时刻进行调用计划的回调函数，第一个参数不再是delay而是when，表示一个绝对的时间点，结合前面的loop.time使用，它的使用方法和call_later()很类似。它的返回值是asyncio.TimerHandle类的一个实例对象。
- loop.call_soon(callback, *args, context=None)
    - 在下一个迭代的时间循环中立刻调用回调函数，用法同上面。它的返回值是asyncio.Handle类的一个实例对象
- loop.call_soon_threadsafe(callback, *args, context=None)
    - 这是call_soon()函数的线程安全版本，计划回调函数必须在另一个线程中使用。
- 回调函数只能定义为同步方法而不是异步方法，每个回调函数只能被调用一次，如果在同一个时刻有另个CallBack方法需要调用，则他们的执行顺序是不确定的；

    


### 并行执行多个或单个task/future的方法
- asyncio.gather(*coros_or_future,loop=None,return_exception=False)
    - 它本身也是个可awaitable的
    - *coros_or_future是序列分拆操作,coror_os_future可以为含task或future对象的列表或元组，也可以为协程对象
    - 当所有的任务都完成后，返回的结果是一个列表的形式，值的顺序和输入顺序一致
    - return_exception:False，默认为False，第一个发出异常的任务会立即返回，然后其他的任务继续执行。为True时：对于已经发生了异常的任务，也会像成功执行了那样，等到所有的任务执行结束仪器将错误的结果返回到最终的结果列表里面。如果gather()被取消，那么里面的task也被取消
    
- asyncio.wait(aws,*,loop=None,timeout=None,return_when=ALL_COMPLETED),
    - 第一个参数是一系列的协程对象或者task对象的集合或者列表或者元组。
    - 该函数的返回值是一个集合：（done, pending）
        - 其中done是一个集合，表示已经完成的任务tasks
        - pending也是一个集合，表示还没有完成的任务
    - timeout，超时后，那些没有执行完的tasks和futures会被返回到第二个集合pending里面。
    - return_when:什么时候wait函数该返回值。
        - FIRST_COMPLETED：当任何一个task或者是future完成或者是取消，wait函数就返回
        - FIRST_EXCEPTION	当任何一个task或者是future触发了某一个异常，就返回，.如果是所有的task和future都没有触发异常，则等价与下面的 ALL_COMPLETED.
        - ALL_COMPLETED	当所有的task或者是future都完成或者是都取消的时候，再返回。

- asyncio.wait_for(aw, timeout, *, loop=None)
    - aw为一个task对象或future对象或coroutine对象
    - 异步操作需要执行的时间超过waitfor设置的timeout，就会触发异常，所以在编写程序的时候，如果要给异步操作设置timeout，一定要选择合适，如果异步操作本身的耗时较长，而你设置的timeout太短，会涉及到她还没做完，就抛出异常了。
    
- asyncio.as_completed(aws, *, loop=None, timeout=None)
    - 第一个参数aws：同上面一样，是一个集合{}集合里面的元素是coroutine、task或者future,第三个参数timeout：意义和上面讲的的一样
    - asyncio.as_completed()函数返回的是一个可迭代（iterator）的对象，对象的每个元素就是一个future对象


# native coroutine实现异步协程的具体步骤
- 定义一个协程函数：使用async关键字，不一定非要有await
- 定义一个事件循环：loop = asyncio.get_event_loop()
- 创建一个task：
- 将task注册到事件循环当中
    - loop.run_until_complete(task)
- 协程的停止：
    - 先取消task：
        for task in asyncio.Task.all_tasks():
            task.cancel()
    - 停止loop事件循环
            loop.stop()
            loop.run_forever():该用法会被淘汰
            loop.close()

In [2]:
import asyncio
help(asyncio.Task.current_task)
help(asyncio.current_task)

Help on built-in function current_task:

current_task(loop=None) method of builtins.type instance
    Return the currently running task in an event loop or None.
    
    By default the current task for the current event loop is returned.
    
    None is returned when called not in the context of a Task.

Help on function current_task in module asyncio.tasks:

current_task(loop=None)
    Return a currently executed task.



In [3]:
import asyncio

async def cor1():
        print("任务1启动")
        print("任务1结束")
    
try:
    a = cor1()
    a.send(None)
    #print(a.throw(StopIteration))
    
except StopIteration as e:
    print("出现StopIteration异常，程序顺利终止")
    pass

任务1启动
任务1结束
出现StopIteration异常，程序顺利终止


# 版本3.7以前：asyncio异步编程的基本模板

In [6]:
# Python3.7之前的版本：模板一：无参数，无返回值
# @types.coroutine转换生成器为协程对象举例

import asyncio
import types
import nest_asyncio
nest_asyncio.apply()

# 使用@types.coroutine将生成器转换为协程对象
@types.coroutine
def cor3():
    print("任务3启动")
    yield from asyncio.sleep(3)
    print("任务3结束了")
    
async def cor1():
    print("任务1开始运行")
    await asyncio.sleep(1)
    print("任务1结束")

async def cor2():
    print("任务2启动")
    print("今天是个好日子")
    await asyncio.sleep(2)
    print("today is a good day")
    print("come on")
    print("任务2结束")

c1 = cor1()
c2 = cor2()
c3 = cor3()
tasks = (cor1(), cor2(), cor3())
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))  
# loop.run_until_complete(asyncio.gather(*tasks))
# 或者只启动一个任务loop.run_until_complete(cor1())

#loop.close()  #在jupyter中关闭会报出RuntimeError



任务2启动
今天是个好日子
任务1开始运行
任务3启动
任务1结束
today is a good day
come on
任务2结束
任务3结束了


({<Task finished coro=<cor1() done, defined at <ipython-input-6-31313dadae8e>:16> result=None>,
  <Task finished coro=<cor2() done, defined at <ipython-input-6-31313dadae8e>:21> result=None>,
  <Task finished coro=<cor3() done, defined at <ipython-input-6-31313dadae8e>:10> result=None>},
 set())

In [21]:
# 模板2：有参数，有返回值
import asyncio
import time

async def f1(a, b):
    print("我是程序1，开始")
    await asyncio.sleep(1)
    print("我是程序1，结束")
    return a + b

async def f2(a, b):
    print("我是程序2，开始")
    await asyncio.sleep(1)
    print("我是程序2，结束")
    return a - b

async def f3(a, b):
    print("我是程序3，开始")
    await asyncio.sleep(1)
    print("我是程序3，结束")
    return a * b

#创建事件循环
loop = asyncio.get_event_loop()
loop_name = asyncio.get_running_loop()
print(loop_name)
# 将协程对象包装成task对象:有三种种方法
"""
task1 = asyncio.ensure_future(f1(10, 10))
task2 = asyncio.ensure_future(f2(10, 10))
task3 = asyncio.ensure_future(f3(10, 10))
"""
"""
task1 = asyncio.create_task(f1(10, 10))
task2 = asyncio.create_task(f2(10, 10))
task3 = asyncio.create_task(f3(20, 10))
"""

task1 = loop.create_task(f1(10, 10))
task2 = loop.create_task(f2(10, 10))
task3 = loop.create_task(f3(10, 10))


# 将对象装进列表或者元组
tasks = [task1, task2, task3]


# 将task对象列表丢入事件循环
loop.run_until_complete(asyncio.wait(tasks))
#loop.run_until_complete(asynco.gather(*tasks))

# 并在所有的任务完成后，获取任务完成结果
print(task1.result(),'\n', task2.result(), '\n', task3.result())

<_WindowsSelectorEventLoop running=True closed=False debug=False>
我是程序1，开始
我是程序2，开始
我是程序3，开始
我是程序1，结束
我是程序2，结束
我是程序3，结束
20 
 0 
 100


# Python3.7之前asyncio编程四步骤结构
- 第一步：构造事件循环
        
        loop=asyncio.get_running_loop() #返回（获取）在当前线程中正在运行的事件循环，如果没有正在运行的事件循环，则会显示错误；它是python3.7中新添加的

        loop=asyncio.get_event_loop() #获得一个事件循环，如果当前线程还没有事件循环，则创建一个新的事件循环loop；

        loop=asyncio.set_event_loop(loop) #设置一个事件循环为当前线程的事件循环；

        loop=asyncio.new_event_loop()  #创建一个新的事件循环
        
- 第二步：将一个或者多个协程对象包装成Task对象
        #高层API
        task = asyncio.create_task(coro(参数列表)) 这是3.7版本新添加的
        task = asyncio.ensure_future(coro(参数列表)) 

        #低层API
        loop.create_task(coro)

- 第三步：把task对象丢进事件循环运行
        loop.run_until_complete(asyncio.wait(tasks))  #通过asyncio.wait()整合多个task
 
        loop.run_until_complete(asyncio.gather(tasks))  #通过asyncio.gather()整合多个task

        loop.run_until_complete(task_1)  #单个任务则不需要整合

- 第四步：关闭事件循环
        loop.close(),有时候不关闭也能正常运行，只要不关闭，就可以再运行，但建议关闭，防止误操作
        
        
# Python3.7版本asyncio编程步骤
- 第一步：构建一个入口函数main
    - main函数也是通过async定义的，并且要在main函数里面await一个或者是多个协程，同前面一样，我可以通过gather或者是wait进行组合，对于有返回值的协程函数，一般就在main里面进行结果的获取。
- 第二步：启动主函数main
    - asyncio.run(main())
        - 不需要显式创建事件循环

# 版本3.7以后创建asyncio模板

In [2]:
# 模板一：有参数，无返回值
import asyncio
import time
import nest_asyncio
nest_asyncio.apply()

async def f1(a, b):
    print("程序1开始启动")
    await asyncio.sleep(1)
    print("程序1结束")


async def f2(a, b):
    print("程序2开始启动")
    await asyncio.sleep(2)
    print("程序2结束")


async def f3(a, b):
    print("程序3开始启动")
    await asyncio.sleep(1)
    print("程序3结束")


async def main():
    tasks = [asyncio.create_task(task) for task in (f1(10, 10), f2(10, 10), f3(10, 10))]
    results = await asyncio.gather(*tasks)
    # 两种方法访问结果
    for result in results:
        print(result)
    print("=================")
    
    result_done, result_pending = await asyncio.wait(tasks)
    for result in result_done:
        print(result.result())
    for result in result_pending:
        print(result.result())
                                                     
asyncio.run(main())

程序1开始启动
程序2开始启动
程序3开始启动
程序1结束
程序3结束
程序2结束
None
None
None
None
None
None


In [39]:
# 模板2：有参数，有返回值
import asyncio
import time

async def f1(a, b):
    print("程序1开始启动")
    await asyncio.sleep(1)
    print("程序1结束")
    return a + b

async def f2(a, b):
    print("程序2开始启动")
    await asyncio.sleep(2)
    print("程序2结束")
    return a - b

async def f3(a, b):
    print("程序3开始启动")
    await asyncio.sleep(1)
    print("程序3结束")
    return a * b

tasks = [asyncio.create_task(task) for task in (f1(10, 10), f2(10, 10), f3(10, 10))]
results = await asyncio.gather(*tasks)
for result in results:
        print(result)

程序1开始启动
程序2开始启动
程序3开始启动
程序1结束
程序3结束
程序2结束
20
0
100


In [40]:
# 创建一个future对象并使用
import asyncio


def mark_done(future, result):
    print('setting future result to {!r}'.format(result))
    future.set_result(result)

async def main():
    loop = asyncio.get_event_loop()
    future = loop.create_future()
    print('scheduling mark_done')
    loop.call_soon(mark_done, future, 'the result')
    print('suspending the coroutine')
    result = await future
    print('awaited result: {!r}'.format(result))
    print('future result: {!r}'.format(future.result()))
    return result

if __name__ == '__main__':
    print('entering the event loop')
    result = asyncio.run(main())
    print('returned result: {!r}'.format(result))

entering the event loop
scheduling mark_done
suspending the coroutine
setting future result to 'the result'
awaited result: 'the result'
future result: 'the result'
returned result: 'the result'


In [None]:
# 计划执行回调函数

import asyncio

def callback(a, loop):
    print("我的参数为：{}, 执行的时间为:".format(a, loop.time()))

if __name__ == "__main__":
    try:
        loop = asyncio.get_event_loop()
        now = loop.time()
        loop.call_later(5, callback, 5, loop) #第一个参数设置的时间5.5秒后执行，
        loop.call_at(now+2, callback, 2, loop)    #在指定的时间，运行，当前时间+2秒
        loop.call_at(now+1, callback, 1, loop)
        loop.call_at(now+3, callback, 3, loop)
        loop.call_soon(callback, 4, loop)
        loop.run_forever()  #要用这个run_forever运行，因为没有传入协程，这个函数在3.7中已经被取消
    except KeyboardInterrupt:
        print("Goodbye!")


In [6]:
# 异步的阻塞案例
# 根据结果看出，如果在协程里面嵌套另一个协程，则达不到提升性能的效果，所以尽量别这样做
import asyncio
import time
import nest_asyncio
nest_asyncio.apply()

async def f1():
    print("程序1开始启动")
    await f2()  # 在f1中调用f2
    print("程序1结束")
    
async def f2():
    print("程序2开始启动")
    await asyncio.sleep(1)
    # await f1() #如果在f2中再嵌套调用f1，则会产生死循环

async def main():
    tasks = asyncio.create_task(f1())
    results = await asyncio.gather(tasks)
    


start = time.time()
asyncio.run(main())
end = time.time()
print("总共耗时：{} s".format(end - start))

start spider  https://thief.one
start spider  https://home.nmask.cn
start spider  https://movie.nmask.cn
start spider  https://tool.nmask.cn


({<Task finished coro=<run() done, defined at <ipython-input-6-06e73b7dcd01>:9> exception=NameError("name 'aiohttp' is not defined")>,
  <Task finished coro=<run() done, defined at <ipython-input-6-06e73b7dcd01>:9> exception=NameError("name 'aiohttp' is not defined")>,
  <Task finished coro=<run() done, defined at <ipython-input-6-06e73b7dcd01>:9> exception=NameError("name 'aiohttp' is not defined")>,
  <Task finished coro=<run() done, defined at <ipython-input-6-06e73b7dcd01>:9> exception=NameError("name 'aiohttp' is not defined")>},
 set())

# aiohttp:
- asyncio可以实现单线程并发IO操作。如果仅用在客户端，发挥的威力不大。如果把asyncio用在服务器端，例如Web服务器，由于HTTP连接就是IO操作，因此可以用单线程+coroutine实现多用户的高并发支持
- asyncio实现了TCP、UDP、SSL等协议，aiohttp则是基于asyncio实现的HTTP框架。
- 比如说异步爬虫。我尝试用requests模块、urllib模块写异步爬虫，但实际操作发现并不支持asyncio异步，因此可以使用aiohttp模块编写异步爬虫。

In [8]:
# aiohttp的实现：参见：https://thief.one/2018/06/21/1/
import asyncio
import nest_asyncio
nest_asyncio.apply()
import aiohttp

# async with是上下文管理器，参见Python官方文档中asyncio
async def run(url):
    print("start spider ",url)
    async with aiohttp.ClientSession() as session:
        async with session.get(url) as resp:
            print(resp.url)
url_list = ["https://thief.one","https://home.nmask.cn","https://movie.nmask.cn","https://tool.nmask.cn"]
tasks = [asyncio.ensure_future(run(url)) for url in url_list]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))

start spider  https://thief.one
start spider  https://home.nmask.cn
start spider  https://movie.nmask.cn
start spider  https://tool.nmask.cn
https://thief.one


({<Task finished coro=<run() done, defined at <ipython-input-8-5f9143683c2e>:8> exception=ClientConnectorError(11001, 'getaddrinfo failed')>,
  <Task finished coro=<run() done, defined at <ipython-input-8-5f9143683c2e>:8> exception=ClientConnectorError(11001, 'getaddrinfo failed')>,
  <Task finished coro=<run() done, defined at <ipython-input-8-5f9143683c2e>:8> exception=ClientConnectorError(11001, 'getaddrinfo failed')>,
  <Task finished coro=<run() done, defined at <ipython-input-8-5f9143683c2e>:8> result=None>},
 set())

SSL error in data received
protocol: <asyncio.sslproto.SSLProtocol object at 0x0000017BB8E66E10>
transport: <_SelectorSocketTransport fd=1044 read=polling write=<idle, bufsize=0>>
Traceback (most recent call last):
  File "e:\Users\acer\Anaconda3\lib\asyncio\sslproto.py", line 526, in data_received
    ssldata, appdata = self._sslpipe.feed_ssldata(data)
  File "e:\Users\acer\Anaconda3\lib\asyncio\sslproto.py", line 207, in feed_ssldata
    self._sslobj.unwrap()
  File "e:\Users\acer\Anaconda3\lib\ssl.py", line 767, in unwrap
    return self._sslobj.shutdown()
ssl.SSLError: [SSL: KRB5_S_INIT] application data after close notify (_ssl.c:2609)


In [10]:
import asyncio
import requests
async def run(url):
    print("start ",url)
    loop = asyncio.get_event_loop()
    response = await loop.run_in_executor(None, requests.get, url)
    print(response.url)
    
url_list = ["https://thief.one","https://home.nmask.cn","https://movie.nmask.cn","https://tool.nmask.cn"]
tasks = [asyncio.ensure_future(run(url)) for url in url_list]
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))

start  https://thief.one
start  https://home.nmask.cn
start  https://movie.nmask.cn
start  https://tool.nmask.cn
https://thief.one/


({<Task finished coro=<run() done, defined at <ipython-input-10-d27399617f05>:3> exception=ConnectionError(MaxRetryError("HTTPSConnectionPool(host='home.nmask.cn', port=443): Max retries exceeded with url: / (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x0000017BB8646198>: Failed to establish a new connection: [Errno 11001] getaddrinfo failed'))"))>,
  <Task finished coro=<run() done, defined at <ipython-input-10-d27399617f05>:3> exception=ConnectionError(MaxRetryError("HTTPSConnectionPool(host='movie.nmask.cn', port=443): Max retries exceeded with url: / (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x0000017BB8233978>: Failed to establish a new connection: [Errno 11001] getaddrinfo failed'))"))>,
  <Task finished coro=<run() done, defined at <ipython-input-10-d27399617f05>:3> exception=ConnectionError(MaxRetryError("HTTPSConnectionPool(host='tool.nmask.cn', port=443): Max retries exceeded with url: / (Caus

# 解决asyncio假死：新线程协程
- 使用异步编程asyncio依然会出现假死情况，尤其是在编写桌面程序的时候，如果使用单个线程，同步函数的方式，则这是无法避免的，即使在单个线程中使用了异步函数，依然会假死。所以需要构建新的线程，在新的线程中实现协程

In [3]:
# 同步假死的案例
import tkinter as tk
import time

class Form():
    def __init__(self):
        self.root = tk.Tk()
        self.root.geometry("500x500")
        self.root.title("窗体程序")
        
        self.button = tk.Button(self.root, text="开始计算", command=self.calculate)
        self.label = tk.Label(master=self.root, text='等待计算结果')
        self.button.pack()
        self.label.pack()
        self.root.mainloop()
    
    def calculate(self):
        time.sleep(3)
        self.label['text'] = 300
        
if __name__ == "__main__":
    form = Form()
    
# 由运行结果可知，窗体会假死，即无法移动缩放

In [7]:
# 异步假死
import tkinter as tk          # 导入 Tkinter 库
import asyncio
import nest_asyncio
nest_asyncio.apply()
 
class Form:
    def __init__(self):
        self.root=tk.Tk()
        self.root.geometry('500x300')
        self.root.title('窗体程序')  #设置窗口标题
        
        self.button=tk.Button(self.root,text="开始计算",command=self.get_loop)
        self.label=tk.Label(master=self.root,text="等待计算结果")
 
        self.button.pack()
        self.label.pack()
 
        self.root.mainloop()
    async def calculate(self):
        await asyncio.sleep(3)
        self.label['text'] = 300
        
    # asyncio任务只能通过事件循环运行，不能直接运行异步函数
    def get_loop(self):
        self.loop = asyncio.get_event_loop()
        task = asyncio.create_task(self.calculate())
        self.loop.run_until_complete(task)
        #self.loop.close()
        
if __name__ == "__main__":
    form = Form()
# 由结果可知，异步函数同样会假死，因为他们公用一个线程，
#但是拥有事件循环的那个线程同时还需要维护窗体的状态，始终只有一个线程在运行
# 解决办法就是新建一个线程


# asyncio专门实现Concurrency and Multithreading（多线程和并发）的函数介绍
- 即创建新的线程，让协程在新的线程中运行

- 为了让一个协程函数在不同的线程中执行，我们可以使用以下两个函数

    - （1）loop.call_soon_threadsafe(callback, *args)，这是一个很底层的API接口，一般很少使用，本文也暂时不做讨论。

    - （2）asyncio.run_coroutine_threadsafe(coroutine，loop)
        - 就是我在新线程中创建一个事件循环loop，然后在新线程的loop中不断不停的运行一个或者是多个coroutine。
        - 第一个参数为需要异步执行的协程函数，第二个loop参数为在新线程中创建的事件循环loop，注意一定要是在新线程中创建哦，该函数的返回值是一个concurrent.futures.Future类的对象，用来获取协程的返回结果。

In [10]:
# 建立新线程，使协程在其中运行保证不假死案例
import tkinter as tk
import time
import asyncio
import threading
import nest_asyncio
nest_asyncio.apply() # 这个模块是为了每次重新运行loop，免得报出cannot close running loop

class Form:
    def __init__(self):
        self.root=tk.Tk()
        self.root.geometry('500x300')
        self.root.title('窗体程序')  #设置窗口标题
        
        self.button=tk.Button(self.root,text="开始计算",command=self.change_form_state)
        self.label=tk.Label(master=self.root,text="等待计算结果")
 
        self.button.pack()
        self.label.pack()
 
        self.root.mainloop()
 
    async def calculate(self):
        await asyncio.sleep(3)
        self.label["text"]=300

    def get_loop(self, loop):
        self.loop = loop
        asyncio.set_event_loop(self.loop) # 设置一个事件循环为当前线程的循环
        self.loop.run_forever() #不建议使用，该函数将被淘汰
    
    def change_form_state(self):
        cor = self.calculate()
        #在当前线程下创建新的事件循环（未启用），在get_loop里面启动它
        new_loop = asyncio.new_event_loop() 
         # 通过当前线程新建一个线程去启动事件循环
        t = threading.Thread(target=self.get_loop, args=(new_loop, )) 
        t.start()
        # 这一步是关键，表明在新线程中事件循环不断游走执行
        asyncio.run_coroutine_threadsafe(cor, new_loop)
        
if __name__ == "__main__":
    form = Form()

# 使用asyncio实现一个timer
        所谓的timer指的是，指定一个时间间隔，让某一个操作隔一个时间间隔执行一次，如此周而复始。很多编程语言都提供了专门的timer实现机制、包括C++、C#等。但是 Python 并没有原生支持 timer，不过可以用 asyncio.sleep 模拟。
        大致的思想如下，将timer定义为一个异步协程，然后通过事件循环去调用这个异步协程，让事件循环不断在这个协程中反反复调用，只不过隔几秒调用一次即可。

In [None]:
# 实现timer示例
async def delay(time):
    await asyncio.sleep(time)

async def timer(time,function):
    while True:
        future=asyncio.ensure_future(delay(time))
        await future
        future.add_done_callback(function)

def func(future):
    print('done')

if __name__=='__main__':
    asyncio.run(timer(2,func))


done
done
done
done
done
done


# 协程之greenlet模块
- 如果我们在单个线程内有20个任务，要想实现在多个任务之间切换，使用yield生成器的方式过于麻烦（需要先得到初始化一次的生成器，然后再调用send。。。非常麻烦），而使用greenlet模块可以非常简单地实现这20个任务直接的切换。
- greenlet只是提供了一种比generator更加便捷的切换方式，当切到一个任务执行时如果遇到IO，那就原地阻塞，仍然是没有解决遇到IO自动切换来提升效率的问题。
- 为了解决阻塞问题，使用gevent模块

# 协程之Gevent模块
- Gevent是一个第三方库，可以轻松通过gevent实现并发同步或异步编程，在gevent中用到的主要模式是Greenlet，它是以C扩展模块形式接入Python的轻量级协程。Greenlet全部运行在主程序操作系统进程的内部，但他们被协作式地调度。
    - gevent.spawn(func,1,2,3,x=4,y=5):创建一个协程对象g1，spawn括号内第一个参数是函数名，后面可以有多个参数，可以是位置实参或关键字实参，都是传给函数的，spawn是异步提交任务
    - gevent.join(g1)
    - gevent.joinall([g1,g2]),让两个对象同时结束后主程序才结束
    - 要用gevent，需要将from gevent import monkey;monkey.patch_all()放到文件的开头：

- 协程是通过自己的程序（代码）来进行切换的，自己能够控制，只有遇到协程模块能够识别的IO操作的时候，程序才会进行任务切换，实现并发效果，如果所有程序都没有IO操作，那么就基本属于串行执行了

In [12]:
# greenlet示例
from greenlet import greenlet
def eating(name):
    print("{} is eating 1".format(name))
    g2.switch('xiaoming')
    print("{} is eating 2".format(name))
    g2.switch()
    
def playing(name):
    print("{} is playing game 1".format(name))
    g1.switch()
    print("{} is palying game 2".format(name))
    
g1 = greenlet(eating)
g2 = greenlet(playing)
g1.switch("xiaohong") # 可以在第一次传入参数，以后都不需要

xiaohong is eating 1
xiaoming is playing game 1
xiaohong is eating 2
xiaoming is palying game 2


In [1]:
# Gevent模块示例
import gevent

def eat(name):
    print('%s eat 1' % name)
    gevent.sleep(2)  #模拟的是gevent可以识别的io阻塞;
    #而time.sleep(2)或其他的阻塞,gevent是不能直接识别的,需要打补丁,就可以识别
    print('%s eat 2' % name)

def play(name):
    print('%s play 1' % name)
    gevent.sleep(1)
    print('%s play 2' % name)


g1 = gevent.spawn(eat, 'egon')
g2 = gevent.spawn(play, name='egon')
g1.join()
g2.join()
# 或者gevent.joinall([g1,g2])
print('主')

egon eat 1
egon play 1
egon play 2
egon eat 2
主


In [2]:
# gevent打补丁举例
from gevent import monkey

monkey.patch_all()  # 必须写在最上面，这句话后面的所有阻塞全部能够识别了

import gevent  # 直接导入即可
import time

def eat():
    # print()　　
    print('eat food 1')
    time.sleep(2)  # 加上monkey就能够识别到time模块的sleep了
    print('eat food 2')

def play():
    print('play 1')
    time.sleep(1)  # 来回切换，直到一个I/O的时间结束，这里都是我们个gevent做得，不再是控制不了的操作系统了。
    print('play 2')

g1 = gevent.spawn(eat)
g2 = gevent.spawn(play)
gevent.joinall([g1, g2])
print('主')

eat food 1
play 1
play 2
eat food 2
主


  with loop.timer(seconds, ref=ref) as t:


In [3]:
# Gevent之同步与异步对比
from gevent import spawn, joinall, monkey

monkey.patch_all()
                 
import time

def task(pid):
    """
    Some non-deterministic task
    """
    time.sleep(0.5)
    print('Task %s done' % pid)

def synchronous():
    for i in range(10):
        task(i)

def asynchronous():
    g_l = [spawn(task, i) for i in range(10)]
    joinall(g_l)

if __name__ == '__main__':
    #同步
    print('Synchronous:')
    synchronous()
    
    #异步
    print('Asynchronous:')
    asynchronous()

Synchronous:
The history saving thread hit an unexpected error (This operation would block forever
	Hub: <Hub '' at 0x275b52ca9a0 backend=default ptr=<cdata 'struct uv_loop_s *' 0x00000275B53EBB10> pending=0 ref=0 thread_ident=0x4d0>
	Handles:
[HandleState(handle=<cdata 'struct uv_handle_s *' 0x00000275B49BDAB8>, type=b'check', watcher=<gevent.libuv.loop.loop at 0x275b50df208 backend=default ptr=<cdata 'struct uv_loop_s *' 0x00000275B53EBB10> pending=0 ref=0>, ref=0, active=1, closing=0),
 HandleState(handle=<cdata 'struct uv_handle_s *' 0x00000275B0A89A78>, type=b'timer', watcher=<gevent.libuv.loop.loop at 0x275b50df208 backend=default ptr=<cdata 'struct uv_loop_s *' 0x00000275B53EBB10> pending=0 ref=0>, ref=0, active=1, closing=0),
 HandleState(handle=<cdata 'struct uv_handle_s *' 0x00000275B49BD278>, type=b'prepare', watcher=<gevent.libuv.loop.loop at 0x275b50df208 backend=default ptr=<cdata 'struct uv_loop_s *' 0x00000275B53EBB10> pending=0 ref=0>, ref=0, active=1, closing=0),
 Han

Traceback (most recent call last):
  File "e:\Users\acer\Anaconda3\lib\site-packages\gevent\_ffi\loop.py", line 496, in _run_callbacks
    callback(*args)
  File "src\\gevent\\_abstract_linkable.py", line 182, in gevent._gevent_c_abstract_linkable.AbstractLinkable._notify_links
  File "src\\gevent\\_abstract_linkable.py", line 227, in gevent._gevent_c_abstract_linkable.AbstractLinkable._notify_links
AssertionError: (<callback at 0x275b5070a20 stopped>, <callback at 0x275b5493978 args=([],)>)
2020-09-27T22:13:46Z <callback at 0x275b5493978 args=([],)> failed with AssertionError

