# 异步编程

## 并行和并发

### 并行
即有多个程序在同时执行，这里的程序指的是操作系统的线程。每个 cpu 核心，只能在同一个时刻运行一组指令，意味着同一时刻，一个核心上只有一个线程在执行。当 cpu 有四个核心时，他只可以并行执行4个线程。
![](../asset/parallel.jpg)

### 并发
想要了解并发，就需要知道阻塞和异步。

#### 同步阻塞
当程序中的一个 I/O 操作，会占据比较长的时间，这时候，程序没有被挂起，且一直在等待网络数据传输，无法进行其他操作，这时候就是同步阻塞。
![](../asset/sync-block.jpg)
同步的一个概念就是，网络传输完成后也无法告知主程序操作完成，这就导致了主程序：
- 要么只能进行等待 I/O 完成
- 要么轮询去查看是否传输是否已经完成
当然，轮询时候可以进行其他的操作，这时候，就是非阻塞的状态，即 同步非阻塞。
#### 同步非阻塞
非阻塞的概念即主程序可以进行其他的操作。
![](../asset/sync-nonblock.jpg)
#### 异步阻塞
有同步，就有异步。
而异步阻塞与同步阻塞相同，主程序啥也不干，就等着 I/O 操作完成。
![](../asset/async-block.jpg)
#### 异步非阻塞
有同步，就有异步。
而异步阻塞与同步阻塞相同，主程序啥也不干，就等着 I/O 操作完成。
![](../asset/async-nonblock.jpg)
#### 并发
而并发就是异步非阻塞 状态下的一种形式，当程序执行操作 a 时，使 a 的 I/O 异步操作，这时程序去执行操作 b, 在外部看来，a 和 b 时同时被执行的，然而他们只运行在在一个线程当中。
与线程、进程不同的是，协程并不是操作系统物理层面存在的一种程序。
协程是程序级别的，由程序编写者自己操控整个协程的生命周期。这样就实现了类似操作系统操作多线程一样的效果，但是省下了现成的切换中造成的资源消耗。
而通过程序来操纵协程，就造成了cpu 一直在运行，并且是多个协程一直在运行的假象，也就变成了并发。

## 协程
![](../asset/sync-async.png)
## concurrent.futures模块 - 线程池和进程池的异步使用
![](../asset/pooling-management.png)

In [None]:
# %load concurrent-pool.py
import concurrent.futures
import time
number_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

def evaluate_item(x):
        # 计算总和，这里只是为了消耗时间
        result_item = count(x)
        # 打印输入和输出结果
        return result_item

def  count(number) :
        for i in range(0, 10000000):
                i=i+1
        return i * number

if __name__ == "__main__":
        # 顺序执行
        start_time = time.time()
        for item in number_list:
                print(evaluate_item(item))
        print("Sequential execution in " + str(time.time() - start_time), "seconds")
        # 线程池执行
        start_time_1 = time.time()
        with concurrent.futures.ThreadPoolExecutor(max_workers=5) as executor:
                futures = [executor.submit(evaluate_item, item) for item in number_list]
                for future in concurrent.futures.as_completed(futures):
                        print(future.result())
        print ("Thread pool execution in " + str(time.time() - start_time_1), "seconds")
        # 进程池
        start_time_2 = time.time()
        with concurrent.futures.ProcessPoolExecutor(max_workers=5) as executor:
                futures = [executor.submit(evaluate_item, item) for item in number_list]
                for future in concurrent.futures.as_completed(futures):
                        print(future.result())
        print ("Process pool execution in " + str(time.time() - start_time_2), "seconds")

In [2]:
!python src/concurrent-pool.py

10000000
20000000
30000000
40000000
50000000
60000000
70000000
80000000
90000000
100000000
Sequential execution in 4.841911792755127 seconds
10000000
20000000
40000000
50000000
30000000
100000000
80000000
70000000
60000000
90000000
Thread pool execution in 4.392979145050049 seconds
10000000
40000000
30000000
50000000
20000000
60000000
70000000
90000000
80000000
100000000
Process pool execution in 1.3073639869689941 seconds


## Asyncio模块

### 使用Asyncio管理事件循环
![](../asset/task-execution.png)

In [None]:
# %load src/asyncio-event-loop.py
import asyncio
import datetime
import time


def function_1(end_time, loop):
    print("function_1 called")
    if (loop.time() + 1.0) < end_time:
        loop.call_later(1, function_2, end_time, loop)
    else:
        loop.stop()


def function_2(end_time, loop):
    print("function_2 called ")
    if (loop.time() + 1.0) < end_time:
        loop.call_later(1, function_3, end_time, loop)
    else:
        loop.stop()


def function_3(end_time, loop):
    print("function_3 called")
    if (loop.time() + 1.0) < end_time:
        loop.call_later(1, function_1, end_time, loop)
    else:
        loop.stop()


def function_4(end_time, loop):
    print("function_4 called")
    if (loop.time() + 1.0) < end_time:
        loop.call_later(1, function_4, end_time, loop)
    else:
        loop.stop()


loop = asyncio.get_event_loop()

end_loop = loop.time() + 9.0
loop.call_soon(function_1, end_loop, loop)
loop.call_soon(function_4, end_loop, loop)
loop.run_forever()
loop.close()


In [4]:
!python src/asyncio-event-loop.py

function_1 called
function_4 called
function_2 called 
function_4 called
function_3 called
function_4 called
function_1 called
function_4 called
function_2 called 
function_4 called
function_3 called
function_4 called
function_1 called
function_4 called
function_2 called 
function_4 called
function_3 called
function_4 called


- 事件循环: 在Asyncio模块中，每一个进程都有一个事件循环。
- 协程: 这是子程序的泛化概念。协程可以在执行期间暂停，这样就可以等待外部的处理（例如IO）完成之后，从之前暂停的地方恢复执行。
- Futures: 定义了 Future 对象，和 concurrent.futures 模块一样，表示尚未完成的计算。
- Tasks: 这是Asyncio的子类，用于封装和管理并行模式下的协程。

In [None]:
while (1) {
    events = getEvents();
    for (e in events)
        processEvent(e);
}

### 使用Asyncio管理协程

In [None]:
# %load src/asyncio-hello.py
import asyncio


async def main():
    print('Hello ...')
    await asyncio.sleep(2)
    print('... World!')


# Python 3.7+
asyncio.run(main())

In [12]:
!python src/asyncio-hello.py

Hello ...
... World!


### 使用Asyncio控制任务

In [None]:
# %load src/asyncio-task.py
import asyncio


async def factorial(number):
    f = 1
    for i in range(2, number + 1):
        print("Asyncio.Task: Compute factorial(%s)" % (i))
        await asyncio.sleep(1)
        f *= i
    print("Asyncio.Task - factorial(%s) = %s" % (number, f))


async def fibonacci(number):
    a, b = 0, 1
    for i in range(number):
        print("Asyncio.Task: Compute fibonacci (%s)" % (i))
        await asyncio.sleep(1)
        a, b = b, a + b
    print("Asyncio.Task - fibonacci(%s) = %s" % (number, a))


async def binomialCoeff(n, k):
    result = 1
    for i in range(1, k + 1):
        result = result * (n - i + 1) / i
        print("Asyncio.Task: Compute binomialCoeff (%s)" % (i))
        await asyncio.sleep(1)
    print("Asyncio.Task - binomialCoeff(%s , %s) = %s" % (n, k, result))


if __name__ == "__main__":
    tasks = [asyncio.Task(factorial(10)),
             asyncio.Task(fibonacci(10)),
             asyncio.Task(binomialCoeff(20, 10))]
    loop = asyncio.get_event_loop()
    loop.run_until_complete(asyncio.wait(tasks))
    loop.close()


In [14]:
!python src/asyncio-task.py

Asyncio.Task: Compute factorial(2)
Asyncio.Task: Compute fibonacci (0)
Asyncio.Task: Compute binomialCoeff (1)
Asyncio.Task: Compute factorial(3)
Asyncio.Task: Compute fibonacci (1)
Asyncio.Task: Compute binomialCoeff (2)
Asyncio.Task: Compute factorial(4)
Asyncio.Task: Compute fibonacci (2)
Asyncio.Task: Compute binomialCoeff (3)
Asyncio.Task: Compute factorial(5)
Asyncio.Task: Compute fibonacci (3)
Asyncio.Task: Compute binomialCoeff (4)
Asyncio.Task: Compute factorial(6)
Asyncio.Task: Compute fibonacci (4)
Asyncio.Task: Compute binomialCoeff (5)
Asyncio.Task: Compute factorial(7)
Asyncio.Task: Compute fibonacci (5)
Asyncio.Task: Compute binomialCoeff (6)
Asyncio.Task: Compute factorial(8)
Asyncio.Task: Compute fibonacci (6)
Asyncio.Task: Compute binomialCoeff (7)
Asyncio.Task: Compute factorial(9)
Asyncio.Task: Compute fibonacci (7)
Asyncio.Task: Compute binomialCoeff (8)
Asyncio.Task: Compute factorial(10)
Asyncio.Task: Compute fibonacci (8)
Asyncio.Task: Compute binomialCoeff (9)


## 协程的面试题

### 协程的优缺点
**协程的优点**

（1）无需线程上下文切换的开销，协程避免了无意义的调度，由此可以提高性能（但也因此，程序员必须自己承担调度的责任，同时，协程也失去了标准线程使用多CPU的能力）

（2）无需原子操作锁定及同步的开销

（3）方便切换控制流，简化编程模型

（4）高并发+高扩展性+低成本：一个CPU支持上万的协程都不是问题。所以很适合用于高并发处理。

**协程的缺点**

（1）无法利用多核资源：协程的本质是个单线程,它不能同时将 单个CPU 的多个核用上,协程需要和进程配合才能运行在多CPU上.当然我们日常所编写的绝大部分应用都没有这个必要，除非是cpu密集型应用。

（2）进行阻塞（Blocking）操作（如计算任务时）会阻塞掉整个程序

### 为什么使用协程的时候大部分都使用但线程，而不是多线程？

**多核环境下 CPU 缓存的亲和性**
CPU 本身配有⾼效的多级缓存，虽然 CPU 多级缓存容量较内存⼩的多，但其访问效率却远⾼于内存，在单线程调度⽅式下，可以⽅便编译器有效地进⾏ CPU 缓存使⽤优化，使运⾏指令和共享数据尽可能放置在 CPU 缓存中，⽽如果采⽤多线程调度⽅式，多个线程间共享的数据就可能使 CPU 缓存失效，容易造成调度线程越多，协程的运⾏效率越低的问题；

**多线程分配任务时的同步问题**
当多个线程需要从公共协程任务资源中获取协程任务时，需要增加『锁』保护机制，⼀旦产⽣⼤量的『锁』冲突，则势必会造成运⾏性能的严重损耗；

### 协程的设计问题
[关于协程的设计问题](https://www.chainnews.com/articles/453644660771.htm)


[第一版协程的源码](https://swtch.com/libtask/)