## python协程
* 协程（coroutine）是一种特殊的函数，可以在执行过程中暂停并在稍后恢复。
* 协程是异步编程的重要组成部分，特别适用于处理 I/O 密集型任务，如网络请求、文件操作等。
* Python 从版本 3.5 开始引入了 async 和 await 关键字，使得编写协程变得更加直观和简洁。

### 协程函数
* 使用 async def 定义的函数称为协程函数。
* 协程函数返回一个协程对象，该对象需要通过 await 或事件循环来运行。
### 协程对象
* 协程函数返回的协程对象，可以通过 next() 或 send() 方法来控制协程的运行。
* next() 方法用于第一次运行协程，send() 方法用于在协程中发送数据。
* 协程对象可以通过 yield 关键字来暂停和恢复其运行。
* yield from 语句可以简化协程的嵌套调用。
* 协程对象需要通过 await 或事件循环来启动和管理。

### await 关键字
* await 关键字用于等待一个协程对象，直到其完成。
* await 关键字只能在协程函数中使用，不能在普通函数中使用。
* 当 await 后面跟着一个表达式时，Python 会将表达式的结果作为参数传递给 next() 方法，然后等待协程对象完成。
* 当 await 后面跟着一个协程对象时，Python 会将协程对象作为参数传递给 next() 方法，然后等待协程对象完成。
* 当 await 后面跟着一个 Future 对象时，Python 会将 Future对象作为参数传递给 next() 方法，然后等待 Future 对象完成
### 事件循环
* 事件循环是 Python 中的一个重要概念，它负责管理协程的生命周期，包括创建、调度和销毁。
* Python 的事件循环由 asyncio 模块提供，它提供了各种工具，如 Future、Task、Event 和 Semaphore 等，用于管理协程的生命周期。
* 事件循环可以通过 asyncio.run() 或 asyncio.get_event_loop() 来创建和运行。
* 事件循环可以通过 asyncio.create_task() 或 asyncio.ensure_future() 来创建任务。

In [4]:
# 示例1 
import asyncio

async def hello_world():
    print("Hello, World!")

# 获取事件循环
loop = asyncio.get_event_loop()

# 运行协程
loop.run_until_complete(hello_world())

# 关闭事件循环
loop.close()

RuntimeError: This event loop is already running

In [None]:
## 串行化的爬虫示例
import time

def crawl_page(url):
    print('crawling {}'.format(url))
    sleep_time = int(url.split('_')[-1])
    time.sleep(sleep_time)
    print('OK {}'.format(url))

def main(urls):
    for url in urls:
        crawl_page(url)

%time main(['url_1', 'url_2', 'url_3', 'url_4'])

########## 输出 ##########

* await 执行的效果，和 Python 正常执行是一样的，也就是说程序会阻塞在这里，进入被调用的协程函数，执行完毕返回后再继续

In [1]:
## 使用协程 await实现同步协程

import asyncio

async def crawl_page(url):
    print('crawling {}'.format(url))
    sleep_time = int(url.split('_')[-1])

    await asyncio.sleep(sleep_time)
    print('OK {}'.format(url))

async def main(urls):
    for url in urls:
        await crawl_page(url)

%time asyncio.run(main(['url_1', 'url_2', 'url_3', 'url_4']))

########## 输出 ##########


RuntimeError: asyncio.run() cannot be called from a running event loop

* 异步协程

In [None]:
import asyncio

async def crawl_page(url):
    print('crawling {}'.format(url))
    sleep_time = int(url.split('_')[-1])
    await asyncio.sleep(sleep_time)
    print('OK {}'.format(url))

async def main(urls):
    tasks = [asyncio.create_task(crawl_page(url)) for url in urls]
    for task in tasks:
        await task
%time asyncio.run(main(['url_1', 'url_2', 'url_3', 'url_4']))

########## 输出 ##########
