协程是实现并发编程的一种方式,多线程/多进程,正式解决并发问题的经典模型之一,但是随着互联网的快速发展,遇到了c10k瓶颈,也就是同时连接到服务器的客户达到了一万个,于是很多代码跑崩了,进程上下文切换占用了大量资源,线程也顶不住如此巨大的压力

python3.7提供了基于asyncio和async/await的方法

### 1. 一个简单的爬虫例子

In [1]:
#模拟爬虫
import time
def crawl_page(url):
    print('crawling {}'.format(url))
    sleep_time = int(url.split('_')[-1])
    time.sleep(sleep_time)
    print('OK {}'.format(url))
    
def main(urls):
    for url in urls:
        crawl_page(url)
        
        
%time main(['url_1', 'url_2', 'url_3', 'url_4'])

crawling url_1
OK url_1
crawling url_2
OK url_2
crawling url_3
OK url_3
crawling url_4
OK url_4
Wall time: 10 s


**并发化**

In [9]:
import asyncio

async def crawl_page(url):
    print('crawling {}'.format(url))
    sleep_time = int(url.split('_')[-1])
    await asyncio.sleep(sleep_time)
    print('OK {}'.format(url))
    
async def main(urls):
    for url in urls:
        await crawl_page(url)
        
        
#asyncio.run(main(['url_1', 'url_2', 'url_3', 'url_4']))
await main(['url_1', 'url_2', 'url_3', 'url_4'])

crawling url_1
OK url_1
crawling url_2
OK url_2
crawling url_3
OK url_3
crawling url_4
OK url_4


async 修饰词声明异步函数,于是,这里crawl_page和main都变成了异步函数,而调用异步函数,我们便可以得到一个协程对象(coroutine object)

In [10]:
print(crawl_page(''))

<coroutine object async-def-wrapper.<locals>.crawl_page at 0x000001176F90DB48>


  """Entry point for launching an IPython kernel.


### 执行协程

#### 1.await来调用

await执行的效果,和python正常执行是一样的,也就是说程序会阻塞在这里,进入被调用的协程函数,执行完毕返回后再继续,而这也是await的字面意思<br/>
代码中
```python
await asyncio.sleep(sleep_time)#会在这里休息若干秒,
await crawl_page(url)#会执行crawl_page()函数
```

### 2.通过asyncio.create_task()来创建任务

### 3.需要asyncio.run来触发运行

asyncio.run这个函数是python3.7之后才有的特性,可以让python的协程接口变得非常简单
asyncio.run(main())作为主程序的入口函数
在程序运行期间,只调用一次asyncio.run()

**await是同步调用**

### Task