[gevent](http://xlambda.com/gevent-tutorial/#)是python中最简单易部署的异步框架,它通过greenlet来实现协程,它的基本思想是IO操作时自动使用greenlet,这样我们的程序就不用等待缓慢的IO操作了

## 安装

pip安装即可,注意这个库只能用在python2上
    
    pip install --pre gevent
    
现在他已经可以在pypy上使用了

并发的核心思想是一个大的任务可以分解成多个子任务，这些子任务是相互独立的，因此可以异步运行 ，而不是同步执行。两个执行程序间的转换是一个关联转换。

在gevent中一个关联转换可以通过 yielding 来实现.在这个例子,两个程序的转换是通过调用 gevent.sleep(0).

> 一个例子

In [1]:
import gevent

def foo():
    print('Running in foo')
    gevent.sleep(0)
    print('Explicit context switch to foo again')

def bar():
    print('Explicit context to bar')
    gevent.sleep(0)
    print('Implicit context switch back to bar')

gevent.joinall([
    gevent.spawn(foo),
    gevent.spawn(bar),
])

Running in foo
Explicit context to bar
Explicit context switch to foo again
Implicit context switch back to bar


[<Greenlet at 0x103f493d8>, <Greenlet at 0x103f49800>]

gevent真正的能力在于我们把它用于网络和IO相关的功能,这会让程序更好的运行而不浪费cpu性能在那边空等.

上边的程序运行的顺序是这样的


<img src="img/flow.gif" />

> select()轮询的阻塞调用

In [2]:
import time
import gevent
from gevent import select

start = time.time()
tic = lambda: 'at %1.1f seconds' % (time.time() - start)

def gr1():
    # Busy waits for a second, but we don't want to stick around...
    print('Started Polling: %s' % tic())
    select.select([], [], [], 2)
    print('Ended Polling: %s' % tic())

def gr2():
    # Busy waits for a second, but we don't want to stick around...
    print('Started Polling: %s' % tic())
    select.select([], [], [], 2)
    print('Ended Polling: %s' % tic())

def gr3():
    print("Hey lets do some stuff while the greenlets poll, %s" % tic())
    gevent.sleep(1)

gevent.joinall([
    gevent.spawn(gr1),
    gevent.spawn(gr2),
    gevent.spawn(gr3),
])

Started Polling: at 0.0 seconds
Started Polling: at 0.0 seconds
Hey lets do some stuff while the greenlets poll, at 0.0 seconds
Ended Polling: at 2.0 seconds
Ended Polling: at 2.0 seconds


[<Greenlet at 0x103f49c28>,
 <Greenlet at 0x103f49a60>,
 <Greenlet at 0x103f49b90>]

下面是另外一个多少有点人造色彩的例子，定义一个非确定性的(non-deterministic) 的task函数(给定相同输入的情况下，它的输出不保证相同)。 此例中执行这个函数的副作用就是，每次task在它的执行过程中都会随机地停某些秒。

> 随机睡眠一定秒数,观察同步与异步的不同

In [4]:
import gevent
import random

def task(pid):
    """
    Some non-deterministic task
    """
    gevent.sleep(random.randint(0,2)*0.001)
    print('Task %s done' % pid)

def synchronous():
    for i in range(1,10):
        task(i)

def asynchronous():
    threads = [gevent.spawn(task, i) for i in range(10)]
    gevent.joinall(threads)

print('Synchronous:')
synchronous()

print('Asynchronous:')
asynchronous()



Synchronous:
Task 1 done
Task 2 done
Task 3 done
Task 4 done
Task 5 done
Task 6 done
Task 7 done
Task 8 done
Task 9 done
Asynchronous:
Task 0 done
Task 1 done
Task 3 done
Task 8 done
Task 4 done
Task 5 done
Task 7 done
Task 2 done
Task 6 done
Task 9 done


In [5]:
%time synchronous()

Task 1 done
Task 2 done
Task 3 done
Task 4 done
Task 5 done
Task 6 done
Task 7 done
Task 8 done
Task 9 done
CPU times: user 1.24 ms, sys: 809 µs, total: 2.05 ms
Wall time: 14.5 ms


In [6]:
%time asynchronous()

Task 0 done
Task 1 done
Task 3 done
Task 4 done
Task 6 done
Task 7 done
Task 9 done
Task 2 done
Task 5 done
Task 8 done
CPU times: user 1.01 ms, sys: 319 µs, total: 1.32 ms
Wall time: 2.63 ms


上例中，在同步的部分，所有的task都同步的执行， 结果当每个task在执行时主流程被阻塞(主流程的执行暂时停住)。

程序的重要部分是将task函数封装到Greenlet内部线程的gevent.spawn。 初始化的greenlet列表存放在数组threads中，此数组被传给gevent.joinall 函数，后者阻塞当前流程，并执行所有给定的greenlet。执行流程只会在 所有greenlet执行完后才会继续向下走。

要重点留意的是，异步的部分本质上是随机的，而且异步部分的整体运行时间比同步 要大大减少。事实上，同步部分的最大运行时间，即是每个task停0.002秒，结果整个 队列要停0.02秒。而异步部分的最大运行时间大致为0.002秒，因为没有任何一个task会 阻塞其它task的执行。

一个更常见的应用场景，如异步地向服务器取数据，取数据操作的执行时间 依赖于发起取数据请求时远端服务器的负载，各个请求的执行时间会有差别。

In [8]:
import gevent.monkey
gevent.monkey.patch_socket()

import gevent
import requests

def fetch(pid):
    result = requests.get("http://hq.sinajs.cn/list=sh601006").text
    stock = result.split(",")[0].split("=")[1]
    print('stock:'+stock+"pid=",pid)
    return stock

def synchronous():
    for i in range(1,10):
        fetch(i)

def asynchronous():
    threads = []
    for i in range(1,10):
        threads.append(gevent.spawn(fetch, i))
    gevent.joinall(threads)

print('Synchronous:')
synchronous()

print('Asynchronous:')
asynchronous()

Synchronous:
stock:"大秦铁路pid= 1
stock:"大秦铁路pid= 2
stock:"大秦铁路pid= 3
stock:"大秦铁路pid= 4
stock:"大秦铁路pid= 5
stock:"大秦铁路pid= 6
stock:"大秦铁路pid= 7
stock:"大秦铁路pid= 8
stock:"大秦铁路pid= 9
Asynchronous:
stock:"大秦铁路pid= 1
stock:"大秦铁路pid= 3
stock:"大秦铁路pid= 9
stock:"大秦铁路pid= 2
stock:"大秦铁路pid= 4
stock:"大秦铁路pid= 5
stock:"大秦铁路pid= 6
stock:"大秦铁路pid= 7
stock:"大秦铁路pid= 8


## 确定性
greenlet具有确定性。在相同配置相同输入的情况下，它们总是 会产生相同的输出。下面就有例子，我们在multiprocessing的pool之间执行一系列的 任务，与在gevent的pool之间执行作比较。

In [10]:
import time

def echo(i):
    time.sleep(0.001)
    return i

# Non Deterministic Process Pool

from multiprocessing.pool import Pool

p = Pool(10)
run1 = [a for a in p.imap_unordered(echo, range(10))]
run2 = [a for a in p.imap_unordered(echo, range(10))]
run3 = [a for a in p.imap_unordered(echo, range(10))]
run4 = [a for a in p.imap_unordered(echo, range(10))]

print(run1 == run2 == run3 == run4)

# Deterministic Gevent Pool

from gevent.pool import Pool

p = Pool(10)
run1 = [a for a in p.imap_unordered(echo, range(10))]
run2 = [a for a in p.imap_unordered(echo, range(10))]
run3 = [a for a in p.imap_unordered(echo, range(10))]
run4 = [a for a in p.imap_unordered(echo, range(10))]

print(run1 == run2 == run3 == run4)

False
True


即使gevent通常带有确定性，当开始与如socket或文件等外部服务交互时， 不确定性也可能溜进你的程序中。因此尽管gevent线程是一种“确定的并发”形式， 使用它仍然可能会遇到像使用POSIX线程或进程时遇到的那些问题。

涉及并发长期存在的问题就是竞争条件(race condition)。简单来说， 当两个并发线程/进程都依赖于某个共享资源同时都尝试去修改它的时候， 就会出现竞争条件。这会导致资源修改的结果状态依赖于时间和执行顺序。 这是个问题，我们一般会做很多努力尝试避免竞争条件， 因为它会导致整个程序行为变得不确定。

最好的办法是始终避免所有全局的状态。全局状态和导入时(import-time)副作用总是会 反咬你一口！



## 创建Greenlets

gevent对Greenlet初始化提供了一些封装，最常用的使用模板之一有

In [34]:
import gevent
from gevent import Greenlet

def foo(message, n):
    """
    Each thread will be passed the message, and n arguments
    in its initialization.
    """
    gevent.sleep(n)
    print(message)

# Initialize a new Greenlet instance running the named function
# foo
thread1 = Greenlet.spawn(foo, "Hello", 1)

# Wrapper for creating and running a new Greenlet from the named
# function foo, with the passed arguments
thread2 = gevent.spawn(foo, "I live!", 2)

# Lambda expressions
thread3 = gevent.spawn(lambda x: (x+1), 2)

threads = [thread1, thread2, thread3]

# Block until all threads complete.
gevent.joinall(threads)


Hello
I live!


>子类化Greenlet类，重载它的_run方法

In [35]:
import gevent
from gevent import Greenlet

class MyGreenlet(Greenlet):

    def __init__(self, message, n):
        Greenlet.__init__(self)
        self.message = message
        self.n = n

    def _run(self):
        print(self.message)
        gevent.sleep(self.n)

g = MyGreenlet("Hi there!", 3)
g.start()
g.join()

Hi there!


## Greenlet状态

就像任何其他成段代码，Greenlet也可能以不同的方式运行失败。 Greenlet可能未能成功抛出异常，不能停止运行，或消耗了太多的系统资源。

一个greenlet的状态通常是一个依赖于时间的参数。在greenlet中有一些标志， 让你可以监视它的线程内部状态：

状态|类型|说明
---|---|---
started | Boolean|指示此Greenlet是否已经启动
ready()| Boolean|指示此Greenlet是否已经停止
successful() |Boolean|指示此Greenlet是否已经停止而且没抛异常
value | 任意值|此Greenlet代码返回的值
exception|异常|此Greenlet内抛出的未捕获异常


In [36]:
import gevent

def win():
    return 'You win!'

def fail():
    raise Exception('You fail at failing.')

winner = gevent.spawn(win)
loser = gevent.spawn(fail)

print(winner.started) # True
print(loser.started)  # True

# Exceptions raised in the Greenlet, stay inside the Greenlet.
try:
    gevent.joinall([winner, loser])
except Exception as e:
    print('This will never be reached')

print(winner.value) # 'You win!'
print(loser.value)  # None

print(winner.ready()) # True
print(loser.ready())  # True

print(winner.successful()) # True
print(loser.successful())  # False

# The exception raised in fail, will not propogate outside the
# greenlet. A stack trace will be printed to stdout but it
# will not unwind the stack of the parent.

print(loser.exception)

# It is possible though to raise the exception again outside
# raise loser.exception
# or with
# loser.get()

True
True
You win!
None
True
True
True
False
You fail at failing.


Traceback (most recent call last):
  File "/Users/huangsizhe/Lib/conda/anaconda/lib/python2.7/site-packages/gevent/greenlet.py", line 327, in run
    result = self._run(*self.args, **self.kwargs)
  File "<ipython-input-36-f5e704eb2c3b>", line 7, in fail
    raise Exception('You fail at failing.')
Exception: You fail at failing.
<Greenlet at 0x103f324b0: fail> failed with Exception



# 程序停止

当主程序(main program)收到一个SIGQUIT信号时，不能成功做yield操作的 Greenlet可能会令意外地挂起程序的执行。这导致了所谓的僵尸进程， 它需要在Python解释器之外被kill掉。

对此，一个通用的处理模式就是在主程序中监听SIGQUIT信号，在程序退出 调用gevent.shutdown。



In [37]:
%%writefile shutdownexp.py
import gevent
import signal

def run_forever():
    gevent.sleep(1000)

if __name__ == '__main__':
    gevent.signal(signal.SIGQUIT, gevent.shutdown)
    thread = gevent.spawn(run_forever)
    thread.join()

Writing shutdownexp.py


## 超时
超时是一种对一块代码或一个Greenlet的运行时间的约束。


In [38]:
import gevent
from gevent import Timeout

seconds = 10

timeout = Timeout(seconds)
timeout.start()

def wait():
    gevent.sleep(10)

try:
    gevent.spawn(wait).join()
except Timeout:
    print('Could not complete')

Could not complete


超时类也可以用在上下文管理器(context manager)中, 也就是with语句内。

In [39]:
import gevent
from gevent import Timeout

time_to_wait = 5 # seconds

class TooLong(Exception):
    pass

with Timeout(time_to_wait, TooLong):
    gevent.sleep(10)


TooLong: 

另外，对各种Greenlet和数据结构相关的调用，gevent也提供了超时参数。 例如：

In [40]:
import gevent
from gevent import Timeout

def wait():
    gevent.sleep(2)

timer = Timeout(1).start()
thread1 = gevent.spawn(wait)

try:
    thread1.join(timeout=timer)
except Timeout:
    print('Thread 1 timed out')

# --

timer = Timeout.start_new(1)
thread2 = gevent.spawn(wait)

try:
    thread2.get(timeout=timer)
except Timeout:
    print('Thread 2 timed out')

# --

try:
    gevent.with_timeout(1, wait)
except Timeout:
    print('Thread 3 timed out')


Thread 1 timed out
Thread 2 timed out
Thread 3 timed out


## Monkey patching
我们现在来到gevent的死角了. 在此之前，我已经避免提到猴子补丁(monkey patching) 以尝试使gevent这个强大的协程模型变得生动有趣，但现在到了讨论猴子补丁的黑色艺术 的时候了。你之前可能注意到我们提到了monkey.patch_socket()这个命令，这个 纯粹副作用命令是用来改变标准socket库的。

In [41]:
import socket
print(socket.socket)

print("After monkey patch")
from gevent import monkey
monkey.patch_socket()
print(socket.socket)

import select
print(select.select)
monkey.patch_select()
print("After monkey patch")
print(select.select)

<class 'gevent.socket.socket'>
After monkey patch
<class 'gevent.socket.socket'>
<built-in function select>
After monkey patch
<function select at 0x103f2f6e0>


Python的运行环境允许我们在运行时修改大部分的对象，包括模块，类甚至函数。 这是个一般说来令人惊奇的坏主意，因为它创造了“隐式的副作用”，如果出现问题 它很多时候是极难调试的。虽然如此，在极端情况下当一个库需要修改Python本身 的基础行为的时候，猴子补丁就派上用场了。在这种情况下，gevent能够 修改标准库里面大部分的阻塞式系统调用，包括socket、ssl、threading和 select等模块，而变为协作式运行。

例如，Redis的python绑定一般使用常规的tcp socket来与redis-server实例通信。 通过简单地调用gevent.monkey.patch_all()，可以使得redis的绑定协作式的调度 请求，与gevent栈的其它部分一起工作。

这让我们可以将一般不能与gevent共同工作的库结合起来，而不用写哪怕一行代码。 虽然猴子补丁仍然是邪恶的(evil)，但在这种情况下它是“有用的邪恶(useful evil)”。

# 数据结构

这部分不研究了,看到再查就行[地址](http://xlambda.com/gevent-tutorial/#_7)

In [23]:
from greenlet import greenlet
import gevent
from time import sleep
def test1():
    print(12)
    #gevent.sleep(2)
    print(34)
    return "a"

def test2():
    print(56)
    gr1.switch()
    #sleep(2)
    gevent.sleep(2)
    print(78)
    return "b"
def no():
    for i in range(10):
        print(i)

gr1 = greenlet(test1)
gr2 = greenlet(test2)
r1 = gr2.switch()
print(r1)
no()
r2 = gr2.switch()

56
12
34
a
0
1
2
3
4
5
6
7
8
9
78


In [24]:
r2

'b'

In [32]:
import gevent
import signal

def run_forever():
    gevent.sleep(1000)

#gevent.signal(signal.SIGQUIT, gevent.shutdown)
thread = gevent.spawn(run_forever)
thread.join()
gevent.kill(thread)

    

KeyboardInterrupt


KeyboardInterrupt: 