# 多态和封装

“多态”，英文是:Polymorphism，在台湾被称作“多型”。维基百科中对此有详细解释说明。

* 多型（英语：Polymorphism），是指物件導向程式執行時，相同的訊息可能會送給多個不同的類別之物件，而系統可依據物件所屬類別，引發對應類別的方法，而有不同的行為。簡單來說，所謂多型意指相同的訊息給予不同的物件會引發不同的動作稱之。

再简化的说法就是“有多种形式”，就算不知道变量（参数）所引用的对象类型，也一样能进行操作，来者不拒。比如上面显示的例子。在python中，更为pythonic的做法是根本就不进行类型检验。

In [1]:
"This is a book".count("s")

2

In [2]:
[1,2,4,3,5,3].count(3)

2

count()的作用是数一数某个元素在对象中出现的次数，并没有限定count的参数。类似的例子还有：

In [3]:
f = lambda x,y:x+y

In [4]:
f(2,3)

5

In [5]:
f("qiw","sir")

'qiwsir'

In [7]:
repr([1,2,3])

# repr()函数，它能够针对输入的任何对象返回一个字符串。

'[1, 2, 3]'

In [8]:
repr({"lang":"python"})

"{'lang': 'python'}"

In [9]:
def length(x):
    print("The length of ",repr(x)," is ",len(x))

In [10]:
length("how are you")

The length of  'how are you'  is  11


In [12]:
#!/usr/bin/env python
# coding=utf-8

"the code is from: http://zetcode.com/lang/python/oop/"

__metaclass__ = type

class Animal:
    def __init__(self, name=""):
        self.name = name

    def talk(self):
        pass

class Cat(Animal):
    def talk(self):
        print("Meow!")

class Dog(Animal):
    def talk(self):
        print("Woof!")

In [13]:
a = Animal()
a.talk()

In [14]:
c = Cat("Missy")
c.talk()

Meow!


In [15]:
d = Dog("Rocky")
d.talk()


Woof!


关于多态，有一个被称作“鸭子类型”(duck typeing)的东西，其含义在维基百科中被表述为：

* 在程序设计中，鸭子类型（英语：duck typing）是动态类型的一种风格。在这种风格中，一个对象有效的语义，不是由继承自特定的类或实现特定的接口，而是由当前方法和属性的集合决定。这个概念的名字来源于由James Whitcomb Riley提出的鸭子测试（见下面的“历史”章节），“鸭子测试”可以这样表述：“当看到一只鸟走起来像鸭子、游泳起来像鸭子、叫起来也像鸭子，那么这只鸟就可以被称为鸭子。”

对于鸭子类型，也是有争议的。这方面的详细信息，读者可以去看有关维基百科的介绍。

对于多态问题，最后还要告诫读者，类型检查是毁掉多态的利器，比如type、isinstance以及isubclass函数，所以，一定要慎用这些类型检查函数。

## 封装和私有化

在程序设计中，封装(Encapsulation)是对object的一种抽象，即将某些部分隐藏起来，在程序外部看不到，即无法调用（不是人用眼睛看不到那个代码，除非用某种加密或者混淆方法，造成现实上的困难，但这不是封装）。

要了解封装，离不开“私有化”，就是将类或者函数中的某些属性限制在某个区域之内，外部无法调用。

python中私有化的方法也比较简单，就是在准备私有化的属性（包括方法、数据）名字前面加双下划线。

In [17]:
#!/usr/bin/env python
# coding=utf-8

__metaclass__ = type

class ProtectMe:
    def __init__(self):
        self.me = "qiwsir"
        self.__name = "kivi"

    def __python(self):
        print("I love Python.")

    def code(self):
        print("Which language do you like?")
        self.__python()

if __name__ == "__main__":
    p = ProtectMe()
    print(p.me)
    print(p.__name)

qiwsir


AttributeError: 'ProtectMe' object has no attribute '__name'

查看报错信息，告诉我们没有__name那个属性。果然隐藏了，在类的外面无法调用。

In [18]:
if __name__ == "__main__":
    p = ProtectMe()
    p.code()
    p.__python()

Which language do you like?
I love Python.


AttributeError: 'ProtectMe' object has no attribute '__python'

该调用的调用了，该隐藏的隐藏了。

要调用那些私有属性，可以使用property函数。

In [20]:
#!/usr/bin/env python
# coding=utf-8

__metaclass__ = type

class ProtectMe:
    def __init__(self):
        self.me = "qiwsir"
        self.__name = "kivi"

    @property
    def name(self):
        return self.__name

if __name__ == "__main__":
    p = ProtectMe()
    print(p.name)
    
# 封装的确不是让“人看不见”。

kivi


## 特殊方法

In [21]:
class A(object):
     pass

In [22]:
a = A()
dir(a)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__']

In [23]:
dir(A)

['__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__']

用dir()来查看一下，发现不管是类还是实例，都有很多属性，这在前面已经反复出现，有点见怪不怪了。不过，这里我们要看一个属性：\__dict__，因为它是一个保存秘密的东西：对象的属性。

In [40]:
class Spring(object):
    season = "the spring of class"

In [41]:
Spring.__dict__

mappingproxy({'__module__': '__main__',
              'season': 'the spring of class',
              '__dict__': <attribute '__dict__' of 'Spring' objects>,
              '__weakref__': <attribute '__weakref__' of 'Spring' objects>,
              '__doc__': None})

有一个键'season'，这就是这个类的属性；其值就是类属性的数据。

In [42]:
s = Spring()
s.__dict__

{}

In [43]:
s.season

'the spring of class'

这个其实是指向了类属性中的Spring.season

In [44]:
s.season = "the spring of instance"
s.__dict__

# 这时候建立的实例属性和上面的那个s.season只不过重名，并且把它“遮盖”了。

{'season': 'the spring of instance'}

In [45]:
Spring.__dict__['season']

'the spring of class'

In [46]:
Spring.season

# Spring的类属性没有受到实例属性的影响。

'the spring of class'

In [47]:
del s.season
s.season

'the spring of class'

In [48]:
s.lang = "python"
s.__dict__

{'lang': 'python'}

果然打回原形。

这样做仅仅是更改了实例的\__dict__内容，对Spring.\__dict__无任何影响，也就是说通过Spring.lang或者Spring.\__dict__['lang']是得不到上述结果的。

In [49]:
Spring.lang

AttributeError: type object 'Spring' has no attribute 'lang'

In [50]:
Spring.flower = "peach"
Spring.__dict__

mappingproxy({'__module__': '__main__',
              'season': 'the spring of class',
              '__dict__': <attribute '__dict__' of 'Spring' objects>,
              '__weakref__': <attribute '__weakref__' of 'Spring' objects>,
              '__doc__': None,
              'flower': 'peach'})

在类的\__dict__被更改了，类属性中增加了一个'flower'属性。但是，实例的\__dict__中不变

In [51]:
s.__dict__

{'lang': 'python'}

In [52]:
s.flower

'peach'

In [53]:
class Spring(object):
    def tree(self,x):
        self.x = x
        return self.x

In [54]:
Spring.__dict__

mappingproxy({'__module__': '__main__',
              'tree': <function __main__.Spring.tree(self, x)>,
              '__dict__': <attribute '__dict__' of 'Spring' objects>,
              '__weakref__': <attribute '__weakref__' of 'Spring' objects>,
              '__doc__': None})

In [55]:
 Spring.__dict__['tree']

<function __main__.Spring.tree(self, x)>

In [57]:
t = Spring()
t.tree("xiangzhangshu")

'xiangzhangshu'

In [58]:
t.__dict__

{'x': 'xiangzhangshu'}

印证了实例t和self的关系，即实例方法(t.tree('xiangzhangshu'))的第一个参数(self，但没有写出来)绑定实例t，透过self.x来设定值，即给t.\__dict__添加属性值。

In [60]:
class Spring(object):
    __slots__ = ("tree", "flower")
    
# __slots__能够限制属性的定义，但是这不是它存在终极目标，
# 它存在的终极目标更应该是一个在编程中非常重要的方面：优化内存使用。

In [61]:
dir(Spring)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__slots__',
 '__str__',
 '__subclasshook__',
 'flower',
 'tree']

\__dict__属性没有了，\__slots__把\__dict__挤出去了，它进入了类的属性。

In [62]:
Spring.__slots__

('tree', 'flower')

In [63]:
t = Spring()
t.__slots__

('tree', 'flower')

In [64]:
Spring.tree = "liushu"

In [65]:
t.tree = "guangyulan"

# 前面已经通过类给这个属性赋值了。不能用实例属性来修改

AttributeError: 'Spring' object attribute 'tree' is read-only

In [66]:
Spring.tree = "guangyulan"
t.tree

'guangyulan'

看来\__slots__已经把实例属性牢牢地管控了起来，但更本质是的是优化了内存

如果访问某属性不存在，那么就要转向到某个操作。我们把这种情况称之为“拦截”。就好像“寻隐者不遇”，却被童子“遥指杏花村”，将你“拦截”了。在Python中，有一些方法就具有这种“拦截”能力。

* \__setattr__(self,name,value)：如果要给name赋值，就调用这个方法。
* \__getattr__(self,name)：如果name被访问，同时它不存在的时候，此方法被调用。
* \__getattribute__(self,name)：当name被访问时自动被调用（注意：这个仅能用于新式类），无论name是否存在，都要被调用。
* \__delattr__(self,name)：如果要删除name，这个方法就被调用。


In [2]:
class A(object):
    def __getattr__(self, name):
        print("You use getattr")
    def __setattr__(self, name, value):
        print("You use setattr")
        self.__dict__[name] = value


In [3]:
a = A()
a.x

You use getattr


由于在这里使用了\__getattr__(self, name)方法，当发现x不存在于对象的\__dict__中的时候，就调用了\__getattr__，即所谓“拦截成员”。

In [4]:
a.x = 7

You use setattr


给对象的属性赋值时候，调用了\__setattr__(self, name, value)方法，这个方法中有一句self.\__dict__[name] = value，通过这个语句，就将属性和数据保存到了对象的\__dict__中，如果在调用这个属性：

In [6]:
a.x

# 它已经存在于对象的__dict__之中

7

In [7]:
class B(object):
    def __getattribute__(self, name):
        print("you are useing getattribute")
        return object.__getattribute__(self, name)

需要提醒注意，在这里返回的内容用的是return object.\__getattribute__(self, name)，而没有使用return self.\__dict__[name]像是。因为如果用这样的方式，就是访问self.\__dict__，只要访问这个属性，就要调用`getattribute``，这样就导致了无线递归下去（死循环）。要避免之。

In [8]:
b = B()
b.y

you are useing getattribute


AttributeError: 'B' object has no attribute 'y'

访问不存在的成员，可以看到，已经被__getattribute__拦截了，虽然最后还是要报错的。

In [9]:
b.y = 8
b.y

you are useing getattribute


8

当给其赋值后，意味着已经在__dict__里面了，再调用，依然被拦截，但是由于已经在\__dict__内，会把结果返回。

In [10]:
#!/usr/bin/env python
# coding=utf-8

"""
study __getattr__ and __setattr__
"""

class Rectangle(object):
    """
    the width and length of Rectangle
    """
    def __init__(self):
        self.width = 0
        self.length = 0

    def setSize(self, size):
        self.width, self.length = size
    def getSize(self):
        return self.width, self.length

if __name__ == "__main__":
    r = Rectangle()
    r.width = 3
    r.length = 4
    print(r.getSize())
    r.setSize( (30, 40) )
    print(r.width)
    print(r.length)

(3, 4)
30
40


In [13]:
#!/usr/bin/env python
# coding=utf-8

"""
study __getattr__ and __setattr__
"""

class Rectangle(object):
    """
    the width and length of Rectangle
    """
    def __init__(self):
        self.width = 0
        self.length = 0

    def setSize(self, size):
        self.width, self.length = size
    def getSize(self):
        return self.width, self.length
    
    size = property(getSize, setSize)

if __name__ == "__main__":
    r = Rectangle()
    r.width = 3
    r.length = 4
    print(r.getSize())
    r.size = 30,40  # 改进
    print(r.width)
    print(r.length)

(3, 4)
30
40


## 获得属性顺序

通过实例获取其属性（也有说特性的，名词变化了，但是本质都是属性和方法），如果在\__dict__中有相应的属性，就直接返回其结果；如果没有，会到类属性中找。

In [15]:
#!/usr/bin/env python
# coding=utf-8

class A(object):
    author = "qiwsir"
    def __getattr__(self, name):
        if name != "author":
            return "from starter to master."

if __name__ == "__main__":
    a = A()
    print("a.author: ", a.author)
    print("a.long: ",a.lang)


a.author:  qiwsir
a.long:  from starter to master.


当a = A()后，并没有为实例建立任何属性，或者说实例的\__dict__是空的，这在上节中已经探讨过了。但是如果要查看a.author，因为实例的属性中没有，所以就去类属性中找，发现果然有，于是返回其值"qiwsir"。但是，在找a.lang的时候，不仅实例属性中没有，类属性中也没有，于是就调用了\__getattr__()方法。在上面的类中，有这个方法，如果没有\__getattr__()方法呢？如果没有定义这个方法，就会引发AttributeError，这在前面已经看到了。

## 双下划线

至此，是否注意到，我们使用很多以双下划线开头和结尾的方法名，比如\__dict__，\__init__个。在Python中，用这种方法表示特殊的方法名，当然，这是一个惯例，之所以这样做，主要是确保这些特殊的方法名不会跟你自己所定义的名称冲突，我们自己定义名称的时候，是绝少用双划线开头和结尾的。如果你需要重写这些方法，当然是可以的，具体参看前文关于继承的讲述。

# 迭代器

对序列（列表、元组）、字典和文件都可以用iter()方法生成迭代对象，然后用next()方法访问。当然，这种访问不是自动的，如果用for循环，就可以自动完成上述访问了。

如果用dir(list),dir(tuple),dir(file),dir(dict)来查看不同类型对象的属性，会发现它们都有一个名为\__iter__的东西。这个应该引起读者的关注，因为它和迭代器（iterator）、内置的函数iter()在名字上是一样的，除了前后的双下划线。望文生义，我们也能猜出它肯定是跟迭代有关的东西。当然，这种猜测也不是没有根据的，其重要根据就是英文单词，如果它们之间没有一点关系，肯定不会将命名搞得一样。

猜对了。\__iter__就是对象的一个特殊方法，它是迭代规则(iterator potocol)的基础。或者说，对象如果没有它，就不能返回迭代器，就没有next()方法，就不能迭代。

提醒注意，如果读者用的是python3.x，迭代器对象实现的是\__next__()方法，不是next()。并且，在python3.x中有一个内建函数next()，可以实现next(it)，访问迭代器，这相当于于python2.x中的it.next()（it是迭代对象）。

那些类型是list、tuple、file、dict对象有\__iter__()方法，标着他们能够迭代。这些类型都是python中固有的，我们能不能自己写一个对象，让它能够迭代呢？

In [16]:
#!/usr/bin/env python
# coding=utf-8

"""
the interator as range()
"""
class MyRange(object):
    def __init__(self, n):
        self.i = 0
        self.n = n

    def __iter__(self):
        return self

    def next(self):
        if self.i < self.n:
            i = self.i
            self.i += 1
            return i
        else:
            raise StopIteration()

if __name__ == "__main__":
    x = MyRange(7)
    print("x.next()==>", x.next())
    print("x.next()==>", x.next())
    print("------for loop--------")
    for i in x:
        print(i)

x.next()==> 0
x.next()==> 1
------for loop--------


TypeError: iter() returned non-iterator of type 'MyRange'

从range()的帮助文档和方法中可以看出，它的结果是一个列表。

xrange()返回的是对象，并且进一步告诉我们，类似range()，但不是列表。在循环的时候，它跟range()相比“slightly faster than range() and more memory efficient”，稍快并更高的内存效率（就是省内存呀）。

通过range()得到的列表，会一次性被读入内存，而xrange()返回的对象，则是需要一个数值才从返回一个数值。

迭代器的确有迷人之处，但是它也不是万能之物。比如迭代器不能回退，只能如过河的卒子，不断向前。另外，迭代器也不适合在多线程环境中对可变集合使用

# 生成器

生成器（英文：generator）是一个非常迷人的东西，也常被认为是python的高级编程技能。不过，我依然很乐意在这里跟读者——尽管你可能是一个初学者——探讨这个话题，因为我相信读者看本教程的目的，绝非仅仅将自己限制于初学者水平，一定有一颗不羁的心——要成为python高手。那么，开始了解生成器吧。

还记得上节的“迭代器”吗？生成器和迭代器有着一定的渊源关系。生成器必须是可迭代的，诚然它又不仅仅是迭代器，但除此之外，又没有太多的别的用途，所以，我们可以把它理解为非常方便的自定义迭代器。

In [29]:
my_generator = (x*x for x in range(4))

# “生成器解析式”（或者：生成器推导式、生成器表达式）

In [22]:
dir(my_generator)

['__class__',
 '__del__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__name__',
 '__ne__',
 '__new__',
 '__next__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'close',
 'gi_code',
 'gi_frame',
 'gi_running',
 'gi_yieldfrom',
 'send',
 'throw']

In [23]:
my_list = [x*x for x in range(4)]
my_list

[0, 1, 4, 9]

In [25]:
for i in my_generator:
    print(i)

0
1
4
9


In [26]:
print(i)

9


In [27]:
for i in my_list:
    print(i)

0
1
4
9


In [28]:
for i in my_list:
    print(i)

0
1
4
9


生成器解析式是有很多用途的，在不少地方替代列表，是一个不错的选择。特别是针对大量值的时候，如上节所说的，列表占内存较多，迭代器（生成器是迭代器）的优势就在于少占内存，因此无需将生成器（或者说是迭代器）实例化为一个列表，直接对其进行操作，方显示出其迭代的优势。

In [30]:
sum(i*i for i in range(10))

285

## 定义和执行过程

yield这个词在汉语中有“生产、出产”之意，在python中，它作为一个关键词（你在变量、函数、类的名称中就不能用这个了），是生成器的标志。

In [31]:
def g():
    yield 0
    yield 1
    yield 2
    
g

<function __main__.g()>

In [34]:
ge = g()
ge

# 上面建立的函数返回值是一个生成器(generator)类型的对象。

<generator object g at 0x7f9edc3b5fc0>

In [35]:
dir(ge)

# 在这里看到了__iter__()和next()，说明它是迭代器。

['__class__',
 '__del__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__name__',
 '__ne__',
 '__new__',
 '__next__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'close',
 'gi_code',
 'gi_frame',
 'gi_running',
 'gi_yieldfrom',
 'send',
 'throw']

In [37]:
next(ge)

0

In [38]:
next(ge)

1

从这个简单例子中可以看出，那个含有yield关键词的函数返回值是一个生成器类型的对象，这个生成器对象就是迭代器。

我们把含有yield语句的函数称作生成器。生成器是一种用普通函数语法定义的迭代器。通过上面的例子可以看出，这个生成器（也是迭代器），在定义过程中并没有像上节迭代器那样写__inter__()和next()，而是只要用了yield语句，那个普通函数就神奇般地成为了生成器，也就具备了迭代器的功能特性。

yield语句的作用，就是在调用的时候返回相应的值。详细剖析一下上面的运行过程：

* ge = g()：除了返回生成器之外，什么也没有操作，任何值也没有被返回。
* ge.next()：直到这时候，生成器才开始执行，遇到了第一个yield语句，将值返回，并暂停执行（有的称之为挂起）。
* ge.next()：从上次暂停的位置开始，继续向下执行，遇到yield语句，将值返回，又暂停。
* gen.next()：重复上面的操作。
* gene.next()：从上面的挂起位置开始，但是后面没有可执行的了，于是next()发出异常。


In [39]:
def r_return(n):
    print("You taked me.")
    while n:
        print("before return")
        return n
        n -= 1
        print("after return")

In [40]:
rr = r_return(3)

You taked me.
before return


In [41]:
rr

3

In [50]:
def y_yield(n):
    print("You taked me.")
    while n:
        print("before yield")
        yield n
        n -= 1
        print("after yield")

In [51]:
yy = y_yield(3)

In [52]:
next(yy)

You taked me.
before yield


3

In [53]:
next(yy)

after yield
before yield


2

一般的函数，都是止于return。作为生成器的函数，由于有了yield，则会遇到它挂起，如果还有return，遇到它就直接抛出SoptIteration异常而中止迭代。

## 生成器方法

在python2.5以后，生成器有了一个新特征，就是在开始运行后能够为生成器提供新的值。这就好似生成器和“外界”之间进行数据交流。

In [54]:
def repeator(n):
    while True:
        n = (yield n)

In [55]:
r = repeator(4)
next(r)

4

In [56]:
r.send("hello")

'hello'

当执行到r.next()的时候，生成器开始执行，在内部遇到了yield n挂起。注意在生成器函数中，n = (yield n)中的yield n是一个表达式，并将结果赋值给n，虽然不严格要求它必须用圆括号包裹，但是一般情况都这么做，请读者也追随这个习惯。

当执行r.send("hello")的时候，原来已经被挂起的生成器（函数）又被唤醒，开始执行n = (yield n)，也就是讲send()方法发送的值返回。这就是在运行后能够为生成器提供值的含义。

In [57]:
next(r)

由于没有传入任何值，yield返回的就只能是None，返回为空

还有两个方法：close()和throw()

* throw(type, value=None, traceback=None):用于在生成器内部（生成器的当前挂起处，或未启动时在定义处）抛出一个异常（在yield表达式中）。
* close()：调用时不用参数，用于关闭生成器。


# 上下文管理器

如果要打开文件，一种比较好的方法使使用with语句，因为这种方法，不仅结构简单，更重要的是不用再单独去判断某种异常情况，也不用专门去执行文件关闭的指令了。

上下文管理

如果把它作为一个概念来阐述，似乎有点多余，因为从字面上也可以有一丝的体会，但是，我要说的是，那点直觉的体会不一定等于理性的严格定义，特别是周遭事物越来越复杂的时候。

“上下文”的英文是context，在网上检索了一下关于“上下文”的说法，发现没有什么严格的定义，另外，不同的语言环境，对“上下文管理”有不同的说法。根据我个人的经验和能看到的某些资料，我以为可以把“上下文”理解为某一些语句构成的一个环境（也可以说使代码块），所谓“管理”就是要在这个环境中做一些事情，做什么事情呢？就Python而言，是要将前面某个语句（“上文”）干的事情独立成为对象，然后在后面（“下文”）中使用这个对象来做事情。

上下文管理协议

英文是Context Management Protocol，既然使协议，就应该是包含某些方法的东西，大家都按照这个去做（协商好了的东西）。Python中的上下文管理协议中必须包含\__enter__()和\__exit__()两个方法。

看这个两个方法的名字，估计读者也能领悟一二了（名字不是随便取的，这个某个岛国取名字的方法不同，当然，现在人家也不是随便取了）。

上下文管理器

网上能够找到的最通常的说法是：上下文管理器使支持上下文管理协议的对象，这种对象实现了\__enter__()和\__exit__()方法。

这个简洁而准确的定义，一般情况下一些高手使理解了。如果读者有疑惑，就说明...，我还是要把一个高雅的定义通俗化更好一些。

在Python中，下面的语句，也存在上下文，但它们使一气呵成执行的。

In [58]:
f = open("a.txt","w")
f.write("hello")
f.write("python")
f.close()

在这个示例中，当f = open("a.txt", "w")之后，其实这句话并没有如同前面的示例中那样被“遗忘”，它是让计算机运行到一种状态——文件始终处于打开状态——然后在这种状态中进行后面的操作，直到f.close()为止，这种状态才结束。

在这种情况下，我们就可以使用“上下文管理器”（英文：Context Manager），用它来获得“上文”状态对象，然后在“下文”使用它，并在整个过程执行完毕来收场。

更Python一点的说法，可以说是在某任务执行之初，上下文管理器做好执行准备，当任务（代码块）执行完毕或者中间出现了异常，上下文管理器负责结束工作。

这么好的一个东西，是Python2.5以后才进来的。

## 必要性

刚才那个向文件中写入hello和python两个单词的示例，如果你觉得在工程中也可以这样做，就大错特错了。因为它存在隐含的问题，比如在写入了hello之后，不知道什么原因，后面的python不能写入了，最能说服你的是恰好遇到了“磁盘已满”——虽然这种情况的概率可能比抓奖券还还小，但作为严禁的程序员，使必须要考虑的，这也是程序复杂之原因，这时候后面的操作就出现了异常，无法执行，文件也不能close。解决这个问题的方法使用try ... finally ...语句，读者一定能写出来。

不错，的确解决了。

问题继续，如果要从一个文件读内容，写入到另外一个文件中

In [61]:
f = open("23501.txt","w")
f.write("hello laoqi\n")
f.write("www.itdiffer.com")
f.close()

In [63]:
# !/usr/bin/env python
# coding=utf-8

read_file = open("23501.txt")
write_file = open("23502.txt", "w")

try:
    r = read_file.readlines()
    for line in r:
        write_file.write(line)
finally:
    read_file.close()
    write_file.close()

In [64]:
cat 23501.txt

hello laoqi
www.itdiffer.com

In [65]:
with open("23501.txt") as read_file, open("23503.txt", "w") as write_file:
    for line in read_file.readlines():
        write_file.write(line)

可见上下文管理器是必要的，因为它让代码优雅了，当然优雅只是表象，还有更深层次的含义

## 更深入

前面已经说了，上下文管理器执行了\__enter__()和\__exit__()方法，可是在with语句中哪里看到了这两个方法呢？

为了解把这个问题解释清楚，需要先做点别的操作，虽然工程中一般不需要做。

In [66]:
#!/usr/bin/env python
# coding=utf-8

class ContextManagerOpenDemo(object):
    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        print("Starting the Manager.")
        self.open_file = open(self.filename, self.mode)
        return self.open_file

    def __exit__(self, *others):
        self.open_file.close()
        print("Exiting the Manager.")

with ContextManagerOpenDemo("23501.txt", 'r') as reader:
    print("In the Manager.")
    for line in reader:
        print(line)

Starting the Manager.
In the Manager.
hello laoqi

www.itdiffer.com
Exiting the Manager.


我们写了一个类ContextManagerOpenDemo()，你就把它理解为我自己写的Open()吧，当然使最简版本了。在这个类中，\__enter__()方法和\__exit__()方法都比较简单，就是要检测是否执行该方法。

然后用with语句来执行，目的是按照“上下文管理器”的解释那样，应该首先执行类中的\__enter__()方法，它总是在进入代码块前被调用的，接着就执行代码块——with语句下面的内容，当代码块执行完毕，离开的时候又调用类中的\__exit__()。

这段代码的意图主要是：

* 通过\__init__()能够读入文件名和打开模式，以使得看起来更接近open()；
* 当进入语句块时，先执行\__enter__()方法，把文件打开，并返回该文件对象；
* 执行代码块内容，打印文件内容；
* 离开代码块的时候，执行\__exit__()方法，关闭文件。

In [67]:
#!/usr/bin/env python
# coding=utf-8

class ContextManagerOpenDemo(object):
    def __init__(self, filename, mode):
        self.filename = filename
        self.mode = mode

    def __enter__(self):
        print("Starting the Manager.")
        self.open_file = open(self.filename, self.mode)
        return self.open_file

#     def __exit__(self, *others):
#         self.open_file.close()
#         print("Exiting the Manager.")
   
    def __exit__(self, exc_type, exc_value, exc_traceback):
        return False

with ContextManagerOpenDemo("23501.txt", 'r') as reader:
    print("In the Manager.")
    for line in reader:
        print(line)

Starting the Manager.
In the Manager.
hello laoqi

www.itdiffer.com


当代码块出现异常，则由\__exit__()负责善后清理，如果返回False，如上面的示例，则异常让with之外的语句逻辑来处理，这是通常使用的方法；如果返回True，意味着不对异常进行处理。

从上面我们自己写的类和方法中，已经了解了上下文管理器的运行原理了。那么，open()跟它有什么关系吗？

为了能清楚地查看，我们需要建立一个文件对象，并且使用dir()来看看是否有我们所期盼的东西。

In [68]:
f = open("a.txt")
dir(f)

['_CHUNK_SIZE',
 '__class__',
 '__del__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__ne__',
 '__new__',
 '__next__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '_checkClosed',
 '_checkReadable',
 '_checkSeekable',
 '_checkWritable',
 '_finalizing',
 'buffer',
 'close',
 'closed',
 'detach',
 'encoding',
 'errors',
 'fileno',
 'flush',
 'isatty',
 'line_buffering',
 'mode',
 'name',
 'newlines',
 'read',
 'readable',
 'readline',
 'readlines',
 'seek',
 'seekable',
 'tell',
 'truncate',
 'writable',
 'write',
 'writelines']

在with语句中还有一个as，虽然在上面示例中没有显示，但是一般我们还是不抛弃它的，它的作用就是将返回的对象付给一个变量，以便于以后使用。

contextlib模块

Python中的这个模块使上下文管理中非常好用的东东，这也是标准库中的一员，不需要另外安装了。

常用的是contextmanger、closing和nested。

In [69]:
import contextlib
dir(contextlib)

['AbstractContextManager',
 'ContextDecorator',
 'ExitStack',
 '_GeneratorContextManager',
 '_RedirectStream',
 '__all__',
 '__builtins__',
 '__cached__',
 '__doc__',
 '__file__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 '_collections_abc',
 'abc',
 'closing',
 'contextmanager',
 'deque',
 'redirect_stderr',
 'redirect_stdout',
 'suppress',
 'sys',
 'wraps']

contextlib.nested()

nested的汉语意思是“嵌套的，内装的”，从字面上读者也可能理解了，这个方法跟嵌套有关。前面有一个示例，是从一个文件读取，然后写入到另外一个文件。

contextlib.contextmanager

contextlib.contextmanager是一个装饰器，它作用于生成器函数（也就是带有yield的函数），一单生成器函数被装饰以后，就返回一个上下文管理器，即contextlib.contextmanager因为装饰了一个生成器函数而产生了__enter__()和__exit__()方法。