# 第四章 类与面向对象

## 4.1 对象比较:is 与 ==

In [1]:
a = [1,2,3]
b = a

In [2]:
a

[1, 2, 3]

In [3]:
b

[1, 2, 3]

In [4]:
a == b

True

In [5]:
a is b

True

In [6]:
c = list(a)

In [7]:
c

[1, 2, 3]

In [8]:
 a == c

True

In [9]:
a is c

False

## 4.2 字符串转换(每个类都需要__repr__)

In [10]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage

In [12]:
my_car = Car('red',37281)

In [13]:
print(my_car)

<__main__.Car object at 0x0000021827DC4278>


In [14]:
my_car

<__main__.Car at 0x21827dc4278>

In [15]:
print(my_car.color,my_car.mileage)

red 37281


In [17]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
    
    def __str__(self):
        return f'a {self.color} car'

In [18]:
my_car = Car('red',37281)

In [19]:
print(my_car)

a red car


In [20]:
my_car

<__main__.Car at 0x21827dc4710>

__str__是python中的一种双下滑线方法，尝试将对象转换为字符串时会调用这个方法

In [21]:
print(my_car)

a red car


In [22]:
str(my_car)

'a red car'

In [23]:
'{}'.format(my_car)

'a red car'

### 4.2.1 __str__与__repr__

In [26]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
        
    def __repr__(self):
        return '__repr__ for Car'
    def __str__(self):
        return '__str__ for Car'

In [27]:
my_car = Car('red',37281)

In [28]:
print(my_car)

__str__ for Car


In [30]:
'{}'.format(my_car)

'__str__ for Car'

In [29]:
my_car

__repr__ for Car

In [31]:
str([my_car])

'[__repr__ for Car]'

In [32]:
str(my_car)

'__str__ for Car'

In [33]:
repr(my_car)

'__repr__ for Car'

In [34]:
import datetime
today = datetime.date.today()

In [35]:
str(today)

'2019-11-18'

In [36]:
repr(today)

'datetime.date(2019, 11, 18)'

### 4.2.2 为什么每个类都需要__repr__

下面介绍如何快速高效的为自定义类添加基本的字符转换功能

In [50]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
    def __repr__(self):
        return f'Car({self.color!r},{self.mileage!r})'

In [42]:
def __repr__(self):
    return (f'{self.__class__.__name__}('
            f'{self.color!r},{self.mileage!r})')

In [47]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
    def __repr__(self):
        return (f'{self.__class__.__name__}('
            f'{self.color!r},{self.mileage!r})')

In [48]:
my_car = Car('red','37281')

In [49]:
repr(my_car)

"Car('red','37281')"

In [52]:
print(my_car)

Car('red','37281')


In [53]:
str(my_car)

"Car('red','37281')"

In [1]:
class Car:
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
    def __repr__(self):
        return (f'{self.__class__.__name__}('
                f'{self.color!r},{self.mileage!r})')
    def __str__(self):
        return f'a {self.color} car'

### 4.2.3 python2.x的差异：__unicode__

In [3]:
def __str__(self):
    return unicode(self).encode('utf-8')

In [4]:
class Car(object):
    def __init__(self,color,mileage):
        self.color = color
        self.mileage = mileage
        
    def __repr__(self):
        return '{}({!r},{!r})'.format(self.__class__.__name__,self.color,self.mileage)
    def __str__(self):
        return unicode(self).encode('utf-8')

### 4.2.4 关键要点 

 使用__str__和__repr__双下划线方法能够自行控制类中的字符串转换。  __str__的结果应该是可读的。__repr__的结果应该是无歧义的。  总是为类添加__repr__。__str__默认情况下会调用__repr__。  在 Python 2中使用__unicode__而不是__str__。 

## 4.3 定义自己的异常类 

定义自己的错误类型有 很多好处，比如可以清楚地显示出潜在的错误，让函数和模块更具可维护性。自定义错误类型还 可用来提供额外的调试信息。 

这些特性都有助于改进 Python 代码，使其更易于理解、调试和维护。下面通过几个例子循 序渐进地轻松学习定义自己的异常类。本节将逐个介绍其中必须掌握的要点。 
假设需要对应用程序中表示人名的输入字符串进行验证，你编写了下面这个简单的人名验证 函数

In [1]:
def validate(name):
    if len(name) < 10:
        return ValueError

不过使用像 ValueError 这样的“高级”泛型异常类有一个缺点。假设函数是其他库的一 部分，同事在不了解其内部实现的情况下直接使用。那么在名字验证失败时，栈调试回溯中的内 容会如下所示： 

In [2]:
validate('joe')

ValueError

这个栈回溯用处不大。虽然知道出了问题，并且问题与某种“错误的值”有关，但为了解决 问题，同事肯定会查看 validate()的实现。但阅读代码需要时间，而且通常会耗费很长时间。
 

幸运的是还有更好的办法，即引入自定义异常类型来表示名字验证失败。下面将基于 Python 的内置 ValueError 创建新的异常类，但用更显式的名称来说明问题： 

In [3]:
class NameTooShortError(ValueError):
    pass
def validate(name):
    if len(name) < 10:
        return NameTooShortError(name)

现在有了能够“顾名思义”的 NameTooShortError 异常类型，它扩展自内置的 ValueError 类。一般情况下自定义异常都是派生自 Exception 这个异常基类或其他内置的 Python异常，如 ValueError 或 TypeError——取决于哪个更合适。

另外，注意在 validate 函数中实例化自定义异常时，将 name 变量传递给了构造函数，这 样能为他人提供更好的栈回溯内容： 

In [4]:
validate('jane')

__main__.NameTooShortError('jane')

下面为一个模块或包中的所有异常创建自定义的异常层次结构。第一步是声明一个基类，其 他所有的具体错误都会继承这个类： 

In [5]:
class BaseValidationError(ValueError):
    pass

所有的“实际”错误类都可以从这个错误基类派生出来，从而组成一个优雅且整洁的异常层 次结构： 


In [6]:
class NameTooShortError(BaseValidationError):
    pass

In [7]:
class NameTooLongError(BaseValidationError):
    pass

In [8]:
class NameTooCuteError(BaseValidationError):
    pass

这样用户就可以编写 try...except 语句来处理软件包中所有的自定义错误，无须手动捕 获各个具体的异常： 

In [9]:
try:
    validate(name)
except BaseValidationError as err:
    handle_validation_error(err)

NameError: name 'name' is not defined

## 4.4 克隆对象
 

Python中的赋值语句不会创建对象的副本，而只是将名称绑定到对象上。对于不可变对象也 是如此。 

但为了处理可变对象或可变对象集合，需要一种方法来创建这些对象的“真实副本”或“克 隆体”

从本质上讲，你有时需要用到对象的副本，以便修改副本时不会改动本体。本节将介绍如何 在 Python中复制或“克隆”对象，以及相关的注意事项。 

1 
2 
3 
4 
5 
9 
6 
7 
8 
先来看如何复制 Python 的内置容器（collection）。①Python 的内置可变容器，如列表、字典 和集合，调用对应的工厂函数就能完成复制： 

但用这种方法无法复制自定义对象，且重要的是这种方法只创建浅副本。对于像列表、字 典和集合这样的复合对象，浅复制和深复制之间有下面这一个重要区别。 

浅复制是指构建一个新的容器对象，然后填充原对象中子对象的引用。本质上浅复制只执行 一层，复制过程不会递归，因此不会创建子对象的副本。 

深复制是递归复制，首先构造一个新的容器对象，然后递归地填充原始对象中子对象的副本。 这种方式会遍历整个对象树，以此来创建原对象及其所有子项的完全独立的副本

### 4.4.1 制作浅副本 

下面的例子中将创建一个新的嵌套列表，然后用 list()工厂函数浅复制： 

In [31]:
xs = [[1,2,3],[4,5,6],[7,8,9]]

In [32]:
ys = list(xs) #制作一个浅副本

这意味着 ys 现在是一个新的独立对象，与 xs 具有相同的内容。查看这两个对象来确认一下：


In [33]:
xs 

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [34]:
ys

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

为了确认 ys 真的与原对象互相独立，我们来设计一个小实验。先尝试向原对象（xs）添加 一个新列表，然后查看这个改动是否影响了副本（ys）： 

In [35]:
xs.append(['new sublist'])

In [36]:
xs

[[1, 2, 3], [4, 5, 6], [7, 8, 9], ['new sublist']]

In [37]:
ys

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

从中可以看到，结果符合预期。修改浅复制的列表完全不会影响副本。 

但由于前面只创建了原列表的浅副本，所以 ys 仍然含有 xs 子对象的引用

这些子对象没有复制，只是在 ys 中再次引用。 

因此在修改 xs 中的子对象时，这些改动也会反映在 ys 中——因为两个列表共享相同的子 对象。这个副本是仅含有一层的浅复制： 

In [38]:
xs[1][0] = 'x'

In [39]:
xs

[[1, 2, 3], ['x', 5, 6], [7, 8, 9], ['new sublist']]

In [40]:
ys

[[1, 2, 3], ['x', 5, 6], [7, 8, 9]]

在上面的例子中，看上去只是修改了 xs。但事实证明，xs 和 ys 中的索引 1处的子列表都 被修改了。再次提醒，发生这种情况是因为前面只创建了原始列表的浅副本。 

如果在第一步中创建的是 xs 的深副本，那么这两个对象会互相完全独立。这就是对象的浅 副本和深副本之间的实际区别。 

现在你了解了如何创建一些内置容器类的浅副本，并且知道了浅复制和深复制之间的区别， 剩下的问题如下。 
 如何创建内置容器的深副本？  如何创建任意对象（包括自定义类）的浅副本和深副本？ 

解决这些问题需要用到 Python标准库中的 copy 模块。该模块提供了一个简单接口来创建任 意 Python对象的浅副本和深副本。 

### 4.4.2 制作深副本 

修改前面的列表复制示例，这次使用 copy 模块中定义的 deepcopy()函数创建深副本： 

In [41]:
import copy

In [42]:
xs = [[1,2,3],[4,5,6],[7,8,9]]

In [43]:
zs = copy.deepcopy(xs)

In [44]:
xs

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

In [45]:
zs

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

但如果修改原对象（xs）中的某个子对象，则会发现这些修改不会影响深副本（zs）。 
现在原对象和副本是完全独立的。复制过程中递归复制了 xs，包括它的所有子对象： 

In [46]:
xs[1][0] = 'x'

In [47]:
xs

[[1, 2, 3], ['x', 5, 6], [7, 8, 9]]

In [48]:
zs

[[1, 2, 3], [4, 5, 6], [7, 8, 9]]

顺便说一句，还可以使用 copy 模块中的一个函数来创建浅副本。copy.copy()函数会创建 对象的浅副本。 

在代码中，copy.copy()可以清楚地表明这里创建的是浅副本。但对于内置容器，只需要 使用 list、dict 和 set 这样的工厂函数就能创建浅副本，这种方式更具 Python特色.

### 4.4.3 复制任意对象 

还有一个问题是，如何创建任意对象（包括自定义类）的浅副本和深副本，下面就来看看。
 
还是要用到copy模块，其中的copy.copy()和copy.deepcopy()函数可以复制任何对象。
 
同样，理解其工作方式的好方法是进行简单的实验。基于之前的列表复制示例，首先定义 一个简单的 2D点类： 

In [51]:
class Point:
    def __init__(self,x,y):
        self.x = x
        self.y = y
    def __repr__(self):
        return f'Point({self.x!r},{self.y!r})'

这个类很简单，其中实现了__repr__()以便轻松地在 Python 解释器中查看从此类创建的 对象。

In [52]:
a = Point(23,42)
b = copy.copy(a)

In [53]:
a

Point(23,42)

In [54]:
b

Point(23,42)

In [55]:
a is b

False

还有一点需要记住，由于的点对象使用不可变类型（int）作为其坐标，因此在这种情况下， 浅复制和深复制之间并没有区别。不过下面会扩展这个例子。 
来看一个更复杂的例子。下面将定义另一个类来表示 2D矩形。这次将创建更复杂的对象层 次结构，矩形将使用 Point 对象来表示坐标： 

In [64]:
class Rectangle:
    def __init__(self,topleft,bottomright):
        self.topleft = topleft
        self.bottomright = bottomright
    def __repr__(self):
        return (f'Rectangle({self.topleft!r},'
                f'{self.bottomright!r})')

同样，首先尝试创建一个矩形实例的浅副本： 

In [65]:
rect = Rectangle(Point(0,1),Point(5,6))

In [66]:
srect = copy.copy(rect)

In [67]:
rect

Rectangle(Point(0,1),Point(5,6))

In [68]:
rect is srect

False

还记得前面关于列表的示例中是如何查看浅副本和深副本之间的区别吗？这里将使用相同 的方法，在对象层次结构中修改位于内部的对象，然后在（浅）副本中查看相关改动： 

In [69]:
rect.topleft.x= 999

In [70]:
rect

Rectangle(Point(999,1),Point(5,6))

In [71]:
srect

Rectangle(Point(999,1),Point(5,6))

希望这和你的期望一致。接着将创建原矩形的深副本并再次修改，观察哪些对象受到影响：
 

In [72]:
drect = copy.deepcopy(srect)

In [73]:
drect.topleft.x = 222

In [74]:
drect

Rectangle(Point(222,1),Point(5,6))

In [75]:
rect

Rectangle(Point(999,1),Point(5,6))

In [76]:
srect

Rectangle(Point(999,1),Point(5,6))

看吧！这次深副本（drect）完全独立于原对象（rect）和浅副本（srect）。 

到这里已经介绍了很多内容，但关于对象的复制还有许多细节。 
这个主题值得深入研究，因此你可能需要研究 copy 模块的文档①，甚至可能需要深入研究 copy 模块的源码②。例如，对象可以通过定义特殊方法__copy__()和__deepcopy__()来控制 它们的复制方式。玩得开心！

4.4.4 关键要点  创建的浅副本不会克隆子对象，因此副本和原对象并不完全独立。  对象的深副本将递归克隆子对象。副本完全独立于原对象，但创建深副本的速度较慢。  使用 copy 模块可以复制任意对象（包括自定义类）。 

## 4.5 用抽象基类避免继承错误 

抽象基类（abstract base class，ABC）用来确保派生类实现了基类中的特定方法。本节将学 习其优点以及如何使用 Python内置的 abc 模块来定义抽象基类。

我们有一个 BaseService 类定义了一个通用接口和几个具体的实现。这些具体的实现 （MockService 和 RealService 等）各自做不同的事情，但都提供了相同的接口。明确一下这 种关系：所有这些具体实现都是 BaseService 的子类。 

为了使这些代码尽可能易于维护和方便程序员使用，我们希望确保以下几点： 
 无法实例化基类；  如果忘记在其中一个子类中实现接口方法，那么要尽早报错。 

什么要使用 Python的 abc 模块来解决这个问题？上述设计在复杂的系统中很常见，为了强 制派生类实现基类中的许多方法，通常使用如下 Python惯用法： 

In [77]:
class Base:
    def foo(self):
        raise NotImplementedError()
    def bar(self):
        raise NotImplementedError()

In [78]:
class Concrete(Base):
    def foo(self):
        return 'foo() called'
    #忘记重载bar()了...
    #def bar(self):
     #   return "bar() called"

第一次尝试解决问题时，会发现在 Base 的实例上调用方法能正确引发 NotImplementedError 异常：

In [79]:
b = Base()

In [80]:
b.foo()

NotImplementedError: 

此外，Concrete 类也能正确地实例化和使用。如果在其实例上调用未实现的方法 bar()也 会引发异常： 

In [82]:
c = Concrete()
c.foo()

'foo() called'

In [83]:
c.bar()

NotImplementedError: 

第一个实现还不错，但不够完美，有以下缺点可以改进：  实例化 Base 时没有报错；  提供了不完整的子类，即实例化 Concrete 并不会报错，只有在调用缺失的 bar()方法 时才报错。 

使用自 Python 2.6添加的 abc 模块①可以更好地解决剩下的这些问题。下面这个改进版使用 abc 模块定义了抽象基类： 

In [85]:
from abc import ABCMeta,abstractmethod

class Base(metaclass = ABCMeta):
    @abstractmethod
    def foo(self):
        pass
    @abstractmethod
    def bar(self):
        pass

class Concrete(Base):
    def foo(self):
        pass

这种方式仍然能按预期运行并正确地创建类层次结构： 

In [86]:
assert issubclass(Concrete, Base) 

这么做有额外的好处。如果忘记实现某个抽象方法，实例化 Base 的子类时会引发 TypeError。引发的异常会告诉我们缺少哪些方法

In [87]:
c = Concrete()

TypeError: Can't instantiate abstract class Concrete with abstract methods bar

不用 abc 模块的话，如果缺失某个方法，则只有在实际调用这个方法时才会抛出 NotImple- mentedError。在实例化时就告知缺少某个方法的好处很多，这样更难编写出无效的子类。如 果你正在编写新的代码可能还体会不到，但几周或几个月后就会感觉到这个优点了。 

## 4.6 namedtuple的优点 

Python有专门的 namedtuple容器类型，但似乎没有得到应有的重视。这是 Python中那些缺 乏关注但又令人惊叹的特性之一。 

利用 namedtuple 可以手动定义类（class），除此之外，本节还会介绍 namedtuple 中其他有 趣的特性。 
那么 namedtuple 是什么，有什么特别之处呢？理解 namedtuple 的一个好方法是将其视为内 置元组数据类型的扩展。 
Python的元组是用于对任意对象进行分组的简单数据结构。元组也是不可变的，创建后就不 能修改。来看一个简单的例子： 

In [88]:
tup = ('hello',object(),42)

In [89]:
tup

('hello', <object at 0x25acf105120>, 42)

In [90]:
tup[2]

42

In [91]:
tup[2] = 22

TypeError: 'tuple' object does not support item assignment

简单元组有一个缺点，那就是存储在其中的数据只能通过整数索引来访问。无法给存储在元 组中的单个属性赋予名称，因而代码的可读性不高。 

另外，元组是一种具有单例性质的数据结构，很难保证两个元组存有相同数量的字段和相同 的属性，因此很容易因为不同元组之间的字段顺序不同而引入难以意识到的 bug。 

### 4.6.1 namedtuple上场 

namedtuple旨在解决两个问题。 

首先，与普通元组一样，namedtuple是不可变容器。一旦将数据存储在 namedtuple的顶层属 性中，就不能更新属性了。namedtuple对象上的所有属性都遵循“一次写入，多次读取”的原则。
 

其次，namedtuple就是具有名称的元组。存储在其中的每个对象都可以通过唯一的（人类可 读的）标识符来访问。因此不必记住整数索引，也无须采用其他变通方法，如将整数常量定义为 索引的助记符。 

下面来看看 namedtuple： 

In [92]:
from collections import namedtuple
Car = namedtuple('Car','color mileage')

namedtuple在 Python 2.6被首次添加到标准库中。使用时需要导入 collections 模块。上 面的例子中定义了一个简单的 Car 数据类型，含有 color 和 mileage 两个字段。 

这个参数在 Python文档中被称为 typename，在调用 namedtuple 函数时作为新创建的类名称。
 

由于 namedtuple 并不知道创建的类后会赋给哪个变量，因此需要明确告诉它需要使用 的类名。namedtuple 会自动生成文档字符串和__repr__，其中的实现中会用到类名。 

在这个例子中还有另外一个奇特的语法：为什么将字段作为'color mileage'这样的字符 串整体传递？ 

答案是 namedtuple 的工厂函数会对字段名称字符串调用 split()，将其解析为字段名称列 表。分开来就是下面这两步： 

In [93]:
'color mileage'.split()

['color', 'mileage']

In [94]:
Car = namedtuple('Car',['color','mileage'])

当然，如果更倾向于分开写的话，也可以直接传入带有字符串字段名称的列表。使用列表的 好处是，在需要拆分成多行时可以更轻松地重新格式化代码：

In [95]:
Car = namedtuple('Car',[
    'color',
    'mileage'
])

无论以什么方式初始化，现在都可以使用 Car 工厂函数创建新的“汽车”对象，其效果和手 动定义 Car 类并提供一个接受 color 和 mileage 值的构造函数相同：

In [96]:
my_car = Car('red','3812.4')

In [97]:
my_car.color

'red'

In [98]:
my_car.mileage

'3812.4'

除了通过标识符来访问存储在 namedtuple中的值之外，索引访问仍然可用。因此 namedtuple 可以用作普通元组的替代品： 除了通过标识符来访问存储在 namedtuple中的值之外，索引访问仍然可用。因此 namedtuple 可以用作普通元组的替代品： 

In [99]:
my_car[0]

'red'

In [100]:
my_car[1]

'3812.4'

元组解包和用于函数参数解包的*操作符也能正常工作： 

In [101]:
color,mileage = my_car

In [102]:
print(color,mileage)

red 3812.4


In [103]:
print(*my_car)

red 3812.4


自动得到的 namedtuple对象字符串形式也挺不错的，不用自己编写相关函数了： 

In [104]:
my_car

Car(color='red', mileage='3812.4')

与元组一样，namedtuple 是不可变的。试图覆盖某个字段时会得到一个 AttributeError 异常： 

In [105]:
my_car.color = 'blue'

AttributeError: can't set attribute

namedtuple对象在内部是以普通的 Python类实现的。当涉及内存使用时，namedtuple比普通 类“更好”，它和普通元组的内存占用都比较少。 

可以这么看：namedtuple适合在 Python中以节省内存的方式快速手动定义一个不可变 的类。 


### 4.6.2 子类化 namedtuple 

因为 namedtuple建立在普通 Python类之上，所以还可以向 namedtuple对象添加方法。例如， 可以像其他类一样扩展 namedtuple定义的类，为其添加方法和新属性。来看一个例子： 

In [106]:
Car = namedtuple('Car','color mileage')

In [107]:
class MyCarMethods(Car):
    def hexcolor(self):
        if self.color == 'red':
            return '#ff0000'
        else:
            return "#000000"

现在能够创建 MyCarWithMethods 对象并调用 hexcolor()方法了，就像预期的那样： 

In [108]:
c = MyCarMethods('red',1234)

In [109]:
c.hexcolor()

'#ff0000'

这种方式可能有点笨拙，但适合构建具有不可变属性的类，不过也很容易带来其他问题。 

例如，由于 namedtuple 内部的结构比较特殊，因此很难添加新的不可变字段。另外，创建 namedtuple类层次的简单方法是使用基类元组的_fields 属性： 

In [110]:
Car = namedtuple('Car','color mileage')

In [111]:
ElectricCar = namedtuple(
        'ElectricCar',Car._fields + ('charge',))

In [112]:
ElectricCar('red',1234,45.0)

ElectricCar(color='red', mileage=1234, charge=45.0)

### 4.6.3 内置的辅助方法 

除了_fields 属性，每个 namedtuple实例还提供了其他一些有用的辅助方法。这些方法都 以单下划线（_）开头。单下划线通常表示方法或属性是“私有”的，不是类或模块的稳定公共 接口的一部分。 

下面会介绍一些能用到这些 namedtuple辅助方法的情形。我们从_asdict()辅助方法开始， 该方法将 namedtuple的内容以字典形式返回： 

In [113]:
my_car._asdict()

OrderedDict([('color', 'red'), ('mileage', '3812.4')])

这样在生成 JSON输出时可以避免拼错字段名称：

In [115]:
import json

In [116]:
json.dumps(my_car._asdict())

'{"color": "red", "mileage": "3812.4"}'

另一个有用的辅助函数是_replace()。该方法用于创建一个元组的浅副本，并能够选择替 换其中的一些字段： 

In [117]:
my_car._replace(color = 'bule')

Car(color='bule', mileage='3812.4')

后介绍的是_make()类方法，用来从序列或迭代对象中创建 namedtuple的新实例： 

In [118]:
Car._make(['red',999])

Car(color='red', mileage=999)

### 4.6.4 何时使用 namedtuple 

namedtuple能够更好地组织数据的结构，让代码更整洁、更易读。 

例如，将格式固定、针对特定场景的数据类型（比如字典）替换为 namedtuple能更清楚地表 达开发者的意图。通常，当我尝试以这种方式重构时，就会神奇地为眼前的问题想出一个更好的 解决方案。 

用 namedtuple 替换非结构化的元组和字典还可以减轻同事的负担，因为 namedtuple 让数据 在传递时在某种程度上做到了自说明（self documenting）。 

另一方面，如果 namedtuple不能帮我编写更整洁、更易维护的代码，那么我会尽量避免使用。 像本书介绍的许多其他技术一样，滥用 namedtuple会带来负面影响。 
但只要仔细使用，namedtuples无疑能让 Python代码更好、更可读。 

## 4.7 类变量与实例变量的陷阱 

不仅类方法和实例方法之间有区别，Python的对象模型中类变量和实例变量也有所区别。 

这种区别非常重要，在刚接触 Python 时给我带来了不少烦恼。在很长一段时间里，我都没 有花时间从头开始理解这些概念，所以我早期面向对象的代码中充满了令人惊讶的行为和奇怪的 错误。本节将通过一些实践示例来理清曾经引起我困惑的地方。 

就像我刚刚说的那样，Python对象有两种数据属性：类变量和实例变量

类变量在类定义内部声明（但位于实例方法之外），不受任何特定类实例的束缚。类变量将 其内容存储在类本身中，从特定类创建的所有对象都可以访问同一组类变量。这意味着修改类变 量会同时影响所有对象实例。 

实例变量总是绑定到特定的对象实例。它的内容不存储在类上，而是存储在每个由类创建的 单个对象上。因此实例变量的内容与每个对象实例相关，修改实例变量只会影响对应的对象实例。
 

好吧，这些描述相当抽象，下面来看一些代码。这里继续使用老掉牙的“狗狗示例”。出于 某种原因，许多面向对象的教程总是使用汽车或宠物来举例说明，这个传统很难打破。

快乐的狗需要什么？四条腿和一个名字： 

In [119]:
class Dog:
    num_legs = 4 # <- 类变量
    def __init__(self,name):
        self.name = name# <- 实例变量

好吧，这就是用狗狗示例来描述的面向对象的形式。创建新的 Dog 实例能正常工作，并且 每个实例都会获得一个名为 name 的实例变量： 

In [122]:
jack = Dog('Jack')
jill = Dog('Jill')
jack.name,jill.name

('Jack', 'Jill')

涉及类变量时就比较灵活了，在每个 Dog 实例或类本身上可以直接访问 num_legs 类变量：
 

In [123]:
jack.num_legs,jill.num_legs

(4, 4)

In [124]:
Dog.num_legs

4

然而，如果尝试通过类访问实例变量，会失败并抛出 AttributeError。实例变量是特定 于每个对象实例的，在运行__init__构造函数时创建，并不位于类本身中。 

这就是类变量和实例变量之间的核心区别： 

In [125]:
Dog.name

AttributeError: type object 'Dog' has no attribute 'name'

好吧，到目前为止还行。 

假如有一天，一只名为 Jack的狗在吃晚餐时与微波炉靠得太近，发生变异又长出了一双腿， 那么如何在代码中表示呢？ 

第一个想法可能是简单地修改 Dog 类中的 num_legs 变量： 

In [126]:
Dog.num_legs = 6

但记住，我们不希望所有的狗都开始用六条腿四处乱跑。由于修改了类变量，因此现在把所 有的狗都变成了超级狗。这会影响到所有的狗，甚至是之前创建的狗： 

In [127]:
jack.num_legs,jill.num_legs

(6, 6)

所以这种方式不行，原因是修改类名称空间上的类变量会影响类的所有实例。现在撤销这个 对类变量的改动，而是尝试仅向 Jack添加额外两条腿： 

In [128]:
Dog.num_legs = 4

In [130]:
jack.num_legs = 6

来看看这种方式创造了什么怪物： 

In [132]:
jack.num_legs,jill.num_legs,Dog.num_legs

(6, 4, 4)

好吧，看起来“相当不错”（除了可怜的 Jack多了两条腿）。但这种改动是如何影响 Dog 对 象的呢？ 

这里的难点在于，虽然得到了想要的结果（为 Jack添加两条腿），但在 Jack实例中引入了一 个 num_legs 实例变量。而新的 num_legs 实例变量“遮盖”了相同名称的类变量，在访问对 象实例作用域时覆盖并隐藏类变量： 

In [133]:
jack.num_legs,jack.__class__.num_legs

(6, 4)

从上面可以看到，类变量没有同步更新，这是因为写入到 jack.num_legs 创建了一个与类 变量同名的实例变量。 

这不一定是坏事，重要的是要意识到背后发生的事情。在终了解 Python 中的类层面和实 例层面的作用域规则之前，很容易因为这些问题在程序中引入 bug。 

说实话，试图通过对象实例修改类变量时意外地创建了一个名称相同的实例变量，从而隐藏 了原来的类变量。这有点像是 Python中的一个 OOP陷阱。 

### 4.7.1 与狗无关的例子 

在本节的写作过程中，没有狗受到伤害（这里只是为了描述起来更加生动有趣，并不能真的 能为狗添加两条腿）。下面用一个更加实际的例子来介绍类变量的用途，在更接近实际的应用程 序中使用类变量。 

下面就来看这样一个例子，其中的 CountedObject 类记录了它在程序生命周期中实例化的 次数（实际上这可能是一个有趣的性能指标）： 

In [134]:
class CountedObject:
    num_instances = 0
    
    def __init__(self):
        self.__class__.num_instances += 1

CountedObject 保留一个用作共享计数器的 num_instances 类变量。当声明该类时，计 数器初始化为零后就不再改变了。 

每次创建此类的新实例时，会运行__init__构造函数并将共享计数器递增 1： 

In [135]:
CountedObject.num_instances

0

In [136]:
CountedObject().num_instances

1

In [137]:
CountedObject().num_instances

2

注意这段代码需要额外的__class__来确保增加的是类上的计数器变量，有时候很容易犯下 面这种错误： 

In [140]:
class BuggyCountedObject:
    num_instances = 0
    
    def __init__(self):
        self.num_instances += 1

In [141]:
 BuggyCountedObject.num_instances 

0

In [143]:
 BuggyCountedObject().num_instances 

1

In [144]:
 BuggyCountedObject().num_instances 

1

相信你现在意识到哪里出错了。这个糟糕的实现永远不会增加共享计数器，因为我犯了在前 面的 Jack 示例中已经解释的错误。这个实现不起作用，因为在构造函数中创建一个名称相同的 实例变量，意外地“遮盖”了 num_instance 类变量。 

代码先正确地计算了计数器的新值（从 0 增加到 1），然后将结果存储在实例变量中，因此 该类的其他实例看不到修改后的计数器值。 

不难看出这是一个易犯错误。在处理类上的共享状态时，应小心并仔细检查共享状态的作用 范围。自动化测试和同行评审对此有很大帮助。 
尽管类变量中有陷阱，但希望你能明白其优点以及如何在实践中使用。祝你好运！ 

### 4.7.2 关键要点 

 类变量用于类的所有实例之间共享数据。类变量属于一个类，在类的所有实例中共享， 而不是属于某个特定的实例。 

 实例变量是特定于每个实例的数据，属于单个对象实例，不与类的其他实例共享。每个 实例变量都针对特定实例单独存储了一份。 

 因为类变量可以被同名的实例变量“遮盖”，所以很容易（意外地）由于覆盖类变量而引 入 bug和奇怪的行为。 

## 4.8 实例方法、类方法和静态方法揭秘 

本节将深入探寻 Python中的类方法、静态方法和普通实例方法。 

在对这些方法之间的差异有直观的理解后，就能以面向对象的形式编写 Python 代码了，从 而更清楚地传达代码的意图，而且从长远来看代码更易维护。 

首先来编写一个类，其中包含这三种方法的简单示例（Python 3版）： 

In [145]:
class MyClass:
    def method(self):
        return 'instance method called',self
    @classmethod
    def classmethod(cls):
        return 'class method called',cls
    @staticmethod
    def staticmethod():
        return 'static method called'

Python 2用户需要注意：从 Python 2.4开始才可以使用@staticmethod 和@classmethod 装饰器，因此此后的版本才能运行这个示例。另外，还需要使用 class MyClass(object)这 种语法来声明这是继承自 object 的新式类，而不是使用普通的 class MyClass 语法。除了这 些之外就没有其他问题了。 

### 4.8.1 实例方法 

MyClass 上的第一种方法名为 method，这是一个普通的实例方法。代码中一般出现的都是 这种简单基础的实例方法。method 方法需要一个参数 self，在调用时指向 MyClass 的一个实 例。当然，实例方法可以接受多个参数。 

实例方法通过 self 参数在同一个对象上自由访问该对象的其他属性和方法，因此特别适合 修改对象的状态。 

实例方法不仅可以修改对象状态，也可以通过 self.__class__属性访问类本身。这意味 着实例方法也可以修改类的状态。 

### 4.8.2 类方法 

与第一种方法相比，第二种方法 MyClass.classmethod 使用了@classmethod 装饰器①， 将其标记为类方法。

类方法并不接受 self 参数，而是在调用方法时使用 cls 参数指向类（不是对象实例）。 

由于类方法只能访问这个 cls 参数，因此无法修改对象实例的状态，这需要用到 self。但 类方法可以修改应用于类所有实例的类状态。 

### 4.8.3 静态方法 

第三种方法 MyClass.staticmethod 使用@staticmethod 装饰器②将其标记为静态方法。
 

这种类型的方法不接受 self 或 cls 参数，但可以接受任意数量的其他参数。 

因此，静态方法不能修改对象状态或类状态，仅能访问特定的数据，主要用于声明属于某个 命名空间的方法

### 4.8.4 在实践中探寻 

到目前为止都是非常理论化的讨论，而重要的是在实践中直观地理解这些方法之间的区别， 因此这里来介绍一些具体的例子

让我们来看看调用这些方法时其各自的行为。首先创建一个类的实例，然后调用三种不同的 方法。 

MyClass 中进行了一些设置，其中每个方法的实现都会返回一个元组，包含当前方法的说 明信息和该方法可访问的类或对象的内容。 

以下是调用实例方法时的情况： 

In [146]:
obj = MyClass()
obj.method()

('instance method called', <__main__.MyClass at 0x25acfc549e8>)

调用该方法时，Python用实例对象 obj 替换 self 变量。如果不用 obj.method()这种点 号调用语法糖，手动传递实例对象也会获得相同的结果： 

In [147]:
MyClass.method(obj)

('instance method called', <__main__.MyClass at 0x25acfc549e8>)

顺便说一下，在实例方法中也可以通过 self.__class__属性访问类本身。这使得实例方 法在访问方面几乎没什么限制，可以自由修改对象实例和类本身的状态。 

接下来尝试一下类方法： 

In [148]:
obj.classmethod()

('class method called', __main__.MyClass)

现在来调用静态方法： 

In [151]:
obj.staticmethod()

'static method called'

注意到没有，在对象上可以调用 staticmethod()。有些开发人员在得知可以在对象实例 上调用静态方法时会感到惊讶。 

从实现上来说，Python在使用点语法调用静态方法时不会传入 self 或 cls 参数，从而限制 了静态方法访问的内容。 

这意味着静态方法既不能访问对象实例状态，也不能访问类的状态。静态方法与普通函数一 样，但属于类（和每个实例）的名称空间。 

现在不创建对象实例，看看在类本身上调用静态方法时会发生什么： 

In [152]:
MyClass.classmethod()

('class method called', __main__.MyClass)

In [153]:
MyClass.staticmethod()

'static method called'

In [154]:
MyClass.method()

TypeError: method() missing 1 required positional argument: 'self'

调用 classmethod()和 staticmethod()没有问题，但试图调用实例方法 method()会失 败并出现 TypeError。 

这是预料之中的。由于没有创建对象实例，而是直接在类蓝图（blueprint）上调用实例方 法，意味着 Python无法填充 self 参数，因此调用实例方法 method 会失败并抛出 TypeError 异常。 

通过这些实验，你应该更清楚这三种方法类型之间的区别了。别担心，现在还不会结束这个 话题。在接下来的两节中，还将用两个更接近实际的例子来使用这些特殊方法。 

下面以前面的例子为基础，创建一个简单的 Pizza 类： 

In [156]:
class Pizza:
    def __init__(self,ingredients):
        self.ingredients = ingredients
    def __repr__(self):
        return f'Pizza({self.ingredients!r})'

In [157]:
Pizza(['cheese','tomatoes'])

Pizza(['cheese', 'tomatoes'])

### 4.8.5 使用@classmethod 的 Pizza 工厂类 

如果你在现实世界中吃过比萨，那么就会知道比萨有很多种口味可供选择： 

In [158]:
Pizza(['mozzarella', 'tomatoes'])
Pizza(['mozzarella', 'tomatoes', 'ham', 'mushrooms'])
Pizza(['mozzarella'] * 4) 

Pizza(['mozzarella', 'mozzarella', 'mozzarella', 'mozzarella'])

几个世纪以前，意大利人就对比萨进行了分类，所以这些美味的比萨饼都有自己的名字。下 面根据这个特性为 Pizza 类提供更好的接口，让用户能创建所需的比萨对象。 
使用类方法作为工厂函数①能够简单方便地创建不同种类的比萨： 

In [164]:
class Pizza:
    def __init__(self,ingredients):
        self.ingredients = ingredients
    def __repr__(self):
        return f'Pizza({self.ingredients!r})'
    @classmethod
    def margherita(cls):
        return cls(['mozzarella','tomatoes'])
    @classmethod
    def prosciutto(cls):
        return cls(['mozzarella','tomatoes','hm'])

注意我们在 margherita 和 prosciutto 工厂方法中使用了 cls 参数，而没有直接调用 Pizza 构造函数。 


这个技巧遵循了“不要重复自己”（DRY）②原则。如果打算在将来重命名这个类，就不必更 新所有工厂函数中的构造函数名称。 

那么这些工厂方法能做什么？来尝试一下： 

In [165]:
Pizza.margherita()

Pizza(['mozzarella', 'tomatoes'])

In [166]:
Pizza.prosciutto()

Pizza(['mozzarella', 'tomatoes', 'hm'])

从中可以看到，工厂函数创建的新 Pizza 对象按照期望的方式进行了配置，这些函数在内 部都使用相同的__init__构造函数，作为一种快捷的方式来记录不同的配方。 

从另一个角度来说，这些类方法为类定义了额外的构造函数。 

Python 只允许每个类有一个__init__方法。使用类方法可以按需添加额外的构造函数，使 得类的接口在一定程度上能做到“自说明”，同时简化了类的使用。 

### 4.8.6 什么时候使用静态方法 

为这个主题提供一个好例子有点难，所以继续使用前面的比萨例子，把比萨烤得越来越 薄……（要流口水了！） 

下面是我想到的： 

In [167]:
import math

In [168]:
class Pizza:
    def __init__(self,radius,ingredients):
        self.radius = radius
        self.ingredients = ingredients
    def __repr__(self):
        return (f'Pizza({self.radius!r},'
                f'{self.ingredients!r})')
    def area(self):
        return self.circle_area(self.radius)
    @staticmethod
    def circle_area(r):
        return r**2*math.pi

这里做了哪些改动呢？ 

其次，添加了一个 area()实例方法用于计算并返回比萨的面积。虽然这里更适合使用 @property 装饰器，不过对于这个简单的示例来说，那么做的话就有些大动干戈了。 

area()并没有直接计算面积，而是调用 circle_area()静态方法，后者使用众所周知的圆 面积公式来计算。 

In [169]:
 p = Pizza(4, ['mozzarella', 'tomatoes']) 

In [170]:
p

Pizza(4,['mozzarella', 'tomatoes'])

In [171]:
p.area()

50.26548245743669

In [172]:
Pizza.circle_area(4)

50.26548245743669

In [173]:
p.circle_area(4)

50.26548245743669

之前已经介绍了，静态方法不能访问类或实例的状态，因为静态方法不会接受 cls 或 self 参数。这是一个很大的局限性，但也很好地表明了静态方法与类的其他所有内容都无关。 

1 
2 
3 
4 
5 
9 
6 
7 
8 
在上面的例子中，很明显 circle_area()不能以任何方式修改类或类实例。（当然，你可以 用全局变量来解决这个问题，不过这不是重点。） 

### 4.8.7 关键要点 

 实例方法需要一个类实例，可以通过 self 访问实例

 类方法不需要类实例，不能访问实例（self），但可以通过 cls 访问类本身。 

 静态方法不能访问 cls 或 self，其作用和普通函数相同，但属于类的名称空间。 

 静态方法和类方法能（在一定程度上）展示和贯彻开发人员对类的设计意图，有助于代 码维护。 