虽然我们已经使用了 Python 的一些面向对象特性，但前两章的程序还算不上真正的面向对象，因为它们没有体现用户自定义类型之间的关联，以及操作它们的函数。下一步是将那些函数转换为方法，让这种关联更加明显。

## 面向对象特性

Python 是一门 **面向对象编程语言**，它提供了一些面向对象的编程的语言特性，这些特性有如下明确的特征:

* 程序包括类定义和方法定义
* 大部分计算都通过对象的操作来表达
* 每个对象定义对应真实世界的某些对象或概念，而方法则对应真实世界中对象之间交互的方式。

例如，上一章中定义的 `Time` 类对应于人们记录一天中的时间的方式，而其中我们定义的函数对应于人们平时处理时间所做的事情。类似地，`Point` 和 `Rectangle` 类对应于数学中点和矩形的概念。

目前为止，我们还没有利用上 Python 所提供的面向对象编程特性。严格地说，这些特性并不是必需的; 它们中大部分都是我们已经做过的事情的另一种选择方案。但在很多情况下，这种方案更简洁，更能准确地表达程序的结构。

在上一章，我们写了 `add_times`,`increment` 等函数，这些函数都是围绕 `Time` 对象来写的，每个函数都至少接收一个 `Time` 对象作为参数。

这种现象就是 **方法** 的由来。**一个方法即是和某个特定类相关联的函数**。我们已经见过字符串,列表,字典和元组的方法。本章中，我们会为用户定义类型定义方法。

方法和函数在语义上是一样的，但在语法上有两个区别。

* 方法定义写在类定义之中，更明确的表示类和方法的关联
* 调用方法和调用函数的语法形式不同

在接下来几节，我们会将前两章中定义的函数转换为方法。这种转换是纯机械式的，可以依照一些列步骤完成它。如果你能够轻松地在方法和函数之间转换，也就能够在任何情况下选择最适合的形式了。

## 打印对象

上一章写过一个名为 `print_time` 的函数:

In [55]:
class Time:
    '''
    表示一天中的时间
    '''
    
def print_time(time):
    print('%.2d:%.2d:%.2d'%(time.hour,time.minute,time.second))

要调用这个函数，需要传入一个 `Time` 对象作为实参:

In [56]:
start = Time()
start.hour = 9
start.minute = 45
start.second = 0
print_time(start)

09:45:00


要把 `print_time` 转换为方法，只需要将函数定义移动到类定义中即可。注意缩进的改变。

In [57]:
class Time:
    def print_time(time):
        print('%.2d:%.2d:%.2d'%(time.hour,time.minute,time.second))

现在有两种方式可以调用 `print_time`。第一种方式是使用函数调用语法，这种语法不太常用:

In [58]:
start = Time()
start.hour = 9
start.minute = 45
start.second = 0
Time.print_time(start)

09:45:00


在这里的点表示法中，`Time` 是类的名称，而 `print_time` 是方法的名称。`start` 是作为参数传入的。

另一种方式是使用方法调用语法:

In [59]:
start.print_time()

09:45:00


在这里的点表示法中，`print_time` 是方法的名称，而 `start` 是调用这个方法的对象，也称为**主体(subject)**。和一句话中主语用来表示这句话是关于什么东西的一样，方法调用的主题表示这个方法是关于哪个对象的。

在方法中，主体会被赋值给第一个形参，所以本例中 `start` 被赋值给 `time `。

依惯例来，方法的第一个形参通常叫做 `self`，所以 `print_time` 通常被写成如下形式:

In [60]:
class Time:
    def print_time(self):
        print('%.2d:%.2d:%.2d'%(time.hour,time.minute,time.second)) 

这种惯例的原因是一个隐喻:

* 函数调用的语法 `print_time(start)` 暗示函数是活动主体。
* 在面向对象编程中，对象是活动主体。

这种方式是否有用还不明显。在已经见过的例子中，它也许没有更有用。但有时候将函数的责任转到对象上，使我们能够编写功能更丰富的函数或方法，也使代码的维护和复用更容易。

## 另一个示例

下面是函数 `increment` 的另一个重写成了方法的版本:

In [11]:
def int_to_time(seconds):
    time = Time()
    minutes, time.second = divmod(seconds,60)
    time.hour,time.minute = divmod(minutes,60)
    return time

class Time:
    def print_time(self):
        print('%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second))     
    
    def increment(self,seconds):
        seconds += self.time_to_int()
        return int_to_time(seconds)
    
    def time_to_int(self):
        minutes = self.hour*60 + self.minute
        seconds = minutes*60 + self.second
        return seconds
    

这里的`increment` 是一个纯函数。给出调用 `increment` 的方式:

In [71]:
start = Time()
start.hour = 9
start.minute = 45
start.second = 0
start.print_time()

09:45:00


In [72]:
end = start.increment(1337)
end.print_time()

10:07:17


这种机制有时也会带来困惑，尤其在当程序出错的时候。例如，如果使用两个实参调用 `increment`，则会得到:

In [73]:
end = start.increment(1337,460)

TypeError: increment() takes 2 positional arguments but 3 were given

错误信息初看似乎很令人困惑，因为括号里只有两个实参。但调用的主题也被看作一个实参，所以其实总共有 3 个。

另外，**按位实参(positional argument)** 指的是没有指定名称的实参，也就是说，它不是一个**关键词实参**。在下面这个函数调用中，`parrot` 和 `cage` 是按位实参，而 `dead` 是一个关键词实参:

```python
sketch(parrot,cage,dead = True)
```

## 一个更复杂的示例

重写函数 `is_after` 稍微复杂一些，因为它接收两个 `Time` 对象作为形参。这种情形下，依惯例，第一个形参命名为 `self`，而第二个形参命名为 `other`:

In [74]:
class Time:
    def print_time(self):
        print('%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second))     
    
    def increment(self,seconds):
        seconds += self.time_to_int()
        return int_to_time(seconds)
    
    def time_to_int(self):
        minutes = self.hour*60 + self.minute
        seconds = minutes*60 + self.second
        return seconds
    
    def is_after(self,other):
        return self.time_to_int() > other.time_to_int()

要使用这个方法，需要在一个对象上调用它，并传入另一个对象作为实参:

In [75]:
start = Time()
start.hour = 9
start.minute = 45
start.second = 0

end = start.increment(1337)
end.is_after(start)

True

这种语法的一个好处是，阅读起来几乎和英语一样:"end is after start?"

## init 方法

`init` 方法(即 "initialization" 的简写，意思是初始化)是一个特殊方法，当对象初始化时会被调用。它的全名是 `__init__`。`Time` 类的 `init` 方法可能如下所示:

In [3]:
class Time:
    '''
    表示一天中的时间
    '''
    def __init__(self,hour=0,minute=0,second=0):
        self.hour = hour
        self.minute = minute
        self.second = second
        
    def print_time(self):
        print('%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second)) 

`__init__` 的形参和类的属性名称常常是相同的。语句

```python
self.hour = hour
```

将形参 `hour` 的值存储为 `self` 的一个属性。

形参是可选的，所以当你不使用任何实参调用 `Time` 时，会得到默认值:

In [4]:
time = Time()
time.print_time()

00:00:00


如果提供 1 个实参，它会覆盖 `hour`:

In [5]:
time = Time(9)
time.print_time()

09:00:00


如果提供 2 个实参，它会覆盖 `hour` 和 `minute`:

In [6]:
time = Time(9,45)
time.print_time()

09:45:00


如果提供 3 个实参，它们会覆盖全部 3 个默认值。

## `__str__` 方法

`__str__` 和 `__init__` 类似，是一个特殊方法，它用来返回对象的字符串表达形式。

例如，下面是一个 `Time` 对象的 `str` 方法:

In [7]:
class Time:
    '''
    表示一天中的时间
    '''
    def __init__(self,hour=0,minute=0,second=0):
        self.hour = hour
        self.minute = minute
        self.second = second
        
    def __str__(self):
        return '%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second) 

当打印对象时，Python 会调用 `str` 方法。

In [8]:
time = Time(9,45)
print(time)

09:45:00


当编写一个新类时，我们一般首先要写 `__init__`，以便初始化对象，然后视情况可以写 `__str__`，以便调试。

## 操作符重载

通过定义其他的特殊方法，你可以为用户定义类型的各种操作符指定行为。例如，如果你为 `Time` 类定义一个 `__add__` 方法，则可以在 `Time` 对象上使用 `+` 操作符。给出这个方法的定义:

In [12]:
class Time:
    '''
    表示一天中的时间
    '''
    def __init__(self,hour=0,minute=0,second=0):
        self.hour = hour
        self.minute = minute
        self.second = second
        
    def __str__(self):
        return '%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second)
    
    def __add__(self,other):
        seconds = self.time_to_int() + other.time_to_int()
        return int_to_time(seconds)

    def time_to_int(self):
        minutes = self.hour*60 + self.minute
        seconds = minutes*60 + self.second
        return seconds

下面是如何使用它:

In [13]:
start = Time(9,45)
duration = Time(1,35)
print(start+duration)

11:20:00


当对 `Time` 对象应用 `+` 操作符时，Python 会调用 `__add__`。当打印结果时，Python 会调用 `__str__`。幕后其实发生了很多事情。

修改操作符的行为以便它能够作用于用户定义类型，这个过程称为 **操作符重载**。对每一个操作符，Python 都提供了一个对应的特殊方法，如 `__add__`。

## 基于类型的分发

在前面一节中我们将两个 `Time` 对象相加，但你也可能会想要将一个 `Time` 对象加上一个整数。接下来是 `__add__` 的一个版本，检查 `other` 的类型，并调用 `add_time` 或 `increment`:

In [14]:
class Time:
    '''
    表示一天中的时间
    '''
    def __init__(self,hour=0,minute=0,second=0):
        self.hour = hour
        self.minute = minute
        self.second = second
        
    def __str__(self):
        return '%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second)
    
    def __add__(self,other):
        if isinstance(other,Time):
            return self.add_time(other)
        else:
            return self.increment(other)
    
    def add_time(self,other):
        seconds = self.time_to_int() + other.time_to_int()
        return int_to_time(seconds)
    
    def increment(self,seconds):
        seconds += self.time_to_int()
        return int_to_time(seconds)

    def time_to_int(self):
        minutes = self.hour*60 + self.minute
        seconds = minutes*60 + self.second
        return seconds

内置函数 `isinstance` 接收一个值与一个类对象，并当此值是此类的一个实例时返回 `True`。

如果 `other` 是一个 `Time` 对象，`__add__` 会调用 `add_time`。否则它认为实参是整数，并调用 `increment`，这个操作称为 **基于类型的分发(type-based dispatch)**，因为它根据形参的类型，将计算分发到不同的方法上。

下面是使用不同类型的实参调用 `+` 操作符的示例:

In [15]:
start = Time(9,45)
duration = Time(1,35)
print(start + duration)

11:20:00


In [16]:
print(start+1337)

10:07:17


不过这个加法的实现并不满足交换律。如果整数是第一个操作数，则会得到:

In [17]:
print(1377+start)

TypeError: unsupported operand type(s) for +: 'int' and 'Time'

问题在于，这里和之前询问一个 `Time` 对象加上一个整数不同，Python 在询问一个整数去加上一个 `Time` 对象，而它不知道如何去做到。但这个问题也有一个聪明的解决方案:特别方法 `__radd__`，意即"右加法"(right-side add)。当 `Time` 对象出现在 `+` 号的右侧时，会调用这个方法。下面是它的定义:

In [18]:
class Time:
    '''
    表示一天中的时间
    '''
    def __init__(self,hour=0,minute=0,second=0):
        self.hour = hour
        self.minute = minute
        self.second = second
        
    def __str__(self):
        return '%.2d:%.2d:%.2d'%(self.hour,self.minute,self.second)
    
    def __add__(self,other):
        if isinstance(other,Time):
            return self.add_time(other)
        else:
            return self.increment(other)
    def __radd__(self,other):
        return self.__add__(other)
    
    def add_time(self,other):
        seconds = self.time_to_int() + other.time_to_int()
        return int_to_time(seconds)
    
    def increment(self,seconds):
        seconds += self.time_to_int()
        return int_to_time(seconds)

    def time_to_int(self):
        minutes = self.hour*60 + self.minute
        seconds = minutes*60 + self.second
        return seconds

In [19]:
start = Time(9,45)
duration = Time(1,35)
print(1337 + start)

10:07:17


## 多态

当需要时，基于类型的分发很有用，但我们并不总是需要它。通常可以编写函数处理不同类型的参数来避免它。

我们编写的很多处理字符串的函数，实际上对其他序列类型也可以用。例如，在 11.1 节中，我们使用 `histogram` 来记录单词中每个字母出现的次数:

In [20]:
def histogram(s):
    d = dict()
    for c in s:
        if c not in d:
            d[c] = 1
        else:
            d[c] = d[c]+1
    return d

这个函数对列表,元组甚至是字典都可以用，只要 `s` 的元素是可散列的，因而可以用作 `d` 的键即可:

In [21]:
t = ['spam','egg','spam','spam','bacom','spam']
histogram(t)

{'spam': 4, 'egg': 1, 'bacom': 1}

处理多个类型的函数称为 **多态(polymorphic**。多态可以促进代码复用。例如，用来计算一个序列所有元素的和的内置函数 `sum`，对所有其元素支持加法的序列都可用。

由于 `Time` 对象提供了 `add` 方法，它们也可以使用 `sum`:

In [22]:
t1 = Time(7,43)
t2 = Time(7,41)
t3 = Time(7,37)
total = sum([t1,t2,t3])
print(total)

23:01:00


总的来说，如果函数内部所有的操作都支持某种类型，那么这个函数就可以用于那种类型。

当你发现一个写好的函数，竟有出人意料的效果，可以用于没有计划过的类型时，这才是最好的多态。

## 接口和实现

面向对象设计的目标之一是提高软件的可维护性，也就是说，当系统的其他部分改变时，程序还能够保持正确运行，并且能够修改程序来适应新的需求。

将接口和实现分离的设计理念，可以帮我们更容易达到这个目标。对于对象来说，那意味着类所提供的方法应该不依赖于其属性的表达方式。

例如，本章中我们开发了一个类来表达一天中的时间。这个类提供的方法包括 `time_to_int`,`is_after` 和 `add_time`。

我们可以使用几种不同的方式来实现这些方法。实现的细节依赖于我们表达时间概念的方式。在本章中，`Time` 对象的属性是 `hour`,`minute`和 `second`。

用另一种方案，我们可以将这些属性替换成一个整数，表示从凌晨开始到现在的秒数。这种实现可能会让一些方法，如 `is_after`, 更容易实现，但也会让另一些方法更难实现。

在部署一个新类时，你可能会发现更好的实现。如果程序中其他部分用到你的类，则修改接口会非常消耗时间，并且容易产生错误。

但是，如果很谨慎小心地设计接口，则可以在不修改接口的情况下修改实现，这样程序的其他部分就不需要跟着修改。

## 调试

在程序运行的任何时刻，往对象上添加属性都是合法的，但如果遵守更严格的类型理论，让对象拥有相同的类型却有不同的属性组，会很容易导致错误。通常来说，在 `__init__` 方法中初始化对象的全部属性是个好习惯。

如果并不清楚一个对象是否拥有某个属性，可以使用内置函数 `hasattr`。

另一种访问一个对象的属性的方法是使用内置函数 `vars`，它接收一个对象，并返回一个将属性名字(字符串形式)映射到属性值的字典对象:

In [1]:
class Point:
    '''
    表示二维空间中的点
    '''
    
    def __init__(self,x=0.0,y=0.0):
        self.x = x
        self.y = y
        
    def show(self):
        s = 'Point(%f,%f)'%(self.x,self.y)
        return s
p = Point(3,4)
vars(p)

{'x': 3, 'y': 4}

为了调试，你可能会发现将这个函数放在手边是很有用的:

In [2]:
def print_attributes(obj):
    for attr in vars(obj):
        print(attr,getattr(obj,attr))

`print_attributes` 遍历对象的属性字典，并打印出每个属性的名称和相应的值。

内置函数 `getattr` 接收一个对象以及一个属性名称(字符串形式)并返回属性的值。