现在我们将注意力转向最后一个与Python编程相关的主题：围绕模块和数据抽象，使用类来组织程序。

有许多不同的方式来使用类。在本书中，我们强调的是在**面向对象编程**的环境中使用它们。面向对象编程的关键是**把对象看作是既有数据又有数据操作方法的集合。

面向对象编程的基本思想已经有40多年的历史了，并且在过去的25年左右被广泛接受和实践。在20世纪70年代中期，人们开始撰写文章，解释这种编程方法的好处。大约在同一时间，编程语言`SmallTalk`(施乐PARC)和`CLU`(麻省理工学院)为这些想法提供了语言支持。但是，直到`c++`和`Java`的出现，它才真正在实践中起飞。

在本书的大部分内容中，我们一直隐含地依赖于面向对象编程。回到2.1.1节，我们说过“**对象是Python程序操作的核心。每个对象都有一个定义程序可以用该对象做的事情的类型**。”从第2章开始，我们就一直依赖于`list`和`dict`等内置类型以及跟这些类型相关的方法。但是，正如编程语言的设计者只能构建一小部分有用的函数一样，他们也只能构建一小部分有用的类型。我们已经研究了一种允许程序员定义新函数的机制。现在我们来看一种允许程序员定义新类型的机制。

## 8.1 抽象数据类型和类
抽象数据类型的概念非常简单。抽象数据类型是一组对象和这些对象上的操作。它们被绑定在一起，这样就可以将对象从程序的一个部分传递到另一个部分，这样做不仅提供了对对象数据属性的访问，还提供了对操作的访问，从而使操作数据变得更容易。

这些操作的规范定义了抽象数据类型和程序其余部分之间的接口。接口定义了操作的行为，即它们做什么，而不是如何做。因此，该接口提供了一个抽象屏障，将程序的其余部分与提供对类型抽象的实现所涉及的数据结构、算法和代码隔离开来。

**编程是以一种方便修改的方式管理复杂性**。有两种强大的机制可以实现这一点：**分解**和**抽象**。分解是在程序中创建结构，抽象是抑制细节。关键是要隐藏适当的细节。这就是**数据抽象**的切入点。可以创建提供方便抽象的特定领域类型。理想情况下，这些类型可以捕获跟程序的生命周期相关的概念。如果一个人通过设计几个月甚至几十年后的相关类型来开始编程，那么他在维护软件方面就有很大的优势。

在本书中，我们一直在使用抽象数据类型。我们编写了使用整数、列表、浮点数、字符串和字典的程序，而没有考虑这些类型可能如何实现。

在Python中，使用类实现数据抽象。图8.1包含一个类定义，它提供了一个名为`IntSet`的整数集抽象的简单实现。

In [1]:
class IntSet(object):
    """An intSet is a set of integers"""
    #Information about the implementation (not the abstraction)
    #Value of the set is represented by a list of ints, self.vals.
    #Each int in the set occurs in self.vals exactly once.
    def __init__(self):
        """Create an empty set of integers"""
        self.vals = []
    def insert(self, e):
        """Assumes e is an integer and inserts e into self"""
        if e not in self.vals:
            self.vals.append(e)
    def member(self, e):
        """Assumes e is an integer
        Returns True if e is in self, and False otherwise"""
        return e in self.vals
    def remove(self, e):
        """Assumes e is an integer and removes e from self
        Raises ValueError if e is not in self"""
        try:
            self.vals.remove(e)
        except:
            raise ValueError(str(e) + ' not found')
    def getMembers(self):
        """Returns a list containing the elements of self.
        Nothing can be assumed about the order of the elements"""
        return self.vals[:]
    def __str__(self):
        """Returns a string representation of self"""
        self.vals.sort()
        result = ''
        for e in self.vals:
            result = result + str(e) + ','
        return '{' + result[:-1] + '}' #-1 omits trailing comma
    

print(type(IntSet), type(IntSet.insert))
s = IntSet()
s.insert(3)
print(s.member(3)) 

<class 'type'> <class 'function'>
True


类定义创建一个类型为`type`的对象，并将一组类型为`instancemethod`的对象与该类对象关联起来。例如，表达式`IntSet.insert`是指在类`IntSet`的定义中定义的方法`insert`。代码：

In [2]:
print(type(IntSet), type(IntSet.insert))

<class 'type'> <class 'function'>


请注意：类定义顶部的文档字符串("""括起来的注释)描述的是类提供的抽象，而不是关于类如何实现的信息。相反，文档字符串下面的注释包含关于实现的信息。该信息针对的是那些可能想要修改类的实现或构建子类的程序员，而不是那些可能想要使用抽象的程序员。

当函数定义在类定义中出现时，定义的函数被称为**方法**并关联到该类。这些方法有时被称为**类的方法属性**。如果现在这看起来让人困惑，不要担心。在本章的后面，我们将对这个话题有更多的讨论。

类支持两种操作:
- 实例化用于创建类的实例。

  例如，语句`s = IntSet()`创建了一个类型为`IntSet`的新对象。这个对象被称为`IntSet`的一个实例。

- 属性引用使用点符号来访问与类相关的属性。

  例如，`s.member`引用与类型为`IntSet`的实例`s`相关联的方法`member`。
  
每个类定义都以保留字`class`开头，后跟类的名称以及它与其他类之间的关系的一些信息。在本例中，第一行表示`IntSet`是`object`的子类。现在，忽略子类的含义。我们很快就会讲到。

正如我们将看到的，Python有许多**特殊的方法名**，它们以两个下划线开始和结束。

我们首先要看的是`__init__`。每当一个类被实例化时，都会调用该类中定义的`__init__方法`。当执行如下代码时：

In [3]:
s = IntSet()

解释器将创建一个类型为`IntSet`的新实例，然后调用`IntSet.__init__`，将新创建的对象作为绑定到形式形参`self`的实际形参。当调用`IntSet.__init__`时，它创建了`vals`列表：它是一个`list`类型的对象，成为新创建的`IntSet`类型实例的一部分。注意，`vals`列表是用`[]`来创建的，`[]`是对`list()`的简写。`vals列表`称为IntSet实例的**数据属性**。注意：每个`IntSet`对象有不同的`vals`列表。

可使用点号来调用跟一个类的实例关联的方法。比如，

In [5]:
s = IntSet()
s.insert(3)
print(s.member(3))

True


上述代码创建了一个`IntSet`实例，向那个`IntSet`中插入了整数3，然后输出`True`。

乍一看，这里似乎有些不一致的地方。看起来好像调用每个方法时都少了一个参数。例如，`member`有两个形式参数，但我们似乎只用一个实际参数调用它。这是点符号的产物。点号前面跟表达式关联的对象作为第一个参数隐式地传递给方法。在整本书中，我们遵循使用self作为形式参数(实际参数要绑定到它)的名称的约定。Python程序员几乎普遍遵守这一约定，我们强烈建议您也使用它。

类不应与该类的实例相混淆，正如`list`类型的对象不应与`list`类型相混淆一样。属性可以与类本身相关联，也可以与类的实例相关联:
- 方法属性

    方法属性分为类属性和实例属性。
    
    方法属性是在类定义中定义的。
    
    例如，`IntSet.member`是类IntSet的属性。当类被实例化时(比如`s = IntSet()`)，实例属性被创建(比如`s.member`)。
    
    注意：
    
    `IntSet.member`和`s.member`是不同的对象。虽然`s.member`初始是被绑定到类`IntSet`中定义的`member`方法，但是该绑定可以在计算过程中被更改。例如，你可以(但不应该!)写`s.member=Insert.insert`。
- 数据属性
    
    数据属性也分为类属性和实例属性。
    
    类变量是跟类关联的数据属性。实例变量是跟实例关联的数据属性。
    
    例如，`vals`是一个实例变量，因为对于类`IntSet`的每个实例，`vals`被绑定到不同的列表。到目前为止，我们还没有看到类变量。
    


关键词：表示独立性 表示不变量

数据抽象实现了表示独立性。一个抽象类型的实现成有若干个组件：
- 类型方法的实现；
- 跟方法实现一起对类型值编码的数据结构；
- 关于如何使用数据结构来实现方法的约定。表示不变量捕获了关键的约定。

简单地总结一下，一个抽象数据类型的实现有哪些组件？
- 方法
- 数据结构
- 实现约定



关键词：表示不变量

**表示不变量**定义了数据属性的哪些值对应于类实例的有效表示。比如，`IntSet`的表示不变量是不包含重复项的`vals`。`__init__`的实现负责建立不变量(持有空列表)，其他方法负责维护该不变量。这就是为什么`insert`仅在`e`不在`self.vals`中时才附加它的原因。

`remove`的实现利用了进入`remove`时满足“表示不变量”这一假设。它只调用`list.remove`一次，因为表示不变量保证在`self.vals`中最多出现一次 `e`。

关键词：`__str__`方法

类中定义的最后一个方法`__str__`是另一种特殊的`__`方法。使用`print`命令时，它会自动调用与要打印的对象关联的`__str__`函数。例如，代码

In [6]:
s = IntSet()
s.insert(3)
s.insert(4)
print(s)

{3,4}


注意：
- 如果没有定义`__str__`方法，执行`print(s)`会导致诸如`<__main__.IntSet object at 0x1663510>`之类的东西被打印出来。

我们也可以通过写`print s.__str__()`或者`print IntSet.__str__(s)`来输出`s`的值，但使用这些形式不方便。 

当程序通过调用`str`将类的实例转换为字符串时，也会调用类的`__str__` 方法。

关键词：hashable

用户定义类的所有实例都是`hashable`的，因此可以用作字典的keys。 

如果没有提供`__hash__`方法，则对象的哈希值是从函数`id`派生的(参见第 5.3 节)。 

如果没有提供`__eq__`方法，则所有对象都被认为是不相等的(除了它们自己)。

如果提供了用户定义的`__hash__`，则应确保对象的哈希值在该对象的整个生命周期中保持不变。

### 8.1.1 使用抽象数据类型来设计程序
抽象数据类型很重要。它导致了对组织大型程序的不同思考方式。当我们思考世界时，我们依赖于抽象。在金融界，人们谈论股票和债券。在生物学领域，人们谈论蛋白质和残留物。当试图理解诸如此类的概念时，我们会在大脑中将这些对象的一些相关数据和特征收集到一个智力包中。例如，我们认为债券具有利率和到期日作为数据属性。我们还认为债券具有“设定价格”和“计算到期收益率”等操作。抽象数据类型允许我们将这种组织方式融入到程序设计中。

数据抽象鼓励程序设计人员**关注数据对象而不是函数**。**将程序更多地看作是类型的集合而不是函数的集合**，会导致一个完全不同的组织原则。除此之外，它鼓励人们将**编程看作是组合相对较大块的过程**，因为数据抽象通常包含比单个函数更多的功能。这反过来又使我们认为，**编程的本质不是编写单独的代码行，而是组成抽象的过程**。

**可重用抽象**的可用性不仅减少了开发时间，而且通常还会带来更可靠的程序，因为成熟的软件通常比新软件更可靠。多年来，唯一常用的程序库是统计的或科学的。然而，现在有大量可用的程序库(特别是针对Python的)，通常基于一组丰富的数据抽象，我们将在本书后面看到。


### 8.1.2 使用类来记录学生和教师
假设你要设计一个程序来跟踪一所大学的所有学生和教员。

两种实现方式：不使用数据抽象和使用数据抽象

不使用数据抽象：需要设计一堆数据结构，比如每个学生都有姓氏、名字、家庭地址、年份、成绩等数据结构。教员也需要一些类似的数据结构和一些不同的数据结构，比如跟踪薪资历史的数据结构等。


使用数据抽象：

先考虑一些可能有用的抽象，比如：是否存下一个涵盖学生、教授、工作人员共同属性的抽象？

In [7]:
import datetime

class Person(object):
    def __init__(self, name):
        """
        创建一个人
        """
        self.name = name
        try:
            lastBlank = name.rindex(' ')
            self.lastName = name[lastBlank+1:]
        except:
            self.lastName = name
        self.birthday = None
        
    def getName(self):
        """
        返回self的全名
        """
        return self.name
    
    def getLastName(self):
        """
        返回self的姓氏
        """
        return self.lastName
    
    def setBirthday(self, birthdate):
        """
        假设birthday是datetime.date类型
        设置self的birthday为birthdate
        """
        self.birthday = birthdate
        
    def getAge(self):
        """
        返回以天数的形式表示的self的年龄
        """
        if self.birthday == None:
            raise ValueError
        return (datetime.date.today() - self.birthday).days
    def __lt__(self, other):
        """
        如果按照字母表顺序，self比other早，就返回True，否则返回False。
        虽然是基于姓氏比较，但是如果姓氏相同，那么就比较全名。
        """
        if self.lastName == other.lastName:
            return self.name < other.name
        return self.lastName < other.lastName
    
    def __str__(self):
        """
        返回self的全名
        """
        return self.name

In [8]:
me = Person('Michael Guttag')
him = Person('Barack Hussein Obama')
her = Person('Madonna')
print(him.getLastName())
him.setBirthday(datetime.date(1961, 8, 4))
her.setBirthday(datetime.date(1958, 8, 16))
print(him.getName(), 'is', him.getAge(), 'days old')

Obama
Barack Hussein Obama is 21958 days old


注意：
- 每当`Person`被实例化时，都会向`__init__`函数提供一个参数。通常，在实例化一个类时，我们需要查看该类的`__init__`函数的规范，以了解要提供哪些参数以及这些参数应该具有哪些属性。

上述代码执行后，会出现`Person`类的三个实例。然后可以使用与它们关联的方法访问有关这些实例的信息。例如，`him.getLastName()·`返回`'Obama'`。表达式`him.lastName`也将返回`'Obama'`；然而，应该避免编写直接访问实例变量的表达式，这被认为是糟糕的形式。

同样，`Person`抽象的用户没有合适的方法来提取一个人的生日，尽管该实现包含具有该值的属性。但是，有一种方法可以根据人的生日提取信息，如上述代码中的最后一个`print`语句所示。

类`Person`定义了另一个特别命名的方法`__lt__`。此方法重载`<`运算符。只要`<`运算符的第一个参数是`Person`类型，就会调用`Person.__lt__`方法。`Person`类中的`__lt__`方法是使用`str`类型的二元`<`运算符实现的。表达式`self.name < other.name`是`self.name.__lt__(other.name)`的简写。由于`self.name`是`str`类型，所以这个`__lt__`方法是与`str`类型关联的方法。

除了提供编写使用`<`的中缀表达式的语法便利之外，这种重载还提供对使用`__lt__`定义的任何多态方法的自动访问。内置方法`sort`就是这样一种方法。因此，例如，如果`pList`是由`Person`类型的元素组成的列表，则调用`pList.sort()`将使用类`Person`中定义的`__lt__`方法对该列表进行排序。

In [9]:
pList = [me, him, her]

for p in pList:
    print(p)
    
pList.sort()
for p in pList:
    print(p)

Michael Guttag
Barack Hussein Obama
Madonna
Michael Guttag
Madonna
Barack Hussein Obama


## 8.2 继承
许多类型具有与其他类型相同的属性。例如，`list`和`str`类型都有表示相同含义的`len`函数。

继承为构建相关抽象组提供了一种方便的机制。它允许程序员创建一个类型层次结构，在这个层次结构中，每个类型从其上面的类型继承属性。


类对象位于层次结构的顶端。这是有意义的，因为**在Python中，在运行时存在的一切都是对象**。因为`Person`继承了`object`的所有属性，所以程序可以将变量绑定到`Person`，将`Person`添加到列表里等。

In [16]:
class MITPerson(Person):
    #类变量nextIdNum
    nextIdNum = 0 #identification number
    def __init__(self, name):
        Person.__init__(self, name)
        #实例变量idNum
        self.idNum = MITPerson.nextIdNum
        MITPerson.nextIdNum += 1
    def getIdNum(self): 
        return self.idNum
    def __lt__(self, other):
        return self.idNum < other.idNum
    
    def isStudent(self):
        return isinstance(self, Student)

图8.3中的`MITPerson`类继承了其父类`Person`的属性，包括`Person`从其父类`object`继承的所有属性。

用面向对象编程的术语来说，`MITPerson`是`Person`的子类，因此继承了其父类的属性。除了它继承的内容外，子类还可以:
- 添加新属性 

  例如，子类`MITPerson`增加了类变量`nextIdNum`、实例变量`idNum`和方法`getIdNum`。
- 覆盖父类的属性

  例如，`MITPerson`覆盖了`__init__`和`__lt__`。
  
  当一个方法被覆盖时，执行的方法的版本基于用来调用该方法的对象。
  
  如果对象的类型是子类，则将使用子类中定义的版本。
  
  如果对象的类型是父类，则将使用超类中的版本。
  
`MITPerson.__init__ `方法首先调用`Person.__init__`来初始化继承的实例变量`self.name`。然后它初始化`self.idNum`这是一个`MITPerson`实例有但`Person`实例没有的实例变量。

实例变量`self.idNum`是使用类变量`nextIdNum`初始化的。注意：`nextIdNum`属于类`MITPerson`，而不是类的实例。创建`MITPerson`的实例时，不会创建`nextIdNum`的新实例。这允许`__init__`确保每个`MITPerson`实例都有一个唯一的`idNum`。

In [17]:
p1 = MITPerson('Barbara Beaver')
print(str(p1)+'\'s id number is '+str(p1.getIdNum()))

Barbara Beaver's id number is 0


解释：

第一行创建了一个新的`MITPerson`。 

第二行有点复杂。
当它尝试对表达式`str(p1)`求值时，运行时系统首先检查是否存在与类`MITPerson`关联的`__str__`方法。由于没有，它接下来检查是否有一个与`MITPerson`的父类`Person`相关联的`__str__`方法。有，所以它使用它。
当运行时系统尝试计算表达式`p1.getidNum()`时，它首先检查是否存在与类`MITPerson`关联的`getIdNum`方法。

In [18]:
p1 = MITPerson('Mark Guttag')
p2 = MITPerson('Billy Bob Beaver')
p3 = MITPerson('Billy Bob Beaver')
p4 = Person('Billy Bob Beaver')

我们创建了四个虚拟的人，其中三个名为`Billy Bob Beaver`。 两个 `Billy Bobs`是`MITPerson`类型，一个是`Person`类型。

In [19]:
print('p1 < p2 =', p1 < p2)
print('p3 < p2 =', p3 < p2)
print('p4 < p1 =', p4 < p1)
print('p1 < p4 =', p1 < p4)

p1 < p2 = True
p3 < p2 = False
p4 < p1 = True


AttributeError: 'Person' object has no attribute 'idNum'

由于`p1`、`p2`和`p3`都是`MITPerson`类型，解释器在评估前两个比较时将使用类`MITPerson`中定义的`__lt__`方法，因此排序将基于标识号。
在第三次比较中，`<`运算符应用于不同类型的操作数。由于表达式的第一个参数用于确定调用哪个`__lt__`方法，因此`p4 < p1`是`p4.__lt__(p1)`的简写。因此，解释器使用与`p4`关联的`Person`类的`__lt_`方法，"people"将将按名称排序。

### 8.2.1 多层继承
图 8.4向类层次结构添加了另外两层的继承。

In [20]:
class Student(MITPerson): 
    pass

class UG(Student):
    def __init__(self, name, classYear):
        MITPerson.__init__(self, name)
        self.year = classYear 
    
    def getClass(self):
        return self.year

class Grad(Student): 
    pass

添加`UG`似乎是合乎逻辑的，因为我们希望将毕业年份与每个本科生联系起来。但是`Student`和`Grad`这两个类是怎么回事？通过使用Python中的保留字`pass`作为主体，我们表明除了从父类继承的属性外，该类没有其他属性。为什么要创建一个没有新属性的类呢?

通过引入`class Grad`，我们获得了创建两种不同类型的`Student`的能力，并使用他们的类型来区分一种对象与另一种对象。例如，代码

In [21]:
p5 = Grad('Buzz Aldrin')
p6 = UG('Billy Beaver', 1984)
print(p5, 'is a graduate student is', type(p5) == Grad)
print(p5, 'is an undergraduate student is', type(p5) == UG)

Buzz Aldrin is a graduate student is True
Buzz Aldrin is an undergraduate student is False


中间类型`Student`的效用是有点微妙的。回到之前的`MITPerson`类的代码，添加如下函数得到：
```
def isStudent(self):
    return isinstance(self, Student)
```

函数`isinstance`是Python中的一个内置函数。`isinstance`函数的第一个参数可以是任何对象，但第二个参数必须是type类型的对象。 当且仅当第一个参数是第二个参数的实例时，该函数才返回True。例如，`isinstance([1,2], list)` 的值为 True。

In [22]:
print(isinstance([1,2], list))

True


返回到我们的示例，代码：

In [23]:
print(p5, 'is a student is', p5.isStudent())
print(p6, 'is a student is', p6.isStudent())
print(p3, 'is a student is', p3.isStudent())

Buzz Aldrin is a student is True
Billy Beaver is a student is True
Billy Bob Beaver is a student is False


解释：
`isinstance(p6, Student)`的含义与`type(p6) == Student`的含义大不相同。
`p6`绑定的对象是`UG`类型，不是`student`，但由于`UG`是`Student`的子类，`p6`绑定的对象被认为是`Student`类的实例、`MITPerson`和`Person`的实例。

由于只有两种学生，我们可以将`isStudent`实现为：
```
def isStudent(self):
    return type(self) == Grad or type(self) == UG
```

但是，如果稍后引入了新类型的学生，则有必要返回并编辑实现`isStudent`的代码。通过引入中间类`Student`并使用`isinstance`，我们就避免了这个问题。 例如，如果我们要添加：

In [24]:
class TransferStudent(Student):
    def __init__(self, name, fromSchool):
        MITPerson.__init__(self, name)
        self.fromSchool = fromSchool
        
    def getOldSchool(self):
        return self.fromSchool

就不需要对方法`isStudent`做修改。

在程序的创建和后期维护期间，返回并向添加新类或像旧类中添加新属性的情况并不少见。优秀的程序员会为了尽量减少完成后可能需要更改的代码量而设计他们的程序。

### 8.2.2 替换原则

当使用子类来定义类的层级时，子类应该被认为是扩展了其父类的行为。通过添加新属性或重写从父类继承的属性来实现这一点。例如，子类`TransferStudent`通过添加新的属性`fromSchool`来扩展`Student`。

有时，子类会覆盖父类中的方法，但这必须小心进行。特别地，父类的重要行为必须被它的每个子类都支持。如果客户端代码使用父类的实例能够正常工作，那么当子类的实例替换父类的实例时，它也应该能够正常工作。例如，应该可以使用`Student`的规范来编写客户端代码，并使其在一个`TransferStudent`实例上也能正确地工作。

相反，也没有理由期望为`TransferStudent`编写的代码适用于任意`Student`类。

## 8.3 封装和信息隐藏
跟学生打交道，要是不让他们经历上课、获取成绩的痛苦就太可惜了。

图 8.5包含一个类，可用于跟踪一组学生的成绩。可使用列表和字典来实现类`Grades`的实例。列表跟踪班级中的学生。字典将学生的身份证号码映射到成绩列表。

In [26]:
class Grades(object):
    def __init__(self):
        """Create empty grade book"""
        self.students = []
        self.grades = {}
        self.isSorted = True
    
    def addStudent(self, student):
        """Assumes: student is of type Student
        Add student to the grade book"""
        if student in self.students:
            raise ValueError('Duplicate student')
        self.students.append(student)
        self.grades[student.getIdNum()] = []
        self.isSorted = False
    
    def addGrade(self, student, grade):
        """Assumes: grade is a float
        Add grade to the list of grades for student"""
        try:
            self.grades[student.getIdNum()].append(grade)
        except:
            raise ValueError('Student not in mapping')

    def getGrades(self, student):
        """Return a list of grades for student"""
        try: #return copy of list of student's grades
            return self.grades[student.getIdNum()][:]
        except:
            raise ValueError('Student not in mapping')

    def getStudents(self):
        """Return a sorted list of the students in the grade book"""
        if not self.isSorted:
            self.students.sort()
            self.isSorted = True
        return self.students[:] #return copy of list of students

注意：`getGrades`返回的是与学生关联的成绩列表的副本，`getStudents`返回的是学生列表的副本。通过简单地返回实例变量本身可以避免复制列表的计算成本。 但是，这样做可能会导致问题。比如，如下代码：
```
allStudents = course1.getStudents()
allStudents.extend(course2.getStudents())
```
如果`getStudents`返回的是`self.students`，则第二行代码会有副作用，即修改了`course1`中的学生集。

实例变量`isSorted`用于跟踪自上次添加学生以来学生列表是否已排序。这允许`getStudents`的实现避免对已经排序的列表进行排序。

图8.6包含一个函数，该函数使用类`Grades`为一些参加名为`SixHundred`的课程的学生生成成绩报告。

In [27]:
def gradeReport(course):
    """Assumes course is of type Grades"""
    report = ''
    for s in course.getStudents():
        tot = 0.0
        numGrades = 0
        
        for g in course.getGrades(s):
            tot += g
            numGrades += 1
        
        try:
            average = tot/numGrades
            report = report + '\n'\
            + str(s) + '\'s mean grade is ' + str(average)
        except ZeroDivisionError:
            report = report + '\n'\
            + str(s) + ' has no grades'
    return report

ug1 = UG('Jane Doe', 2014)
ug2 = UG('John Doe', 2015)
ug3 = UG('David Henry', 2003)
g1 = Grad('Billy Buckner')
g2 = Grad('Bucky F. Dent')

sixHundred = Grades()
sixHundred.addStudent(ug1)
sixHundred.addStudent(ug2)
sixHundred.addStudent(g1)
sixHundred.addStudent(g2)

for s in sixHundred.getStudents():
    sixHundred.addGrade(s, 75)

sixHundred.addGrade(g1, 25)
sixHundred.addGrade(g2, 100)
sixHundred.addStudent(ug3)

print(gradeReport(sixHundred))


Jane Doe's mean grade is 75.0
John Doe's mean grade is 75.0
David Henry has no grades
Billy Buckner's mean grade is 50.0
Bucky F. Dent's mean grade is 87.5


在面向对象的核心有两个重要的概念：封装和信息隐藏。

第一个概念是封装。封装做的事就是将数据属性和操作它们的方法捆绑到一起。比如：我们写了如下代码后，
```
Rafael = MITPerson('Rafael Reilf')
```
我们就能使用点号来访问属性，比如`Rafael`的名字和身份号码。

第二个概念是信息隐藏。这是模块化的关键之一。如果类的客户端仅依赖于类中方法的规范，那么实现类的程序员可以自由地更改类的实现而不必担心更改会破坏使用该类的代码。

诸如例如Java和C++等编程语言提供的是强制信息隐藏的机制：程序员将类的属性设为`private`，这样类的客户端只能通过对象的方法访问数据。Python 3使用**命名约定使属性在类之外不可见**。 当属性的名称以`__`开头但不以`__`结尾时，该属性在类之外不可见。

考虑如下代码：

In [28]:
class infoHiding(object):
    def __init__(self):
        self.visible = 'Look at me'
        self.__alsoVisible__ = 'Look at me too'
        self.__invisible = 'Don\'t look at me directly' 

    def printVisible(self):
        print(self.visible)

    def printInvisible(self):
        print(self.__invisible)

    def __printInvisible(self):
        print(self.__invisible)

    def __printInvisible__(self):
        print(self.__invisible)

In [29]:
test = infoHiding()
print(test.visible)
print(test.__alsoVisible__)
print(test.__invisible)

Look at me
Look at me too


AttributeError: 'infoHiding' object has no attribute '__invisible'

In [30]:
test = infoHiding()
test.printInvisible()
test.__printInvisible__()
test.__printInvisible()

Don't look at me directly
Don't look at me directly


AttributeError: 'infoHiding' object has no attribute '__printInvisible'

In [31]:
class subClass(infoHiding):
    def __init__(self):
        print('from subclass', self.__invisible)
 

testSub = subClass()

AttributeError: 'subClass' object has no attribute '_subClass__invisible'

注意：当一个子类尝试去使用一个在父类中的隐藏属性时，就引发了一个`AttributeError`。这使得在Python中的信息隐藏有点困难。

因为它有点困难，所以许多Python程序员不会利用`__`机制来隐藏属性，我们在本书里也不会这么做。所以，类`Person`的客户端可以写表达式`Rafael.lastName`，而不是`Rafael.getLastName()`。

这太不幸了，因为这样就允许客户端代码依赖一些不是类`Person`规范的一部分的东西，而且这部分是有可能改变的。如果类`Person`的实现被改变了，比如，不是将姓氏保存在实例变量中，而是每次请求时直接拉取，上面的客户端的代码可能就永远不能工作了。

Python不仅允许程序在类定义的外部读取实例变量和类变量，而且允许程序写这些变量。所以，比如：代码`Rafael.birthday = '8/21/50'`是完全合法的。当在后续的计算中调用`Rafael.getAge`时，这会导致运行时类型错误。

甚至有可能在类定义的外部创建实例变量。比如，如果如下语句：
```
me.age = Rafael.getIdNum()
```
出现在类定义的外部，Python将不会抱怨。

虽然这种相对弱的静态语义检查在Python里是一个缺陷，但不是致命的缺陷。

一个有纪律的程序员可以简单地遵守如下微妙的规则就可以避免上述问题：**不要直接在定义它们的类的外部直接访问数据属性**。

### 8.3.1 生成器generators
信息隐藏有一个可感知的风险是阻止程序直接访问关键数据结构可能会导致一种不可接受的效率损失。在数据抽象的早期，许多人关心的是引入无关的函数/方法调用的开销。现代编译器使得这种担忧变得无关紧要。一个更严重的问题是客户端强制使用效率低下的算法。

In [None]:
def gradeReport(course):
    """Assumes course is of type Grades"""
    report = ''
    for s in course.getStudents():
        tot = 0.0
        numGrades = 0
        
        for g in course.getGrades(s):
            tot += g
            numGrades += 1
        
        try:
            average = tot/numGrades
            report = report + '\n'\
            + str(s) + '\'s mean grade is ' + str(average)
        except ZeroDivisionError:
            report = report + '\n'\
            + str(s) + ' has no grades'
    return report

看图8.6中`gradeReport`的实现。`course.getStudents`的调用创建和返回一个大小为n的列表，其中n是学生的个数。这对单个班级的成绩名册可能不是一个问题，但是想象一下记录参加SAT考试的170万高中生的成绩。当列表已经存在时，创建170万大小的新列表的效率会极其低下。一个解是放弃抽象，允许`gradeReport`直接访问实例变量`course.students`，但是那将会违反信息隐藏。幸运的是，存在一个更好的解。

在图8.8中的代码将在类`Grades`中的`getStudents`函数替换为一个使用了`yield`语句的函数。

In [33]:
class Grades(object):
    def __init__(self):
        """Create empty grade book"""
        self.students = []
        self.grades = {}
        self.isSorted = True
    
    def addStudent(self, student):
        """Assumes: student is of type Student
        Add student to the grade book"""
        if student in self.students:
            raise ValueError('Duplicate student')
        self.students.append(student)
        self.grades[student.getIdNum()] = []
        self.isSorted = False
    
    def addGrade(self, student, grade):
        """Assumes: grade is a float
        Add grade to the list of grades for student"""
        try:
            self.grades[student.getIdNum()].append(grade)
        except:
            raise ValueError('Student not in mapping')

    def getGrades(self, student):
        """Return a list of grades for student"""
        try: #return copy of list of student's grades
            return self.grades[student.getIdNum()][:]
        except:
            raise ValueError('Student not in mapping')

    def getStudents(self):
        """Return the students in the grade book one at a time
        in alphabetical order"""
        
        if not self.isSorted:
            self.students.sort()
            self.isSorted = True
            
        for s in self.students:
            yield s

Python会特殊处理任何一个包含`yield`语句的函数。`yield`的出现告诉Python系统：这个函数是一个**生成器**。生成器通常是配合for语句一起使用的，比如：
```
for s in course.getStudents():
```
在使用生成器的`for`循环的第一次迭代开始时，生成器被调用并运行，直到第一次执行`yield`语句，此时它返回`yield`语句中表达式的值。在下一次迭代中，生成器在`yield语句`之后立即继续执行，所有局部变量都绑定到执行`yield`语句时绑定到的对象上，并再次运行，直到执行`yield`语句。它会继续这样做，直到用完了要执行的代码或执行了`return`语句，这时循环就退出了。

图8.8中的`getStudents`版本允许程序员使用`for`循环遍历`Grades`类型对象中的`students` ，就像他们可以使用`for`循环遍历诸如list等内置类型的元素一样。 例如，代码：

In [34]:
book = Grades()
book.addStudent(Grad('Julie'))
book.addStudent(Grad('Charlie'))
for s in book.getStudents():
    print(s)

Julie
Charlie


因此，图 8.6 中的循环
```
for s in course.getStudents():
```
无需更改即可利用包含`getStudents`新实现的`Grades`版本。当然，大多数依赖于`getStudents`返回列表的代码将不再起作用。相同的for循环可以迭代`getStudents`提供的值，而不管`getStudents`是返回值列表还是一次生成一个值。

一次生成一个值会更有效率，因为不会创建包含学生的新列表。

## 8.3 抵押贷款示例

In [37]:
def findPayment(loan, r, m):
    """Assumes: loan and r are floats, m an int
    Returns the monthly payment for a mortgage of size
    loan at a monthly rate of r for m months"""
    return loan*((r*(1+r)**m)/((1+r)**m - 1))

class Mortgage(object):
    """Abstract class for building different kinds of mortgages"""
    def __init__(self, loan, annRate, months): 
        """Assumes: loan and annRate are floats, months an int
            Creates a new mortgage of size loan, duration months, and
           annual rate annRate"""
        self.loan = loan
        self.rate = annRate/12
        self.months = months
        self.paid = [0.0]
        self.outstanding = [loan]
        self.payment = findPayment(loan, self.rate, months)
        self.legend = None #description of mortgage

    def makePayment(self):
        """Make a payment"""
        self.paid.append(self.payment)
        reduction = self.payment - self.outstanding[-1]*self.rate
        self.outstanding.append(self.outstanding[-1] - reduction)

    def getTotalPaid(self):
        """Return the total amount paid so far"""
        return sum(self.paid)

    def __str__(self):
        return self.legend

In [None]:
class Fixed(Mortgage):
    def __init__(self, loan, r, months):
        Mortgage.__init__(self, loan, r, months)
        self.legend = 'Fixed, ' + str(round(r*100, 2)) + '%'

class FixedWithPts(Mortgage):
    def __init__(self, loan, r, months, pts):
        Mortgage.__init__(self, loan, r, months)
        self.pts = pts
        self.paid = [loan*(pts/100)]
        self.legend = 'Fixed, ' + str(round(r*100, 2)) + '%, '\
        + str(pts) + ' points'

class TwoRate(Mortgage):
    def __init__(self, loan, r, months, teaserRate, teaserMonths):
    Mortgage.__init__(self, loan, teaserRate, months)
    self.teaserMonths = teaserMonths
    self.teaserRate = teaserRate
    self.nextRate = r/12
    self.legend = str(teaserRate*100)\
    + '% for ' + str(self.teaserMonths)\
    + ' months, then ' + str(round(r*100, 2)) + '%'
def makePayment(self):
if len(self.paid) == self.teaserMonths + 1:
self.rate = self.nextRate
self.payment = findPayment(self.outstanding[-1],
self.rate,
self.months - self.teaserMonths)
Mortgage.makePayment(self)