## 8.1 抽象数据类型与类

抽象数据类型的概念非常简单，抽象数据类型是一个由对象以及对象上的操作组成的集合，对象和操作被捆绑为一个整体，可以从程序的一个部分传递到另一个部分。

**在Python语言中，我们使用类实现数据抽象。**

In [25]:
class IntSet(object):
    """IntSet是一个整数集合"""
    #关于实现（不是抽象）的信息
    def __init__(self):
        self.vals = []
        
    def insert(self,e):
        if e not in self.vals:
            self.vals.append(e)
            
    def member(self,e):
        return e in self.vals
    
    def remove(self,e):
        try:
            self.vals.remove(e)
        except:
            raise ValueError(str(e)+'not found')
    
    def getMember(self):
        return self.vals[:]
    
    def __str__(self):
        self.vals.sort()
        result = ''
        for e in self.vals:
            result = result + str(e) + ','
        return '{' + result[:-1] + '}'

In [26]:
print(type(IntSet),type(IntSet.insert))

<class 'type'> <class 'function'>


类定义会创建一个type类型的对象，并将这个类的对象与一组instancemethod类型的对象关联起来。

类支持两种操作。
* 实例化：创建类的实例。例如，语句s=IntSet()会创建一个新的IntSet类型的对象，这个对象就称为IntSet类的一个实例。
* 属性引用：通过点标记法访问与类关联的属性。例如，s.insert表示与IntSet类型的实例s关联的insert方法。

In [27]:
s=IntSet()
s.insert(3)
print(s.member(3))

True


表达式中，点号前面的对象会被隐含地作为第一个实参传入方法。在本书中，我们会遵照惯例，使用self作为与这个实参绑定的形参名。

类中定义的最后一个方法是__str__，这也是一个特殊的方法。执行print命令时，会自动调用与待输出对象相关联的str方法。例如，以下代码：

In [28]:
s=IntSet()
s.insert(5)
s.insert(6)
print(s.member(5))
print(s.member(6))
print(s)

True
True
{5,6}


### 8.1.1 使用抽象数据类型设计程序

举例来说，我们理解债券时，认为它具有利率和到期日这些数据属性，并具有如“定价”和“计算到期收入”这样的一些操作。

### 8.1.2 使用类记录学生与教师

In [None]:
import datetime
class Person(object):
    def __init__(self,name):
        """创建一个人"""
        self.name = name
        try:
            lastBlank = name.rindex(' ')
            self.lastName = name[lastBlank+1:]
        except:
            self.lastName = name
        self.birthday = None
    
    def getName(self):
        """返回self的全名"""
        return self.name
    
    def getLastName(self):
        """返回self的姓"""
        return self.lastName
    
    def setBirthday(self,birthdate):
        """假设birthday是datetime.date类型,将self的生日设置为birthday"""
        self.birthday = birthdate
        
    def getAge(self):
        """返回self的当前年龄，用日表示"""
        if self.birthday == None:
            raise ValueError
        return (datetime.date.today() - self.birthday).days
    
    def __lt__(self,other):
        """如果self按字母顺序位于other之前，则返回True，否则返回False。
            首先按照姓进行比较，如果姓相同，就按照全名比较"""
        if self.lastName == other.lastName:
            return self.name < other.name
        return self.lastName < other.lastName
    
    def __str__(self):
        """返回self的全名"""
        return self.name
        

In [38]:
me=Person('Michael Guttag')
him=Person('Barack Hussein Obama')
her=Person('Madonna')
print(him.getLastName())
him.setBirthday(datetime.date(1961, 8, 4))
her.setBirthday(datetime.date(1958, 8, 16))
print(him.getName(), 'is', him.getAge(), 'days old')


Obama
Barack Hussein Obama is 22787 days old


一般来说，实例化一个类时，我们应该看一下这个类的__init__函数的规范，知道应该使用哪些参数，以及这些参数应该具有什么性质。

Person类还定义了一个带有特殊名称的方法__lt__，这个方法重载了<操作符。只要<操作符的第一个参数是Person类型，则调用Person.lt方法。Person类中的__lt__方法是使用str类型的二元操作符<实现的。

In [40]:
pList=[me, him, her]
for p in pList:
    print(p)

Michael Guttag
Barack Hussein Obama
Madonna


In [41]:
pList.sort()
for p in pList:
    print(p)

Michael Guttag
Madonna
Barack Hussein Obama


In [42]:
print(me)

Michael Guttag


## 8.2 继承

类MITPerson继承了它的父类Person中的属性，其中也包括Person从它的父类object中继承的所有属性。

In [61]:
class MITPerson(Person):
    nextIdNum = 0 #identification number
    
    def __init__(self,name):
        Person.__init__(self,name)
        self.idNum = MITPerson.nextIdNum
        MITPerson.nextIdNum += 1
        
    def getIdNum(self):
        return self.idNum
    
    def __lt__(self,other):
        return self.idNum < other.idNum
    
    def isStudent(self):
            return isinstance(self, Student)


* 添加新的属性。例如，子类MITPerson中新增了__类变量__nextIdNum、__实例变量__idNum和方法getIdNum。
* 覆盖——也就是替换——超类中的属性。例如，MITPerson就覆盖了__init__和__lt__。

创建一个新的MITPerson实例时，并不创建nextIdNum的新实例。这使得__init__方法可以确保每个MITPerson实例都具有唯一的idNum。即没有一个实例创建，nextIdNum就会增加1

In [62]:
p1=MITPerson('Barbara Beaver')
print(str(p1)+'\'s id number is '+str(p1.getIdNum()))


Barbara Beaver's id number is 0


In [63]:
p1=MITPerson('Mark Guttag')
p2=MITPerson('Billy Bob Beaver')
p3=MITPerson('Billy Bob Beaver')
p4=Person('Billy Bob Beaver')

In [64]:
print('p1 < p2=', p1 < p2)
print('p3 < p2=', p3 < p2)
print('p4 < p1=', p4 < p1)


p1 < p2= True
p3 < p2= False
p4 < p1= True


第三个比较表达式中，<操作符被应用在两个不同类型之间，因为调用哪种__lt__方法是由表达式的第一个参数决定的，p4 < p1是p4.__lt__(p1)的简写，所以解释器使用与p4的类型Person关联的__lt__方法，按照名字排序。

### 8.2.1 多重继承

In [65]:
class Student(MITPerson):
    pass

class UG(Student):
    def __init__(self,name,classYear):
        MITPerson.__init__(self,name)
        self.year = classYear
    
    def getClass(self):
        return self.year
    
class Grad(Student):
    pass

通过引入Grad类，我们可以获得这样一种能力，即创建两种不同类型的学生并使用他们的类型来区分各自的对象。

In [66]:
p5=Grad('Buzz Aldrin')
p6=UG('Billy Beaver', 1984)
print(p5, 'is a graduate student is', type(p5)==Grad)
print(p5, 'is an undergraduate student is', type(p5)==UG)

Buzz Aldrin is a graduate student is True
Buzz Aldrin is an undergraduate student is False


为MITPerson类，添加：


In [None]:
def isStudent(self):  
    return isinstance(self, Student)

用于判断是不是属于Student类的一个实例（注意不是判断type(p6)==Student）

In [67]:
isinstance([1, 2], list)

True

In [68]:
print(p5, 'is a student is', p5.isStudent())
print(p6, 'is a student is', p6.isStudent())
print(p3, 'is a student is', p3.isStudent())


Buzz Aldrin is a student is True
Billy Beaver is a student is True
Billy Bob Beaver is a student is False


In [69]:
type(p6) == Student

False

### 8.2.2 替换原则

使用子类定义一个类型的层次结构时，子类应该被看作对超类行为的扩展，这种扩展是通过添加新属性或对继承自超类的属性进行覆盖来实现的。

## 8.3 封装与信息隐藏

In [75]:
class Grades(object):
    def __init__(self):
        """创建一个空的成绩册"""
        self.students = []
        self.grades = {}
        self.isSorted = True
        
    def addStudent(self,student):
        """假设student为Student类型
            将student添加到成绩册"""
        if student in self.students:
            raise ValueError('Duplicate student')
        self.students.append(student)
        self.grades[student.getIdNum()] = []
        self.isSorted = False
    
    def addGrade(self,student,grade):
        """假设grade为浮点数
            将grade添加到student的成绩列表"""
        try:
            self.grades[student.getIdNum()].append(grade)
        except:
            raise ValueError('Student not in mapping')
        
    def getGrades(self,student):
        """返回student的成绩列表"""
        try: #return copy of list of stuent‘s grades
            return self.grades[student.getIdNum()][:]
        except:
            raise ValueError('Student no in mapping')
            
    def getStudents(self):
        """返回成绩册中排好序的成绩列表"""
        if not self.isSorted:
            self.students.sort()
            self.isSorted = True
        return self.students[:] #返回一个学生列表的副本

In [76]:
s = Grades()

In [87]:
def gradeReport(course):
    """假设course是Grades类型"""
    report = ''
    for s in course.getStudents():
        tot = 0.0
        numGrades = 0
        for g in course.getGrades(s):
            tot += g
            numGrades += 1
        try:
            average = tot/numGrades
            report = report + '\n' + str(s) + '\'s mean grade is ' + str(average)
        except ZeroDivisionError:
            report = report + '\n' + str(s) + ' has no grades'
    return report

In [88]:
ug1 = UG('Jane Doe',2014)
ug2 = UG('John Doe',2015)
ug3 = UG('David Henry',2003)
g1 = Grad('Billy Buckner')
g2 = Grad('Bucky F.Dent')
sixHundred = Grades()
sixHundred.addStudent(ug1)
sixHundred.addStudent(ug2)
sixHundred.addStudent(g1)
sixHundred.addStudent(g2)
for s in sixHundred.getStudents():
    sixHundred.addGrade(s,75)
sixHundred.addGrade(g1,25)
sixHundred.addGrade(g2,100)
sixHundred.addStudent(ug3)
print(gradeReport(sixHundred))


Jane Doe's mean grade is 75.0
John Doe's mean grade is 75.0
David Henry has no grades
Billy Buckner's mean grade is 50.0
Bucky F.Dent's mean grade is 87.5


面向对象编程的核心思想有两个重要概念。
* 第一个就是封装，将数据属性和操作数据属性的方法打包在一起。

In [91]:
Rafael=MITPerson('Rafael Reif')

* 第二个重要概念是信息隐藏，这是模块化的关键要素之一。

当一个属性的名称以下划线开头但不以下划线结束时，这个属性在类外就是不可见的。

In [None]:
class infoHiding(object):
    def __init__(self):
        self.visible = 'look at me'
        self.__alsoVisible__ = 'look at me too'
        self.__invisible = 'do not look at me directly'
    
    def printVisible(self):
        print(self.visible)
        
    def printInvisible(self):
        print(self.__invisible)
        
    def __printInvisible(self):
        print(self.__invisible)
        
    def __printInvisible__(self):
        print(self.__invisible)

In [98]:
test=infoHiding()
print(test.visible)
print(test.__alsoVisible__)
print(test.__invisible)


look at me
look at me too


AttributeError: 'infoHiding' object has no attribute '__invisible'

In [99]:
test=infoHiding()
test.printInvisible()
test.__printInvisible__()
test.__printInvisible()


do not look at me directly
do not look at me directly


AttributeError: 'infoHiding' object has no attribute '__printInvisible'

In [100]:
class subClass(infoHiding):
    def __init__(self):
        print('from subclass', self.__invisible)
testSub=subClass()


AttributeError: 'subClass' object has no attribute '_subClass__invisible'

**方法不隐藏，属性隐藏，仍然可以跑出结果。其他有隐藏均报错，子类也无法引用父类的隐藏属性**

In [101]:
Rafael=MITPerson('Rafael Reif')

In [103]:
Rafael.getIdNum()

38

在Python中，不但允许程序在类的外部读取实例变量和类变量，而且允许程序改写这些变量

In [106]:
Rafael.birthday = None

In [107]:
Rafael.birthday = datetime.date(1961, 8, 4)

In [108]:
print(Rafael.birthday)

1961-08-04


Python语言甚至允许为类的实例新建一个类定义中没有的实例变量

In [109]:
me.age=Rafael.getIdNum()

### 生成器

return self.students[:] ,会返回一个学生列表的副本，效率低下

使用一个新版本代替Grades类中的getStudents方法，其中应用了一种我们没有用过的语句：yield语句。

In [113]:
def getStudents(self):
    """按字母顺序每次返回成绩册中的一个学生"""
    if not self.isSorted:
        self.students.sort()
        self.isSorted = True
        
    for s in self.students:
        yield s

生成器一般与for语句一起使用。使用生成器的for循环的第一次迭代开始时，解释器会调用生成器内部代码。运行至第一次执行yield语句时，生成器返回yield语句中表达式的值。下一次迭代中，生成器紧接着yield语句继续运行，此时所有局部变量都保持为上次yield语句执行完毕时的值，这次运行仍然到执行yield语句后结束。重复这个过程，直到所有代码运行完毕或者执行到一个return语句，循环结束。

**每次生成一个值效率更高，只有调用的时候才会计算，因为不需要再创建一个包含所有学生的新列表，节省空间。**