# 类和实例

面向对象最重要的概念就是类 `（Class）` 和实例 `（Instance）` ，

必须牢记类是**抽象的模板** ，比如 `Student` 类，

而实例是根据类创建出来的一个个**具体的“对象”** ，每个对象都拥有相同的方法，但各自的数据可能不同。

`class` 后面紧接着是类名，即 `Student` ，类名通常是大写开头的单词，紧接着是`(object)` 

`object` 类，这是所有类最终都会继承的类(可有可無)

In [1]:
class Student(object):
    pass

In [3]:
bart = Student()

bart
Student

<__main__.Student at 0x246dab5e438>

__main__.Student

可以看到，变量 `bart` 指向的就是一个 `Student` 的实例，后面的 `0x10a67a590` 是内存地址

可以自由地给一个实例变量绑定属性，比如，给实例 `bart` 绑定一个 `name` 属性：

In [4]:
bart.name = 'Bart Simpson'
bart.name

'Bart Simpson'

由于类可以起到模板的作用，因此，可以在创建实例的时候，把一些我们认为必须绑定的属性强制填写进去。

通过定义一个特殊的 `__init__` 方法，在创建实例的时候，就把 `name` ， `score` 等属性绑上去：

In [5]:
class Student(object):

    def __init__(self, name, score):
        self.name = name
        self.score = score
        
bart = Student('Bart Simpson', 59)
bart.name

'Bart Simpson'

# 数据封装

面向对象编程的一个重要特点就是数据封装。

在上面的 `Student` 类中，每个实例就拥有各自的 `name` 和 `score` 这些数据。

我们可以通过函数来访问这些数据，比如打印一个学生的成绩：

In [6]:
def print_score(std):
    print('%s: %s' % (std.name, std.score))
    
print_score(bart)

Bart Simpson: 59


但是，既然 `Student` 实例本身就拥有这些数据，要访问这些数据，就没有必要从外面的函数去访问，可以直接在 `Student` 类的内部定义访问数据的函数，这样，就把“数据”给封装起来了。这些封装数据的函数是和 `Student` 类本身是关联起来的，我们称之为类的方法：

In [7]:
class Student(object):

    def __init__(self, name, score):
        self.name = name
        self.score = score

    def print_score(self):
        print('%s: %s' % (self.name, self.score))
        
        
bart = Student('Bart Simpson', 59)
bart.print_score()

Bart Simpson: 59


封装的另一个好处是可以给 `Student` 类增加新的方法，比如 `get_grade` ：

In [None]:
class Student(object):
    def __init__(self, name, score):
        self.name = name
        self.score = score

    def get_grade(self):
        if self.score >= 90:
            return 'A'
        elif self.score >= 60:
            return 'B'
        else:
            return 'C'


# 访问限制

如果要让内部属性不被外部访问，可以把属性的名称前加上两个下划线 `__` ，在 `Python` 中，实例的变量名如果以 `__` 开头，就变成了一个私有变量 `（private）` ，只有内部可以访问，外部不能访问，所以，我们把 `Student` 类改一改：

In [10]:
class Student(object):

    def __init__(self, name, score):
        self.__name = name
        self.__score = score

    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))

In [11]:
bart = Student('Bart Simpson', 59)
bart.__name

AttributeError: 'Student' object has no attribute '__name'

但是如果外部代码要获取 `name` 和 `score` 怎么办？

可以给 `Student` 类增加 `get_name和get_score` 这样的方法：

```py
class Student(object):
    ...

    def get_name(self):
        return self.__name

    def get_score(self):
        return self.__score
```

如果又要允许外部代码修改 `score` 怎么办？

可以再给 `Student` 类增加 `set_score` 方法：

```py
class Student(object):
    ...

    def set_score(self, score):
        self.__score = score
```

原先那种直接通过 `bart.score = 99` 也可以修改啊，为什么要定义一个方法大费周折？

因为在方法中，可以对参数做检查，避免传入无效的参数：

```py
class Student(object):
    ...

    def set_score(self, score):
        if 0 <= score <= 100:
            self.__score = score
        else:
            raise ValueError('bad score')
```

需要注意的是，在 `Python` 中，变量名类似 `__xxx__` 的，也就是以双下划线开头，并且以双下划线结尾的，是特殊变量，特殊变量是可以直接访问的，不是 `private` 变量，所以，不能用 `__name__` 、 `__score__` 这样的变量名。

有些时候，你会看到以一个下划线开头的实例变量名，比如 `_name` ，这样的实例变量外部是可以访问的，但是，按照约定俗成的规定，当你看到这样的变量时，意思就是，“虽然我可以被访问，但是，请把我 **视为私有变量，不要随意访问** ”。

双下划线开头的实例变量是不是一定不能从外部访问呢？其实也不是。

不能直接访问 `__name` 是因为 `Python` 解释器对外把 `__name` 变量改成了`_Student__name` ，所以，仍然可以通过 `_Student__name` 来访问 `__name` 变量：


In [12]:
bart._Student__name

'Bart Simpson'

但是强烈建议你不要这么干，因为不同版本的 `Python` 解释器可能会把 `__name` 改成不同的变量名。

总的来说就是， `Python` 本身没有任何机制阻止你干坏事，一切全靠自觉。

最后注意下面的这种错误写法：

In [13]:
bart = Student('Bart Simpson', 59)

bart.__name = 'New Name' # 设置__name变量！
bart.__name

'New Name'

表面上看，外部代码“成功”地设置了 `__name` 变量，但实际上这个 `__name` 变量和 `class` 内部的 `__name` 变量不是一个变量！内部的 `__name` 变量已经被 `Python` 解释器自动改成了 `_Student__name` ，而外部代码给 `bart` 新增了一个 `__name` 变量。不信试试：

In [15]:
bart.print_score() 

Bart Simpson: 59


## 练习

请把下面的 `Student` 对象的 `gender` 字段对外隐藏起来，用 `get_gender()` 和 `set_gender()` 代替，并检查参数有效性：

In [16]:
class Student(object):
    def __init__(self, name, gender):
        self.name = name
        self.__gender = gender
    def get_gender(self):
        return self.__gender
    def set_gender(self, gender):
        self.__gender = gender

In [17]:
# 测试:
bart = Student('Bart', 'male')
if bart.get_gender() != 'male':
    print('测试失败!')
else:
    bart.set_gender('female')
    if bart.get_gender() != 'female':
        print('测试失败!')
    else:
        print('测试成功!')

测试成功!


# 继承和多态

在 `OOP` 程序设计中，当我们定义一个 `class` 的时候，可以从某个现有的 `class` 继承，新的 `class` 称为子类 `（Subclass）` ，而被继承的 `class` 称为基类、父类或超类 `（Base class、Super class）`

比如，我们已经编写了一个名为 `Animal` 的 `class` ，有一个 `run()` 方法可以直接打印：

In [1]:
class Animal(object):
    def run(self):
        print('Animal is running...')

当我们需要编写 `Dog` 和 `Cat` 类时，就可以直接从 `Animal` 类继承：

In [19]:
class Dog(Animal):
    pass

class Cat(Animal):
    pass

In [20]:
dog = Dog()
dog.run()

cat = Cat()
cat.run()

Animal is running...
Animal is running...


当然，也可以对子类增加一些方法，比如 `Dog` 类：

In [2]:
class Dog(Animal):

    def run(self):
        print('Dog is running...')

    def eat(self):
        print('Eating meat...')
        
dog = Dog()
dog.run()

Dog is running...


## overwrite 多態

继承的第二个好处需要我们对代码做一点改进。

你看到了，无论是 `Dog` 还是 `Cat` ，它们 `run()` 的时候，显示的都是 `Animal is running...` ，符合逻辑的做法是分别显示 `Dog is running...` 和 `Cat is running...` ，因此，对 `Dog` 和 `Cat` 类改进如下：

In [6]:
class Dog(Animal):

    def run(self):
        print('Dog is running...')

class Cat(Animal):

    def run(self):
        print('Cat is running...')

当子类和父类都存在相同的 `run()` 方法时，我们说，子类的 `run()` 覆盖了父类的`run()` ，在代码运行的时候，总是会调用子类的 `run()` 。

这样，我们就获得了继承的另一个好处：多态。

## isinstance()

判断一个变量是否是某个类型可以用 `isinstance()` 判断：

In [24]:
a = list() # a是list类型
b = Animal() # b是Animal类型
c = Dog() # c是Dog类型

isinstance(a, list)
isinstance(b, Animal)
isinstance(c, Dog)

True

True

True

在继承关系中，如果一个实例的数据类型是某个子类，那它的数据类型也可以被看做是父类。

但是，反过来就不行：

In [26]:
isinstance(c, Animal) # c是Dog类型

isinstance(b, Dog) # b是Animal类型

True

False

## 多态的好处

要理解多态的好处，我们还需要再编写一个函数，这个函数接受一个`Animal`类型的变量：

In [3]:
def run_twice(animal):
    animal.run()
    animal.run()

In [7]:

# Animal()
run_twice(Animal())
# Dog()
run_twice(Dog())
# Cat()
run_twice(Cat())

Animal is running...
Animal is running...
Dog is running...
Dog is running...
Cat is running...
Cat is running...


多态的好处就是，当我们需要传入 `Dog` 、 `Cat` 时，我们只需要接收 `Animal` 类型就可以了，因为 `Dog` 、 `Cat` 都是 `Animal` 类型，然后，按照 `Animal` 类型进行操作即可。

由于 `Animal` 类型有 `run()` 方法，因此，传入的任意类型，只要是 `Animal` 类或者子类，就会自动调用实际类型的 `run()` 方法，这就是多态的意思：

对于一个变量，我们只需要知道它是 `Animal` 类型，无需确切地知道它的子类型，就可以放心地调用 `run()` 方法，而具体调用的 `run()` 方法是作用在 `Animal` 、 `Dog` 、 `Cat` 对象上，由运行时该对象的确切类型决定，这就是多态真正的威力：

调用方只管调用，不管细节，而当我们新增一种 `Animal` 的子类时，只要确保 `run()` 方法编写正确，不用管原来的代码是如何调用的。这就是著名的**“开闭”原则**：

对扩展开放：允许新增 `Animal` 子类；

对修改封闭：不需要修改依赖 `Animal` 类型的 `run_twice()` 等函数。

## 静态语言 vs 动态语言

对于静态语言（例如 `Java` ）来说，如果需要传入 `Animal` 类型，则传入的对象必须是 `Animal` 类型或者它的子类，否则，将无法调用 `run()` 方法。

对于 `Python` 这样的动态语言来说，则不一定需要传入 `Animal` 类型。

我们只需要保证传入的对象有一个 `run()` 方法就可以了：

In [8]:
class Timer(object):
    def run(self):
        print('Start...')
        
run_twice(Timer())

Start...
Start...


这就是动态语言的**“鸭子类型”**，它并不要求严格的继承体系，一个对象只要“看起来像鸭子，走起路来像鸭子”，那它就可以被看做是鸭子。

`Python` 的 `“file-like object“` 就是一种鸭子类型。

对真正的文件对象，它有一个 `read()` 方法，返回其内容。

但是，许多对象，只要有 `read()` 方法，都被视为 `“file-like object“` 。

许多函数接收的参数就是 `“file-like object“` ，你不一定要传入真正的文件对象，完全可以传入任何实现了 `read()` 方法的对象。

# 获取对象信息

## 使用type()

In [10]:
type(123) # 基本类型
type(abs) # 变量指向函数或者类

int

builtin_function_or_method

In [11]:
# type()函数返回 Class类型

type(123)==type(456)
type(123)==int

True

True

## types常量 types.FunctionType

In [13]:
import types

def fn():
    pass
    
type(fn)==types.FunctionType
type(abs)==types.BuiltinFunctionType
type(lambda x: x)==types.LambdaType
type((x for x in range(10)))==types.GeneratorType

True

True

True

True

## 使用isinstance()

对于 `class` 的继承关系来说，使用 `type()` 就很不方便。

我们要判断 `class` 的类型，可以使用 `isinstance()` 函数。

我们回顾上次的例子，如果继承关系是：

    object -> Animal -> Dog -> Husky
    
那么， `isinstance()` 就可以告诉我们，一个对象是否是某种类型。先创建3种类型的对象：

In [14]:
class Animal(object):
    def run(self):
        print('Animal is running...')

In [17]:
class Dog(Animal):

    def run(self):
        print('Dog is running...')

class Cat(Animal):

    def run(self):
        print('Cat is running...')

In [21]:
a = Animal()
d = Dog()
isinstance(d, Dog)
isinstance(d, Animal)

True

True

`isinstance()` 判断的是一个对象是否是该类型本身，或者位于该类型的父继承链上。

能用 `type()` 判断的基本类型也可以用 `isinstance()` 判断：

In [23]:
isinstance('a', str)
isinstance(123, int)
isinstance(b'a', bytes)

True

True

True

**优先使用isinstance()判断类型，可以将指定类型及其子类“一网打尽”**

## 使用dir()

如果要获得一个对象的所有属性和方法，可以使用 `dir()` 函数，它返回一个包含字符串的 `list` ，比如，获得一个 `str` 对象的所有属性和方法：

In [24]:
dir('ABC')

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',
 'zfill']

类似 `__xxx__` 的属性和方法在 `Python` 中都是有特殊用途的，比如 `__len__` 方法返回长度。

在 `Python` 中，如果你调用 `len()` 函数试图获取一个对象的长度，实际上，在 `len()` 函数内部，它自动去调用该对象的 `__len__()` 方法

In [25]:
len('ABC')
'ABC'.__len__()

3

3

我们自己写的类，如果也想用  `len(myObj)` 的话，就自己写一个 `__len__()` 方法：

In [26]:
class MyDog(object):
    def __len__(self):
        return 100
    
dog = MyDog()
len(dog)

100

## getattr()、setattr()以及hasattr()

仅仅把属性和方法列出来是不够的，配合 `getattr()` 、 `setattr()` 以及`hasattr()` ，我们可以直接操作一个对象的状态：

In [28]:
class MyObject(object):
    def __init__(self):
        self.x = 9
    def power(self):
        return self.x * self.x
    
obj = MyObject()

In [32]:
hasattr(obj, 'x') # 有属性'x'吗？

hasattr(obj, 'y') # 有属性'y'吗？
setattr(obj, 'y', 19) # 设置一个属性'y'
getattr(obj, 'y') # 获取属性'y'

getattr(obj, 'z', 404) # 获取属性'z'，如果不存在，返回默认值404

True

True

19

404

In [33]:
hasattr(obj, 'power') # 有属性'power'吗？
fn = getattr(obj, 'power') # 获取属性'power'并赋值到变量fn
fn()

True

81

只有在不知道对象信息的时候，我们才会去获取对象信息

一个正确的用法的例子如下：

```py
def readImage(fp):
    if hasattr(fp, 'read'):
        return readData(fp)
    return None
```

## 实例属性和类属性

给实例绑定属性的方法是通过**实例变量**，或者通过 `self` 变量：

In [35]:
class Student(object):
    def __init__(self, name):
        # self 变量
        self.name = name  

s = Student('Bob')
s.score = 90 # 实例变量

### 类属性

当我们定义了一个类属性后，这个属性虽然归类所有，但类的所有实例都可以访问到。来测试一下：

In [37]:
class Student(object):
    name = 'Student'
    
s = Student() # 创建实例s
print(s.name) # 打印name属性，因为实例并没有name属性，所以会继续查找class的name属性

print(Student.name) # 打印类的name属性
s.name = 'Michael' # 给实例绑定name属性

print(s.name) # 由于实例属性优先级比类属性高，因此，它会屏蔽掉类的name属性

print(Student.name) # 但是类属性并未消失，用Student.name仍然可以访问

del s.name # 如果删除实例的name属性

print(s.name) # 再次调用s.name，由于实例的name属性没有找到，类的name属性就显示出来了

Student
Student
Michael
Student
Student


从上面的例子可以看出，在编写程序的时候，千万不要对实例属性和类属性使用相同的名字，因为相同名称的实例属性将屏蔽掉类属性，但是当你删除实例属性后，再使用相同的名称，访问到的将是类属性。

### 练习

为了统计学生人数，可以给 `Student` 类增加一个类属性，每创建一个实例，该属性自动增加：

In [None]:
class Student(object):
    count = 0

    def __init__(self, name):
        self.name = name
        Student.count += 1
        
# 测试:
if Student.count != 0:
    print('测试失败!')
else:
    bart = Student('Bart')
    if Student.count != 1:
        print('测试失败!')
    else:
        lisa = Student('Bart')
        if Student.count != 2:
            print('测试失败!')
        else:
            print('Students:', Student.count)
            print('测试通过!')