# 对象和类

本章我们学习如何使用自定义的数据结构：**对象**。

## 什么是对象

“对象是 Python 中对数据的一种抽象，Python程序中所有数据都是通过对象或对象之间的关系来表示的。”

在 Python 中，所有的对象都具有**id**、**type**、**value**三个属性：

其中**id**代表内存地址，可以通过内置函数`id()`查看，而**type**表示对象的类别，不同的类别意味着该对象拥有的属性和方法等，可以通过`type()`方法查看。

对象既包含数据（attribute，称为特性），也包含代码（函数，也称为方法），它是某一类具体事物的特殊实例。

对象作为 Python 中的基本单位，可以被创建、命名或删除。Python中一般不需要手动删除对象，其垃圾回收机制会自动处理不再使用的对象，当然如果需要，也可以使用`del`语句删除某个变量；所谓命名则是指给对象贴上一个名字标签，方便使用，也就是声明或赋值变量。

对于一些 Python 内置类型的对象，通常可以使用特定的语法生成，例如**数字**直接使用阿拉伯数字字面量，**字符串**使用引号`''`，**列表**使用`[]`，**字典**使用`{}`，**函数**使用`def`语法等，这些对象的类型都是 Python 内置的。


**我们把对象比做是塑料盒子， 类class就是制作盒子用的模具**


## 类与实例

在Python中通常使用`class`语句来定义一个类（类对象），与其他对象不同的是，`class`定义的对象（类）可以用于产生新的对象（实例）。

例：

In [12]:
class Person():
    pass

def who(obj):
    print(id(obj), type(obj))
    
someone = Person()
who(someone)

140706206496848 <class '__main__.Person'>


In [13]:
type(Person)

type

上面的例子中`Person`是我们创建的一个新的类，通过调用`Person()`可以获得一个`Person`类型的实例对象，将其赋值为`someone`，就成功创建了一个与所有内置对象类型不同的对象`someone`，它的类型为`__main__.Person`。

到这里，可以将Python中一切的对象分为两种：

1. 可以用来生成新对象的类，包括内置的`int`、`str`以及上面定义的`Person`等；
2. 由类生成的实例对象，包括内置类型的数字、字符串、以及上面定义的类型为`__main__.Person`的`someone`。

在实践中不得不考虑的一些细节性问题：

1. 需要一些方便的机制来实现面向对象编程中的继承、重载等特性；
2. 需要一些固定的流程让我们可以在生成实例化对象的过程中执行一些特定的操作。

## 类的方法

在类的内部，使用`def`关键字可以为类定义一个方法，与一般函数定义不同，方法必须包含参数`self`，且为第一个参数。

Python使用特殊的对象初始化方法（构造函数，在生成对象时调用）`__init__`，当创建了这个类的实例时就会调用该方法，与C++中构造函数类似。如果想重新定义一下上面的`Person`类，比如为其添加一个`name`参数，可以这样：

例：

In [14]:
class Person():
    def __init__(self, name):
        self.name = name

perter = Person('Perter')


`self` 参数指向了这个正在被创建的对象本身，尽管`self`不是python中的保留字，但是很很常用。

上面代码执行流程分析：
1. 查看Person类的定义
2. 在内存中实例化（创建）一个新的对象
3. 调用对象的'__init__'方法，将这个新创建的对象作为'self'参数传入，并将另一个参数（’Perter‘）作为'name'传入
4. 将'name'的值存入对象
5. 将名字'perter'与这个对象关联

**注意**：注意到__init__方法的第一个参数永远是self，表示创建的实例本身，因此，在__init__方法内部，就可以把各种属性绑定到self，因为self就指向创建的实例本身。

有了__init__方法，在创建实例的时候，就不能传入空的参数了，必须传入与__init__方法匹配的参数，但self不需要传，Python解释器自己会把实例变量传进去。

除self方法外，类的方法和普通函数没有什么区别，所以，你仍然可以用默认参数、可变参数、关键字参数和命名关键字参数。

## 继承

从已有类中衍生出新的类，添加或修改部分功能，能提高代码复用。使用继承得到的新类会自动获得旧类中的所有方法，而不需要进行复制。

你可以在新类里面定义自己额外需要的方法，或者按照需要对继承的方法进行修改。

例：

In [21]:
class A():
    def foo(self):
        print('A.foo')
        
class B(A):
    def foo(self): # 在子类中重写方法，会覆盖掉原来父类的方法
        super().foo() # 在子类中调用父类的方法
        print('B.foo')
    def bar(self): # 在子类中添加新的父类中没有的新方法
        print('B.bar')

In [22]:
a = A()
b = B()
a.foo()
b.foo()
b.bar()

A.foo
A.foo
B.foo
B.bar


### 使用super( )从父类得到帮助
例：

In [23]:
class Person():
    def __init__(self, name):
        self.name = name
    
class EmailPerson(Person):
    def __init__(self, name, email):
        super().__init__(name)
        self.email = email



我们说 `self` 永远是指当前这个正在创建的对象，在调用父类的`__init__` 方法是 `self` 会自动降参数传递给父类

In [24]:
lilei = EmailPerson('lilei', 'lilei@aaa.com')

In [25]:
lilei.name

'lilei'

In [26]:
lilei.email

'lilei@aaa.com'

## 在类中封装属性名

Python中类的所有特性都是公开的，Python程序员不去依赖语言特性去封装数据，而是通过遵循一定的属性和方法命名规约来达到这个效果。

第一个约定是任何以单下划线`_`开头的名字都应该是内部实现。

例：

In [47]:
class A():
    def __init__(self):
        self.__internal = 0
    def _internal_method(self):
        pass
    def set_interval(self):
        self.__internal += 1
        return self.__internal

In [48]:
a = A()

In [49]:
a.set_interval()

1

Python并不会真的阻止别人访问内部名称。但是如果你这么做肯定是不好的，可能会导致脆弱的代码。同时还要注意到，使用下划线开头的约定同样适用于模块名和模块级别函数。

另外，使用双下划线`__`开始会导致访问名称变成其他形式（名称改写／name mangling）。

例：

In [55]:
class Student():
    def __init__(self, name, score):
        self.__name = name
        self.__score = score
        
        
    def print_score(self):
        print('%s: %s' % (self.__name, self.__score))
        
    def get_name(self):
        return self.__name
    
    def set_score(self, score):
        if 0 <= score <=100:
            self.__score = score
        else:
            print('bad score')

In [56]:
bart = Student('Bart', 59)

In [52]:
bart.print_score()

Bart: 59


In [57]:
bart.get_name()

'Bart'

In [60]:
bart._Student__name

'Bart'

上面的类B中，私有特性和方法会被重命名为`_B__private`和`_B__private_method`。这样做的目的就是为了继承时无法被覆盖。例如：

上面示例中，私有名称`__private`和`__private_method`会被重命名为`_C__private`和`_C__private_method`，这个跟父类B中的名称是完全不同的。

上面提到的两种不同的编码约定（单下划线和双下划线）来命名私有属性应该选择哪一种？大多数而言，你应该让你的非公共名称以单下划线开头。但是，如果你清楚你的代码会涉及到子类，并且有些内部属性应该在子类中隐藏起来，那么你需要考虑使用双下划线方案。

还有一点，有时候你定义的一个变量和某个保留关键字冲突，这时候可以使用单下划线作为后缀：

上面并不使用单下划线前缀的原因是它避免误解它的使用初衷（如使用单下划线前缀的目的是为了防止命名冲突而不是指明这个属性是私有的）。通过使用单下划线后缀可以解决这个问题。

## 方法类型

在类中定义的方法有3种，分别是：

* **实例方法**（instance method），以`self`作为第一个参数，当其被调用时，Python会把调用该方法的对象作为`self`参数传入。
* **类方法**（class method），用`@classmethod`装饰器指定，第一个参数是类本身，通常写作`cls`，作用于整个类，对类作出的任何改变会对它的所有实例对象产生影响。
* **静态方法**（static method），用`@staticmethod`修饰，其参数既不需要`self`，也不需要`cls`，其功能既不影响类也不影响类的实例，仅仅为了组织代码的方便。

例：

In [66]:
class A():
    count = 0
    def __init__(self):
        A.count += 1
    
    @classmethod
    def kid(cls):
        print('A has', cls.count, 'little objects')
    
    @staticmethod
    def static_method():
        print('Static method called!')

In [67]:
easy_a = A()

In [68]:
breezy_a = A()
wheezy_a = A()

In [69]:
easy_a.kid()

A has 3 little objects


In [None]:
easy_a.static_method()
A.static_method()

## 鸭子类型

在程序设计中，鸭子类型（duck typing）是动态类型的一种风格。在这种风格中，一个对象有效的语义，不是由继承自特定的类或实现特定的接口，而是由"当前方法和属性的集合"决定。支持“鸭子类型”的语言的解释器/编译器会在解释或编译时推断对象的类型。在鸭子类型中，关注的不是对象的类型本身，而是它是如何使用的。例如，在不使用鸭子类型的语言中，我们可以编写一个函数，它接受一个类型为“鸭子”的对象，并调用它的“走”和“叫”方法。在使用鸭子类型的语言中，这样的一个函数可以接受一个任意类型的对象，并调用它的“走”和“叫”方法。如果这些需要被调用的方法不存在，那么将引发一个运行时错误。任何拥有这样的正确的“走”和“叫”方法的对象都可被函数接受的这种行为引出了以上表述，这种决定类型的方式因此得名。

在动态语言设计中，可以解释为无论一个对象是什么类型的，只要它具有某类型的行为（方法），则它就是这一类型的实例，而不在于它是否显示的实现或者继承。比如，如果一个对象具备迭代器所具有的所有行为特征，那它就是迭代器了。而如何保证一个对象实现某一种类型的所有特征，则依靠**协议**。

例：

In [75]:
class Que():
    def __init__(self, person, words):
        self.person = person
        self.words = words
    
    def who(self):
        return self.person
    
    def says(self):
        return self.words + '.'

class QQue(Que):
    def says(self):
        return self.words + '?'

class EQue(Que):
    def says(self):
        return self.words + '!'

In [76]:
h1 = Que('Elmer', 'hello')

In [77]:
print(h1.who(), 'says', h1.says())

Elmer says hello.


In [78]:
h2 = QQue('Bunny', 'hi')
print(h2.who(), 'says', h2.says())

Bunny says hi?


In [80]:
h3 = EQue('Daffy', 'haha')
print(h3.who(), 'says', h3.says())

Daffy says haha!


In [81]:
def who_says(obj):
    print(obj.who(), 'says', obj.says())

In [82]:
who_says(h2)

Bunny says hi?


In [83]:
class Bab():
    def who(self):
        return 'Bab'
    def says(self):
        return 'Biu'

In [84]:
biu = Bab()

In [85]:
who_says(biu)

Bab says Biu


## 特殊方法（魔法方法）

特殊方法是指Python类中以双下划线`__`开头和结尾的方法，比如`__init__`，根据类的定义以及传入的参数对新创建的对象进行初始化。

例：

In [86]:
a = 3 + 8

11

In [87]:
'ha' == 'HA'

False

In [88]:
class Word():
    def __init__(self, text):
        self.text = text
    
    def equals(self, word2):
        return self.text.lower() == word2.text.lower()

In [94]:
first = Word('ha')
second = Word('HA')

In [90]:
first.equals(second)

True

In [91]:
third = Word('biu')

In [92]:
first.equals(third)

False

In [93]:
class Word():
    def __init__(self, text):
        self.text = text
    
    def __eq__(self, word2):
        return self.text.lower() == word2.text.lower()

In [95]:
first == second

True

### 构造和初始化

但是当调用`x = SomeClass()`的时候，`__init__`并不是第一个被调用的方法。实际上，还有一个叫做`__new__`的方法，来构造这个实例。然后给在开始创建时候的初始化函数来传递参数。在对象生命周期的另一端，也有一个`__del__`方法（如果`__new__`和`__init__`是对象的构造器的话，那么`__del__`就是析构器），它定义的是当一个对象进行垃圾回收时候的行为。当一个对象在删除的时需要更多的清洁工作的时候此方法会很有用，比如套接字对象或者是文件对象。

```python
from os.path import join

class FileObject:
    '''给文件对象进行包装从而确认在删除时关闭文件流'''

    def __init__(self, filepath='~', filename='sample.txt'):
        # 读写模式打开一个文件
        self.file = open(join(filepath, filename), 'r+')

    def __del__(self):
        self.file.close()
        del self.file
```

### 用于比较的魔术方法

```
__lt__(self, other)    self < other
__le__(self, other)    self <= other
__eq__(self, other)    self == other
__ne__(self, other)    self != other
__gt__(self, other)    self > other
__ge__(self, other)    self >= other
```

举一个例子，创建一个类来表示一个词语。我们也许会想要比较单词的字典序(通过字母表)，通过默认的字符串比较的方法就可以实现，但是我们也想要通过一些其他的标准来实现，比如单词长度或者音节数量。

### 普通算数操作符

```
__add__(self, other)      加法 +
__sub__(self, other)      减法 -
__mul__(self, other)      乘法 *
__floordiv__(self, other) 整数除法 //
__truediv__(self, other)  真除法 /
__mod__(self, other)      取模算法 %
__divmod___(self, other)  内置divmod()函数
__pow__(self, other)      指数运算 **
__lshift__(self, other)   左移 <<
__rshift__(self, other)   右移 >>
__and__(self, other)      按位与 &
__or__(self, other)       按位或 |
__xor__(self, other)      按位异或 ^
```

### 其他种类的魔法方法

* `__str__(self)`  等价于`str(self)`，定义如何打印对象信息，`print()`、`str()`以及字符串格式化相关方法都会用到`__str__()`。
* `__repr__(self)` 等价于`repr(self)`，交互式解释器适用此方法输出变量。
* `__len__(self)` 等价于`len(self)`。

In [96]:
print(first)

<__main__.Word object at 0x109c724e0>


In [103]:
class Word():
    def __init__(self, text):
        self.text = text
    
    def __eq__(self, word2):
        return self.text.lower() == word2.text.lower()
    
    def __str__(self):
        return self.text
    
    def __repr__(self):
        return 'Word("'+ self.text +'")'

In [104]:
first = Word('ha')

In [99]:
print(first)

ha


In [105]:
first

Word("ha")

In [25]:
class Student(object):
    def __init__(self,sname,sclass,spost,sno):
        self.__sname = sname
        self.__sclass = sclass
        self.__spost = spost
        self.__sno = sno 
    def information(self):
        print('姓名：%s 班级：%s 职务：%s 学号：%s'%(self.__sname,self.__sclass,self.__spost,self.__sno))

In [26]:
b = Student('焦国宁','四','群众','20000')

In [27]:
b.information()

姓名：焦国宁 班级：四 职务：群众 学号：20000


In [14]:
a = Student

In [3]:
a.sname = 'lisa'

In [4]:
a.sage = 17

In [5]:
a.sname

'lisa'

In [6]:
a.sage

17

In [7]:
a.score = 60

In [8]:
a.score

60

In [9]:
a.score = 70

In [10]:
a.score

70

In [12]:
a._Student__score = 20

In [15]:
a.score

<property at 0x19f3ab12868>

In [16]:
a.score = 90

In [24]:
a.getsocre()

TypeError: getsocre() missing 1 required positional argument: 'self'

In [21]:
a.score

90

In [22]:
a.score = 78

# 命名元组

命名元组是元组的子类，你既可以通过名称来访问其中的值，也可以通过位置进行访问。

命名元组并不是python自动支持的类型，使用之前需要加载与其相关的模块。

In [1]:
from collections import namedtuple

In [2]:
class Duck():
    def __init__(self, bill, tail):
        self.bill = bill 
        self.tail = tail 
    def about(self):
        print('this duck has a', self.bill, 'bill and a', self.tail, 'tail')

In [3]:
duck = Duck('wide orange', 'long')
duck.about()

this duck has a wide orange bill and a long tail


将前面的DUCK类改写成为命名元组。

我们可以将下面两个参数传入namedtuple函数来创建命名元组：

* 名称

* 由多个域名组成的字符串，各个城市之间由空格隔开

In [5]:
Duck = namedtuple('Duck', 'bill tail')
duck0 = Duck('wide orange', 'long')
duck0

Duck(bill='wide orange', tail='long')

In [6]:
duck0.bill

'wide orange'

In [7]:
duck0.tail

'long'

也可以用字典来构造一个命名元组：

In [8]:
parts = {'bill':'wide orange', 'tail':'long'}
duck2 = Duck(**parts)
duck2

Duck(bill='wide orange', tail='long')

上面的例子中的**parts， 他是个关键字变量。它的作用是将parts字典中的键和值抽取出来作为参数提供给 Duck()使用 

它与下面的这行代码实现的功能一样：

In [None]:
duck = Duck(bill = 'wide orange', tail = 'long')

命名元组是不可变的，但是你可以替换其中某些域的值并返回一个新的命名元组：

In [11]:
duck3 = duck2._replace(tail='magnificent', bill='crushing')
duck3

Duck(bill='crushing', tail='magnificent')

使用命名元组的好处：
* 它无论是看起来还是用起来都和不可变对象非常相似
* 与使用对象相比， 使用命名元组在时间和空间上效率非常高
* 可以使用点号， 对特性进行访问， 而不需要使用字典风格的方括号
* 可以把它作为字典的键