# 类

类提供了一种组合数据和功能的方法

创建一个新类
- 创建一个新的对象类型
    - 创建一个该类型的新实例

每个类的实例可以拥有：
- 保存自己状态的属性
- 改变自己状态的方法

面向对象编程的标准特性
- 类继承机制允许多个基类
- 派生类可以覆盖其基类的任何方法
- 一个方法可以调用基类中相同名称的方法

对象可以包含任意数量和类型的数据

类具有动态特性
- 运行时创建
- 创建后修改

以 C++ 术语表述
- 通常类成员（包括数据成员）是 public (例外：私有变量)

以 Modula-3 术语表述
- 没有用于从方法引用对象成员的简写
    - 方法函数使用表示对象的显式第一个参数声明，该参数由调用隐式提供。

以 Smalltalk 术语表述
- 类本身也是对象
    - 为导入和重命名提供了语义

其它特性
- 内置类型可以用作用户扩展的基类
- 大多数具有特殊语法（算术运算符、下标等）的内置运算符都可以为类实例重新定义

## 名称和对象

别名 alias
- 多个名称（在多个作用域内）可以绑定到同一个对象

在处理不可变的基本类型（数字，字符串，元组）时可以安全地忽略

在处理可变对象（如列表，字典和大多数其他类型）时可能引发语义错误
- 如果函数修改了作为参数传递的（可变）对象，调用者将看到更改

传递对象的代价很小
- 只传递一个指针

## 命名空间 namespace

名字到对象的映射
- 大部分命名空间由 Python 字典实现

例子
- 存放内置函数的集合（内置的异常）
- 模块中的全局名称
- 函数调用中的局部名称
- 从某种意义上来说，对象的属性集合

不同命名空间中的名称之间没有关系
- 使用模块名称区分

任何跟在一个点号 `.` 之后的名称都被称为属性

对模块中名称的引用属于属性引用
- `modname.funcname`：`modname` 模块对象，`funcname` 属性
    - 模块的属性和模块中定义的全局名称之间正好存在一个直观的映射：共享相同的命名空间
        - 例外，模块对象有一个隐藏的只读属性 [\_\_dict\_\_](https://docs.python.org/zh-cn/3/library/stdtypes.html#object.__dict__)，返回用于实现模块命名空间的字典；`__dict__` 是属性但不是全局名称
        - 显然，使用这个将违反命名空间实现的抽象，应当仅被用于事后调试之类的场合
    
属性可以是只读或可写的
- 可写属性可以赋值，使用 `del` 删除

不同时刻创建的命名空间拥有不同的生存期
- 包含内置名称的命名空间在 Python 解释器启动时创建，永远不会被删除
- 模块的全局命名空间在模块定义被读入时创建
    - 通常，模块命名空间也会持续保留到解释器退出
- 被解释器的顶层调用执行的语句
    - 从一个脚本文件读取或交互式地读取，被认为是 [\_\_main\_\_](https://docs.python.org/zh-cn/3/library/__main__.html#module-__main__) 模块调用的一部分，因此它们拥有自己的全局命名空间
    - 内置名称存在于 [builtins](https://docs.python.org/zh-cn/3/library/builtins.html#module-builtins) 模块中


函数的本地命名空间
- 在函数被调用时创建
- 在函数返回或抛出一个不在函数内部处理的错误时被删除
- 每次递归调用都会有它自己的本地命名空间

## 作用域 scope

命名空间可直接访问的 Python 程序的文本区域
- 可直接访问：对名称的非限定引用会尝试在命名空间中查找名称

在执行期间的任何时刻，会有 3 或 4 个命名空间可被直接访问的嵌套作用域：
- 最先搜索的最内部作用域包含局部名称
- 从最近的封闭作用域开始搜索的任何封闭函数的作用域包含非局部名称，也包括非全局名称
- 倒数第二个作用域包含当前模块的全局名称
- 最外面的作用域（最后搜索）是包含内置名称的命名空间

如果一个名称被声明为全局变量，则所有引用和赋值将直接指向包含该模块的全局名称的中间作用域

要重新绑定在最内层作用域以外找到的变量，可以使用 [nonlocal](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#nonlocal) 语句声明为非本地变量

如果没有被声明为非本地变量，这些变量将是只读的
- 尝试写入这样的变量只会在最内层作用域中创建一个新的局部变量，而同名的外部变量保持不变

当前局部作用域将（按字面文本）引用当前函数的局部名称。

在函数以外，局部作用域将引用与全局作用域相一致的命名空间：模块的命名空间。

类定义将在局部命名空间内再放置另一个命名空间。

在一个模块内定义的函数的全局作用域就是该模块的命名空间，无论该函数从什么地方或以什么别名被调用。 

实际的名称搜索是在运行时动态完成的
- 事实上，局部变量已经被静态确定了

如果不存在生效的 [global](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#the-global-statement) 或 [nonlocal](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#nonlocal) 语句 
- 对名称的赋值总是会进入最内层作用域
- 赋值不会复制数据
    - 只是将名称绑定到对象
- 删除同理
    - 语句 `del x` 会从局部作用域所引用的命名空间中移除对 x 的绑定

所有引入新名称的操作都是使用局部作用域
- 特别地，import 语句和函数定义会在局部作用域中绑定模块或函数名称

[global](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#the-global-statement) 语句
- 表明特定变量生存于全局作用域并且应当在其中被重新绑定

[nonlocal](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#nonlocal) 语句
- 表明特定变量生存于外层作用域中并且应当在其中被重新绑定

In [1]:
# 引用不同作用域和名称空间
def scope_test():
    def do_local():
        spam = "local spam"    # 局部赋值

    def do_nonlocal():
        nonlocal spam
        spam = "nonlocal spam" # 改变 scope_test 对 spam 的绑定

    def do_global():
        global spam
        spam = "global spam"   # 改变模块层级的绑定

    spam = "test spam"
    do_local()
    print("After local assignment:", spam)
    do_nonlocal()
    print("After nonlocal assignment:", spam)
    do_global()
    print("After global assignment:", spam)

scope_test()
print("In global scope:", spam)

After local assignment: test spam
After nonlocal assignment: nonlocal spam
After global assignment: nonlocal spam
In global scope: global spam


类引入了一些新语法，三种新对象类型和一些新语义

### 类定义语法

被执行才会起作用

类定义内的语句通常都是函数定义，允许有其他语句

在类内部的函数定义通常具有一种特别形式的参数列表
- 由方法调用的约定规范指明

进入类定义时，将创建一个新的命名空间，并将其用作局部作用域
- 所有对局部变量的赋值都在这个新命名空间之内
- 函数定义会绑定到这里的新函数名称

从（结尾处）正常离开类定义时，将创建一个类对象
- 基本上是一个包围在类定义所创建命名空间内容周围的包装器
- 原始的（在进入类定义之前起作用的）局部作用域将重新生效
    - 类对象将在这里被绑定到类定义头所给出的类名称 (在这个示例中为 ClassName)

```python
class ClassName:
    <statement-1>
    .
    .
    .
    <statement-N>
```

### 类对象

支持两种操作
- 属性引用
- 实例化

属性引用
- 使用 Python 中所有属性引用所使用的标准语法：`obj.name`

有效的属性名称
- 类对象被创建时存在于类命名空间中的所有名称


In [2]:
class MyClass:
    """A simple example class"""
    i = 12345

    def f(self):
        return 'hello world'

有效的属性引用
- `MyClass.i`：整数
- `MyClass.f`：函数对象
- `MyClass.__doc__`：返回所属类的文档字符串

类的实例化使用函数表示法
- 把类对象视为是返回该类的一个新实例的不带参数的函数

In [3]:
# 创建类的新实例，并将其分配给局部变量
x = MyClass()

实例化操作（调用类对象）会创建一个空对象

许多类创建带有特定初始状态的自定义实例
- 类定义可能包含一个名为 [\_\_init\_\_](https://docs.python.org/zh-cn/3/reference/datamodel.html#object.__init__) 的特殊方法
    - 类的实例化操作会自动为新创建的类实例调用 `__init__()`
    - 提供给实例化运算符的参数将被传递给 `__init__()`

In [4]:
def __init__(self):
    self.data = []

In [5]:
class Complex:
    def __init__(self, realpart, imagpart):    # 实例化参数
        self.r = realpart
        self.i = imagpart

x = Complex(3.0, -4.5)
x.r, x.i

(3.0, -4.5)

### 实例对象

属性引用 --> 有效的属性名称
- 数据属性
    - 不需要声明，在第一次被赋值时产生
- 方法
    - “从属”于对象的函数

实例对象的有效方法名称依赖于其所属的类
- 一个类中所有是函数对象的属性都是定义课其实例的相应方法
- `x.f` 是一个方法对象，`MyClass.f` 是一个函数对象

In [6]:
# MyClass 类实例
x.counter = 1
while x.counter < 10:
    x.counter = x.counter * 2
print(x.counter)
del x.counter

16


### 方法对象

实例对象会作为函数的第一个参数被传入方法

调用一个具有 n 个参数的方法就相当于调用 n+1 个参数的对应函数
- 多出来的这一个参数为实例对象，且位置在其他参数之前

当一个实例的非数据属性被引用时，将搜索实例所属的类
- 如果被引用的属性名称表示一个有效的类属性中的函数对象，会通过打包（指向）查找到的实例对象和函数对象到一个抽象对象的方式来创建方法对象
    - 这个抽象对象就是方法对象
- 当附带参数列表调用方法对象时，将基于实例对象和参数列表构建一个新的参数列表，并使用这个新参数列表调用相应的函数对象

In [7]:
# 方法在绑定后立即被调用
x = MyClass()
x.f()        # 相当于 MyClass.f(x)

'hello world'

In [8]:
# 保存起来以后再调用
xf = x.f
for i in range(2):
    print(xf())

hello world
hello world


### 类和实例变量

一般来说
- 实例变量用于每个实例的唯一数据
- 类变量用于类的所有实例共享的属性和方法

In [9]:
class Dog:
    kind = 'canine'         # class variable shared by all instances
    def __init__(self, name):
        self.name = name    # instance variable unique to each instance

d = Dog('Fido')
e = Dog('Buddy')

In [10]:
d.kind

'canine'

In [11]:
e.kind

'canine'

In [12]:
d.name

'Fido'

In [13]:
e.name

'Buddy'

共享数据在涉及可变（[mutable](https://docs.python.org/zh-cn/3/glossary.html#term-mutable)）对象时可能出错

In [14]:
# 类变量 tricks --> 所有 Dog 实例共享单独的列表
class Dog:
    tricks = []             # mistaken use of a class variable
    def __init__(self, name):
        self.name = name
    def add_trick(self, trick):
        self.tricks.append(trick)

d = Dog('Fido')
e = Dog('Buddy')
d.add_trick('roll over')
e.add_trick('play dead')
d.tricks                # unexpectedly shared by all dogs

['roll over', 'play dead']

In [15]:
# 正确做法：使用实例变量
class Dog:
    def __init__(self, name):
        self.name = name
        self.tricks = []    # creates a new empty list for each dog
    def add_trick(self, trick):
        self.tricks.append(trick)

d = Dog('Fido')
e = Dog('Buddy')
d.add_trick('roll over')
e.add_trick('play dead')
d.tricks

['roll over']

In [16]:
e.tricks

['play dead']

如果同样的属性名称同时出现在实例和类中，属性查找会优先选择实例中的属性

In [17]:
class Warehouse:
    purpose = 'storage'
    region = 'west'

w1 = Warehouse()
print(w1.purpose, w1.region)

w2 = Warehouse()
w2.region = 'east'
print(w2.purpose, w2.region)    # 优先选择实例变量，而不是类变量

storage west
storage east


数据属性可以被方法或对象所引用
- 类不能用于实现纯抽象数据类型
- 可能通过直接操作数据属性的方式破坏由方法所维护的固定变量
- 可以向一个实例对象添加数据属性而不会影响方法的可用性
    - 只要保证避免名称冲突 

> 用 C 语言编写的 Python 实现则可以完全隐藏实现细节，并在必要时控制对象的访问；此特性可以通过用 C 编写 Python 扩展来使用。

约定：方法的第一个参数常常被命名为 `self`

任何一个作为类属性的函数都为该类的实例定义了一个相应方法

函数定义的文本并非必须包含于类定义之内
- 将一个函数对象赋值给一个局部变量也是可以的

In [18]:
# Function defined outside the class
def f1(self, x, y):
    return min(x, x+y)

class C:
    f = f1
    def g(self):
        return 'hello world'
    h = g

`f`、`g`、`h` 都是 C 类的引用函数对象的属性
- 都是 C 的实例的方法
- `h` 完全等同于 `g`

In [19]:
# 方法可以通过使用 self 参数的方法属性调用其他方法
class Bag:
    def __init__(self):
        self.data = []

    def add(self, x):
        self.data.append(x)

    def addtwice(self, x):
        self.add(x)
        self.add(x)

方法可以通过与普通函数相同的方式引用全局名称

与方法相关联的全局作用域就是包含其定义的模块
- 类永远不会被作为全局作用域

全局作用域存在许多合法的使用场景
- 导入到全局作用域的函数和模块可以被方法所使用
    - 在其中定义的函数和类也一样
    - 通常，包含该方法的类本身是在全局作用域中定义的

每个值都是一个对象，因此具有类（也称为类型），并存储为 `object.__class__` 

## 继承

派生类定义的语法

```python
class DerivedClassName(BaseClassName):
    <statement-1>
    .
    .
    .
    <statement-N>
```

- 名称 BaseClassName 必须定义在包含派生类定义的作用域中
- 也允许用其他任意表达式代替基类名称所在的位置
    - 当基类定义在另一个模块中的时候

```python
class DerivedClassName(modname.BaseClassName):
```

派生类定义的执行过程与基类相同
- 当构造类对象时，基类会被记住
    - 此信息将被用来解析属性引用
        - 如果请求的属性在类中找不到，搜索将转往基类中进行查找
        - 如果基类本身也派生自其他某个类，则按照此规则递归进行查找

派生类的实例化就是类的实例化（相同方式）

方法引用将按以下方式解析:
- 搜索相应的类属性
    - 如有必要将按基类继承链逐步向下查找
    - 如果产生了一个函数对象则方法引用就生效

派生类可以重载其基类的方法
- 扩展同名的基类方法
- 方法在调用同一对象的其他方法时没有特殊权限
    - 调用同一基类中定义的另一方法的基类方法最终可能会调用覆盖派生类的方法
- 对 C++ 程序员的提示：Python 中所有的方法实际上都是 virtual 方法

直接调用基类方法
- 调用 `BaseClassName.methodname(self, arguments)`
- 仅当此基类可在全局作用域中以 BaseClassName 的名称被访问时可使用

Python 有两个内置函数可被用于继承机制
- [isinstance()](https://docs.python.org/zh-cn/3/library/functions.html#isinstance)：检查一个实例的类型
    - `isinstance(obj, int)` 仅会在 `obj.__class__` 为 int 或某个派生自 int 的类时为 True
- [issubclass()](https://docs.python.org/zh-cn/3/library/functions.html#issubclass)：检查类的继承关系
    - `issubclass(bool, int)` 为 True，因为 bool 是 int 的子类
    - `issubclass(float, int)` 为 False，因为 float 不是 int 的子类

In [20]:
issubclass(bool, int)

True

In [21]:
issubclass(float, int)

False

### 多重继承

带有多个基类的类定义语句如下

```python
class DerivedClassName(Base1, Base2, Base3):
    <statement-1>
    .
    .
    .
    <statement-N>
```

搜索从父类所继承属性的操作是深度优先、从左至右的，当层次结构中存在重叠时不会在同一个类中搜索两次

如果某一属性在 `DerivedClassName` 中未找到，则会到 `Base1` 中搜索它，然后（递归地）到 `Base1` 的基类中搜索，如果在那里未找到，再到 `Base2` 中搜索，以此类推。

方法解析顺序会动态改变以支持对 [super()](https://docs.python.org/zh-cn/3/library/functions.html#super) 的协同调用
- 这种方式在某些其他多重继承型语言中被称为后续方法调用
- 比单继承型语言中的 super 调用更强大

动态改变顺序是有必要的
- 所有多重继承的情况都会显示出一个或更多的菱形关联（即至少有一个父类可通过多条路径被最底层类所访问）
- 所有类都是继承自 Object，因此任何多重继承的情况都提供了一条以上的路径可以通向 Object
- 为了确保基类不会被访问一次以上，动态算法会用一种特殊方式将搜索顺序线性化，保留每个类所指定的从左至右的顺序，只调用每个父类一次，并且保持单调
    - 即一个类可以被子类化而不影响其父类的优先顺序

## 私有变量

带有一个下划线的名称应该被当作是 API 的非公有部分
- 函数、方法、数据成员
- 例如 `_spam`

避免名称与子类所定义的名称冲突

名称改写
- 任何形式为 `__spam` 的标识符将被替换为 `_classname__spam`
    - 至少带有两个前缀下划线，至多一个后缀下划线
    - `classname` 为去除了前缀下划线的当前类名称
- 不考虑标识符的句法位置
    - 只要出现在类定义内部就会进行

名称改写有助于让子类重载方法而不破坏类内方法调用
- 为了避免意外冲突
- 仍有可能访问或修改被视为私有的变量

> 请注意传递给 exec() 或 eval() 的代码不会将发起调用类的类名视作当前类；这类似于 global 语句的效果，因此这种效果仅限于同时经过字节码编译的代码。 同样的限制也适用于 getattr(), setattr() 和 delattr()，以及对于 `__dict__` 的直接引用。

In [22]:
class Mapping:
    def __init__(self, iterable):
        self.items_list = []
        self.__update(iterable)

    def update(self, iterable):        # _Mapping__update
        for item in iterable:
            self.items_list.append(item)

    __update = update   # private copy of original update() method

class MappingSubclass(Mapping):
    def update(self, keys, values):    # _MappingSubclass__update
        # provides new signature for update()
        # but does not break __init__()
        for item in zip(keys, values):
            self.items_list.append(item)

定义一个空类
- 将一些命名数据项捆绑在一起

一段需要特定抽象数据类型的 Python 代码往往可以被传入一个模拟了该数据类型的方法的类作为替代
- 例如，如果使用一个基于文件对象来格式化某些数据的函数，可以定义一个带有 read() 和 readline() 方法从字符串缓存获取数据的类，并将其作为参数传入。

实例方法对象也具有属性
- `m.__self__`：带有 m() 方法的实例对象
- `m.__func__`：该方法所对应的函数对象

In [23]:
class Employee:
    pass

john = Employee()  # Create an empty employee record

# Fill the fields of the record
john.name = 'John Doe'
john.dept = 'computer lab'
john.salary = 1000

john.name

'John Doe'

## 迭代器

大多数容器对象都可以使用 for 语句

for 语句在容器对象上调用 [iter()](https://docs.python.org/zh-cn/3/library/functions.html#iter)
- 返回一个定义了 [\_\_next\_\_](https://docs.python.org/zh-cn/3/library/stdtypes.html#iterator.__next__) 方法的迭代器对象
    - 逐一访问容器中的元素
    - 元素耗尽时，引发 [StopIteraion](https://docs.python.org/zh-cn/3/library/exceptions.html#StopIteration) 异常来通知终止 for 循环

In [24]:
for element in [1, 2, 3]:
    print(element)
for element in (1, 2, 3):
    print(element)
for key in {'one':1, 'two':2}:
    print(key)
for char in "123":
    print(char)
for line in open("myfile.txt"):
    print(line, end='')

1
2
3
1
2
3
one
two
1
2
3
test!


In [25]:
# 使用内置函数 next() 来调用 __next__() 方法
s = 'abc'
it = iter(s)
it

<str_iterator at 0x1d6229fa940>

In [26]:
next(it)

'a'

In [27]:
next(it)

'b'

In [28]:
next(it)

'c'

In [29]:
next(it)

StopIteration: 

给类添加迭代器行为
- 定义一个 `__iter__()` 方法来返回一个带有 `__next__()` 方法的对象
- 如果类已经定义了 `__next__()` ，则 `__iter__()` 可以简单地返回 `self`

In [30]:
class Reverse:
    """Iterator for looping over a sequence backwards."""
    def __init__(self, data):
        self.data = data
        self.index = len(data)

    def __iter__(self):
        return self

    def __next__(self):
        if self.index == 0:
            raise StopIteration
        self.index = self.index - 1
        return self.data[self.index]

rev = Reverse('spam')
iter(rev)

<__main__.Reverse at 0x1d622a32dc0>

In [31]:
for char in rev:
    print(char)

m
a
p
s


## [生成器](https://docs.python.org/zh-cn/3/glossary.html#term-generator)

用于创建迭代器的工具
- 写法类似于标准的函数
- 返回数据时时使用 [yield](https://docs.python.org/zh-cn/3/reference/simple_stmts.html#yield) 语句
- 每次在生成器上调用 `next()` 时，会从上次离开的位置恢复执行
    - 记住上次执行语句时的所有数据值

特性
- 生成器的写法更为紧凑
    - 自动创建 `__iter()__` 和 `__next()__` 方法
- 局部变量和执行状态会在每次调用之间自动保存
    - 自动保存程序状态
- 当生成器遍历完毕时自动引发 [StopIteration](https://docs.python.org/zh-cn/3/library/exceptions.html#StopIteration) 异常

In [32]:
# 生成器示例
def reverse(data):
    for index in range(len(data)-1, -1, -1):
        yield data[index]

for char in reverse('golf'):
    print(char)

f
l
o
g


## 生成器表达式

语法类似列表推导式
- 外层为圆括号而非方括号

作为函数调用的参数

- 相比完整的生成器更紧凑但较不灵活
- 相比等效的列表推导式则更为节省内存

In [33]:
sum(i*i for i in range(10))                 # sum of squares

285

In [34]:
xvec = [10, 20, 30]
yvec = [7, 5, 3]
sum(x*y for x,y in zip(xvec, yvec))         # dot product

260

In [35]:
with open("myfile.txt") as f:
    page = f.readlines()

unique_words = set(word for line in page for word in line.split())
unique_words

{'test!'}

In [36]:
class STU:
    def __init__(self, gpa, name):
        self.gpa = gpa
        self.name = name

graduates = [STU(1, "a"), STU(2, "b")]
    
valedictorian = max((student.gpa, student.name) for student in graduates)
valedictorian

(2, 'b')

In [37]:
data = 'golf'
list(data[i] for i in range(len(data)-1, -1, -1))

['f', 'l', 'o', 'g']