# How does class work
## I. class and instance
- 在python的OOP model中有两类object，class和instance。从功能上看，class用来定义shared data和behavior，并且用来创建instance。instance则代表被程序表示的具体实体，记录属于实体自己的信息。
- <font color=blue>**class**</font>
  - **功能**：instance factory
  - **创建方式**：class statement
    - class statement是executable statement。当class statement所在module被import的时候，就会被执行
    - 执行class statement时，python会创建一个namespace，然后用name refer到它。一开始namespace是空的，但是存放了到所有superclass的link。
    - <font color=green>**也因此说class本质上是一个namespace。存放的link保证了class能继承所有superclass的全部attributes**</font>

- class statement block中的first-level assignment会生成class namespace中的attributes。
  - **attributes的功能和可用范围**：
    - class attributes以data和method的形式分别提供state和behavior。
    - class attributes提供了让所有class的instance共享state information和behavior的机会。
  - **继承和customization能力**：class继承它所有superclass的attributes
    - 如果是<font color=orange>**reference**</font>，也就是当class内外部expression中出现`class_name.attr_name`的时候，python会根据<font color=green>**inheritance attributes search**</font>规则“从下到上，从左到右”查找`attr_name`。使用找到的第一个name对应的对象。<font color=norange>**这是class的继承实现方式**。</font><font color=deeppink>**也就是说，python class的“attribute继承”是通过让可以从namespace的linked superclass objects中查找attribute name来实现的。**</font>
    - 如果是<font color=orange>**assignment**</font>，就会在当前class的namespace中新建一个name或者改变已有name的值，但此时不会向上找linked superclass的namespace。该name会override所有superclass中同名name。<font color=norange>**这是class的customization实现方式**</font>
      - 实现方式：
        1. 如果是data，在class内部top-level scope中用`attr_name=value`；在class外部，用`class_name.attr_name=value`
        2. 如果是method，在class内部的top-level scope中用`def` statement；在class外部，用`class_name.method_name=function_name`
           - <font color=brown>外部这种方式少见，因为代码可读性差。在外部定义的函数如果要用到instance attribute，那么额外定义的function里面的变量名要一致，很麻烦。</font>
           - <font color=brown>这种方式也没有必要，如果需要额外增加method，要么在class中直接增加method，要么用继承class方法，在subclass中增加method两种方式可以解决不同场景下的问题。</font>

- <font color=blue>**instance**</font>: <font color=green>**instance本质上是一个namespace，在创建时就有所属class中attributes的link**</font>
  - **功能**：是程序中用来表示specific concrete item的对象。他们对attributes用来记录对应item的data。
  - **创建方式**：class call
    - 当执行class call时，python会创建一个namespace，并用instance name refer到它。一开始namespace是空的，但是存放了到class的link。
    - 也因此说<font color=orange>instance本质上就是一个namespace。</font>存放的link保证了instance能继承它所属class的全部attributes
  - **instance attributes的有效范围**：instance自己的namespace中定义的attribute是attach在instance上的，该attribute只与这个instance有关。
  - **继承能力**：instance继承它所属class的所有attributes。<font color=red>**python class的“attribute继承”是通过让`instance_name.attr_name`可以从namespace的linked objects中查找attribute name来实现的。**</font>
    - class的namespace中有superclass的link
    - instance的namespace中有所属class的link
    - 这些link可以关联到对应class object的namespace，就可以查看namespace中定义的names
  - **instance attributes实现继承和customization的方式**：
    - 用`instance_name.attr_name`可以在instance的attribute namespace和它继承的class attribute namespace中查找该attribute name。
    - <font color=norange>**在reference时触发继承机制。**</font>此时，python按照自己的<font color=green>**inheritance attributes search**</font>规则来查找attribute。如果能找到，就使用找到的第一个name，如果没有，就报错。
    - <font color=norange>**在assignment场景下触发customization机制。**</font>python会在instance自己的namespace中新建或者重新赋值该name。有两种assignment方式：
      1. 在method中，用`self.attr_name=attr_value`
      2. 在class外面，直接用`instance_name.attr_name=attr_value`

In [56]:
class Person:
    numbers = 0             # class attribute
    def __init__(self, name):
        Person.numbers += 1 # 这里必须指定class name，'Person'
        self.name = name    # 关联self的都是instance attribute
    def display(self):
        att = ''
        for k in self.__dict__.keys():
            if not k.startswith('__'):
                att =' '.join([att, (k + ':' + str(self.__dict__[k]))])
        print(att)
        
class Employee(Person):
    numbers = 0          # override superclass中同名name
    def __init__(self, name, job, pay):
        Person.__init__(self, name)
        Employee.numbers += 1
        self.job = job   # 关联self的是instance attribute 
        self.pay = pay
        
bob = Employee('bob', 'teacher', 1000)
tom = Employee('tom', 'programmer', 1999)
john = Person('john')

print(Person.numbers, Employee.numbers)
bob.display()

3 2
 name:bob job:teacher pay:1000


In [51]:
tom.height = 168 # 在instance的namespace中增加attribute
tom.display()

 name:tom job:programmer pay:1999 height:168


## II. namespace和attribute inheritance search
### II.1 namespace的实现方式
- 在python中，namespace是用dictionary实现的。
- <font color=blue>**class namespace**</font>：class statement执行时，python会在新建的class的namespace dict中存放link来链接superclass的namespace。<font color=green>这种方式也同步构建了**inheritance tree**</font>。
  - class的`__bases__`attribute是一个用references to its superclass作为元素的tuple。
  - <font color=red>注意是bases，不是base</font>
- <font color=blue>**instance namespace**</font>：新建instance时，python会生成一个dictionary，再用instance name来refer到它。这个dictionary中存放了一个reference来链接其所属class的namespace。
  - instance的`__class__`attribute就是这个reference，用它可以得到所属class

In [23]:
class rec:
    name = 'bob'
    age = 40
x = rec()
y = rec()
x.name = 'sue'
print(rec.__base__, x.__class__)

<class 'object'> <class '__main__.rec'>


In [26]:
x.__class__.name

'bob'

In [30]:
class First:
    name = 'ace'
class Second:
    height = 198
class Student(First, Second):
    pass

Student.__bases__

(__main__.First, __main__.Second)

#### 2. 查看class和instance中的namespace
- 一般而言，用`__dict__`可以查看大多数class和instance objects的namespace dictionary。但是有的class定义了`__slots__`属性来存放attributes，这时候dict中可能就找不到对应的attributes。
- <font color=red>`__dict__`不会启动inheritance search，它只显示当前对象的namespace dictionary中的值。</font>
- 如果想得到不止当前object的namespace结果，同时得到他们继承的attributes，可以用`dir(obj_name)`

In [15]:
list(rec.__dict__.keys()) # class的namespace

['__module__', 'name', 'age', '__dict__', '__weakref__', '__doc__']

In [19]:
# 只看class中自定义的attribute，instance不需要这样处理
list(name for name in rec.__dict__.keys() if not name.startswith('__')) 

['name', 'age']

In [16]:
list(x.__dict__.keys()) # x的namespace中只有name

['name']

In [17]:
list(y.__dict__.keys()) # y中没有定义attribute，namespace是空的

[]

### II.2 attribute search的规则和实现方式
#### II.2.1 search规则
  - 先找object，然后按照“从下到上，从左到右”的顺序找所有它继承的class中的attribute，第一个出现的attribute就是目标。

#### II.2.2 实现attribute search的方式
  - python实现attribute search的方式是tree search。因为在实现class继承和instance创建的时候，python用的方法就是build up trees of linked objects

#### II.2.3 search规则对python编程方式的影响
- 由于search是“从下到上”进行的，因此，如果subclass中定义了与superclass中同名的attribute，那么先找到的就是subclass中的attribute。因此，可以很方便地在subclass中实现自定义功能(override behavior)。

## III. method
- 在class中定义的top-level function称为methods
- 在实际使用中，有两种method：常规method和用于class的method
  - 常规method是最常用的method，他们最主要的作用是维护instance information，class method一般用于维护class information。

### III.1 method的功能和特征
1. <font color=orange>从用户视角来看</font>，method是class与用户交互的interface。利用method可以实现encapsulate和abstract：
   - 通过method来wrap up operation logic也就实现了OOP的一个核心理念<font color=blue>**encapsulate**。</font>
   - 复杂的operation logic全部藏在method内部，用户只需要明确input和output的关系直接调用就好，因此也就实现了OOP的另一个核心理念<font color=blue>**abstrion**。</font>
2. <font color=orange>从programmer视角来看</font>，method是实现代码复用和方便代码维护的工具。
   - 代码复用：只用写一次，instance要进行的同类behavior都可以用它来实现。
   - 方便维护：只用维护1个method，所有refer它的位置都会随之修改。
3. <font color=orange>作为工具本身</font>，method的作用是处理instance中的state information。
   - instance data attributes是method call的处理对象。虽然class attributes也可以用method处理，但前者是最重要的用途。

### III.2 常规method
<font color=red>**注：没有特殊说明时，method和常规method都是指instance method。后面会专门说明class method的用法。**</font>
- class的一大功能特征是构建multiple instances。class为instance提供的attributes，包括methods，会被所有instance共享。
- method存在的最主要作用就是通过设置instance相关的state来表达instance所代表的entity的behavior。因此，通过instance来invoke method的时候，需要method与instance是关联的。
- python用了一种很简单的机制让instance既可以通过method只控制instance自身的state，又让所有instances能共享这些method。<font color=green>**这个机制就是invoke method的时候，其第一个参数(python传统命名为`self`)总是默认receive instance作为value。**</font><font color=brown>**所以，method就是function，也适用function的所有规则。它唯一特殊之处是它的第一个参数会被python自动赋值**。</font>

#### III.2.1 常规method也即instance method的定义方式
- 一般的method都是instance method，在定义时，第一个参数是self。<font color=red>**所以，`self`总是出现在method stock里面。所有self都关联到instance，而非class。**</font>  
    ```python
    class FirstClass:
        def setdata(self, value): # 和function的定义方式完全一样
            self.data = value
        def display(self):        # 只是定义在class里面
            print(self.data)
    ```
- <font color=brown>实际上python关心的是“第一个参数”而不是argument name为“self”的参数。</font>用`self`是python的传统，严格说用其他的比如`xx`也可以，但代码可读性差。
     ```python
     class UglyClass:
        def setdata(xx, value): 
            xx.data = value     # 使用attribute的符号也要改变
     ```

#### III.2.2 method中的name resolution
1. `self.attr_name`是instance attribute
   - method被call时，<font color=red>**不论这个method定义在哪个层次的class中**</font>，它的第一个参数会自动赋值为此时它关联的instance object。<font color=red>**只要看到`self`，那么它总是关联instance**。</font>
     ```python
     x = FirstClass()
     x.setdata('hello') # 会被python转变成下面的等价语句来执行
     First.setdata(x, 'world') # 第1个参数是instance obj
     ```

2. `class_name.attr_name`或者`class_name.method_name`直接获取class attribute
   - <font color=red>注意，method和函数不同，如果直接用`name`，method只在local scope中做查找，不会向上到method之外的class statement block中继续查找。</font>
```python
class Person:
    numbers = 0          # class attribute
    def __init__(self, name):
        numbers += 1
        self.name = name
x = Person('Bob') # 报错：local variable 'numbers' referenced before assignment

```

### III.3 避免method的name在namespace中发生冲突
#### III.3.1 可能发生冲突的场景
   - 在interface中经常定义一些适用于多种class instance的method作为工具。比如：`gather_attrs(self)`, `display(self)`。很多class自己也会定义这些工具，而且还容易用一样的名字。这时候继承作为interface的class本身的目的就是想用他们的method。但是由于他们是superclass，method会被subclass中的同名method override掉。此时的name collision就会影响interface class功能的发挥。

#### III.3.2 python传统处理方式
- 如果class中有仅用于class内部的method，程序员一般会将这些method的name定义成`_method_name`。也就是在name前加上一条`_`。
  - 如果superclass和subclass中各有一个`namex`，其中一个是class自用的，将其改为`_namex`，collision就可以避免。
- 其他程序员读到代码的时候，一旦看到method name前面有一条`_`就会知道这是class自用，而不提供给用户使用的method。<font color=green>但这只是程序员之间默认的传统，并不涉及python interpreter的执行规则。</font>
- <font color=red>这种方式很常见，但更主要的功能是防止用户使用method，而不是collision，因为如果两个class中的这个method都是自用的，大家都定义了`_namex`，还是可能发生冲突。</font>

#### III.3.3 pseudoprivate class attributes
- python提供了一种自动处理attribute name使其命名唯一的方法。<font color=green>**注意，不仅适用于method，也适用于data attribute。**</font>
- **使用方式**：`__methname`
  - 在name前面加上`__`，和operator overloading中特殊的builtin method name不同在于只加在前面，后面不加。和程序员们形成的传统代码风格不同的是，这里是两条线，传统风格是一条。
- **工作方式**：
  - 当python interpreter看到这种形式的name，就会自动将其转换为`_ClassName__methname`，在加上了class name之后，即使有相同的`methname`，也不会被subclass override。<font color=red>原name的attribute已经不存在，存在的只有更该name后的attribute</font>
- **并不是真正的private attributes**：使用`_ClassName__methname`仍然能refer到attribute，所以不是真正的private化了attributes。但是提供了一种class内部'隐藏'attribute的工具。

- <font color=red>**和`_`传统的区别**</font>：
  - `_`是给用户信号，不要使用这个attribute，它是class内部工具，特别是method，通常是被内部其他method使用的tool。但是如果在继承时superclass和subclass都定义了相同的`_attrname`，当通过instance调用name(`self._attrname`)时，name collision还是可能发生。
  - `__`则不同，在interpreter自动加上了class name之后，superclass和subclass中的同名attributes就不会再有冲突。

In [70]:
class C1:
    def meth1(self):
        self.x = 0
    def display1(self):
        print(self.x)
        
class C2:
    def meth2(self):
        self.x = 10
    def display2(self):
        print(self.x)

class B(C1, C2):
    pass

I = B()
I.meth1(), I.meth2() # meth2后执行，所以覆盖了x的结果
I.display1(), I.display2()
print(I.__dict__)    # 这里instance只有1个x attribute

10
10
{'x': 10}


In [72]:
class C1:
    def meth1(self):
        self.__x = 0
    def display1(self):
        print(self.__x)
        
class C2:
    def meth2(self):
        self.__x = 10
    def display2(self):
        print(self.__x)

class B(C1, C2):
    pass

I = B()
I.meth1(), I.meth2()
I.display1(), I.display2() # 两个display分别打印了自己所属metho的attribute
print(I.__dict__)          # 这里instance继承了两个不同name的attribute
# print(I.__x)             # Error！interpreter已经改写了attribute name

0
10
{'_C1__x': 0, '_C2__x': 10}


### III.3 class method和static method
#### 1. 应用场景
- 从python 3之后，添加了用于处理class data attribute的method。因为功能是用于维护class state，所以这种method不需要关联到具体的instance被invoke。
- 在实现方式上，python提供了class method和static method两种不同的工具。

#### 2. class method
- **什么是class method**：
  - 第一个参数习惯还是用self，但python interpreter会自动将其绑定为class object而不会绑定常规method中的instance object。
  - 在invoke的时候quanlified name的前缀可以是class name `classname.methname`，也可以是instance name `instname.methname`。

- **定义形式**
  - 不管用instancename还是classname来invoke，class method都需要声明
  - 有两种等价的声明方式：
    1. `@classmethod`decorator
    2. `classmethod(methname)`

In [83]:
class Spam:
    numInstances = 0
    def __init__(self):
        Spam.numInstances += 1
    
    def getNumInstances(cls):  
        return cls.numInstances
    
    # 注意声明形式
    getNumInstances = classmethod(getNumInstances)

a = Spam()
b = Spam()
n1 = Spam.getNumInstances()

c  = Spam()
n2 = c.getNumInstances()
print(n1, n2)

2 3


#### 3. staticmethod
- **什么是static method**：
  - staticmethod定义时第一个参数既不是self，也不是class，不会被python interpreter将第一个参数自动关联为instance。

- **定义形式**
  - 用`@staticmethod`decorator声明，或者用`staticmethod(methname)`声明
  - 如果是以`classname_methname`的形式invoke method，可以不用在定义method时将其声明staticmethod就可行。
  - 如果是以`instname_methname`的形式invoke method，则必须在定义method时将其声明staticmethod才行。

In [81]:
class Spam:
    numInstances = 0
    def __init__(self):
        Spam.numInstances += 1
    def getNumInstances():  # 没有self参数，且没有声明为staticmethod
        return Spam.numInstances

a = Spam()
b = Spam()

# 如果用class name来invoke class method，不需要声明
n = Spam.getNumInstances()

# 如果用instance name，必须该method的定义中声明为static method
# c  = Spam().getNumInstances()  # Error!!!

In [80]:
class Spam:
    numInstances = 0
    def __init__(self):
        Spam.numInstances += 1
    
    @staticmethod    # 声明后就可以同时被call through class和instance
    def getNumInstances():  
        return Spam.numInstances

a = Spam()
b = Spam()
n1 = Spam.getNumInstances()

c  = Spam()
n2 = c.getNumInstances()
print(n1, n2)

2 3
