# Python 进阶教程
## 代码规范
### 1.1 名称
* 文件夹，小写或者小写下划线连接，比如：models, utils, train_utils...
* 文件，小写或者小写下划线连接，比如：train.py, multiple_gpus_train.py...
* 包名、模块名、函数名，小写或者小写下划线连接，比如：import torch, train_for_one_epoch(...)
* 类名，首字母大写式，比如：class AgentEncoder(nn.Module)
* 变量
  * 全局变量，大写或者大写下划线连接，比如：CONFIG = dict(), TRAIN_ARGS = dict()...
  * 局部变量，小写或者小写下划线连接，比如：optimizer = Optim.Adam(...), val_dataloader = DataLoader(...)

### 1.2 注释
* 方法必须使用标注注释，如果是公有方法或对外提供的API相关方法，则最好给出使用样例
* TODO注释：'#'+单个空格+'TODO'+单个空格+注释内容

## 基础知识
### 1. list, tuple, set, dict
| 类型    | 是否可修改    | 是否有序 | 元素要求   | 是否可哈希 | 转换         | 空定义                |
|-------|----------|------|--------|-------|------------|--------------------|
| list  | 是        | 是    | 无      | 否     | list(...)  | v = list()或v = []  |
| tuple | 否        | 是    | 无      | 是     | tuple(...) | v = tuple()或v = () |
| set   | 否        | 否    | 可哈希    | 否     | set(...)   | v = set()          |
| dict  | value可修改 | 否    | key可哈希 | 否     | dict(...)  | v = dict()或v = {}  |

__注意__：Python3.6之后，dict是有序的，体现在list(dict.keys())是按照插入的顺序返回的  
__注意__：1, True, 1.0作为key的时候是一样的，最后只会出现一组键值对

In [None]:
list_v = [1, 2, (1, 2), "str", True, {1: 1, 2: 2}, {1, 2}, 1.0]
tuple_v = (1, 2, (1, 2), "str", True, {1: 1, 2: 2}, {1, 2}, 1.0)
set_v = {1, 2, (1, 2), "str", True}
dict_v = {(1, 2): 0, "str": 2, True: 2}
for item in [list_v, tuple_v, set_v, dict_v]:
    print(item)
print(list(dict_v.keys()))

### 2. pass, continue, break
* pass是空语句，作用是保持程序结构的完整性.
* continue结束本次循环，继续下一次循环
* break结束本次循环，跳出循环

In [None]:
for i in range(5):
    print(f"loop: {i}".center(20, '-'))
    print(f"the num is {i}")
    if i == 0:
        pass
    if i == 1:
        print("continue: the num is {}".format(i))
        continue
    else:
        print("the num is {}".format(i))
    if i == 3:
        print("break: the num is %d" % i)
        break
    else:
        print("the num is %d" % i)


### 3. is和==的区别
* ==：比较值是否相等
* is：比较内存地址是否相同

In [None]:
v1, v2 = [], []
v3 = v2
print(v1 == v2)
print(v1 is v2)
print(v2 == v3)
print(v2 is v3)

## 文件操作
### 1. 文件读取和写入
#### 1.1 文件读取
* f.read(...)    # 不给参数时默认读取整个文件，如果文件过大，内存可能不够，给定参数n后，可读取特定的n个字符或字节
* f.readline()   # 从当前光标位置逐行读取
* f.readlines()  # 从当前光标位置逐行读取剩下的所有内容，并返回一个list

#### 1.2 文件写入
* f.write(...)   # 只是将内容写入了缓冲区，缓冲区机制是到达一个容量后才写入硬盘
* f.flush()      # 将当前缓冲区内的内容立刻写入硬盘  

__注意__：读取和写入的不同模式，会导致光标所在字节位置有变化

#### 1.3 上下文管理
* 可以实现自动关闭文件

In [None]:
file_object = open("materials/log.txt", mode='rt')
line = file_object.readline()
line = file_object.readlines()
file_object.close()
print(line)
assert len(line) > 0
file_object = open("materials/log.txt", mode='a')
if line[-1] != "this is a string written by file operation in Python. \n":
    file_object.write("this is a string written by file operation in Python. \n")
file_object.close()
with open("materials/log.txt", 'rt') as f:
    data = f.read()
    print(data)

### 2. 文件和文件夹路径相关

In [None]:
import os
base_dir = os.getcwd()
file_dir = os.path.join(base_dir, "materials", "log.txt")
print(base_dir, file_dir)
print(os.path.exists(file_dir))
print(os.path.isdir(file_dir))
print(os.path.isabs(file_dir))

### 3. 文件移动、删除、复制
* shutil.rmtree(...)  # 参数为文件夹路径，将递归的删除文件夹内所有文件，最后删除该文件夹
* os.remove(...)  # 用于删除单个文件

In [None]:
import os
import shutil
file_dir = os.path.join(os.getcwd(), "materials", "log.txt")
new_file_dir = os.path.join(os.path.dirname(file_dir), 'log_copy.txt')
shutil.copyfile(file_dir, new_file_dir)
shutil.move(new_file_dir, os.path.join(os.path.dirname(new_file_dir), "log_rename.txt"))
os.remove(os.path.join(os.path.dirname(new_file_dir), "log_rename.txt"))

### 4. CSV格式文件
* csv文件是用逗号作为分隔符的纯文本数据存储格式
* 可以用传统文件读写操作处理，也可以使用第三方库：csv, pandas

In [None]:
import pandas as pd
df = pd.read_csv("materials/points.csv", header=0)
new_df = pd.DataFrame([["Shengjie Wu", 24, "NY", 99]])
if "Shengjie Wu" not in list(df["name"]):
    new_df.to_csv("materials/points.csv", mode='a', header=False, index=None)
print(list(df["point"]))
print(new_df)

### 5. pickle格式文件
* 不同于普通的file函数只能存储和读取字符串格式的数据，pickle可以存储和读取其他格式比如list, dict, numpy.array()等
* pickle的经常存取的场景（保存和恢复状态）下读取效率相较file更加高效  

__注意__：在深度学习数据预处理时，就可以将处理后的数据保存成*.pickle，训练时直接load即可

In [None]:
import pickle
import numpy as np
pickle_data = {
    "feats": np.random.rand(3, 3),
    "idcs": [0, 1, 2]
}
if not os.path.exists("materials/data.pickle"):
    with open("materials/data.pickle", mode="wb") as f:
        pickle.dump(pickle_data, f, protocol=pickle.HIGHEST_PROTOCOL)
        print(pickle_data)
else:
    with open("materials/data.pickle", mode="rb") as f:
        data = pickle.load(f)
        print(data)

### 6. YAML格式文件
* 与Python一样采用缩进区分层级，需要同一层级文件缩进相同，但是不能用TAB，用相同数量的空格
* '#' 表示注释，从它开始到行尾都被忽略
* 大小写敏感
* 以‘-’开头会被转换为list
* 包含':'转换为dictionary
* 单引号内内容按照字符串输出，不会变成转义字符，双引号内内容存在转义字符会转换

In [None]:
import yaml
with open('materials/config.yml', encoding="utf-8") as f:
    config = yaml.safe_load(f)
    print(config[0])
with open('materials/config.yml', mode='a', encoding='utf-8') as f:
    new_config = {
        'url': '/api/user/login', 
        'method': 'post', 
        'detail': '正常登录', 
        'data': {
            'username': 'Shengjie Wu', 
            'passwd': 'aA123456'
        }, 
        'check': ['userId', 'sign', '111', 222]
    }
    if "Shengjie Wu" not in [x['data']['username'] for x in config]:
        yaml.dump([new_config], f)

## 函数相关
### 1. 参数和返回值
#### 1.1 函数的参数和返回值传递的都是内存地址
* 可以节省内存空间，避免多次调用函数时，开辟多个内存空间用于传递
* 对于可变类型：list, set, dict，在函数体内修改元素的值，则所有的地方都会改变
* 可以用new_data = copy.deepcopy(data)实现值传递
* python有缓存和驻留机制

In [None]:
def addr(data1, data2):
    print(data1, id(data1), data2, id(data2))
    data1.append(4)
    data2 = 10  # data2重新指向另外一个内存空间，所以不影响传入内存地址的值

v1 = [1, 2, 3]
v2 = 5
print(v1, id(v1), v2, id(v2))
addr(v1, v2)
print(v1, id(v1), v2, id(v2))

v1 = 1
v2 = 1
print(id(v1), id(v2))  # 理论上v1和v2指向的内存空间地址是不一样的，但是由于Python内部的缓存和驻留机制，相当于常见值的内存是共享的


#### 1.2 动态参数
* *args
  * args是一个tuple
  * 只能按照位置传参
* **kwargs
  * kwargs是一个dict
  * 只能按照关键字传参(keyword args)

__注意__：python的字符串format就是典型的动态参数例子  
__注意__：实参也是支持 * 和 ** ，但是数据会重新拷贝一份，而不是直接传递内存地址。加*相当于将输入的容器打散成一个个元素，然后按位置传参给函数的形参，本质和输入参数为一个list一样，只不过省略了v1 = list[0], v2 = list[1]...

In [None]:
def dynamic_args(*args, **kwargs):
    print(args)
    print(kwargs)

dynamic_args(1, 2, 3, name="Shengjie Wu", age=24)  # 关键字传参必须在置传参之后
print("name: {}, age: {}, gender: {}".format("Shengjie Wu", 24, "male"))  # 位置传参
print("name: {name}, age: {age}, gender: {gender}".format(name="Shengjie Wu", age=24, gender="male"))  # 关键字传参
print("name: {}, age: {}, gender: {gender}, points: {points}".format(*["Shengjie Wu", 24], **{"gender": "male", "points": 99}))  # 实参用*和**

# 实参加*和实参为list
def dynamic_real_args(v1, v2):
    print(v1, v2)
def normal_list_args(v):
    print(v[0], v[1])

dynamic_real_args(*[1, 2])
normal_list_args([1, 2])


#### 1.3 默认参数
* Python在创建函数（未执行）时，如果发现函数参数中有默认值，则会在函数内部创建一块区域用来维护这个默认值
* 如果该默认值为可变数据类型（list, set, dict），并且在函数内部修改了之后，那么维护的内存空间里面的值也会改变

In [None]:
def default_args(v1, v2=[1, 2]):
    v2.append(3)
    print(v1, v2)
    return v2  # 这时候函数内部维护的内存空间被返回了，在外部的修改也会影响默认值

default_args(100)
default_args(200)
default_args(200, [7, 8])
default_args(300)

### 2. 函数和函数名
函数必须先定义才能执行（解释型语言），C++可以先声明，后定义
#### 2.1 函数名作为元素
* 函数名可以作为list的元素，同时函数名也可以被hash，可以作为set的元素和dict的key
* 应用场景1：将不同函数用dict存储，根据key选择调用某个特定函数，这时候可以将不同函数的参数打包为一个列表，然后采用加*的方法按位置传参数，也可以在函数内部对列表元素处理
* 应用场景2：将不同函数用list存储，可以循环调用按顺序执行的操作

In [None]:
def func_as_args_1(v1):
    print(v1)
def func_as_args_2(v1, v2):
    print(v1, v2)
function_dict = {
    1: [func_as_args_1, ["v1"]],
    2: [func_as_args_2, ["v1", "v2"]]
}
for key in [1, 2]:
    item = function_dict[key]
    func = item[0]
    params = item[1]
    func(*params)

#### 2.2 函数名赋值
* 函数名相当于一个变量指向该函数，如果将函数名指向别的内存空间，那么就不能指代原来的函数
* 如果同一函数名用来定义了多个函数，那么该函数名只会指向最后定义的函数

In [None]:
def func(v1):
    print(v1)
func("func")
func = "func"  # 此时func只是一个字符串变量

#### 2.3 函数名作为参数和返回值
* 和普通的数据类型是一样的，只不过该变量指向某个函数，可以调用而已

In [None]:
def func(v1):
    print(v1)
def handler(func, v1):
    func(v1)
    return func
res = handler(func, "func")
res("func")

### 3. 作用域
* Python是以函数作为作用域，函数中用for循环定义的i，是可以在函数内部直接访问的，和C++不一样
* 优先在当前作用域内寻找，如果在当前作用域找不到，则向上一作用域寻找
* 定义在函数外面的是全局变量，在局部作用域中默认只能对全局变量进行读取，或者修改可变全局变量（list, set, dict）的元素。如果重新赋值，只是在该函数内部作用域下定义了新的变量，不会改变全局变量
* 如果需要在函数内部对全局变量进行重新赋值，需要使用global关键字

In [None]:
cities = ["Beijing", "Shanghai"]
def func_1():
    cities = ["Beijing", "Shanghai", "Chongqing"]
    print(cities)
def func_2():
    global cities
    cities = ["Beijing", "Shanghai", "Chongqing"]
    print(cities)
func_1()
print(cities)
func_2()
print(cities)

### 4. 函数高级
#### 4.1 函数嵌套
* 如果某个函数内部代码量较多，可以拆分为多个子函数，但是这多个子函数只是在该函数实现时需要调用，放在外部定义的话，有可能和别的函数名称冲突，因此可以定义在函数内部，作用域限定在该函数内部

In [None]:
def func(v1, v2):
    def f1(v1):
        print(v1)
    def f2(v2):
        print(v2)
    f1(v1)
    f2(v2)

func("f1", "f2")

#### 4.2 闭包
* 应用场景1：封装数据避免污染全局（很少用）
* 应用场景2：将数据封装在一个包（区域）中，需要使用时再去取，func中返回的v1，v2就包含了一个特定的name，可以在多线程时候使用

In [None]:
def func(name):
    def inner():
        print(name)
        return "Alex"
    return inner

v1 = func("Shengjie Wu")
v2 = func("Wu Shengjie")
print(id(v1), id(v2))
v1()
v2()

#### 4.3 装饰器
* 基于@语法和函数闭包，将原函数封装在闭包中，然后将函数赋值为一个新的函数（内层函数），执行函数时再在内层函数中调用闭包中的原函数
* 可以在不改变函数代码和**调用方式**的前提下，实现函数执行和执行扩展功能
* 使用于对多个函数统一在执行前后实现某些特定功能
* 通过类实现装饰器

In [None]:
# 实现方式一: 可以对多个函数统一处理，但是必须改变掉调用方式，不再是func1(9, 10)
def func1(v1, v2=10):
    print(v1, v2)

def handler(origin, *args, **kwargs):
    print("before".center(20, "-"))
    origin(*args, **kwargs)
    print("after".center(20, "-"))

handler(func1, *[9, 10])

# 实现方式二：采用装饰器，func = outer(func)
import functools
def outer(origin):
    @functools.wraps(origin)  # 加上这个装饰器后可以保留原函数的__name__, __doc__等信息，如果用不到这些信息，可以不加
    def inner(*args, **kwargs):
        print("before".center(20, "-"))
        origin(*args, **kwargs)
        print("after".center(20, "-"))
    return inner

@outer
def func2(v1, v2=10):
    print(v1, v2)

func2(9, 10)

# 实现方式三：采用类实现装饰器，func = Outer(func)，这里Outer是一个类, func是一个Outer的实例化对象，因此需要定义__call__方法
class Outer(object):
    def __init__(self, origin):
        self.f = origin
    
    def __call__(self, *args, **kwargs):
        print("before".center(20, "-"))
        self.f(*args, **kwargs)
        print("after".center(20, "-"))

@Outer
def func3(v1, v2=10):
    print(v1, v2)

func3(9, 10)

### 5. 匿名函数
* 匿名函数是以及lambda表达式创建的一个没有函数名的函数
* lambda表达式格式：```lambda 参数: 函数体```，其中参数可以任意的，比如*args, **kwargs，函数体只支持一行代码，返回值默认是函数体的计算结果

In [None]:
func_list = [lambda x: x**2, lambda x, y: x + y, lambda *args, **kwargs: print(args, kwargs)]
print(func_list[0](1))
print(func_list[1](1, 2))
func_list[2](1, 2, **{"age": 24})

### 6. 生成器
* yield关键字，用next(generator)调用，遇到yield会返回yield后面的值，并且记录当前位置，下次调用时，从该位置开始继续向下执行
* 可以应用于动态创建的场景，比如加载数据时，可以一个一个加载，节省内存占用

In [None]:
import random
def generator_func(max_count):
    count = 0
    while count < max_count:
        yield random.randint(0, 10)
        count += 1

g = generator_func(5)
print(next(g))
print(next(g))
print(''.center(20, '-'))
for item in g:
    print(item)

### 7. 三元运算符和推导式
* 推导式初始化时对于list, set, dict都是直接生成，对于tuple则是生成一个生成器

In [None]:
idcs = [len(x) for x in [[-1, 2], [3, -4]]]
print(idcs)
positive_nums = [_ for _ in [1, -2, 3, 4, -5] if _ > 0]
print(positive_nums)
ones_list = [1 for _ in range(10)]
print(ones_list)
ones_tuple = (1 for _ in range(10))
print(ones_tuple)

# tuple和list的区别
func_list = [lambda x: i * x for i in range(4)]    # 一次性生成4个函数，且i为最终的值3
func_tuple  = (lambda x: i * x for i in range(4))  # 生成器，只有执行时才创建，此时的i依次为0, 1, 2, 3
print([f(2) for f in func_list])
print([f(2) for f in func_tuple])

## 模块与包
* 模块(module)是一个单独的py文件，包含了一些特定功能的函数
* 包(package)是包含了多个py文件的文件夹，包含了一些特定功能的py文件
* 包中一般（**python2必须有，可以是空的，python3可以没有**）需要包含```__init__.py```文件，可以用来导入包中模块，对包中各个模块进行说明，版本信息等  

### 1. 自定义模块
* 导入模块时，Python只会在一些特定的路径下```sys.path```按顺序去查找，可以用```sys.path.append("/xxxx")```添加路径
* 导入模块时，按照顺序查找，找到后就停止查找，而且当前工作空间是第一个路径，因此不要在当前路径下创建和内置模块或则第三方模块同名的模块，否则只会导入自定义的模块
* 当某个文件被python解释器运行时，该文件内部的```__name__```的值会等于```__main__```

In [None]:
import sys
print(sys.path)

## 面向对象
### 1. 面向过程和面向对象的区别
* 面向对象和面向过程都是解决问题的一种方式，面向对象本身是对面向过程的一种封装
* 面向过程最重要的是按照步骤划分一个具体任务，一个任务有多个步骤实现
* 面向对象最重要的是按照对象划分一个具体任务，一个任务有多个对象实现，每个对象里面包括具体的步骤

### 2. 类和对象
* 类由名称、属性和方法组成
* 实例化：就是通过类生成一个具体实例
* 对象：就是实例化后生成的实例  

__注意__：Python中万物皆对象，类本身也是一个特殊的对象，称为**类对象**，类实例化出来的叫该类的对象

### 3. 属性相关
#### 3.1 类属性和对象属性
* 类属性：可以直接用类名访问
* 对象属性：通过具体的对象访问
* 查找对象的属性时，优先在对象内部查找，如果没有则会在类的属性里面去查找，但是不能通过对象修改类里面的属性
* 通过对象里面的```__class__```变量可以找到对应的类，如果修改这个变量的值，则会找到别的类  

__注意__：不同于C++，Python不论是类还是类的实例化对象，都是可以动态增加属性的，此时可以通过```__slots__```限制可添加的对象属性

#### 3.2 内存存储形式
* 一般情况下，**属性和方法**都会存储在```__dict__```指向的内存空间，有些内置对象没有```__dict__```这个属性
* 一般对象（类实例化的对象）可以直接修改```__dict__```属性
* 类对象的```__dict__```默认为只读，无法修改，但是也可以通过```__setattr__```方法修改

In [None]:
class Person(object):
    nationality = "CN"  # 类属性，可以直接用类名访问
    def __init__(self, name, age, sex):  # 对象属性，通过具体的对象访问
        self.name = name
        self.age = age
        self.sex = sex

p1 = Person("Shengjie Wu", 24, "M")
p1.nationality = "USA"  # 这时候会在对象p1的对象属性中创建nationality，然后赋值为"USA"，并不会改变类属性的值
print(p1.nationality, Person.nationality)
print(p1.__dict__)
p1.__dict__["height"] = 170  # 通过__dict__增加height属性
print(p1.height)

#### 3.3 访问权限
* 公有属性：
  * 类内部、派生类内部
  * 当前模块内其他位置：类、派生类、类的实例和派生类实例
  * 跨模块访问：import或者from xxx import *
* 保护属性：属性名称前加一个下划线
  * 类内部、派生类内部
  * 当前模块内其他位置：类、派生类、类的实例和派生类实例，可以访问但是**会报warning**
  * 跨模块访问：import可以但是**会报warning**，from xxx import *不能访问**会报错**，通过在原来模块内的```__all__```变量指定后可以，而且也不会报warning
* 私有属性：属性名称前加双下划线
  * 类内部可以访问，派生类不行
  * 当前模块内其他位置不能访问
  * 跨模块访问：和保护属性一样
  
__注意__：Python不支持真正的私有化，是通过名称重整来达到伪私有的效果，重改```__x```为另为一个名称，比如```_类名__x```，可以实现避免被外界访问和避免被子类同名属性覆盖的目的   
__注意__：为了和系统关键字区分，可以在关键字后加一个下划线，比如```class_```，而变量左右各加双下划线，一般是系统内置的变量，比如```__dict__```等  
__注意__：如果想真正设置一个私有属性为只读权限，需要重写```__setattr__```这个内置方法，如果属性已经存在```__dict__```中，那么就不允许修改操作，但是```__dict__```还是可以被外部直接修改，因此说Python不支持真正私有化

In [None]:
class PermissionTest(object):
    __private_attr = 1
    _protected_attr = 2
    public_attr = 3
    def __init__(self):
        self.__age = 18
    
    @property  # 可以以使用属性的方法来调用该方法，property类可以用于关联某个属性的获取方法、设置方法和删除方法，方便外部对类内部某个私有属性的操作，经过property装饰后，可以像使用公有属性一样操作私有属性
    def age(self):
        return self.__age

    def get_private_attr(self):
        return self.__private_attr

pt = PermissionTest()
print(PermissionTest.__dict__)
print(pt.public_attr)
print(pt._protected_attr)
print(pt._PermissionTest__private_attr)  # 直接访问私有属性，print(pt.__private_attr)会报错，提示类中没有该属性
print(pt.age)  # 先将age设置为私有属性，再提供一个公开的获取借口，再用@property修饰，这样子就可以实现在类外部对该属性进行只读操作

#### 3.4 内置特殊属性
* 类属性：
  * ```__dict__```：类的属性
  * ```__bases__```：类的所有父类构成的元组
  * ```__doc__```：类的文档字符串
  * ```__name__```：类名
  * ```__module__```：类定义所在的模块
* 实例属性：
  * ```__dict__```：实例属性
  * ```__class__```：实例对应的类

### 4. 方法相关
#### 4.1 方法的划分
* 实例方法：默认第一个参数需要接受到一个实例
* 类方法：默认第一个参数需要接受到一个类
* 静态方法：和普通函数一样

__注意__：以上所有方法都是存储在类的```__dict__```中的，类实例化的对象中不存储这些函数，这样可以让所有对象共享这些方法，不需要额外多次开辟空间存储           
__注意__：之所以需要三种不同类型的方法，是为了方便调用，当需要用到实例相关的属性时用实例方法，当只需要类属性的时候可以用类方法，当不需要类属性也不需要实力属性时就可以采用静态方法

In [None]:
class Method(object):
    def object_func(self):
        print("This is a object's function", self)
    
    @classmethod
    def class_func(cls):
        print("This is a class's function", cls)
    
    @staticmethod
    def static_func():
        print("This is a static function")

# 类方法和静态方法可以直接通过类名调用
Method.class_func()
Method.static_func()
print(Method)
print("".center(20,"-"))
# 实例方法需要通过具体的对象调用
m = Method()
m.object_func()  # 等同于Method.object_func(m)
m.class_func()
m.static_func()
print(m)

#### 4.2 实例方法和类方法
* 标准调用时，不需要传入self参数，解释器会自动传入对象本身给self
* 通过类调用，需要手动传入对象给self
* 通过存储位置调用，需要手动传入对象给self
* 如果派生出其他子类，然后通过子类调用该方法时，自动传入给cls的是子类

In [None]:
class ObjectMethod(object):
    def func(self):
        print("This is a object's function", self)

om = ObjectMethod()
om.func()  # 标准调用
ObjectMethod.func(om)  # 通过类调用
ObjectMethod.__dict__["func"](om)  # 通过函数的存储位置调用

class ClassMethod(object):
    @classmethod
    def class_func(cls):
        print("This is a class's function", cls)

ClassMethod.class_func()
ClassMethod().class_func()

class ClassMethodChild(ClassMethod):
    pass

ClassMethodChild.class_func()

#### 4.3 访问权限
* 方法和属性本质上是一样的，都存储在```__dict__```中，如果想私有化某个方法，只需要在方法名称前加双下划线，本质也是名称重整的伪私有化

#### 4.4 内置方法
* ```__str__```：通过print打印某个实例的时候，会默认调用该函数，并且打印该方法的返回值，默认返回类名和对应的存储地址，可以重写实现个性化功能
* ```__repr__```：和str功能类似，但是是面向维护人员，str面向用户  
* ```__call__```：使对象具备当作函数来调用的能力
* ```__setitem__, __getitem__, __delitem__```：可以实现索引和切片操作
* ```__iter__```：可以实现遍历操作，注意需要返回一个迭代器，如果想将类本身设置为迭代器，需要实现```__iter__```和```__next__```两个方法，此时前者可以返回self自身，这样在遍历是可以调用```self.__next__()```
  
__注意__：通过print打印某个实例的时候，优先查找重写的str，repr，然后才是默认的str  
__注意__：PyTorch之所以定义```forward```函数就可以实现调用对象，是因为PyTorch的默认```__call__```函数里面调用了```forward```，实际流程是调用对象，进入```call```函数，在```__call__```函数里面调用了```forward```  
__注意__：```__iter__```和```__getitem__```都可以实现遍历操作，前者的优先级更高

In [None]:
class BuildinMethod(object):
    def __init__(self, name, age, length):
        self.name = name
        self.age = age
        self.cache_dict = dict()
        self.cache_list = [0 for _ in range(length)]
    
    def __len__(self):
        return len(self.cache_list)
    
    def __str__(self):
        return "name: {}, age: {}".format(self.name, self.age)
    
    def __call__(self):
        print(self.__str__())
    
    def __iter__(self):
        return iter(self.cache_list)
    
    # def __next__(self):
    #     pass
    
    def __setitem__(self, key, value):
        if isinstance(key, str):
            self.cache_dict[key] = value
        elif isinstance(key, int) and key < len(self.cache_list):
            self.cache_list[key] = value
        elif isinstance(key, slice) and 0 <= key.start < len(self.cache_list) and 0 <= key.stop <= len(self.cache_list):
            print(key)
            self.cache_list[key] = value
            
    def __getitem__(self, key):
        if isinstance(key, str) and key in self.cache_dict.keys():
            return self.cache_dict[key]
        elif isinstance(key, int) and 0 <= key < len(self.cache_list):
            return self.cache_list[key]
        elif isinstance(key, slice) and 0 <= key.start < len(self.cache_list) and 0 <= key.stop <= len(self.cache_list):
            return self.cache_list[key]
    
    def __delitem__(self, key):
        if isinstance(key, str) and key in self.cache_dict.keys():
            del self.cache_dict[key]
        elif isinstance(key, int) and key < len(self.cache_list):
            self.cache_list[key] = 0
        elif isinstance(key, slice) and 0 <= key.start < len(self.cache_list) and 0 <= key.stop <= len(self.cache_list):
            for i in range(key.start, key.stop, key.step):
                self.cache_list[i] = 0

bm = BuildinMethod("Shengjie Wu", 24, 10)
# str, repr
print(bm)  # 效果和print(str(bm))一样
print(repr(bm), bm.__repr__())
# call
bm()
# 索引和切片操作
print("set && get".center(50, '-'))
bm["math"] = 100
print(bm["math"])
print(bm.cache_dict)
bm[0] = 1
bm[1:len(bm):1] = [_ for _ in range(2, len(bm) + 1)]
print(bm.cache_list)
print("del".center(50, '-'))
del bm["math"]
del bm[0]
del bm[1:5:1]
print(bm.cache_dict)
print(bm.cache_list)
# 遍历操作
for i in bm:
    print(i)

import collections
print(isinstance(bm, collections.Iterator))  # 判断的是bm是否包含了__iter__和__next__两个方法，此时__iter__的返回值应该self，这样才能调用self.__next__()
print(isinstance(bm, collections.Iterable))  # 判断的是bm中__iter__的返回值是否可以迭代

### 5. 元类和类的动态创建
* ```type```是元类，内置的int，str等类都是type的实例化对象，
* 解释器遇到class关键字会自动创建一个类，也可以通过```type```动态创建一个类
* 通过元类创建**类对象**的流程：先在当前类的声明中查找```__metaclass__```，如果没有则在当前类的父类中查找，如果没有父类或者父类中也没有，那么则会在模块的全局变量中查找，如果也没有则默认通过type生成当前类

In [None]:
print("str".__class__)

def run(self):
    print("This is a object function of", self)

xxx = type("DynamicClass", (), {"arg1": 10, "agr2": 20, "run": run})  # 手动创建一个类
a = xxx()
a.run()

### 6. 经典类和新式类
* 区别在于有没有继承object类
* Python2.x定义一个类时，默认不继承object
* Python3.x定义一个类时，默认继承object
* 为了代码兼容性，建议显式的继承object

### 7. 生命周期和内存管理
#### 7.1 存储方面
* 在Python中万物皆对象，不存在基本数据类型，比如0, 1.2, "abc"等都是对象
* 所有对象都会在内存中开辟一块空间进行存储
* 对于整型和短小字符，Python会进行缓存，不会创建多个相同对象，不同变量会指向同一个内存空间
* 容器对象，比如list，dict等，存储的内容，仅仅是其他对象的引用，并不是对象本身，比如list = [p1, p2], 这里面的p1,p2只是其他对象的一个引用，就只是存储了其他的对象的内存地址  
  
#### 7.2 垃圾回收方面
* 引用计数器：一个对象会记录自身被引用的个数，每增加一个引用，引用计数器就会+1,每减少一个引用，引用计数器就会-1
  * 引用计数+1场景
    * ```p1 = Person()```
    * ```p2 = p1```
    * 对象作为参数传入到一个函数中（函数内部一般有两个属性会引用该对象，引用计数会+2）
    * 对象作为一个元素，存储在一个容器中，比如```p_list = [p1, p2 ...]```
  * 引用计数-1场景
    * 显式销毁一个对象的别名```del p1```
    * 对象的别名被赋予新的对象```p1 = 1```
    * 一个对象离开它的作用域，比如一个函数执行完毕
    * 对象所在容器被销毁，或者从容器中删除对象
  * 无法解决循环引用问题，比如两个类各自有一个属性是对方类的实例化对象，要通过垃圾回收机制进行内存释放
* 垃圾回收：从经过”引用计数器机制”仍未被释放的对象中，找到”循环引用“，再释放该对象内存
  * 底层机制
    * 分代回收：0代，1代和2代
    * 垃圾回收器中，新增的对象个数-消亡的对象个数，达到一定的阈值，才会出发垃圾回收机制
  * 垃圾回收时机
    * 自动回收：开启垃圾回收机制，并且达到了垃圾回收的阈值
    * 手动回收
      * 手动调用```gc.collect()```
      * 也可以采用弱引用来解决“引用计数机制”无法解决的循环引用问题

In [None]:
import sys

# 引用计数机制
class LifeDuration(object):
    __count = 0
    def __init__(self):
        self.__class__.__count += 1

    def __del__(self):
        self.__class__.__count -= 1
    
    @classmethod
    def log(cls):
        print("use class attr: {}".format(cls.__count))

ld = LifeDuration()
print("use sys: {}".format(sys.getrefcount(ld)))  # sys.getrefcount()函数会增加一个引用次数
LifeDuration.log()

ld2 = LifeDuration()
LifeDuration.log()

del ld
LifeDuration.log()

# 垃圾回收机制
import gc
import weakref

print(gc.isenabled())
print(gc.get_threshold())

# 手动回收
class Person(object):
    pass

class Dog(object):
    pass

p = Person()
d = Dog()

# 会导致循环引用，p指向的内存空间里面有一个属性pet指向d指向的内存空间，即便释放d，Dog对象的引用计数还是1
p.pet = d
d.master = p  # d.master = weakref.ref(p) 弱引用不会让引用计数+1

del p
del d

# 手动触发
gc.collect()

### 8. 三大特性
#### 8.1 封装
* 使用方便
* 保证数据安全
* 利于代码维护
  
#### 8.2 继承
* 可以继承父类中非私有化属性和方法的使用权，这些属性和方法还是存储在父类的```__dict__```中，子类对象可以调用父类的实例方法和类方法，但是默认传入类方法中的cls参数是子类

In [None]:
class Animal(object):
    attr = 10
    _attr = 11
    __attr = 12

    def t(self):
        print(self.attr, self._attr, self.__attr)
    
    def _t(self):
        print(self.attr, self._attr, self.__attr)
    
    def __t(self):
        print(self.attr, self._attr, self.__attr)

a = Animal()
print(a.attr, a._attr)
a.t()
a._t()

class Dog(Animal):
    def test(self):
        print(self.attr, self._attr)
        self.t()
        self._t()

d = Dog()
d.test()
print(d.attr, d._attr)

##### 8.2.1 继承的几种形态
* 单继承：单继承链，无交叉和公共父类，自下而上查找
* 无重叠的多继承：多继承链，无交叉和公共父类，深度优先查找
* 有重叠的多继承：多继承链，有交叉和公共父类，广度优先查找  

__注意__：Python3.x和Python2.x在查找时所用的算法不一样，以上为Python3.x版本  
__注意__：当子类对象调用父类的实例方法时，传入给self的是子类对象，调用父类的类方法时，传入给cls的是子类

In [None]:
class D(object):
    age = 'd'
    pass

class C(D):
    # age = 'c'
    pass

class B(D):
    # age = 'b'
    pass

class A(B, C):
    # age = 'a'
    pass

print(A.mro())  # 可以通过mro方法查看资源的使用优先级
print(A.age)

##### 8.2.2 资源的重写和累加
* 子类中重写父类方法后，根据调用规则，优先调用子类自己实现的方法
* 子类重写父类方法时可以在父类基础上添加代码，此时可以通过```父类.__init__(self)```调用，这里的self是子类对象，但是在菱形继承中会存在重复调用的问题
* 采用super类可以沿着MRO链条，找到下一级节点，去调用对应的方法
  * 只对新式类有效
  * Python3.x版本之后可以不指定参数，编译器会自动根据上下文确定沿着哪个参数的mro链条找到当前类的下一级节点
  * 采用super方法后就不要通过父类名调用父类方法，否则可能产生多次调用的问题，建议只使用super

In [None]:
class B(object):
    def __init__(self):
        super(B, self).__init__()  # 沿着self.mro()的链条找到B的下一个节点
        self.b = 'b'
    @classmethod
    def test(cls):
        print(cls)

class A(B):
    def __init__(self):
        super().__init__()
        self.a = 'a'
    @classmethod
    def test(cls):
        super(A, cls).test()
        print(cls)

a = A()
print(a.__dict__)
a.test()

#### 8.3 多态
* 像C++之类的静态语言，必须预先设定好类型，这时候可以采用父类的不同派生类来实现多态，即用父类指针指向不同的派生类对象，然后用该指针调用不同派生类内部同一方法的不同实现
* Python是动态语言，不需要指定类型，本身就可以实现类似多态的效果  

#### 8.4 抽象类
* 一个抽象的类，不能直接创建实例
* 抽象方法，不能直接调用，子类必须实现，不实现会报错

In [None]:
import abc

class Animal(object, metaclass=abc.ABCMeta):
    @abc.abstractmethod
    def speak(self):
        pass

class Dog(Animal):
    def speak(self):
        print("汪汪")

class Cat(Animal):
    def speak(self):
        print("喵喵")

c = Cat()
c.speak()
d = Dog()
d.speak()