# Python学习记录

## Python基础

### 数据和变量

In [7]:
# 整数
print(10, 0xFF)
# 浮点数
print(0.1, 1e-3)
# 字符串
print('abc',"abc")
print('I\'m John')
print("I'm John")
print(r'I\'m John')
print('''line1
line2
line3''')


10 255
0.1 0.001
abc abc
I'm John
I'm John
I\'m John
line1
line2
line3


In [8]:
# 布尔值
print(True and True)
print(True and False)
print(not True)
# 空值
print(None)

True
False
False
None


### 字符串和编码
Unicode编码比较长，简化英文编码，节约空间形成变字长UTF-8编码，兼容ASCII编码。  
在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。  
用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件。  
浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。

Python3中的字符串`str`使用Unicode编码。  
调用字符的`ord`方法转为Unicode编码的整数值，Unicode编码的整数值调用`chr`方法得到对应的字符。  
调用`str`的`encode`方法可转换各种编码的为`bytes`类型进行网络传输。网络传输读取的`bytes`可调用`decode`方法按指定编码还原为`str`。

In [13]:
print(ord('A'))
print(chr(20013))
print('ABC'.encode('ascii'))
print('中文'.encode('utf-8'))
print(b'ABC'.decode('ascii'))
print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8'))

65
中
b'ABC'
b'\xe4\xb8\xad\xe6\x96\x87'
ABC
中文


在`.py`文件头部声明下列注释可指定`.py`文件的编码类型。
```py
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
```
第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；  
第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。仅在注释中声明不能设置`.py`文件编码类型，还应在编辑器中设置编码类型。

可使用`%`格式化字符串，不知道用什么就用`%s`转为字符串，`%%`可转义为`%`字符。  
还可以用字符串`str`的`format`方法格式化输出，{0}、{1}是传入参数的占位符，指定此处用传入的第几个参数替换。

In [19]:
print("I'm %s. I'm %d years old" % ('John', 22))
print('Hello, {0}, 成绩提升了 {1:.1f}%, {0}真棒'.format('小明', 17.125))

I'm John. I'm 22 years old
Hello, 小明, 成绩提升了 17.1%, 小明真棒


In [18]:
s1 = 72
s2 = 85
r = 100 * (s2-s1) / s1
print('{0:.1f}%'.format(r))
print('%.1f%%' % (r))

18.1%
18.1%


### list和tuple

`list`类似C++中的`vector`，有序列表，不同是元素类型可不同。  
增：`ls.insert(idx, elem)`、`ls.append(elem)`  
查：`ls[idx]`，idx从0开始，为负数是倒数  
删：`ls.pop(idx=-1)`  
改：`ls[idx] = elem`  

`tuple`元素不可变，`append`和`insert`不行，但可以`[]`。  
元素间关系类似于`pair`，常不带括号接受一对数据`key, value`  
单个元素时应用`t = (1,)`  
`tuple`中存“指针”时，“指针”值不能变，但指向的对象可变。

### 条件判断、循环
条件：
```py
if <condition0>:
    <code0>
elif <condition1>:
    <code1>
else:
    <code2>
```

`while`循环
```python
while <condition>:
    <code1>
else:
    <code2>
```


`for`循环
```py
for <var> in <iterator>:
    <code1>
for i in range(n):
    <code2> # i遍历0到n-1
```


`continue`进入下一轮循环，`break`跳出循环

### dict和set

`dict`存储key-value对，通过key用Hash算法计算出value所在位置，索引速度快。key必须是不可变类型  
增：`d[key] = value`  
查：`d[key]`（key不存在时报错）、`d.get(key)`、`key in d`、`d.keys()`、`d.values()`、`d.items()`  
删：`d.pop(key)`  
改：`d[key] = value`

In [22]:
d = {'a':1,'b':2,'c':3}
print('a' in d)
print(d.get('b'))
print(d['c'])
d['d'] = 4
print(d)
d.pop('d')
print(d)

True
2
3
{'a': 1, 'b': 2, 'c': 3, 'd': 4}
{'a': 1, 'b': 2, 'c': 3}


`set`为key的集合，无序，无重复元素。  
创建：`set([ls])`、`{key1,key2,key3}`  
增：`s.add(key)`  
删：`s.remove(key)`

In [24]:
s1 = {1,2,3}
s2 = set([3,4,5])
s1.remove(1)
s2.add(6)
print(s1)
print(s2)
print(s1&s2)
print(s1|s2)

{2, 3}
{3, 4, 5, 6}
{3}
{2, 3, 4, 5, 6}


## 函数


### 函数调用和定义

调用函数：`f()`  
定义函数：`def f(args):`  
检查参数类型：`isinstance(var, (type1, type2))`

In [29]:
def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError('bad type')
    if x <= 0:
        return -x
    else:
        return x
def void():
    pass
print(my_abs(-1))
void()
print(my_abs(1))
print(my_abs('abc'))

1
1


TypeError: bad type

可用`tuple`实现返回多个值，接受时可不用括号

In [33]:
def move(x, y):
    x += 1
    y += 1
    return x, y
a, b = move(0, 0)
print(a,b)
print(move(0,0))

1 1
(1, 1)


### 函数参数

必选参数：定义：`def f(arg1, arg2)`，调用：`f(para1, para2)`。  
默认参数：定义：`def f(arg1, arg2=default)`，调用：`f(para1)`、`f(para1, para2)`、`f(para1, arg2=para2)`。默认参数可不按顺序调用。**默认参数在函数中必须不被改变，否则下次调用时不再为默认值**  
可变参数：定义：`def f(arg1, arg2=default, *arg3)`，调用：`f(para1, para2, val1, val2, val3)`。默认参数后的任意多个参数组成`tuple`存在arg3中，可通过`val in arg3`遍历。已有list或tuple可通过`f(*ls)`将其转为可变参数传入  
命名关键词参数：定义`def f(arg1, arg2=para2, *, key1, key2)`或`def f(arg1, arg2=para2, *args, key1, key2)`，调用：`f(para1, key1=val1, key2=val2)`。**key1和key2必须显式传入**  
关键字参数：定义`def f(arg1, arg2, **arg4)`，调用：`f(para1, para2, key1=value1, key2=value2)`。调用时转为`dict`传入arg4。  
函数定义参数顺序必须是`def f(pos_only, arg=default, *args, key_only, **kwargs)`，调用时必须是`f(a,b,c,key1=val1,key2=val2,key3=val3)`。位置参数按位置匹配必选、默认参数，多余传入args组成tuple。关键字参数按key匹配默认参数和命名关键字参数，多余传入kwargs组成dict。

In [41]:
def f(a, b, c=0, *args, key1='a', key2, **kwargs):
    print('a =',a,', b =',b,', c =',c,', args =',args,', key1 =',key1,', key2 =',key2,', kwargs =',kwargs)
f(1,2,key1='b',key2=3)
f(1,2,3,4,5, key2=2)
f(1,2,3,4,5, key2=2, key3=3)

a = 1 , b = 2 , c = 0 , args = () , key1 = b , key2 = 3 , kwargs = {}
a = 1 , b = 2 , c = 3 , args = (4, 5) , key1 = a , key2 = 2 , kwargs = {}
a = 1 , b = 2 , c = 3 , args = (4, 5) , key1 = a , key2 = 2 , kwargs = {'key3': 3}


### 函数递归

In [46]:
def move(n, a, b, c):
    if n == 1:
        print(a, '-->', c)
    else:
        move(n-1, a, c, b)
        print(a, '-->', c)
        move(n-1, b, a, c)
move(3, 'A', 'B', 'C')

A --> C
A --> B
C --> B
A --> C
B --> A
B --> C
A --> C


## 高级特性

### 切片

获取`list`或`tuple`部分元素  
`beg`和`end`分别表示起始和末尾的下标，负数表示倒数，范围[`beg`, `end`)，`inc`表示增量，负数表示逆序  
`ls[beg:end]`  
`ls[:end]`  `ls[beg:]`  
`ls[beg:end:inc]`  `ls[:end:inc]`  `ls[beg::inc]` 

In [49]:
ls = list(range(10))
print(ls[1:-2])
print(ls[3:])
print(ls[:-3])
print(ls[::2])
print(ls[-2:-5:-1])

[1, 2, 3, 4, 5, 6, 7]
[3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6]
[0, 2, 4, 6, 8]
[8, 7, 6]


### 迭代

可迭代对象通过`for <element> in <iterator>`遍历元素，内置容器可迭代  
`list`或`tuple`: `for v in ls`  
`dict`: `for k in d`、`for v in d.values()`、`for k, v in d.items()`  
`str`：`for ch in s`  
需要下标时调用`enumerate`  
`for i, v in enumerate(ls)`  
多个元素组成`tuple`返回，可用不带括号的变量对接收

In [50]:
ls = [1,2,3,4,5]
d = {'a':1,'b':2,'c':3}
for v in ls:
    print(v)
for k in d:
    print(k,':',d[k])
for k,v in d.items():
    print(k,':',v)

1
2
3
4
5
a : 1
b : 2
c : 3
a : 1
b : 2
c : 3


### 列表生成式

`[<expression x> for x in <iterator x> if <condition>]`  
遍历`iterator`中满足条件`condition`的`x`，生成关于`x`的表达式`expression`的序列。

In [51]:
l1 = ['Hello', 18, 'World']
l2 = [s.lower() for s in l1 if isinstance(s, str)]
print(l2)

['hello', 'world']


### 生成器

遍历满足一定规律的序列，如由表达式生成的列表，不一定都算出来放入内存，可迭代一次算一次。  
生成器定义了序列生成的规律  
列表生成式中的[]改为()：`g = (<expression x> for x in <iterator x> if <condition>)`  
函数中使用`yield`：  
```py
def f(args):
    <code>
    yield <expression>
    <code>
g = f(paras)
``` 
基本上初始化一个`list`然后不断`append`元素的序列可采用生成器的方法节约内存。

遍历生成器生成的元素时，可迭代`next(g)`  
也可以通过`for x in g`遍历。

In [2]:
g = (x*x for x in range(3))
for v in g:
    print(v)
def triangles():
    ls = [1]
    while True:
        yield ls
        ls = [0] + ls + [0]
        ls = [x + y for x, y in zip(ls[:-1], ls[1:])]
        
n = 0
results = []
for t in triangles():
    results.append(t)
    n = n + 1
    if n == 10:
        break

for t in results:
    print(t)

0
1
4
[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]


### 迭代器

可迭代对象`iterable`：可作用于`for...in...`循环的对象，如`list`、`tuple`、`str`、`dict`、`set`、生成器等。  
迭代器`iterator`：可调用`next`方法的数据流，只有调用`next`时才计算下一元素，如生成器。容器不是，但可用`iter`转换为`iterator`。  
`for`循环实际上不断调用`next`遍历元素。

In [6]:
from collections import Iterator
ls = [0, 1, 2]
g = (x for x in range(3))
print(isinstance(ls, Iterator))
print(isinstance(g, Iterator))

False
True


## 函数式编程

### 高阶函数

将函数名`f`作为变量使用。  
`map(f, <iterable>)`接收函数`f`，作用于可迭代对象中的各个元素，返回迭代器`<iterator>`。  
`reduce(f, <iterable>)`接收可传入两个参数的函数`f`，返回结果和下个元素作为参数传入，如`f(f(x1, x2), x3)`。  
`filter(f, <iterable>)`中的`f`作用于元素判断为`True`或`False`，返回<iterable>中判断为`True`的元素的迭代器。采用**惰性计算**，只有用到下一元素时才会用`f`进行判断。  
`sorted(<iterable>, key=f)`函数f作用于各元素后再排序。

In [14]:
from functools import reduce
ls = [1, 2, -3]
ls2 = map(lambda x: x**2, ls)
print(list(ls2))
s = reduce(lambda x, y: x+y, ls)
print(s)
odd = filter(lambda x: x%2==1 or x%2==-1, ls)
print(list(odd))
orig = sorted(ls)
print(orig)
pos = sorted(ls, key=abs)
print(pos)

[1, 4, 9]
0
[1, -3]
[-3, 1, 2]
[1, 2, -3]


### 函数作为返回值

在函数内部定义函数并返回，可等到需要使用时再调用函数。  
```py
def ret_func(args):
    def func():
        <code>
    return func

f = ret_func(paras)    # 未执行<code>
f()                    # 执行<code>
```  
内部函数引用外部函数的局部变量时，使用的是**外部函数执行完成后**的值。因此在循环内定义的函数不能使用循环变量，因为调用内部函数时使用循环变量的是循环结束之后的值。

In [17]:
def createCounter():
    def genInt():
        n = 1
        while True:
            yield n
            n += 1
    gen_cnt = genInt()
    def count():
        return next(gen_cnt)
    return count
counter = createCounter()
print(counter(), counter(), counter())

1 2 3


### 匿名函数

`lambda x: <expression x>`返回一个函数，传入参数计算表达式，适用于简单函数

### 装饰器

通过定义高阶函数，从而动态使用函数，可达到增强函数功能。

In [19]:
def log(func):
    def new_func(*args, **kwargs):
        print('This is a log')
        return func(*args, **kwargs)
    return new_func

def add(x, y):
    return x + y

new_add = log(add)
print(new_add(1, 2))

This is a log
3


使用装饰器可简化，执行的代码是等价的

In [20]:
def log(func):
    def new_func(*args, **kwargs):
        print('This is a log')
        return func(*args, **kwargs)
    return new_func

@log
def add(x, y):
    return x + y
print(add(1, 2))

This is a log
3


还可以再增加外层函数，从而可向装饰器传参

In [25]:
def log(msg):
    def actualLog(func):
        def new_func(*args, **kwargs):
            print(msg)
            return func(*args, **kwargs)
        return new_func
    return actualLog

@log('log message')
def add(x, y):
    return x + y
print(add(1, 2))

# 等价于
def old_add(x, y):
    return x + y
actual_log = log('log message')
new_add = actual_log(old_add)
print(new_add(1, 2))

log message
3
log message
3


### 偏函数

`func_less_args = functools.partial(func, arg, key=val)`，将`arg`存到位置参数`*args`的左侧，`key: val`存入`**kwargs`中传入函数`func`，其余参数在调用`func_less_args`时传入，减少传参个数。

## 模块

### 自定义模块

`abc.py`文件是一个模块，模块名`abc`，模块可被其他模块引用，不同模块中可使用相同名字的函数和变量，可避免冲突。  
含`.__init__.py`的文件夹`xyz`是一个包，包名`xyz`，文件夹中`abc.py`的模块名为`xyz.abc`。不同包可使用相同名字的模块，可避免模块名的冲突，但自定义模块名不能与内置的模块名冲突。  
`xyz`也是模块名，对应的文件是`xyz.__init__.py`。
```
xyz
├─ __init__.py
└─ abc.py
```

### 使用模块

`import <module_name>`后可显式调用模块中的函数和变量。模块中包括标准注释、模块注释、特殊变量（`__name__`等）、自定义函数、自定义变量。  
直接运行模块时模块的`__name__`为`__main__`，被其他模块调用时为别的名字，因此可用`__name__`变量区分是直接运行还是被调用，可编写直接运行时的测试代码。  
调用`import <module_name>`后会运行一遍模块对应的`.py`文件，因此不应直接在模块测试代码前写可直接运行的代码，应只定义函数和变量。  
模块中的变量（和函数）按名称分为  
+ 正常变量：`abc`、`f`等，可直接调用。
+ 特殊变量：`__name__`、`__author__`，可直接调用。
+ 非公开变量：`_private1`、`__private2`，语法上调用不受限，但建议不直接调用。

In [30]:
import hello
hello.test()
print(hello.hello_var)

Too many arguments!
1


模块搜索路径在`sys`模块的`path`变量中保存，包括当前目录、内置模块和第三方模块安装目录。该变量是一个`list`，可在运行时修改，运行结束后失效。

## 面向对象编程

### 类和实例

`class T(FT)`为类的定义，`T`为类名，从`FT`类继承。  
特殊方法`__init__`类似C++中的构造函数，创建实例时调用，第一个参数`self`表示实例本身，调用时不需要传入，解释器自己传入。  
```py
class T(FT):
    def __init__(self, arg1, arg2):
        self.prop1 = arg1
        self.prop2 = arg2
```
`obj = T(para1, para2)`创建实例。  
在类的内部定义方法第一个参数为`self`，表示实例本身，调用时不需要传入。

In [1]:
class Student(object):
    def __init__(self, name, score):
        self.name = name
        self.score = score
    
    def print_score(self):
        print('%s: %s' % (self.name, self.score))
    
    def get_grade(self):
        if self.score >= 90:
            return 'A'
        elif self.score >= 60:
            return 'B'
        else:
            return 'C'

In [2]:
lisa = Student('Lisa', 99)
print(lisa.name, lisa.get_grade())

Lisa A


### 访问限制

访问实例的属性可直接`obj.prop`，如果名字前加两个下划线，可变为私有属性`obj.__prop`，不能直接访问了。但实际操作是把`obj.__prop`变为了`obj._T__prop`，可通过这个属性名访问。注意不要动态添加属性`obj.__prop = para`，这样相当于从外部动态添加属性。比较好的做法是编写`obj.set_prop(args)`和`obj.get_prop()`方法读写属性，好处是可以对传入参数进行类型检查。

### 继承和多态

`T`类继承了`FT`类，`T`类为`FT`的子类，`FT`为`T`的父类。子类可以调用父类的所有方法，也可以在子类中重新定义，覆盖父类，优先调用子类同名的方法。这样的好处是编写函数可更“泛型”，只要一个类有该函数所要调用的方法，则这个类的实例就可以传入函数，其所有子类的实例也可以传入函数，无需知道具体是哪个子类。

In [7]:
class Animal(object):
    def run(self):
        print('Animal is running')

class Dog(Animal):
    def bark(self):
        print('bark!')

class Cat(Animal):
    def run(self):
        print('Cat is running')
def run_twice(animal):
    animal.run()
    animal.run()

In [8]:
dog = Dog()
cat = Cat()
run_twice(dog)
run_twice(cat)

Animal is running
Animal is running
Cat is running
Cat is running


### 获取对象信息

`isinstance(ogj, T)`可以判断`obj`是否为`T`类或`T`类的父类的实例，其中`T`可改为一些类组成的`tuple`或`list`。`type(obj)`返回实例`obj`所属的类，不能反映父类。  
`dir(obj)`返回实例`obj`所有属性和方法，其中`__xxx__`方法为特殊方法，很多方法类似C++中的重载运算符，例如`len(obj)`等价于`obj.__len__()`。  
`getattr(obj, 'prop')`、`setattr(obj, 'prop', para)`、`hasattr(obj, 'prop')`分别获取、设置、判断属性。

### 实例属性和类属性

实例属性归属于各个实例，各实例可动态绑定和修改，类属性归属于类，所有实例都可以访问，也可以由类名访问，类似于C++类中的静态成员。两种属性重名时实例属性优先级高于类属性。

In [14]:
class Test(object):
    count = 0
    def __init__(self, cnt):
        Test.count += 1
        self.count = cnt

In [15]:
t = Test(1)
t2 = Test(1)
print(t.count)
print(Test.count)
del t.count
print(t.count)

1
2
2


### `__slots__`

可以给实例动态增加属性`obj.prop = para`，也可以给实例动态增加方法，假设已定义函数`method`，`obj.method = MethodType(method, obj)`，但只能给`obj`实例增加，同类其他实例不行，通过`T.method = method`可以给类动态增加方法。  
类的特殊变量`__slots__`可以规定**实例动态增加属性和方法**限制，`__slots__ = ('prop1', 'prop2')`。子类不定义`__slots__`时父类的`__slots__`不起作用，定义时子类可定义的属性为子类和父类`__slots__`规定的属性。

### `@property`

直接读取属性或赋值不安全，通过`get`和`set`方法虽然可以检查类型，但太麻烦。通过对`get`方法使用`@property`装饰器可以使`var = obj.prop`等价于`var = obj.get_prop()`，对`set`方法使用`@prop.setter`可以使`obj.prop = para`等价于`obj.set_prop(para)`。

In [16]:
class Test_name(object):
    @property
    def name(self):
        return self.__name
    @name.setter
    def name(self, name):
        if not isinstance(name, str):
            raise TypeError("name must be a string")
        self.__name = name

In [19]:
a = Test_name()
a.name = 'John'
print(a.name)
a.name = 1

John


TypeError: name must be a string

### 多重继承

当一个类能按多个标准分成子类时，例如动物分为哺乳类、鸟类或分为能飞、不能飞，如果组合成不同子类，子类个数随划分标准数指数增加，显然是不行的。  
采用多重继承时一个类可以继承多个父类，这样只需按不同标准各自划分子类，然后根据子子类的特点继承所需的子类即可。

In [22]:
class Animal(object):
    def eat(self):
        pass
class Flyable(Animal):
    def fly(self):
        pass
class Runnale(Animal):
    def run(self):
        pass
class Mammal(Animal):
    def baby(self):
        pass
class Bird(Animal):
    def egg(self):
        pass
class Dog(Mammal, Runnale):
    pass
class Parrot(Bird, Flyable, Runnale):
    pass


In [23]:
dog = Dog()
dog.eat()
dog.run()
dog.baby()
parrot = Parrot()
parrot.fly()
parrot.egg()
parrot.run()

### 使用特殊方法定制类

`__str__(self)`：返回`print(obj)`时显示内容。  
`__repr__(self)`：返回直接调用实例变量`obj`时显示内容  
`__iter__(self)`：返回`for ... in obj`时迭代的可迭代对象  
`__next__(self)`：返回实例作为可迭代对象时要返回的下个元素，迭代结束时`raise StopIteration()`  
`__getitem(self, key)`：返回调用`obj[key]`时应返回的对象，`n`可能是`int`，也可能是`slice`**等**，要作类型判断返回不同内容。  
`__setitem(self, key, value)`：`obj[key] = value`。  
`__getattr__(self, attr)`：调用属性或方法`obj.abc`时，若`abc`不存在，则调用该方法，将`abc`作为`str`传入`attr`进行动态处理。  
`__call__(self)`：将实例当做方法直接调用`obj()`时调用该方法，`Callable(obj)`可判断`obj`是否可调用。方法`obj.method(args)`可理解为`method`是`obj`的一个可调用属性，调用时传入参数`args`。

### 枚举类

`Enum`的子类为枚举类，其类属性表示枚举项，属性名为key，值为value，枚举项中key不应重复，value不应可从外部修改。

In [1]:
from enum import Enum, unique
@unique
class COLOR(Enum):
    RED = 0
    GREEN = 1
    BLUE = 2

In [6]:
print(COLOR.RED)
print(COLOR['RED'])
print(COLOR(0))
print(COLOR.RED.name)
print(COLOR.RED.value)

COLOR.RED
COLOR.RED
COLOR.RED
RED
0


`COLOR.RED`、`COLOR['RED']`、`COLOR(0)`表示同一个枚举项，`COLOR.RED.name`为枚举名称`RED`，`COLOR.RED.value`为枚举值`0`。

### 元类

类在运行时动态创建，例如导入模块时执行模块中的所有语句时，遇到`class`时动态创建类。  
`type`可返回对象的类，还可以创建新的类。`type('T', (FT,), dict(method=func))`，创建`T`类，继承`FT`，创建方法`method`为预先定义的函数`func`。  
定义`metaclass`也可以创建类，就像定义类后可以创建实例，可认为类是`metaclass`的实例。创建类时，指定`metaclass`后，调用`metaclass`的`__new__`方法动态地创建类。  
`__new__(cls, name, bases, attrs)`：返回动态创建的类定义，参数分别为当前准备创建的类、类名`str`、父类的`tuple`、类属性和方法的`dict`，对这些参数进行修改后再返回就可动态修改类的定义。

In [24]:
class ListMetaclass(type):   # metaclass
    def __new__(cls, name, bases, attrs):
        attrs['add'] = lambda self, value: self.append(value)
        return type.__new__(cls, name, bases, attrs)
class MyList(list, metaclass=ListMetaclass):
    pass

In [26]:
mls = MyList()
mls.add(1)
mls.add(2)
mls.add(3)
print(mls)

[1, 2, 3]


## 错误处理、调试、测试

### 异常处理

程序的编写错误和用户输入错误可以修复或通过检查避免，但运行过程中还会发生难以预料的错误，比如磁盘写满，网络连接断开，称之为异常。异常会导致程序停止运行，因此需要使用异常处理机制进行处理，可保持程序正常运行。  
```py
try:
    <code>
except <SomeError> as <e>:
    <code>
except <AnotherError> as <e>:
    <code>
else:
    <code>
finally:
    <code>
```
`try`内执行一段可能发生异常的代码，发生异常时，根据错误类型进入相应的`except`代码进行异常处理，`as`后为相应异常类的一个实例。  
处理结束后不会再继续执行`try`中异常发生处后面的代码，而是执行`finally`中的代码，进行收尾工作（如释放内存，断开连接等），可以没有`finally`。  
没有发生错误时可进入`else`。  
某层调用发生异常时，异常不断向上抛出，直到被上面某层的`except`接收，因此只需在合适的上层代码处进行异常处理即可。如果未被上层代码接收，最终被解释器接收，打印异常信息，停止运行程序。  
`logging.exception(e)`：打印异常栈。
`raise <SomeError>(<message>)`：向上抛出异常。如果被某层`except`接收后无法处理，可在`excpet`中继续向上抛出。

In [8]:
def divide(a, b):
    if b == 0:
        raise ValueError('should not be divided by 0')
    return a / b

In [15]:
import logging
try:
    res = divide(1, 0)
    print(res)
except ValueError as e:
    logging.exception(e)
except TypeError as e:
    logging.exception(e)
else:
    print('no error')
finally:
    print('finally')

ERROR:root:should not be divided by 0
Traceback (most recent call last):
  File "<ipython-input-15-b5ea29233a88>", line 3, in <module>
    res = divide(1, 0)
  File "<ipython-input-8-060d3a0c2092>", line 3, in divide
    raise ValueError('should not be divided by 0')
ValueError: should not be divided by 0
finally


In [16]:
try:
    res = divide(1, '1')
    print(res)
except ValueError as e:
    logging.exception(e)
except TypeError as e:
    logging.exception(e)
else:
    print('no error')
finally:
    print('finally')

ERROR:root:unsupported operand type(s) for /: 'int' and 'str'
Traceback (most recent call last):
  File "<ipython-input-16-818e2e3ccc1d>", line 2, in <module>
    res = divide(1, '1')
  File "<ipython-input-8-060d3a0c2092>", line 4, in divide
    return a / b
TypeError: unsupported operand type(s) for /: 'int' and 'str'
finally


In [17]:
try:
    res = divide(1, 1)
    print(res)
except ValueError as e:
    logging.exception(e)
except TypeError as e:
    logging.exception(e)
else:
    print('no error')
finally:
    print('finally')

1.0
no error
finally


### 调试

`print(<message>)`：写起来麻烦，还得删除。
`assert <condition>, <message>`：<condition>为`True`时，继续执行，为`False`时，抛出`AssertionError(<message>)`。`python -O <.py>`可以关闭`assert`。  
`logging.<level>(<message>)`：在代码不同处设置打印信息，`<level>`可以是`debug`、`info`、`warning`、`error`，表示不同等级的信息。可以通过`logging.basicConfig(level=logging.<LEVEL>)`控制打印哪个级别或以上的信息。还可以设置信息打印到`console`还是文件。  
`pdb`或IDE调试。  
IDE调试方便，但`logging`功能最强大。

### 测试

使用`unittest`模块进行单元测试。继承`unittest.TestCase`的类为测试类，方法名为`test_<testname>()`的方法被认为是测试方法，可使用继承的`assert<Fucn>`方法来判断测试结果。  
```py
if __name__ == '__main__':
    unittest.main()
```
可运行测试。  
定义`setUp`和`tearDown`方法，分别在测试前和测试后执行，可分别进行初始化和收尾工作。

In [18]:
def add_str(a, b):
    return a + b

In [34]:
import unittest
class TestAddStr(unittest.TestCase):
    def setUp(self):
        print('set up')
    def tearDown(self):
        print('tear down')
    def testRet(self):
        print('testRet')
        ret = add_str('a', 'b')
        self.assertEqual(ret, 'ab')
    def testType(self):
        print('testType')
        ret = add_str('a', 'b')
        self.assertTrue(isinstance(ret, str))

In [35]:
unittest.main(argv=['useless arg'], exit=False)   # Jupyter Notebook需要传参，在.py中运行时不需要

..set up
testRet
tear down
set up
testType
tear down

----------------------------------------------------------------------
Ran 2 tests in 0.002s

OK


<unittest.main.TestProgram at 0x2030500e288>

### 文档测试

使用`doctest`模块对注释中python交互式环境输入和执行的结果进行判断。  
`doctest.testmod()`：执行注释中的交互式环境代码，判断结果是否于注释中给出的一致。

## IO编程

同步IO：CPU暂停执行程序，等待外设处理完毕后再继续执行。异步IO：程序继续执行其他程序，外设处理完毕后通知CPU。回调类似中断，轮询需要CPU执行其他任务时不断查询是否完成。

### 文件读写

文件读写是程序向操作系统申请打开文件，然后调用操作系统提供的接口读写文件。  
`f = open(<filepath>, <mode>)`：打开`<filepath>`地址上的文件，根据`<mode>`决定读、写或追加文件。可选参数`encoding=`决定编码类型。


`<mode>` | 含义  
:-:|:-:
`'r'` | 只读（默认） |
`'w'` | 覆盖写（不可读，不存在则新创建；存在则重写新内容） |
`'a'` | 追加（不可读，不存在则新创建；存在则只追加内容） |
`'x'` | 创建写（不可读，不存在则新创建；存在则出错） |
`'+'` | 与 `'r'`/`'w'`/`'a'`/`'x'` 一起使用，增加读写功能 |
`'t'` | 文本（默认）
`'b'` | 二进制

`f.close()`：关闭文件。文件必须关闭，不然占用操作系统资源。文件读写出错时终止运行程序，会跳过关闭文件，需要用`try...finally`，或者用`with`自动调用`f.close()`。
```py
with open(<filepath>, <mode>) as f:
    <code>
```
`f.read(size)`：一次性读取文件所有内容，返回`str`。未指定`size`会全部读入，文件过大会导致内存不够。  
`f.readlines()`：一次性读取所有文件内容，返回每行内容为元素组成的`list`。  
`f.write(<content>)`：写入文件。调用时操作系统不会立刻写入，会在空闲时写入。调用`close`方法时会把没写入的全部写入，因此跳过`close`方法时会导致写入不完整。

```py
with <expression> [as obj]:
    <code>
```
建立上下文执行代码，`<expression>`返回一个对象，可由`obj`接收。进入`with`时调用返回对象的`__enter__`方法（返回对象自身给`obj`），退出时调用`__exit__`方法。因此在文件读写中，定义`f`的`__exit__`方法中执行`close`，即可保证无论什么原因退出`with`，都会执行`close`。

In [49]:
class TestWith(object):
    def __enter__(self):
        print('enter')
        return self
    def __exit__(self, exc_type, exc_value, exc_trackback):
        print('exit')
    def method(self):
        print('This is an instance of TestWith')

In [50]:
with TestWith() as obj:
    obj.method()

enter
This is an instance of TestWith
exit


### `StringIO`和`BytesIO`

只要有`read`方法，都可以视作file-like Object。`StringIO`可以向**内存**读写`str`，`BytesIO`向**内存**读写`bytes`。

### 操作文件和目录

`os`模块提供了使用操作系统命令的函数。  
`os.name`：操作系统类型。  
`os.environ`：环境变量。  
`os.path.abspath(<relpath>)`：返回相对地址的绝对地址。当前目录用`'.'`表示。  
`os.path.join(<path1>, <path2>)`：返回拼接两个地址。  
`os.path.split(<path>)`：返回拆分地址为两部分的`tuple`，后一部分总是最后一级的目录或文件。  
`os,path.splitext(<path>)`：从扩展名处拆分，其余同上。  
`os.mkdir(<path>)`：创建目录。  
`os.rmdir(<path>)`：删除目录。

In [61]:
import os
def find_file_str(path, s):
    for cata in os.listdir(path):
        cata_path = os.path.join(path, cata)
        if os.path.isfile(cata_path):
            if s in cata:
                print(os.path.abspath(cata_path))
        elif os.path.isdir(cata_path):
            find_file_str(cata_path, s)

In [62]:
find_file_str('.', 'model')

d:\Workspaces\VSCode\exercise\Python\Flask_Exercise\a\ab\momodeldel
d:\Workspaces\VSCode\exercise\Python\Flask_Exercise\a\smodel
d:\Workspaces\VSCode\exercise\Python\Flask_Exercise\metamodel.py
d:\Workspaces\VSCode\exercise\Python\Flask_Exercise\user_model.py
d:\Workspaces\VSCode\exercise\Python\Flask_Exercise\__pycache__\metamodel.cpython-37.pyc


### 序列化

内存存储的变量转换为可存储或可传输的内容，`pickle.dump(<var>)`可将任意变量转换为二进制的`bytes`对象，然后可以`'rb'`、`'wb'`读写，只能用于python，兼容性差。  
JSON是JavaScript语言描述的对象，是采用UTF-8编码的字符串，可用`json`库与`dict`互相转换。  
`json.dumps(<dict>, default=<transfunc>)`：返回字典`dict`按JSON标准转换的字符串`str`。如果传入的是自定义类型，传入`<transfunc>`给出自定义类型到`dict`的转换函数。  
`json.loads(<str>, object_hook=<transfunc>)`：返回字符串`str`按JSON标准解码的字典`dict`。如果要转换为自定义类型，`<transfunc>`给出`dict`到自定义类型的转换函数。

In [77]:
import json
d = dict(name='John', age=22, pat=None)
js = json.dumps(d)
print(type(js), js)
js_str = '{"name": "Jiang", "age": 22, "pat": null}'
d_str = json.loads(js_str)
print(type(d_str), d_str)

<class 'str'> {"name": "John", "age": 22, "pat": null}
<class 'dict'> {'name': 'Jiang', 'age': 22, 'pat': None}
