# Python学习记录

## Python基础

### 数据和变量

In [7]:
# 整数
print(10, 0xFF)
# 浮点数
print(0.1, 1e-3)
# 字符串
print('abc',"abc")
print('I\'m John')
print("I'm John")
print(r'I\'m John')
print('''line1
line2
line3''')


10 255
0.1 0.001
abc abc
I'm John
I'm John
I\'m John
line1
line2
line3


In [8]:
# 布尔值
print(True and True)
print(True and False)
print(not True)
# 空值
print(None)

True
False
False
None


### 字符串和编码
Unicode编码比较长，简化英文编码，节约空间形成变字长UTF-8编码，兼容ASCII编码。  
在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。  
用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件。  
浏览网页的时候，服务器会把动态生成的Unicode内容转换为UTF-8再传输到浏览器。

Python3中的字符串`str`使用Unicode编码。  
调用字符的`ord`方法转为Unicode编码的整数值，Unicode编码的整数值调用`chr`方法得到对应的字符。  
调用`str`的`encode`方法可转换各种编码的为`bytes`类型进行网络传输。网络传输读取的`bytes`可调用`decode`方法按指定编码还原为`str`。

In [13]:
print(ord('A'))
print(chr(20013))
print('ABC'.encode('ascii'))
print('中文'.encode('utf-8'))
print(b'ABC'.decode('ascii'))
print(b'\xe4\xb8\xad\xe6\x96\x87'.decode('utf-8'))

65
中
b'ABC'
b'\xe4\xb8\xad\xe6\x96\x87'
ABC
中文


在`.py`文件头部声明下列注释可指定`.py`文件的编码类型。
```
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
```
第一行注释是为了告诉Linux/OS X系统，这是一个Python可执行程序，Windows系统会忽略这个注释；  
第二行注释是为了告诉Python解释器，按照UTF-8编码读取源代码，否则，你在源代码中写的中文输出可能会有乱码。仅在注释中声明不能设置`.py`文件编码类型，还应在编辑器中设置编码类型。

可使用`%`格式化字符串，不知道用什么就用`%s`转为字符串，`%%`可转义为`%`字符。  
还可以用字符串`str`的`format`方法格式化输出，{0}、{1}是传入参数的占位符，指定此处用传入的第几个参数替换。

In [19]:
print("I'm %s. I'm %d years old" % ('John', 22))
print('Hello, {0}, 成绩提升了 {1:.1f}%, {0}真棒'.format('小明', 17.125))

I'm John. I'm 22 years old
Hello, 小明, 成绩提升了 17.1%, 小明真棒


In [18]:
s1 = 72
s2 = 85
r = 100 * (s2-s1) / s1
print('{0:.1f}%'.format(r))
print('%.1f%%' % (r))

18.1%
18.1%


### list和tuple

`list`类似C++中的`vector`，有序列表，不同是元素类型可不同。  
增：`ls.insert(idx, elem)`、`ls.append(elem)`  
查：`ls[idx]`，idx从0开始，为负数是倒数  
删：`ls.pop(idx=-1)`  
改：`ls[idx] = elem`  

`tuple`元素不可变，`append`和`insert`不行，但可以`[]`。  
元素间关系类似于`pair`，常不带括号接受一对数据`key, value`  
单个元素时应用`t = (1,)`  
`tuple`中存“指针”时，“指针”值不能变，但指向的对象可变。

### 条件判断、循环
条件：
```python
if <condition0>:
    <code0>
elif <condition1>:
    <code1>
else:
    <code2>
```

`while`循环
```python3
while <condition>:
    <code1>
else:
    <code2>
```


`for`循环
```python3
for <var> in <iterator>:
    <code1>
for i in range(n):
    <code2> # i遍历0到n-1
```


`continue`进入下一轮循环，`break`跳出循环

### dict和set

`dict`存储key-value对，通过key用Hash算法计算出value所在位置，索引速度快。key必须是不可变类型  
增：`d[key] = value`  
查：`d[key]`（key不存在时报错）、`d.get(key)`、`key in d`、`d.keys()`、`d.values()`、`d.items()`  
删：`d.pop(key)`  
改：`d[key] = value`

In [22]:
d = {'a':1,'b':2,'c':3}
print('a' in d)
print(d.get('b'))
print(d['c'])
d['d'] = 4
print(d)
d.pop('d')
print(d)

True
2
3
{'a': 1, 'b': 2, 'c': 3, 'd': 4}
{'a': 1, 'b': 2, 'c': 3}


`set`为key的集合，无序，无重复元素。  
创建：`set([ls])`、`{key1,key2,key3}`  
增：`s.add(key)`  
删：`s.remove(key)`

In [24]:
s1 = {1,2,3}
s2 = set([3,4,5])
s1.remove(1)
s2.add(6)
print(s1)
print(s2)
print(s1&s2)
print(s1|s2)

{2, 3}
{3, 4, 5, 6}
{3}
{2, 3, 4, 5, 6}


## 函数


### 函数调用和定义

调用函数：`f()`  
定义函数：`def f(args):`  
检查参数类型：`isinstance(var, (type1, type2))`

In [29]:
def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError('bad type')
    if x <= 0:
        return -x
    else:
        return x
def void():
    pass
print(my_abs(-1))
void()
print(my_abs(1))
print(my_abs('abc'))

1
1


TypeError: bad type

可用`tuple`实现返回多个值，接受时可不用括号

In [33]:
def move(x, y):
    x += 1
    y += 1
    return x, y
a, b = move(0, 0)
print(a,b)
print(move(0,0))

1 1
(1, 1)


### 函数参数

必选参数：定义：`def f(arg1, arg2)`，调用：`f(para1, para2)`。  
默认参数：定义：`def f(arg1, arg2=default)`，调用：`f(para1)`、`f(para1, para2)`、`f(para1, arg2=para2)`。默认参数可不按顺序调用。**默认参数在函数中必须不被改变，否则下次调用时不再为默认值**  
可变参数：定义：`def f(arg1, arg2=default, *arg3)`，调用：`f(para1, para2, val1, val2, val3)`。默认参数后的任意多个参数组成`tuple`存在arg3中，可通过`val in arg3`遍历。已有list或tuple可通过`f(*ls)`将其转为可变参数传入  
命名关键词参数：定义`def f(arg1, arg2=para2, *, key1, key2)`或`def f(arg1, arg2=para2, *args, key1, key2)`，调用：`f(para1, key1=val1, key2=val2)`。**key1和key2必须显式传入**  
关键字参数：定义`def f(arg1, arg2, **arg4)`，调用：`f(para1, para2, key1=value1, key2=value2)`。调用时转为`dict`传入arg4。  
函数定义参数顺序必须是`def f(pos_only, arg=default, *args, key_only, **kwargs)`，调用时必须是`f(a,b,c,key1=val1,key2=val2,key3=val3)`。位置参数按位置匹配必选、默认参数，多余传入args组成tuple。关键字参数按key匹配默认参数和命名关键字参数，多余传入kwargs组成dict。

In [41]:
def f(a, b, c=0, *args, key1='a', key2, **kwargs):
    print('a =',a,', b =',b,', c =',c,', args =',args,', key1 =',key1,', key2 =',key2,', kwargs =',kwargs)
f(1,2,key1='b',key2=3)
f(1,2,3,4,5, key2=2)
f(1,2,3,4,5, key2=2, key3=3)

a = 1 , b = 2 , c = 0 , args = () , key1 = b , key2 = 3 , kwargs = {}
a = 1 , b = 2 , c = 3 , args = (4, 5) , key1 = a , key2 = 2 , kwargs = {}
a = 1 , b = 2 , c = 3 , args = (4, 5) , key1 = a , key2 = 2 , kwargs = {'key3': 3}


### 函数递归

In [46]:
def move(n, a, b, c):
    if n == 1:
        print(a, '-->', c)
    else:
        move(n-1, a, c, b)
        print(a, '-->', c)
        move(n-1, b, a, c)
move(3, 'A', 'B', 'C')

A --> C
A --> B
C --> B
A --> C
B --> A
B --> C
A --> C


## 高级特性

### 切片

获取`list`或`tuple`部分元素  
`beg`和`end`分别表示起始和末尾的下标，负数表示倒数，范围[`beg`, `end`)，`inc`表示增量，负数表示逆序  
`ls[beg:end]`  
`ls[:end]`  `ls[beg:]`  
`ls[beg:end:inc]`  `ls[:end:inc]`  `ls[beg::inc]` 

In [49]:
ls = list(range(10))
print(ls[1:-2])
print(ls[3:])
print(ls[:-3])
print(ls[::2])
print(ls[-2:-5:-1])

[1, 2, 3, 4, 5, 6, 7]
[3, 4, 5, 6, 7, 8, 9]
[0, 1, 2, 3, 4, 5, 6]
[0, 2, 4, 6, 8]
[8, 7, 6]


### 迭代

可迭代对象通过`for <element> in <iterator>`遍历元素，内置容器可迭代  
`list`或`tuple`: `for v in ls`  
`dict`: `for k in d`、`for v in d.values()`、`for k, v in d.items()`  
`str`：`for ch in s`  
需要下标时调用`enumerate`  
`for i, v in enumerate(ls)`  
多个元素组成`tuple`返回，可用不带括号的变量对接收

In [50]:
ls = [1,2,3,4,5]
d = {'a':1,'b':2,'c':3}
for v in ls:
    print(v)
for k in d:
    print(k,':',d[k])
for k,v in d.items():
    print(k,':',v)

1
2
3
4
5
a : 1
b : 2
c : 3
a : 1
b : 2
c : 3


### 列表生成式

`[<expression x> for x in <iterator x> if <condition>]`  
遍历`iterator`中满足条件`condition`的`x`，生成关于`x`的表达式`expression`的序列。

In [51]:
l1 = ['Hello', 18, 'World']
l2 = [s.lower() for s in l1 if isinstance(s, str)]
print(l2)

['hello', 'world']


### 生成器

遍历满足一定规律的序列，如由表达式生成的列表，不一定都算出来放入内存，可迭代一次算一次。  
生成器定义了序列生成的规律  
列表生成式中的[]改为()：`g = (<expression x> for x in <iterator x> if <condition>)`  
函数中使用`yield`：  
```python3
def f(args):
    <code>
    yield <expression>
    <code>
g = f(paras)
``` 
基本上初始化一个`list`然后不断`append`元素的序列可采用生成器的方法节约内存。

遍历生成器生成的元素时，可迭代`next(g)`  
也可以通过`for x in g`遍历。

In [2]:
g = (x*x for x in range(3))
for v in g:
    print(v)
def triangles():
    ls = [1]
    while True:
        yield ls
        ls = [0] + ls + [0]
        ls = [x + y for x, y in zip(ls[:-1], ls[1:])]
        
n = 0
results = []
for t in triangles():
    results.append(t)
    n = n + 1
    if n == 10:
        break

for t in results:
    print(t)

0
1
4
[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]


### 迭代器

可迭代对象`iterable`：可作用于`for...in...`循环的对象，如`list`、`tuple`、`str`、`dict`、`set`、生成器等。  
迭代器`iterator`：可调用`next`方法的数据流，只有调用`next`时才计算下一元素，如生成器。容器不是，但可用`iter`转换为`iterator`。  
`for`循环实际上不断调用`next`遍历元素。

In [6]:
from collections import Iterator
ls = [0, 1, 2]
g = (x for x in range(3))
print(isinstance(ls, Iterator))
print(isinstance(g, Iterator))

False
True


## 函数式编程

### 高阶函数

将函数名`f`作为变量使用。  
`map(f, <iterable>)`接收函数`f`，作用于可迭代对象中的各个元素，返回迭代器`<iterator>`。  
`reduce(f, <iterable>)`接收可传入两个参数的函数`f`，返回结果和下个元素作为参数传入，如`f(f(x1, x2), x3)`。  
`filter(f, <iterable>)`中的`f`作用于元素判断为`True`或`False`，返回<iterable>中判断为`True`的元素的迭代器。采用**惰性计算**，只有用到下一元素时才会用`f`进行判断。  
`sorted(<iterable>, key=f)`函数f作用于各元素后再排序。

In [14]:
from functools import reduce
ls = [1, 2, -3]
ls2 = map(lambda x: x**2, ls)
print(list(ls2))
s = reduce(lambda x, y: x+y, ls)
print(s)
odd = filter(lambda x: x%2==1 or x%2==-1, ls)
print(list(odd))
orig = sorted(ls)
print(orig)
pos = sorted(ls, key=abs)
print(pos)

[1, 4, 9]
0
[1, -3]
[-3, 1, 2]
[1, 2, -3]


### 函数作为返回值

在函数内部定义函数并返回，可等到需要使用时再调用函数。  
```python
def ret_func(args):
    def func():
        <code>
    return func

f = ret_func(paras)    # 未执行<code>
f()                    # 执行<code>
```  
内部函数引用外部函数的局部变量时，使用的是**外部函数执行完成后**的值。因此在循环内定义的函数不能使用循环变量，因为调用内部函数时使用循环变量的是循环结束之后的值。

In [17]:
def createCounter():
    def genInt():
        n = 1
        while True:
            yield n
            n += 1
    gen_cnt = genInt()
    def count():
        return next(gen_cnt)
    return count
counter = createCounter()
print(counter(), counter(), counter())

1 2 3


### 匿名函数

`lambda x: <expression x>`返回一个函数，传入参数计算表达式，适用于简单函数

### 装饰器

通过定义高阶函数，从而动态使用函数，可达到增强函数功能。

In [19]:
def log(func):
    def new_func(*args, **kwargs):
        print('This is a log')
        return func(*args, **kwargs)
    return new_func

def add(x, y):
    return x + y

new_add = log(add)
print(new_add(1, 2))

This is a log
3


使用装饰器可简化，执行的代码是等价的

In [20]:
def log(func):
    def new_func(*args, **kwargs):
        print('This is a log')
        return func(*args, **kwargs)
    return new_func

@log
def add(x, y):
    return x + y
print(add(1, 2))

This is a log
3


还可以再增加外层函数，从而可向装饰器传参

In [25]:
def log(msg):
    def actualLog(func):
        def new_func(*args, **kwargs):
            print(msg)
            return func(*args, **kwargs)
        return new_func
    return actualLog

@log('log message')
def add(x, y):
    return x + y
print(add(1, 2))

# 等价于
def old_add(x, y):
    return x + y
actual_log = log('log message')
new_add = actual_log(old_add)
print(new_add(1, 2))

log message
3
log message
3


### 偏函数

`func_less_args = functools.partial(func, arg, key=val)`，将`arg`存到位置参数`*args`的左侧，`key: val`存入`**kwargs`中传入函数`func`，其余参数在调用`func_less_args`时传入，减少传参个数。

## 模块

### 自定义模块

`abc.py`文件是一个模块，模块名`abc`，模块可被其他模块引用，不同模块中可使用相同名字的函数和变量，可避免冲突。  
含`.__init__.py`的文件夹`xyz`是一个包，包名`xyz`，文件夹中`abc.py`的模块名为`xyz.abc`。不同包可使用相同名字的模块，可避免模块名的冲突，但自定义模块名不能与内置的模块名冲突。  
`xyz`也是模块名，对应的文件是`xyz.__init__.py`。
```
xyz
├─ __init__.py
└─ abc.py
```

### 使用模块

`import <module_name>`后可显式调用模块中的函数和变量。模块中包括标准注释、模块注释、特殊变量（`__name__`等）、自定义函数、自定义变量。  
直接运行模块时模块的`__name__`为`__main__`，被其他模块调用时为别的名字，因此可用`__name__`变量区分是直接运行还是被调用，可编写直接运行时的测试代码。  
调用`import <module_name>`后会运行一遍模块对应的`.py`文件，因此不应直接在模块测试代码前写可直接运行的代码，应只定义函数和变量。  
模块中的变量（和函数）按名称分为  
+ 正常变量：`abc`、`f`等，可直接调用。
+ 特殊变量：`__name__`、`__author__`，可直接调用。
+ 非公开变量：`_private1`、`__private2`，语法上调用不受限，但建议不直接调用。

In [30]:
import hello
hello.test()
print(hello.hello_var)

Too many arguments!
1


模块搜索路径在`sys`模块的`path`变量中保存，包括当前目录、内置模块和第三方模块安装目录。该变量是一个`list`，可在运行时修改，运行结束后失效。