# 第一章 预备知识
## 一、Python基础
### 1. 列表推导式与条件赋值
在生成一个数字序列的时候，在`Python`中可以如下写出：

In [None]:
L = []
def my_func(x):
    return 2*x
for i in range(5):
    L.append(my_func(i))

L

事实上可以利用列表推导式进行写法上的简化：`[* for i in *]`。其中，第一个`*`为映射函数，其输入为后面`*`指代的内容，第二个`*`表示迭代的对象。

In [None]:
[my_func(i) for i in range(5)]

列表表达式还支持多层嵌套，如下面的例子中第一个`for`为外层循环，第二个为内层循环：

In [None]:
[m + '_' + n for m in ['a', 'b'] for n in ['c', 'd']]

除了列表推导式，另一个实用的语法糖是带有`if`选择的条件赋值，其形式为`value = a if condition else b`:

In [None]:
value = 'cat' if 2>1 else 'dog'
value

等价于如下的写法：
```python
a, b = 'cat', 'dog'
condition = 2 > 1  # 此时为True
if condition:
    value = a
else:
    value = b
```
下面举一个例子，截断列表中超过5的元素，即超过5的用5代替，小于5的保留原来的值：

In [None]:
L = [1, 2, 3, 4, 5, 6, 7]
[i if i <= 5 else 5 for i in L]

### 2. 匿名函数与map方法
有一些函数的定义具有清晰简单的映射关系，例如上面的`my_func`函数，这时候可以用匿名函数的方法简洁地表示：

In [None]:
my_func = lambda x: 2*x
my_func(3)

In [None]:
multi_para_func = lambda a, b: a+b
multi_para_func(1, 2)

但上面的用法其实违背了“匿名”的含义，事实上它往往在无需多处调用的场合进行使用，例如上面列表推导式中的例子，用户不关心函数的名字，只关心这种映射的关系：

In [None]:
[(lambda x: 2*x)(i) for i in range(5)]

对于上述的这种列表推导式的匿名函数映射，`Python`中提供了`map`函数来完成，它返回的是一个`map`对象，需要通过`list`转为列表：

In [None]:
list(map(lambda x : 2*x, range(5)))

对于多个输入值的函数映射，可以通过追加迭代对象实现：

In [None]:
list(map(lambda x, y : str(x)+'_'+y, range(5), list('abcde')))

### 3. zip对象与enumerate方法
`zip`函数能够把多个可迭代对象打包成一个元组构成的可迭代对象，它返回了一个`zip`对象，通过`tuple`,`list`可以得到相应的打包结果：

In [None]:
L1, L2, L3 = list('abc'), list('def'), list('hij')
list(zip(L1, L2, L3))

In [None]:
tuple(zip(L1, L2, L3))

往往会在循环迭代的时候使用到`zip`函数：

In [None]:
for i, j, k in zip(L1, L2, L3):
    print(i, j, k)

`enumerate`是一种特殊的打包，它可以在迭代时绑定迭代元素的遍历序号：

In [None]:
L = list('abcd')
for index, value in enumerate(L):
    print(index, value)

用`zip`对象也能够简单地实现这个功能：

In [None]:
for index, value in zip(range(len(L)), L):
    print(index, value)

当需要对两个列表建立字典映射时，可以利用`zip`对象：

In [None]:
dict(zip(L1, L2))

既然有了压缩函数，那么`Python`也提供了`*`操作符和`zip`联合使用来进行解压操作：

In [None]:
zipped = list(zip(L1, L2, L3))
zipped

In [None]:
list(zip(*zipped))  # 三个元组分别对应原来的列表

## 二、Numpy基础
### 1. np数组的构造
最一般的方法是通过`array`来构造：

In [None]:
import numpy as np
np.array([1, 2, 3])

下面讨论一些特殊数组的生成方式：
【a】等差序列：`np.linspace`, `np.arange`

In [None]:
np.linspace(1, 5, 11) # 起始、终止（包含）、样本个数

In [None]:
np.arange(1, 5, 2)

【b】特殊矩阵：`zeros`, `eye`, `full`

In [None]:
np.zeros((2, 3)) # 传入元组表示各维度大小

In [None]:
np.eye(3) # 3*3的单位矩阵

In [None]:
np.eye(3, k=1) # 偏移主对角线1个单位的伪单位矩阵

In [None]:
np.full((2, 3), 10) # 元组传入大小，10表示填充数值

In [None]:
np.full((2, 3), [1, 2, 3]) # 每行填入相同的列表

【c】随机矩阵：`np.random`

最常用的随机生成函数为`rand`, `randn`, `randint`, `choice`, 它们分别表示0-1均匀分布的随机数组、标准正态的随机数组、随机整数组和随机列表抽样：

In [None]:
np.random.rand(3)  # 生成服从0-1均匀分布的三个随机数

In [None]:
np.random.rand(3, 3) # 注意这里传入的不是元组，每个维度大小分开输入

对于服从区间`a`到`b`上的均匀分布可以如下生成：

In [None]:
a, b = 5, 15
(b - a) * np.random.rand(3) + a

一般的，可以选择已有的库函数：

In [None]:
np.random.uniform(5, 15, 3)

`rand`生成了`N(0, I)`的标准正态分布：

In [None]:
np.random.randn(3)

In [None]:
np.random.randn(2, 2)

对于服从方差为$\sigma^2$均值为$\mu$的一元正态分布可以如下生成：

In [None]:
sigma, mu = 2.5, 3
mu + np.random.randn(3) * sigma

同样的，也可选择从已有函数生成：

In [None]:
np.random.normal(3, 2.5, 3)

`randint`可以指定生成随机整数的最小值最大值（不包含）和维度大小：

In [None]:
low, high, size = 5, 15, (2, 2) # 生成5到14的随机整数
np.random.randint(low, high, size)

`choice`可以从给定的列表中，以一定概率和方式抽取结果，当不指定概率时为均匀采样，默认抽取方式为有放回抽样：

In [None]:
my_list = ['a', 'b', 'c', 'd'] 
np.random.choice(my_list, 2, replace=False, p=[0.1, 0.7, 0.1, 0.1])

In [None]:
np.random.choice(my_list, (3, 3))

当返回的元素个数与原列表相同时，不放回抽样等价于使用`permutation`函数，即打散原列表：

In [None]:
np.random.permutation(my_list)

最后，需要提到的是随机种子，它能够固定随机数的输出结果：

In [None]:
np.random.seed(0)
np.random.rand()

### 2. np数组的变形与合并
【a】转置：`T`

In [None]:
np.zeros((2, 3)).T

【b】合并操作：`r_`, `c_`

对于二维数组而言，`r_`和`c_`分别表示上下合并和左右合并：

In [None]:
np.r_[np.zeros((2, 3)), np.zeros((2, 3))]

In [None]:
np.c_[np.zeros((2, 3)), np.zeros((2, 3))]

一维数组和二维数组进行合并时，应当把其视作列向量，在长度匹配的情况下只能够使用左右合并的`c_`操作：

In [None]:
try:
    np.r_[np.array([0, 0]), np.zeros((2, 1))]
except Exception as e :
    Err_Msg = e

Err_Msg

In [None]:
np.r_[np.array([0, 0]), np.zeros(2)]

In [None]:
np.c_[np.array([0, 0]), np.zeros((2, 3))]

【c】维度变换：`reshape`

`reshape`能够帮助用户把原数组按照新的维度重新排列。在使用时有两种模式，分别为`C`模式和`F`模式，分别以逐行和逐列的顺序进行填充读取。

In [None]:
target = np.arange(8).reshape(2, 4)
target

In [None]:
target.reshape((4, 2), order='C')  # 按照行读取和填充

In [None]:
target.reshape((4, 2), order='F')   # 按照列读取和填充

特别地，由于被调用数组的大小是确定的，`reshape`允许有一个维度存在空缺，此时只需填充-1即可：

In [None]:
target.reshape((4, -1))

下面将`n*1`大小的数组转为1维数组的操作是经常使用的：

In [None]:
target = np.ones((3, 1))
target

In [None]:
target.reshape(-1)

### 3. np数组的切片与索引
数组的切片模式支持使用`slice`类型的`start:end:step`切片，还可以直接传入列表指定某个维度的索引进行切片：

In [None]:
target = np.arange(9).reshape(3, 3)
target

In [None]:
target[:-1, [0, 2]]

此外，还可以利用`np.ix_`在对应的维度上使用布尔索引，但此时不能使用`slice`切片：

In [None]:
target[np.ix_([True, False, True], [True, False, True])]

In [None]:
target[np.ix_([1, 2], [True, False, True])]

当数组维度为1维时，可以直接进行布尔索引，而无需`np.ix_`:

In [None]:
new = target.reshape(-1)
new[new%2 == 0]

### 4. 常用函数
为了简单起见，这里假设下述函数输入的数组都是一维的。

【a】`where`

`where`是一种条件函数，可以指定满足条件与不满足条件位置对应的填充值：

In [1]:
a = np.array([-1, 1, -1, 0])
np.where(a>0, a, 5) # 对应位置为True时填充a对应元素，否则填充5

NameError: name 'np' is not defined

【b】`nonzero`, `argmax`, `argmin`

这三个函数返回的都是索引，`nonzero`返回非零数的索引，`argmax`,`argmin`分别返回最大和最小数的索引：

In [None]:
a = np.array([-2, -5, 0, 1, 3, -1])
np.nonzero(a)

In [None]:
a.argmax()

In [None]:
a.argmin()

【c】`any`, `all`

`any`指当序列至少存在一个`True`或非零元素时返回`True`, 否则返回`False`

`all`指当序列元素全为`True`或非零元素时返回`True`, 否则返回`False`

In [None]:
a = np.array([0, 1])
a.any()

In [None]:
a.all()

【d】`cumprod`, `cunsum`, `diff`

`cunprod`, `cumsum`分别表示累乘和累加函数，返回同长度的数组，`diff`表示和前一个元素做差，由于第一个元素为缺失值，因此在默认参数情况下，返回长度是原数组减1

In [None]:
a = np.array([1, 2, 3])
a.cumprod()

In [None]:
a.cumsum()

In [None]:
np.diff(a)

【e】 统计函数

常用的统计函数包括`max`, `min`, `mean`, `median`, `std`, `var`, `sum`, `quantile`,其中分位数计算是全局方法，因此不能通过`array.quantile`的方法调用：

In [None]:
target = np.arange(5)
target

In [None]:
target.max()

In [None]:
np.quantile(target, 0.5) # 0.5分位数

但是对于含有缺失值的数组，它们返回的结果也是缺失值，如果需要略过缺失值，必须使用`nan*`类型的函数，上述的几个统计函数都有对应的`nan*`函数。

In [None]:
target = np.array([1, 2, np.nan])
target

In [None]:
target.max()

In [None]:
np.nanmax(target)

In [None]:
np.nanquantile(target, 0.5)

对于协方差和相关系数分别可以利用`cov`,`corrcoef`如下计算：

In [None]:
target1 = np.array([1, 3, 5, 9])
target2 = np.array([1, 5, 3, -9])
np.cov(target1, target2)

In [None]:
np.corrcoef(target1, target2)

最后，需要说明二维`Numpy`数组中统计函数的`axis`参数，它能够进行某一个维度下的统计特征计算，当`axis=0`时结果为列的统计指标，当`axis=1`时结果为行的统计指标：

In [None]:
target = np.arange(1, 10).reshape(3, -1)
target

In [None]:
target.sum(0)

In [None]:
target.sum(1)

### 5. 广播机制

广播机制用于处理两个不同维度数组之间的操作，这里只讨论不超过两维的数组广播机制。

【a】标量和数组的操作

当一个标量和数组进行运算时，标量会自动把大小扩充为数组大小，之后进行逐元素操作：


In [None]:
res = 3 * np.ones((2, 2)) + 1
res

In [None]:
res = 1/res
res

【b】二维数组之间的操作

当两个数组维度完全一致时，使用对应元素的操作，否则会报错，除非其中的某个数组的维度是$m \times 1$或者$1 \times n$，那么会扩充其具有$1$的维度为另一个数组对应维度的大小。例如，$1 \times 2$数组和$3 \times 2$数组做逐元素运算时会把第一个数组扩充为$3 \times 2$，扩充时的对应数值进行赋值。但是，需要注意的是，如果第一个数组的维度是$1 \times 3$，那么由于在第二维上的大小不匹配且不为$1$，此时报错。

In [None]:
res = np.ones((3, 2))
res

In [None]:
res * np.array([[2, 3]]) # 第二个数组扩充第一维度为3

In [None]:
res * np.array([[2], [3], [4]]) # 第二个数组扩充第二维度为2

In [None]:
res * np.array([[2]])  # 等价于两次扩充，第二个数组两个维度分别扩充为3和2

【c】一维数组与二维数组的操作

当一维数组$A_k$与二维数组$B_{m,n}$操作时，等价于把一维数组视作$A_{1,k}$的二维数组，使用的广播法则与【b】中一致，当$k!=n$且$k,n$都不是$1$时报错。

In [None]:
np.ones(3) + np.ones((2, 3))

In [None]:
np.ones(3) + np.ones((2, 1))

In [None]:
np.ones(1) + np.ones((2, 3))

### 6. 向量与矩阵的计算
【a】向量内积：`dot`
$$
a \cdot b = \sum_{i} a_i b_i 
$$

In [None]:
a = np.array([1, 2, 3])
b = np.array([1, 3, 5])
a.dot(b)

【b】向量范数和矩阵范数：`np.linalg.norm`

在矩阵范数的计算中，最重要的是`ord`参数，可选值如下：

| ord   | norm for matrices                              | norm for vectors                          |
|-------|------------------------------------------------|-------------------------------------------|
| None  | Frobenius norm                                 | 2-norm                                    |
| 'fro' | Frobenius norm                                 | /                                         |
| 'nuc' | nuclear norm                                   | /                                         |
| inf   | max(sum(abs(x), axis=1))                       | max(abs(x))                               |
| -inf  | min(sum(abs(x), axis=1))                       | min(abs(x))                               |
| 0     | /                                              | sum(x != 0)                               |
| 1     | max(sum(abs(x), axis=0))                       | as below                                  |
| -1    | min(sum(abs(x), axis=0))                       | as below                                  |
| 2     | 2-norm (largest singular value)                | as below                                  |
| -2    | smallest singular value                        | as below                                  |
| other | /                                              | sum(abs(x)**ord)**(1.0 / ord)             |


In [None]:
matrix_target = np.arange(4).reshape(-1, 2)
matrix_target

In [None]:
np.linalg.norm(matrix_target, 'fro')

In [None]:
np.linalg.norm(matrix_target, np.inf)

In [None]:
np.linalg.norm(matrix_target, 2)

In [None]:
vector_target = np.arange(4)
vector_target

In [None]:
np.linalg.norm(vector_target, np.inf)

In [None]:
np.linalg.norm(vector_target, 2)

In [None]:
np.linalg.norm(vector_target, 3)

【c】矩阵乘法：`@`
$$
[A_{m \times p} B_{p \times n}]_{ij}
=
\sum_{k=1}^{p} A_{ik} B_{kj}
$$



In [None]:
a = np.arange(4).reshape(-1, 2)
a

In [None]:
b = np.arange(-4, 0).reshape(-1, 2)
b

In [None]:
a@b