## Numpy
---

In [2]:
import numpy as np

### Array的属性
---

In [7]:
array = np.array([[1, 2, 3],
                  [2, 3, 4]])
print(array)
print('number of dim:', array.ndim)    # ndim: dimension
print('shape:', array.shape)    # shape：(行，列)

print('size:', array.size)

[[1 2 3]
 [2 3 4]]
number of dim: 2
shape: (2, 3)
size: 6


### 创建Array与格式
---

In [16]:
a = np.array([[2, 3, 4],
              [3, 4, 6]], dtype=np.float32)
print(a.dtype)

float32


1. `linespace`可以进行分段，并返回分段节点，前两个参数是首尾节点，最后一个参数是节点数（即段数+1）

In [35]:
zeros_mat = np.zeros((3, 5))
print(zeros)
ones_mat = np.ones((5, 6), dtype=np.float32)
print(ones_mat)
empty_mat = np.empty((3, 4))    # empty生成的是每个元素非常接近零的矩阵
print(empty_mat)
arange_vec = np.arange(12).reshape((3, 4))
print(arange_vec)
linesapce_mat = np.linspace(1, 10, 3)
print(linesapce_mat)

[[ 0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  0.]
 [ 0.  0.  0.  0.  0.]]
[[ 1.  1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.  1.]
 [ 1.  1.  1.  1.  1.  1.]]
[[ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]
 [ 0.  0.  0.  0.]]
[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
[  1.    5.5  10. ]


### numpy的基础运算
---
+ 对于np.array对象，`np.dot(a, b)`执行的是点乘运算，即矩阵乘法（`a.dot(b)`与之计算方式相同）；`a * b`执行的是每个元素与对应位置元素相乘.

In [14]:
a = np.array([10, 20, 30, 40])
b = np.arange(4)
print(a, b)
c = a ** b
print(c)
# numpy中提供了很多数学运算方法
d = np.sin(a)
print(d)
print(b < 3)

mat_1 = np.array([[1, 1],
                  [0, 1]])
mat_2 = np.arange(4).reshape((2, 2))
print(mat_1)
print(mat_2)
c = mat_1 * mat_2
c_dot = np.dot(mat_1, mat_2)
c_dot_2 = mat_1.dot(mat_2)
print(c)
print(c_dot)
print(c_dot_2)

[10 20 30 40] [0 1 2 3]
[    1    20   900 64000]
[-0.54402111  0.91294525 -0.98803162  0.74511316]
[ True  True  True False]
[[1 1]
 [0 1]]
[[0 1]
 [2 3]]
[[0 1]
 [0 3]]
[[2 4]
 [2 3]]
[[2 4]
 [2 3]]


---
+ 随机数
    `np.random.random((shape))`能生成形状为shape的随机数
+ axis
    axis表示shape中的维度，axis为几（从0开始），则表示该维度被压缩成1。例如shape(batch) = [128, 28, 28]，如果
    ```
    m = np.mean(batch, axis=0)
    ```
    则表示第0维（即维数为128的维）被压缩为1，返回结果shape(m) = [28 ,28].

In [21]:
random_array = np.random.random((2, 4))
print(random_array)
print(np.sum(random_array, axis=1))
print(np.min(random_array, axis=1))
print(np.max(random_array, axis=1))

[[ 0.31570437  0.8398732   0.50320093  0.90144334]
 [ 0.52986582  0.65243483  0.08869542  0.36604817]]
[ 2.56022184  1.63704424]
[ 0.31570437  0.08869542]
[ 0.90144334  0.65243483]


---
+ 索引操作:
    `argmin(A)`表示A中最小值的索引，索引是先将矩阵向量化为一维（按从左到右，从上到下的顺序），然后返回最小值在该向量中的索引。`argmax(A)`同理。
+ 排序:
    `np.sort(A)`可以对矩阵元素按从左到右，从上到下递增排序。
+ 转置:
    `np.transpose(A)`或`A.T`。
+ 截取:
    `np.clip(A, min, max)`可以使当元素小于min时，令元素等于min；当元素大于max时，令元素等于max。中间的元素保持不变。

In [43]:
A = np.arange(2, 14).reshape((3, 4))
print(np.argmin(A))
print(np.argmax(A))

# 下面三种形式都可以求矩阵的均值
print(np.mean(A))
print(A.mean())
print(np.average(A))

# 输出中位数
print("median:", np.median(A))

# 累加
print(A)
print(np.cumsum(A))

# 逐差，矩阵向量化后每两个相邻元素的差，shape中行数与原矩阵相同，列数比原矩阵少1
print(np.diff(A))
D = [[2],
     [3]]
print(np.diff(D))

# 找出非零数,返回值为两个dtype=int64的nparray，第一个是矩阵中非零元素的行数，第二个是矩阵中非零元素的列数，两个nparray中相同index的元素表示原矩阵中一个元素的行和列
print(np.nonzero(A))

# 排序
print(np.sort(np.random.random((2, 3))))

# 矩阵转置
print('transpose: \n', np.transpose(A))
# 或者
print(A.T)

# 截取
print(np.clip(A, 5, 9))

0
11
7.5
7.5
7.5
median: 7.5
[[ 2  3  4  5]
 [ 6  7  8  9]
 [10 11 12 13]]
[ 2  5  9 14 20 27 35 44 54 65 77 90]
[[1 1 1]
 [1 1 1]
 [1 1 1]]
[]
(array([0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2], dtype=int64), array([0, 1, 2, 3, 0, 1, 2, 3, 0, 1, 2, 3], dtype=int64))
[[ 0.19731267  0.46274003  0.53949162]
 [ 0.27220979  0.61882064  0.99568739]]
transpose: 
 [[ 2  6 10]
 [ 3  7 11]
 [ 4  8 12]
 [ 5  9 13]]
[[ 2  6 10]
 [ 3  7 11]
 [ 4  8 12]
 [ 5  9 13]]
[[5 5 5 5]
 [6 7 8 9]
 [9 9 9 9]]


---
### 索引
+ 迭代列:
    numpy中默认对矩阵的迭代是迭代行，要迭代矩阵的列，可以迭代矩阵的转置。
+ 迭代元素:
    迭代`A.flat`或者`A.flatten()`。其中`A.flat`返回一个迭代器，`A.flatten()`返回数组。

In [4]:
A = np.arange(3, 15).reshape((3, 4))
print(A)
print(A[1][2])
print(A[1, 2])
print(A[2, :])
print(A[:, 1])

# 迭代行
for row in A:
    print(row)

# 迭代列
for column in A.T:
    print(column.T)

# 迭代元素
print(type(A.flat))
print(A.flatten())
for item in A.flatten():
    print(item)

[[ 3  4  5  6]
 [ 7  8  9 10]
 [11 12 13 14]]
9
9
[11 12 13 14]
[ 4  8 12]
[3 4 5 6]
[ 7  8  9 10]
[11 12 13 14]
[ 3  7 11]
[ 4  8 12]
[ 5  9 13]
[ 6 10 14]
<class 'numpy.flatiter'>
[ 3  4  5  6  7  8  9 10 11 12 13 14]
3
4
5
6
7
8
9
10
11
12
13
14


---
### nparray合并
+ 竖向合并: `np.vstack((矩阵Tuple))`
+ 横向合并: `np.hstack((矩阵Tuple))`
+ 将行向量转换为列向量/添加行的维度：`np.newaxis()`。实际上就是None的一个别名
+ 多个矩阵合并：`np.concatenate`，合并时可以指定合并维度，但合并前矩阵应与合并后矩阵具有相同维数

In [71]:
A = np.array([1, 1, 1])
B = np.array([2, 2, 2])

print(np.vstack((A, B)))
print(np.hstack((A, B)))

# 添加行的维度
print(A[np.newaxis, :])
# 添加列的维度（将行向量转化为列）
print(A[:, np.newaxis])
print(type(np.newaxis))

# 因此在索引矩阵的列时，正确的索引方式是
X = np.arange(0, 15).reshape((3, 5))
print(X[:, 2][:, np.newaxis])
# 实际上np.newaxis只是起到占位的作用（与None一样），真正的运算是由[]完成的
print(X[:, 1][:, None])

# 多个矩阵合并
A = A[:, np.newaxis]
B = B[:, np.newaxis]
C = np.concatenate((A, B, B, A), axis=1)
print(C)

[[1 1 1]
 [2 2 2]]
[1 1 1 2 2 2]
[[1 1 1]]
[[1]
 [1]
 [1]]
<class 'NoneType'>
[[ 2]
 [ 7]
 [12]]
[[ 1]
 [ 6]
 [11]]
[[1 2 2 1]
 [1 2 2 1]
 [1 2 2 1]]


---
### ndarray分割
+ 等量分割：`np.split(matrix, indices_or_sections, axis=n)`，将matrix分割为sections块，分割的方向由axis指定。0为横向分割（分割行），1为纵向分割（分割列）
+ 不等量分割：`np.array_split()`。也可以直接用`np.split()`，分割块数参数传入分割节点索引数组，即可实现分割

In [75]:
mat_1 = np.arange(12).reshape((2, 6))
print(mat_1)

# 分割,2表示分割为两份，axis=1表示纵向分割
print(np.split(mat_1, 2, axis=1))
# 传入数组表示不等量分割，这里表示[0, 3)为第一块，[3, 4)为第二块，剩下的为第三块
print(np.split(mat_1, [3, 4], axis=1))

[[ 0  1  2  3  4  5]
 [ 6  7  8  9 10 11]]
[array([[0, 1, 2],
       [6, 7, 8]]), array([[ 3,  4,  5],
       [ 9, 10, 11]])]
[array([[0, 1, 2],
       [6, 7, 8]]), array([[3],
       [9]]), array([[ 4,  5],
       [10, 11]])]


---
### copy & deep copy
+ deep copy: `b = a.copy()`可以对nparray对象进行深度拷贝

In [86]:
def copy_func():
    a = np.arange(4)
    b = a
    c = a
    d = b
    a[0] = 11
    d[1:3] = [5, 32]
    print("a:", a)
    print("b:", b)
    print("c:", c)
    print("d:", d)
    print(d is a)
copy_func()

def deep_copy_func():
    a = np.arange(4)
    b = a.copy()  # deep copy
    a[3] = 45
    print("a:", a)
    print("b:", b)
    print(b is a)
deep_copy_func()

a: [11  5 32  3]
b: [11  5 32  3]
c: [11  5 32  3]
d: [11  5 32  3]
True
a: [ 0  1  2 45]
b: [0 1 2 3]
False
