# 矩阵

将一系列数字以长方形方式排列。通俗的讲，矩阵将数字排列成表格，有行、有列。通常，用大写斜体字母表示矩阵，如矩阵*A*，矩阵*B*。

$${\begin{bmatrix} 1 & 2 & 3 & 4\\ 2 & 3 & 4 & 5 \\ 3 & 4 & 5 & 6 \end{bmatrix}}_{3 \times 4}, {\begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}}_{3 \times 2}$$

$$
X_{n\times D} = 
 \begin{bmatrix}
  x_{1,1} & x_{1,2} & \cdots & x_{1,n} \\
  x_{2,1} & x_{2,2} & \cdots & x_{2,n} \\
  \vdots  & \vdots  & \ddots & \vdots  \\
  x_{m,1} & x_{m,2} & \cdots & x_{m,n} 
 \end{bmatrix}
$$

如上，为一个$n \times D$(n by capital D)矩阵*X*，n是矩阵的行数(number of rows in the matrix)，D是矩阵的列数(number of columns in the matrix)。

在统计中，一般用n代表样本数量。因此，用n代表矩阵的行数。字母D取自dimension（维度）的首字母，方便记忆。

In [None]:
import numpy as np

In [None]:
A = np.array([[1, 2, 3],
              [4, 5, 6]])
A

In [None]:
A_first_col = A[:, 0]  # saved as one dimension row
A_first_col

In [None]:
A_first_col_V2 = A[:, [0]]  # saved as a column
A_first_col_V2

In [None]:
A_first_second_col_V2 = A[:, [0, 1]]  # extract first and second columns
A_first_second_col_V2

In [None]:
A_first_third_col_V2 = A[:, [0, 2]]  # extract first and third columns
A_first_third_col_V2

In [None]:
A_first_row = A[[0], :]  # extract first row
A_first_row

In [None]:
A_second_row = A[[1], :]  # extract second row
A_second_row

In [None]:
A_second_row_first_col = A[[1], [0]]
A_second_row_first_col

## 视角

矩阵可以看作是若干向量上下排列，也可以看作是若干向量上下叠放

$${\begin{bmatrix} 
    1 & 2 & 3 \\ 
    4 & 5 & 6 
\end{bmatrix}}_{2 \times 3} = 
{\begin{bmatrix}
{\begin{bmatrix} 1 \\ 4 \end{bmatrix}}
{\begin{bmatrix} 2 \\ 5 \end{bmatrix}}
{\begin{bmatrix} 3 \\ 6 \end{bmatrix}}
\end{bmatrix}} =
{\begin{bmatrix}
{\begin{bmatrix} 1 & 2 & 3 \end{bmatrix}} \\
{\begin{bmatrix} 4 & 5 & 6 \end{bmatrix}}
\end{bmatrix}}
$$

一般情况下，形状为$n \times D$的矩阵*X*，可以写成$D$个左右排列的列向量。

$$
X_{n \times D} = {\begin{bmatrix} x_1 & x_2 & \cdots & x_D \end{bmatrix}}
$$

*X*也可以写成$n$个行向量上下叠放

$$
X_{n \times D} = {\begin{bmatrix} x^{(1)} \\ x^{(2)} \\ \vdots \\ x^{(n)} \end{bmatrix}}
$$

## 转置

矩阵转置(matrix transpose)指的是将矩阵的行列互换得到的新矩阵。

$${\begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}}^{\operatorname {T}} = {\begin{bmatrix} 1 & 3 & 5 \\ 2 & 4 & 6 \end{bmatrix}}$$

**主对角线是从矩阵第一行第一列元素出发，向右下方倾斜45˚斜线**

$$A^{\operatorname {T}} = {\begin{bmatrix} a_{1} & a_{2} & a_{3} \end{bmatrix}}^{\operatorname {T}} = {\begin{bmatrix} a_{1}^{\operatorname {T}} \\ a_{2}^{\operatorname {T}} \\ a_{3}^{\operatorname {T}} \end{bmatrix}}$$

$$A^{\operatorname {T}} = {\begin{bmatrix} a^{(1)} \\ a^{(2)} \\ a^{(3)} \end{bmatrix}}^{\operatorname {T}} = {\begin{bmatrix} a^{(1)\operatorname {T}} & a^{(2)\operatorname {T}} & a^{(3)\operatorname {T}} \end{bmatrix}}$$

## 形状

- 零向量(zero vector)：列向量元素都是0
- 全1向量(all-ones vector)：列向量元素都为1
- 方阵(square matrix)：行数和列数相同
- 对角矩阵(diagonal matrix)：一个主对角线之外的元素皆为0
- 单位矩阵(identity matrix)：主对角线元素为1，其余元素均为0的方阵，记作$I$
- 对称矩阵(symmetric matrix)：元素相对于主对角线轴对称的方阵
- 零矩阵(null matrix)：一般指所有元素均为0的方阵，记作$O$

## 加减

形状相同、位置对应、批量加减。

In [None]:
list1 = [1, 2, 3]
list2 = [4, 5, 6]
print([x + y for x, y in zip(list1, list2)])
print(list(map(lambda x, y: x + y, list1, list2)))

In [None]:
x = np.array(list1)
y = np.array(list2)
print(x + y)
print(np.add(list1, list2))

In [None]:
A = [[1, 2, 3],
     [4, 5, 6]]
B = [[1, 0, 0],
     [0, 1, 0]]

A_plus_B = [
    [A[i][j] + B[i][j] for j in range(len(A[0]))] for i in range(len(A))
]
print(A_plus_B)

In [None]:
print(np.array(A) + np.array(B))
print(np.add(A, B))