# 线性代数：机器学习背后的优化原理

        
线性代数作为数学的一个分支，广泛应用于科学和工程中，掌握好线性代数对于理解和从事机器学习算法相关工作是很有必要的，尤其对于深度学习算法而言

In [2]:
# import相关库
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sb

## 1、标量，向量，矩阵，张量

**首先，让我们回顾下基本的定义：**

- 标量（scalar）：形式而言，一个标量是一个单独的数，常用斜体的小写变量名称来表示。_v_

- 向量（vector）：形式而言，一个向量是一列有序数，常用粗体的小写变量名称表示**v**，或者上面标记剪头$\vec{v}$ 

- 矩阵（matrix）：形式而言，一个矩阵是一个二维数组，常用大写变量名称表示A，表示内部的元素则会使用$A_{i,j}$

- 张量（tensor）：形式而言，一个张量是一个多维数组，常用粗体的大写字母变量名称表示**T**，表示内部的元素则会使用$A_{i,j,z}$ 等等

用图片直观的显示区别如下
<img src="images/diff.png" width="500">

**接下来让我们回顾下基本的运算：**

- 加法
<img src="images/add.png" width="500">

- 标量乘法
<img src="images/scmu.png" width="400">

- 转置
<img src="images/trans.png" width="370">

- 矩阵向量乘法（内积，人工智能中常见的拼写：matrix product 或者 dot product） 
<img src="images/mul.png" width="570">

**线性方程组：**

由矩阵乘法也演变出了我们最常见的线性方程组，已知矩阵与未知向量的乘积，等于另一个已知向量，通过此方程组可求解那个未知向量，一般写为x，具体如下表示。
等式左侧可以这么来理解：
<img src="images/axb.png" width="400">
列为具体的矩阵来看：
$$
\begin{bmatrix}
    A_{1,1} & A_{1,2} & \cdots & A_{1,n} \\\\
    A_{2,1} & A_{2,2} & \cdots & A_{2,n} \\\\
    \cdots & \cdots & \cdots & \cdots \\\\
    A_{m,1} & A_{m,2} & \cdots & A_{m,n}
\end{bmatrix}
\times
\begin{bmatrix}
    x_1 \\\\
    x_2 \\\\
    \cdots \\\\
    x_n
\end{bmatrix}
=
\begin{bmatrix}
    b_1 \\\\
    b_2 \\\\
    \cdots \\\\
    b_m
\end{bmatrix}
$$

或者更简单的表示为

$$Ax=b$$

既然有未知数，那么自然需要求解未知数，而我们的未知数需要满足所有方程，也不是一直都有解的，下面来列我们二维矩阵所组成的方程解的情况,若两条线平行不存在焦点，那么说明没有一个$x_1$, $x_2$同时满足两个方程，则此方程组无解，同理，若相交，则有一个解，若完全相等，则有无穷个解。
<img src="images/axbsolu.png" width="570">

### 基本运算并绘图
例题 $\vec{v}$ + $\vec{w}$

$\hspace{1cm}\vec{v} = \begin{bmatrix} 1\\ 1\end{bmatrix}$


$\hspace{1cm}\vec{w} = \begin{bmatrix} -2\\ 2\end{bmatrix}$

结果需要先使用numpy计算向量运算结果，并用LaTeX公式表示：

$\hspace{1cm}\vec{v}+\vec{w} = \begin{bmatrix} -1\\ 3\end{bmatrix}$

并使用matlibplot绘制出(图表颜色样式不要求)

<img src="images/add_e.png" width="300">

**根据上面例题展示，计算并绘制  $2\vec{v}$ - $\vec{w}$  的结果**

$\hspace{1cm}\vec{v} = \begin{bmatrix} 4\\ 1\end{bmatrix}$


$\hspace{1cm}\vec{w} = \begin{bmatrix} -1\\ 2\end{bmatrix}$

In [1]:
vec_v = np.array([4,1])
vec_w = np.array([-1,2])
a = 2
vec_av = 2*vec_v
result_vec = vec_av - vec_w

ax = plt.axes()

ax.plot(0,0,'or')
#绘制向量v
ax.arrow(0, 0, *vec_v, color='b', linewidth=2.5, head_width=0.30, head_length=0.35)
#绘制向量2v
ax.arrow(0, 0, *vec_av, color='c', linestyle='dotted', linewidth=2.5, head_width=0.30, 
         head_length=0.35)
#绘制向量w
ax.arrow(0, 0, *vec_w, color='g', linewidth=2.5, head_width=0.30, head_length=0.35)
#绘制向量2v-w
ax.arrow(vec_w[0], vec_w[1], *result_vec, color='k', linewidth=3.5, head_width=0.30, head_length=0.35)

plt.xlim(-3, 10)

major_xticks = np.arange(-3, 10)
ax.set_xticks(major_xticks)


plt.ylim(-1, 10)

major_yticks = np.arange(-1, 10)
ax.set_yticks(major_yticks)

plt.grid(b=True, which='major')
plt.show()

NameError: name 'np' is not defined