**课程内容**：
1. 学习向量与矩阵、向量内积、矩阵乘法等线性代数知识的基本概念知识，及其在Numpy中的表示与实现。
2. 了解向量化较循环计算带来的速度增益。
**课程目标**：
1. 学会numpy的基础使用，加深数组理解

# numpy数组

NumPy是一个功能强大的Python库，主要用于对多维数组执行计算。NumPy的主要对象是同构多维数组。它是一个元素表（通常是数字），所有类型都相同，由非负整数元组索引。在NumPy维度中称为轴。

## 向量

向量：具有方向和幅度的量<br />
物理学：同时满足具有大小和方向两个性质的几何对象认为是向量<br />
计算机：有序的数值列表，列表的长度代表向量的维度<br />
数学：向量可以是任何，只要保证向量相加和数字与向量相乘有意义即可<br />
当我们在计算机表示二维空间中向左移动两个单位，向上移动三个单位时的向量时用[-2,3]表示,将向量赋值给变量a，则用a=[-2,3]，在表示三维坐标时可以用a = [x,y,z],延伸到多维则可以用a = [n1,....,nn]表示
![image.png](attachment:image.png)

In [1]:
# 创建一个向量
import numpy as np
np.zeros(10)# 函数zeros创建一个由0组成的向量

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [2]:
a = np.array([-2,3]) # 指定具体数值
a

array([-2,  3])

In [3]:
a1 = np.array([1, 2, 3, 4, 5]) # 多元素向量
a2 = np.linspace(0, 2*np.pi, 5) # 以均匀步长生成向量
a3 = np.arange(15)
print(f"a1:{a1}")
print(f"a2:{a2}")
print(f"a3:{a3}")

a1:[1 2 3 4 5]
a2:[0.         1.57079633 3.14159265 4.71238898 6.28318531]
a3:[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14]


向量之间的普通运算（+-*/）,需要向量长度完全相等
![image-2.png](attachment:image-2.png)

In [4]:
a = np.array([1])
b = np.array([4,8,10])
a+b

array([ 5,  9, 11])

In [5]:
# numpy进行向量加法
a = np.array([1,2])
b = np.array([4,8])
print(f"a+b:{a+b}")
print(f"a-b:{a-b}")
c = np.array([2,5])
print(f"a*b:{b*c}")
print(f"a/b:{b/c}")
print(f"a//b:{b//c}")

a+b:[ 5 10]
a-b:[-3 -6]
a*b:[ 8 40]
a/b:[2.  1.6]
a//b:[2 1]


向量之间的点乘，对应位置相乘后相加
![image.png](attachment:image.png)

In [6]:
# 向量之间的点乘使用dot,对应位置相乘后相加
d = np.array([3,4])
print(a.dot(d))
a@d # @运算符在numpy和未来的深度学习框架pytorch是向量或矩阵的点乘运算符

11


11

## 矩阵：

单个向量可以视为一阶矩阵，多个向量组合在一起就成了矩阵，要在numpy中构造矩阵，需要传入一个多维数据如a = [[1,0,0],[0,1,1],[0,0,1]]将该列表传递给numpy数组构造函数np.array(a)

In [7]:
a0 = np.array([[1,0,0],[0,1,0],[0,0,1]])
a0

array([[1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])

### 创建矩阵

在numpy中有方法可以创建矩阵

| 函数 | 解释 |
|:--:|:--:|
| array|直接创建，接受list或tuple参数|   
| arange |创建等差数组 |
| zeros| 创建全部为零的数组|
|ones|创建全部为一的数组 |
|diag | 获取或创建对角线数组|
| full|根据指定形状和类型创建数组 |
| eye|创建单位阵 |

In [8]:
# 使用array传入值
a1 = np.array([[11, 12, 13, 14, 15],
              [16, 17, 18, 19, 20],
              [21, 22, 23, 24, 25],
              [26, 27, 28 ,29, 30],
              [31, 32, 33, 34, 35]])
print(a1)
a2 = np.array([(1,2),(3,4)]) # 传入的数据类型不仅可以是列表也可以是元组
print(a2)

[[11 12 13 14 15]
 [16 17 18 19 20]
 [21 22 23 24 25]
 [26 27 28 29 30]
 [31 32 33 34 35]]
[[1 2]
 [3 4]]


In [9]:
# 用随机数创建数组
print(np.random.randn(2, 3)) 
print(np.random.normal(size=(4, 4)))# 生成一组符合高斯分布的概率密度随机数

[[ 0.13781535 -1.45705655  1.7439135 ]
 [-0.45714205  1.91082885 -0.30515825]]
[[-0.83300292  0.0172611   0.41381727  0.37554136]
 [ 0.57159279  0.34839364  0.37499556 -0.69534137]
 [ 1.59238077  0.217122    0.0735232   0.16988946]
 [-0.31029391  1.0316118  -0.71132206  0.35275922]]


In [10]:
# 创建一个由0组成的数组
np.zeros((3, 6))
# 创建一个数组，其初始内容是随机的，取决于内存的状态
np.empty((2, 3, 2))

array([[[4.67374335e-310, 0.00000000e+000],
        [0.00000000e+000, 0.00000000e+000],
        [0.00000000e+000, 0.00000000e+000]],

       [[0.00000000e+000, 0.00000000e+000],
        [0.00000000e+000, 0.00000000e+000],
        [0.00000000e+000, 0.00000000e+000]]])

In [11]:
np.eye(3,k=1) # 偏移主对角线1个单位的伪单位矩阵

array([[0., 1., 0.],
       [0., 0., 1.],
       [0., 0., 0.]])

In [12]:
# 创建一个对角矩阵
print(np.diag([1,2,3,4]))
a = np.full((3,4),5) # 也可以使用不同列表填充如：[1,2,3,4]
print(a)

[[1 0 0 0]
 [0 2 0 0]
 [0 0 3 0]
 [0 0 0 4]]
[[5 5 5 5]
 [5 5 5 5]
 [5 5 5 5]]


### 矩阵属性

在矩阵计算时，我们通常需要知道矩阵的一些基础属性，以进行两个矩阵的相互计算，如矩阵数据形状，矩阵值数据类型，常用的numpy对应数组属性可以用如下方式获取

In [13]:
print(type(a)) # >>><class 'numpy.ndarray'> 
print(a.dtype) # >>>int64 # 矩阵值数据类型
print(a.size) # >>>矩阵内元素个数
print(a.shape) # >>>矩阵形状
print(a.itemsize) # >>>8
print(a.ndim) # >>>矩阵维度
a.astype(np.float64) # 改变数据类型

<class 'numpy.ndarray'>
int64
12
(3, 4)
8
2


array([[5., 5., 5., 5.],
       [5., 5., 5., 5.],
       [5., 5., 5., 5.]])

### 矩阵与向量或标量计算

我们获得的矩阵通常会和其他的数组进行计算，使用矩阵和向量或标量的计算如下图所示:
![image.png](attachment:image.png)

In [14]:
m0 = np.arange(1, 10).reshape(3,3)
div9 =m0/9
print(f"m0 / 9:{np.around(div9,2)}") # 矩阵保留两位有效数字

print(f"m0 * [-1,0,1]=")
print(np.around(m0*np.array([-1,0,1]),2))

print(f"m0 * [[3],[6],[9]]=")
div_v = np.array([[3],[6],[9]])
print(np.around(m0/div_v,1))

m0 / 9:[[0.11 0.22 0.33]
 [0.44 0.56 0.67]
 [0.78 0.89 1.  ]]
m0 * [-1,0,1]=
[[-1  0  3]
 [-4  0  6]
 [-7  0  9]]
m0 * [[3],[6],[9]]=
[[0.3 0.7 1. ]
 [0.7 0.8 1. ]
 [0.8 0.9 1. ]]


算术运算和矩阵运算的一个关键区别是矩阵乘法使用点乘。NumPy 为每个数组赋予 dot() 方法，我们可以用它与其他矩阵执行点乘操作
![image-2.png](attachment:image-2.png)

上述计算过程可以视为：
![image.png](attachment:image.png)

In [15]:
a = np.array([1,2,3])
b = np.array([[1,10],[100,1000],[10000,100000]])
print(f"a.dot(b)={a.dot(b)}")

a.dot(b)=[ 30201 302010]


### 矩阵与矩阵计算

矩阵的普通计算时对应位置进行相互计算，点乘(@)是对应行和对应列相乘计算后相加(第一个位置值是1 * 2 + 2 * 0(前面矩阵第一行对应后面矩阵第一列得到第一行第一个值))其他位置同理。对应公式和图解如下所示：
$$\rm [\mathbf{A}_{m\times p}\mathbf{B}_{p\times n}]_{ij} = \sum_{k=1}^p\mathbf{A}_{ik}\mathbf{B}_{kj}$$
![image-2.png](attachment:image-2.png)

In [16]:
# 左图1，2进行矩阵加减计算
a0 = np.arange(1,5).reshape(2,2)
a1 = np.array([[1,0],[0,1]])
print(f"a0+a1={a0+a1}")
print(f"a0-a1={a0-a1}")

# 右图1，2进行矩阵的普通乘法和点乘
a2 = np.array([[2,0],[0,2]])
print(f"a0*a2={a0*a2}")
print(f"a0.dot(a2)={a0.dot(a2)}")
print(f"a0@a2={a0@a2}")
a3 = np.array([[2,1],[1,2]])
print(f"a0/a3={a0/a3}")

a0+a1=[[2 2]
 [3 5]]
a0-a1=[[0 2]
 [3 3]]
a0*a2=[[2 0]
 [0 8]]
a0.dot(a2)=[[2 4]
 [6 8]]
a0@a2=[[2 4]
 [6 8]]
a0/a3=[[0.5 2. ]
 [3.  2. ]]


### 线代常用矩阵计算

在线性代数中使用矩阵除了进行矩阵的点乘之外，还有一些其他的常用的矩阵操作如，矩阵的行列式值，矩阵的特征值和特征向量，矩阵的逆，

| 函数 | 解释 |
|:--:|:--:|
| diag|以一维数组返回方阵的对角线元素|   
| det |计算矩阵的行列式 |
| eig| 计算方阵的特征值和特征向量|
|inv|方阵的逆 |

In [17]:
from numpy import linalg
a0 = np.random.randn(5, 5)

In [18]:
print(np.diag(a0))
print(linalg.det(a0))
print(linalg.eig(a0)) # 返回对应的特征值和特征向量
print(linalg.inv(a0))
print(np.round(a0.dot(linalg.inv(a0)),2)) # 矩阵点乘逆矩阵

[ 0.01122768 -0.4878336   0.06438374 -0.17732555  0.09033162]
-10.547510733933612
(array([ 0.31725097+2.78207514j,  0.31725097-2.78207514j,
        0.08755344+1.01002997j,  0.08755344-1.01002997j,
       -1.30882492+0.j        ]), array([[ 0.24900462+0.42081602j,  0.24900462-0.42081602j,
        -0.61784029+0.j        , -0.61784029-0.j        ,
         0.4043475 +0.j        ],
       [-0.18059157+0.49299946j, -0.18059157-0.49299946j,
         0.27529109+0.03445017j,  0.27529109-0.03445017j,
        -0.4697448 +0.j        ],
       [ 0.60247526+0.j        ,  0.60247526-0.j        ,
        -0.25092414-0.11359436j, -0.25092414+0.11359436j,
        -0.37720141+0.j        ],
       [ 0.2878602 +0.18085638j,  0.2878602 -0.18085638j,
         0.50844223+0.15581291j,  0.50844223-0.15581291j,
         0.41527706+0.j        ],
       [-0.04141239+0.07060346j, -0.04141239-0.07060346j,
        -0.05075543-0.42434362j, -0.05075543+0.42434362j,
         0.54873216+0.j        ]]))
[[ 0.31028857 -0.

线性代数中比较常见的问题之一是求解矩阵向量方程。 这是一个例子。 我们寻找解决方程的向量x，Ax = b<br />
2X + 1Y - 2Z = -3<br />
3X + 0Y + 1Z= 5<br />
1X + 1Y - Z = -2<br />

In [19]:
A = np.array([[2,1,-2],[3,0,1],[1,1,-1]])
b = np.transpose(np.array([[-3,5,-2]]))

In [20]:
x = np.linalg.solve(A,b) #求解多元一次方程组
x

array([[ 1.],
       [-1.],
       [ 2.]])

### 广播（不同维度之间的操作）

numpy 对不同形状(shape)的数组进行数值计算的方式， 对数组的算术运算通常在相应的元素上进行，将标量值跟数组合并时就会发生最简单的广播

广播的原则：如果两个数组的后缘维度（trailing dimension，即从末尾开始算起的维度）的轴长度相符，或其中的一方的长度为1，则认为它们是广播兼容的。广播会在缺失和（或）长度为1的维度上进行。

In [21]:
# 在这个乘法运算中，标量值4被广播到了其他所有的元素上。
arr = np.arange(5)
arr * 4

array([ 0,  4,  8, 12, 16])

In [22]:
# 将数组减去没一列均值后，数组的列方向均值为零
arr = np.random.randn(4, 3)
print(arr.mean(0))
demeaned = arr - arr.mean(0)
print(arr)

[-0.43394847  0.14473517 -0.6413222 ]
[[-0.5717123   1.26299647  2.06309393]
 [-0.24979228 -0.74243988 -2.31933216]
 [ 0.55724054  0.80318403 -0.58552509]
 [-1.47152983 -0.74479994 -1.7235255 ]]


In [23]:
demeaned

array([[-0.13776383,  1.1182613 ,  2.70441613],
       [ 0.18415619, -0.88717505, -1.67800995],
       [ 0.99118901,  0.65844886,  0.05579712],
       [-1.03758137, -0.88953511, -1.08220329]])

In [24]:
demeaned.mean(0)

array([ 0.00000000e+00,  0.00000000e+00, -5.55111512e-17])

创建一个三维数组（3，4，2）和一个二维数组（4，2），numpy会延续二维数组的进行广播，将每个（4，2）数组加到第一个三维数组上
![image.png](attachment:image.png)

In [25]:
# 创建一个三维数组，和一个二维，二维维度和三维的后两维相同时，数组相加可以延缺失的维度进行
arr = np.arange(0,24).reshape(3,4,2)
# arr1 = np.full((4,2),[1,2])
arr1 = np.arange(0,8).reshape(4,2)
print(arr+arr1)

[[[ 0  2]
  [ 4  6]
  [ 8 10]
  [12 14]]

 [[ 8 10]
  [12 14]
  [16 18]
  [20 22]]

 [[16 18]
  [20 22]
  [24 26]
  [28 30]]]


## 数据统计

矩阵统计中，最常见的统计是统计矩阵的最大值、最小值、均值以及矩阵和。在numpy中，统计整个矩阵的对应值可以直接使用对应的方法
![image.png](attachment:image.png)

In [26]:
# 计算均值方差
arr = np.arange(1,7).reshape(3,2)
print(arr.max())
print(arr.min())
print(arr.sum())
print(arr.mean())
print(arr.std())

6
1
21
3.5
1.707825127659933


假设矩阵一行代表一个样本，不同列代表样本的不同属性，为了查看样本不同属性的差别，我们希望获得列方向上的最大值、最小值、均值等，在分析样本差异时，希望分析行方向的属性。
![image.png](attachment:image.png)


备注：图片中`.max(axis=1)`左侧4和5的位置fan了，矩阵输出为2,4,6，显示有错误。

In [27]:
# 最小值、均值、方差获取方式相同
print(arr.max(axis=0))
print(arr.max(axis=1))
print(arr.std(axis=0))
print(arr.std(axis=1))

[5 6]
[2 4 6]
[1.63299316 1.63299316]
[0.5 0.5 0.5]


In [28]:
# 有时我们希望获得最大值或者最小值位置(会将二维矩阵位置，转成一维输出默认从零开始)
arr = np.random.randn(4,4)
print(arr)
print(arr.argmax())
print(arr.argmin())

[[ 0.09356886 -1.21177934 -0.45767366  0.80329766]
 [-0.86353298 -0.67556966 -0.76783319  1.12315069]
 [ 0.0460145   1.58448849 -0.95601262  0.50119271]
 [-0.34823565  0.09247916  0.3201834  -0.43650944]]
9
1


## 向量化较循环计算带来的速度增益

In [29]:
import time
import numpy as np

In [30]:
# 包含一百万整数数组，使用循环和使用向量让序列乘2
my_arr = np.arange(1000000)
my_list = list(range(1000000))

In [31]:
%time for _ in range(10): my_arr2 = my_arr * 2 

CPU times: user 7.68 ms, sys: 0 ns, total: 7.68 ms
Wall time: 7.21 ms


In [32]:
%time for _ in range(10): my_list2 = [x * 2 for x in my_list]

CPU times: user 268 ms, sys: 60 ms, total: 328 ms
Wall time: 327 ms


In [33]:
a = np.random.rand(1000000)
b = np.random.rand(1000000)
start_time = time.time()
np_c = np.dot(a,b)
end_time = time.time()
print(f"np_time:" + str(1000*(end_time-start_time)) +"ms")

c = 0
start_time = time.time()
for i in range(1000000):
    c += a[i]*b[i]
end_time = time.time()
print(f"For_time:"+ str(1000*(end_time-start_time)) +"ms")
print()

np_time:0.7693767547607422ms
For_time:251.3730525970459ms



# 数组索引


对于一维数组来说，从表面上来看，它使用索引和切片的方式，与Python列表的功能相差不大。对于多维数组来说，索引和切片的使用方式与列表就不一样了，下面的图表说明了给定的示例切片是如何进行工作的
![image.png](attachment:image.png)

In [34]:
a = np.arange(11,36).reshape(5,5)
print(a[0,1:4])
print(a[1:4,0])
print(a[::2,::2])
print(a[:,1])
print(a[[1, 0, 2, 2], [0, 2, 1, 2]]) # 选择(1,0)、(0，2)、(2,1)和(2,2)对应位置的值

[12 13 14]
[16 21 26]
[[11 13 15]
 [21 23 25]
 [31 33 35]]
[12 17 22 27 32]
[16 13 22 23]


In [35]:
# 注意：numpy可变数据类型，当切片值改变数组对应位置值也会改变,如果不希望原数组发生改变，可以将源数组复制
b = a.copy()
a_slice = b[1:3,1:4] 
a_slice[:] = 64
print(a)
a_slice = a[1:3,1:4] 
a_slice[:] = 64
print(a)

[[11 12 13 14 15]
 [16 17 18 19 20]
 [21 22 23 24 25]
 [26 27 28 29 30]
 [31 32 33 34 35]]
[[11 12 13 14 15]
 [16 64 64 64 20]
 [21 64 64 64 25]
 [26 27 28 29 30]
 [31 32 33 34 35]]


In [36]:
# 花式索引，根据数组值下标进行索引
arr = np.empty((8, 4))
for i in range(8):
    arr[i] = i
arr[[4, 3, 0, 6],:] # 以特定顺序选取行

array([[4., 4., 4., 4.],
       [3., 3., 3., 3.],
       [0., 0., 0., 0.],
       [6., 6., 6., 6.]])

In [37]:
print(a[[1,3,0],:]) # 交换数据的两行

[[16 64 64 64 20]
 [26 27 28 29 30]
 [11 12 13 14 15]]


In [38]:
# 使用np.where进行索引，获得数组对应在区间之内的值
index = np.where((a >= 15) & (a <= 25))
print(index)
a[index]

(array([0, 1, 1, 2, 2]), array([4, 0, 4, 0, 4]))


array([15, 16, 20, 21, 25])

In [39]:
# 应用np.where将矩阵中大于零变成2小于零变成-2
arr = np.random.randn(4, 4)
np.where(arr > 0, 2, -2)

array([[-2, -2,  2,  2],
       [ 2,  2,  2, -2],
       [ 2, -2,  2, -2],
       [-2,  2, -2, -2]])

In [40]:
#三元计算
xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
cond = np.array([True, False, True, True, False])
result = [(x if c else y)
    for x, y, c in zip(xarr, yarr, cond)]
result = np.where(cond, xarr, yarr)

# 形状变化

在应用中，会遇到某个模型对输入形状的要求与你的数据集不同时，需要对数据进行变形，使用reshape时可以指定出具体维度，也可以为维度赋值-1，NumPy 可以根据你的矩阵推断出正确的维度

![image.png](attachment:image.png)

In [41]:
arr = np.arange(1, 7).reshape(2, 3) # 指定具体维度
print(arr.shape)
arr = arr.reshape((3, -1))
print(arr.shape)

(2, 3)
(3, 2)


处理矩阵时的一个常见需求是旋转矩阵。当需要对两个矩阵执行点乘运算并对齐它们共享的维度时，通常需要进行转置。NumPy 数组有一个方便的方法 T 来求得矩阵转置
![image.png](attachment:image.png)

In [42]:
print(arr.T)

[[1 3 5]
 [2 4 6]]


In [43]:
# 有时需要将二维数组降低维度展平成一维数组
print(arr.flatten())

[1 2 3 4 5 6]


In [44]:
# 当进行数据处理时，数据的维度往往不一定是二维的有时也会是三维数据，当三维数据进行维度转换时使用transpose
arr = np.arange(24).reshape((2, 3, 4))
print(arr)

[[[ 0  1  2  3]
  [ 4  5  6  7]
  [ 8  9 10 11]]

 [[12 13 14 15]
  [16 17 18 19]
  [20 21 22 23]]]


In [45]:
arr = arr.transpose((1, 2, 0))
print(arr)
print(arr.shape)

[[[ 0 12]
  [ 1 13]
  [ 2 14]
  [ 3 15]]

 [[ 4 16]
  [ 5 17]
  [ 6 18]
  [ 7 19]]

 [[ 8 20]
  [ 9 21]
  [10 22]
  [11 23]]]
(3, 4, 2)


在处理数据时，为了方便，我们通常会对数据进行拼接操作，让数据可以传入更多信息，到后续的处理过程，numpy提供了cocatenate方法，实现数组各个维度的拼接,在多维数组进行拼接时其他维度应该相同
![image.png](attachment:image.png)

In [46]:
arr1 = np.arange(1,25).reshape(2,3,4)
arr2 = np.arange(1,13).reshape(2,3,2)
arr3 = np.arange(1,17).reshape(2,2,4)
print(np.concatenate((arr1,arr2),axis=2))
print(np.concatenate((arr1,arr3),axis=1))

[[[ 1  2  3  4  1  2]
  [ 5  6  7  8  3  4]
  [ 9 10 11 12  5  6]]

 [[13 14 15 16  7  8]
  [17 18 19 20  9 10]
  [21 22 23 24 11 12]]]
[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]
  [ 1  2  3  4]
  [ 5  6  7  8]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]
  [ 9 10 11 12]
  [13 14 15 16]]]


In [47]:
arr3 = np.arange(25,37).reshape(1,3,4)
print(np.concatenate((arr1,arr3),axis=0))

[[[ 1  2  3  4]
  [ 5  6  7  8]
  [ 9 10 11 12]]

 [[13 14 15 16]
  [17 18 19 20]
  [21 22 23 24]]

 [[25 26 27 28]
  [29 30 31 32]
  [33 34 35 36]]]


# 代码实践
1.已知a = np.array([2, 6, 1, 9, 10, 3, 27])获取除5-10之间的所有值
期望输出：array([6, 9, 10])

In [48]:
a = np.array([2, 6, 1, 9, 10, 3, 27])
index = np.where((a >= 5) & (a <= 10))
a[index]

array([ 6,  9, 10])

2.根据矩阵乘法公式，用循环计算出矩阵m1 = [[1, 2, 3],[4, 5, 6]]与m2= [[ 8,  9, 10, 11],[12, 13, 14, 15],[16, 17, 18, 19]]点乘：
$$\rm [\mathbf{A}_{m\times p}\mathbf{B}_{p\times n}]_{ij} = \sum_{k=1}^p\mathbf{A}_{ik}\mathbf{B}_{kj}$$


In [49]:
m1 = np.arange(1, 7).reshape(2,3)
m2 = np.arange(8, 20).reshape(3,4)
res = np.empty((m1.shape[0],m2.shape[1]))
for i in range(m1.shape[0]):
    for j in range(m2.shape[1]):
        item = 0
        for k in range(m1.shape[1]):
            item += m1[i][k] * m2[k][j]
        res[i][j] = item
res

array([[ 80.,  86.,  92.,  98.],
       [188., 203., 218., 233.]])

3.利用np.random创建一个一维数组，计算数组的softmax<br />
提示：softmax公式为：$P= \frac{\text{exp}(v_i)}{ \sum_{j=1}^m{exp}({v}_j)}$，计算指数用np.exp(a)


In [50]:
x = np.random.randn(4)
e_x = np.exp(x - np.max(x)) # -max(x)防止数值较大导致程序的数值溢出
e_x / e_x.sum(axis=0)

array([0.0062179 , 0.69256567, 0.1729306 , 0.12828582])

4.线性方程如下，使用numpy求x,y,z<br />
3X  +  2 Y + Z =  10<br />
X + Y + Z = 6<br />
X + 2Y - Z = 2<br />
提示：系数矩阵A = np.array([[3,2,1],[1,1,1],[1,2,-1]]),x代表未知数，解b = np.array([[10],[6],[2]])，由Ax=b得x=$A^{-1}$b

In [51]:
A = np.array([[3,2,1],[1,1,1],[1,2,-1]])
b = np.array([[10],[6],[2]])
result = np.linalg.inv(A).dot(b)
result

array([[1.],
       [2.],
       [3.]])