# Python手搓神经网络-numpy和矩阵运算

# 点成运算的含义

向量点乘的几何意义是两个向量的模之积再乘以二者夹角的余弦值。这意味着，如果两个向量互相垂直，则其点积为零。反过来说，两个不为零的向量的点积等于零，则两个向量垂直。

![image.png](attachment:image.png)

numpy.dot()函数提供了点乘运算。对于一维数组，NumPy的点乘就是向量点乘，其结果是一个标量。对于多维数组，则需要满足一定条件才能实现点乘，且其结果不再是标量，而是一个多维数组。比如，NumPy的矩阵相乘，就是二维数组的点乘，参与点乘的第一个数组的列数必须等于第二个数组的行数。

![image-2.png](attachment:image-2.png)

In [3]:
import numpy as np
# 数据初始化
b1 = 0
a1 =-0.9
a2 = -0.5
a3 =-0.7
w1 = 0.8
w2 =-0.4
w3 =0
input_s = np.array([a1,a2,a3])
weight_s = np.array([[w1],[w2],[w3]])

# 激活函数
def activation_ReLU(inputs):
    return np.maximum(0, inputs)

# 计算式更新
sum1 = np.dot(input_s,weight_s) + b1
print(sum1)
print(activation_ReLU(sum1))

[-0.52]
[0.]


In [4]:
w11 = 0.8
w21 = -0.4
w31 = 0

w12 = 0.7
w22 =-0.6
w32 = 0.2

weight_s = np.array([[w11, w12],[w21,w22],[w31,w32]])
sum1 = np.dot(input_s,weight_s) + b1
print(sum1)
print(activation_ReLU(sum1))

[-0.52 -0.47]
[0. 0.]


a	w1	w2	sum1	sum2
-0.9	0.8	0.7	-0.72	-0.63
-0.5	-0.4	-0.6	0.2	0.3
-0.7	0	0.2	0	-0.14
			-0.52	-0.47
![image-2.png](attachment:image-2.png)

In [5]:
a11 = -0.9
a21 = -0.4
a31 = -0.7
a12 = -0.8
a22 = -0.5
a32 =-0.6
a13 = -0.5
a23 =-0.8
a33 =-0.2

b1 = 0.5
# batch
input_s = np.array([[a11, a21, a31],[a12,a22,a32],[a13,a23,a33]])
sum1 = np.dot(input_s,weight_s) + b1
print(sum1)
print(activation_ReLU(sum1))

[[-0.06 -0.03]
 [ 0.06  0.12]
 [ 0.42  0.59]]
[[0.   0.  ]
 [0.06 0.12]
 [0.42 0.59]]


-0.9	0.8	0.7	-0.72	-0.63
-0.4	-0.4	-0.6	0.16	0.24
-0.7	0	0.2	0	-0.14
			-0.06	-0.03
				
				
-0.8	0.8	0.7	-0.64	-0.56
-0.5	-0.4	-0.6	0.2	0.3
-0.6	0	0.2	0	-0.12
			0.06	0.12
				
-0.5	0.8	0.7	-0.4	-0.35
-0.8	-0.4	-0.6	0.32	0.48
-0.2	0	0.2	0	-0.04
			0.42	0.59
![image.png](attachment:image.png)

In [7]:
def creat_weights(n_inputs,n_neurons):
    return np.random.randn(n_inputs,n_neurons)

def creat_biases(n_neurons):
    return np.random.randn(n_neurons)

In [9]:
weights = creat_weights(3,2)
print(creat_weights(3,2))
b1 = creat_biases(2)
print(creat_biases(2))
print("----------------")
inputs = np.array([[a11, a21, a31],[a12,a22,a32],[a13,a23,a33]])
sum1 = np.dot(inputs,weights) + b1
print(sum1)
print("----------------")
print(activation_ReLU(sum1))

[[ 1.07611401 -2.39582858]
 [-1.26761983  1.65637855]
 [ 0.79122    -1.4949062 ]]
[-0.44927629 -0.38115384]
----------------
[[-5.03864028 -0.08480031]
 [-4.63862783 -0.31092885]
 [-3.30995445 -1.03265257]]
----------------
[[0. 0.]
 [0. 0.]
 [0. 0.]]


In [10]:
# inputs = np.array([[a11, a21, a31],[a12,a22,a32],[a13,a23,a33]])
def creat_inputs(n_inputs,n_neurons):
    return np.random.randn(n_inputs,n_neurons)

inputs = creat_inputs(5,2)
print(inputs)

#第一层
weights1 = creat_weights(2, 3)
biases1 = creat_biases(3)
#第二层
weights2 = creat_weights(3, 4)
biases2 = creat_biases(4)
#第三层
weights3 = creat_weights(4, 2)
biases3 = creat_biases(2)
#第一层运算
sum_1 = np.dot(inputs, weights1)+ biases1
output1 = activation_ReLU(sum_1)
print(output1)
#第二层运算
sum_2 = np.dot(output1, weights2) + biases2
output2 = activation_ReLU(sum_2)
print(output2)

#第三层运算
sum_3 = np.dot(output2, weights3) + biases3
output3 = activation_ReLU(sum_3)
print(output3)

[[ 0.07374458 -1.97466641]
 [-1.80234452 -0.3965127 ]
 [-0.14840237 -0.34629852]
 [ 2.16872393 -0.10803272]
 [-0.40719667  0.46972829]]
[[0.         0.64392596 0.        ]
 [0.         3.10065845 0.        ]
 [0.         0.90853628 0.        ]
 [0.28073135 0.         0.        ]
 [0.         1.23651407 0.        ]]
[[0.40230353 1.4537916  0.42801253 1.5640483 ]
 [0.         1.89992275 1.66544266 3.19965761]
 [0.11334184 1.5018436  0.56129394 1.74021689]
 [1.4828789  1.14800816 0.18783335 1.17344817]
 [0.         1.56140284 0.72649288 1.9585734 ]]
[[1.51109989 0.        ]
 [3.94966418 0.06826856]
 [1.57802315 0.        ]
 [1.65058342 0.        ]
 [1.85605644 0.        ]]


# ValueError报错说明

这个ValueError通常发生在进行矩阵运算时，两个矩阵的维度不匹配。在这个例子中，尝试进行的运算涉及两个矩阵A和B，其中A的形状是(3,3)，B的形状是(2,3)。由于矩阵乘法要求第一个矩阵的列数必须等于第二个矩阵的行数，当它们不匹配时就会引发这个错误。

解决方法：

确保参与运算的矩阵维度正确对齐。如果你正在尝试进行矩阵加法或者乘法，你需要确保第一个矩阵的列数和第二个矩阵的行数相等。

如果你想进行矩阵乘法，你需要确保A的列数（3）和B的行数（3）相等。如果不相等，你需要调整B的形状，使其与A的列数对齐。

如果你想进行矩阵加法，确保两个矩阵的形状完全相同。

如果矩阵形状不可变，但仍需要进行运算，可以考虑使用广播机制（broadcasting），但这通常需要满足特定条件。

具体解决方法取决于你正在执行的操作。如果是矩阵乘法，你可能需要重塑或者删除B矩阵的行以匹配A矩阵的列数，如果是矩阵加法，你可能需要填充或者删除A、B矩阵以使它们形状一致。