# 梯度下降

到目前为止，我们构建起了一个最简单的人工神经元网络的模型框架。

模型包括两个部分：参数和逻辑。其中模型逻辑相对固定，模型推理的准确度取决于模型参数是否合理。

那么怎样才能得到合理的参数呢？答案是模型可以从大量的数据中学习，逐步优化参数。这个过程被称为**模型训练**（Model Training）。

## 模型训练




In [1]:
import numpy as np

## 数据

### 特征、标签

In [2]:
feature = np.array([28.1, 58.0])
label = np.array([165])

## 模型

### 参数：权重、偏差

In [3]:
weight = np.ones([1, 2]) / 2
bias = np.zeros(1)

### 逻辑：推理函数（前向传播）

In [4]:
def forward(x, w, b):
    return x @ w.T + b

### 损失函数（平均平方差）

In [5]:
def mse_loss(p, y):
    return ((p - y) ** 2).mean()

### 梯度函数

In [6]:
def gradient(p, y):
    return (p - y) * 2

### 反向函数（反向传播）

In [7]:
def backward(x, d, w, b):
    w -= d * x
    b -= np.sum(d)
    return w, b

## 验证

### 推理

In [8]:
prediction = forward(feature, weight, bias)

print(f'prediction: {prediction}')

prediction: [43.05]


### 评估

In [9]:
error = mse_loss(prediction, label)

print(f'error: {error}')

error: 14871.802500000002


### 反向传播

In [10]:
delta = gradient(prediction, label)
weight, bias = backward(feature, delta, weight, bias)

print(f"weight: {weight}")
print(f"bias: {bias}")

weight: [[ 6854.09 14146.7 ]]
bias: [243.9]
