<a href="https://colab.research.google.com/github/YinGuoX/Deep_Learning_Keras_WithDeeplizard/blob/master/5_Train_An_Artificial_Neural_Network_With_TensorFlow's_Keras_API.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Train An Artificial Neural Network With TensorFlow's Keras API
在本集中，我们将演示如何使用TensorFlow集成的Keras API训练人工神经网络。在上一集中，我们经历了构建简单网络的步骤，现在我们将重点关注使用我们在更早的一集中生成的数据来训练它。

部署上一节中的神经网络模型

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Activation, Dense
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.metrics import categorical_crossentropy

In [None]:
model = Sequential([
    Dense(units=16, input_shape=(1,), activation='relu'),
    Dense(units=32, activation='relu'),
    Dense(units=2, activation='softmax')
])

## 1. 编译模型
为了使模型准备好进行训练，我们需要做的第一件事是在其上调用compile（）函数。



In [None]:
model.compile(optimizer=Adam(learning_rate=0.0001),
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

这个函数为训练配置模型，并需要一些参数。首先，我们指定优化器Adam。Adam接受了一个可选参数学习率，我们将其设置为0.0001。（Adam optimization是一种随机梯度下降(SGD)方法）

我们指定的下一个参数是loss。我们将使用sparse_categorical_crossentropy，因为我们的标签是整数格式的。

**注意：**当我们只有两个类时，我们可以将输出层配置为仅一个输出，而不是两个输出，并使用binary_crossentropy作为损失，而不是categorical_crossentropy。 两种选择均能很好地工作，并获得完全相同的结果，但是，对于binary_crossentropy，最后一层需要使用Sigmoid而不是softmax作为其激活函数。

在compile()中指定的最后一个参数是metrics。这个参数期望一个我们希望模型在培训和测试期间评估的指标列表。我们将它设置为一个包含字符串accuracy的列表。

## 2. 训练模型
现在模型已经编译完成，我们可以使用fit()函数来训练它。

准备数据集

In [None]:
import numpy as np
from random import randint
from sklearn.utils import shuffle
from sklearn.preprocessing import MinMaxScaler

train_labels = []
train_samples = []

# 生成数据
for i in range(50):
    # 大约5%的年轻人确实经历过副作用
    random_younger = randint(13,64)
    train_samples.append(random_younger)
    train_labels.append(1)

    # 大约5%的老年人没有经历过副作用
    random_older = randint(65,100)
    train_samples.append(random_older)
    train_labels.append(0)

for i in range(1000):
    # 大约95%的年轻人没有经历过副作用
    random_younger = randint(13,64)
    train_samples.append(random_younger)
    train_labels.append(0)

    # 大约95%的老年人确实经历过副作用
    random_older = randint(65,100)
    train_samples.append(random_older)
    train_labels.append(1)

train_labels = np.array(train_labels)
train_samples = np.array(train_samples)
train_labels,train_samples = shuffle(train_labels,train_samples)
print(train_samples.shape)

# 通过将每个特征缩放到给定的范围来转换特征。
scaler = MinMaxScaler(feature_range=(0,1))

scaled_train_samples = scaler.fit_transform(train_samples.reshape(-1,1))
# 我们只是根据fit_transform（）函数默认情况下不接受一维数据的情况，将数据重塑为2D。
print(train_samples.reshape(-1,1).shape)

(2100,)
(2100, 1)


In [None]:
model.fit(x=scaled_train_samples,y=train_labels,batch_size=10,epochs=30,verbose=2)

Epoch 1/30
210/210 - 1s - loss: 0.6954 - accuracy: 0.5267
Epoch 2/30
210/210 - 0s - loss: 0.6564 - accuracy: 0.6881
Epoch 3/30
210/210 - 0s - loss: 0.6185 - accuracy: 0.7362
Epoch 4/30
210/210 - 0s - loss: 0.5836 - accuracy: 0.7795
Epoch 5/30
210/210 - 0s - loss: 0.5481 - accuracy: 0.7995
Epoch 6/30
210/210 - 0s - loss: 0.5134 - accuracy: 0.8371
Epoch 7/30
210/210 - 0s - loss: 0.4792 - accuracy: 0.8524
Epoch 8/30
210/210 - 0s - loss: 0.4479 - accuracy: 0.8700
Epoch 9/30
210/210 - 0s - loss: 0.4207 - accuracy: 0.8790
Epoch 10/30
210/210 - 0s - loss: 0.3970 - accuracy: 0.8929
Epoch 11/30
210/210 - 0s - loss: 0.3770 - accuracy: 0.8929
Epoch 12/30
210/210 - 0s - loss: 0.3601 - accuracy: 0.9000
Epoch 13/30
210/210 - 0s - loss: 0.3461 - accuracy: 0.9081
Epoch 14/30
210/210 - 0s - loss: 0.3345 - accuracy: 0.9090
Epoch 15/30
210/210 - 0s - loss: 0.3248 - accuracy: 0.9124
Epoch 16/30
210/210 - 0s - loss: 0.3167 - accuracy: 0.9186
Epoch 17/30
210/210 - 0s - loss: 0.3099 - accuracy: 0.9152
Epoch 

<tensorflow.python.keras.callbacks.History at 0x7fe533bc6710>

我们传递给fit()函数的第一项是训练集x。回想一下之前的章节，我们创建了训练集并将其命名为scaled_train_samples.

我们设置的下一个参数是训练集y的标签，我们先前将其命名为train_labels。

然后，我们指定batch_size。 同样，“深度学习基础知识”课程详细介绍了批量大小的概念。

接下来，我们指定要运行多少个epoch。 我们将其设置为30。请注意，一个时期是所有数据到网络的单次传递。

**注意：**
* 一个epoch是所有数据都经过了一次神经网络模型的训练
* batch_size=10:以每次10张图片为一批进入神经网络模型进行训练
* 因此一个epoch要training set size / batch_size个批次完成一个所有数据的训练


最后，我们指定verbose = 2。 这只是指定我们希望在每个培训时期看到多少输出到控制台。 详细程度范围为0到2，因此我们得到的是最详细的输出。

我们可以看到这30个时期的对应输出。通过损失和准确性判断，我们可以看到这两个指标随着时间的推移稳步提高，精确度达到93%，损失稳步减少，直到我们达到0.27。

请注意，尽管这是一个在简单数据上训练的非常简单的模型，但无需付出太多努力，但我们能够以相对较快的时间达到很好的结果。 在随后的几集中，我们将演示更复杂的模型以及更复杂的数据，但是希望您对我们能够轻松开始使用tf.keras感到鼓舞。