# Keras Programing 
Keras 是一个用于构建和训练深度学习模型的高阶API。它可用于快速设计原型、高级研究和生产，具有以下三个主要优势：

- 方便用户使用
Keras 具有针对常见用例做出优化的简单而一致的界面。它可针对用户错误提供切实可行的清晰反馈。
- 模块化和可组合
将可配置的构造块连接在一起就可以构建 Keras 模型，并且几乎不受限制。
- 易于扩展
可以编写自定义构造块以表达新的研究创意，并且可以创建新层、损失函数并开发先进的模型。

## 导入keras 
`tf.keras` 是 TensorFlow 对 Keras API 规范的实现。

是一个用于构建和训练模型的高阶 API，包含对 TensorFlow 特定功能（例如 Eager Execution、tf.data 管道和 Estimator）的支持。

tf.keras 使 TensorFlow 更易于使用，并且不会牺牲灵活性和性能。

In [1]:
import tensorflow as tf
from tensorflow.keras import layers

print(tf.VERSION)
print(tf.keras.__version__)

1.13.1
2.2.4-tf


`tf.keras` 可以运行任何与 Keras 兼容的代码，但请注意：

保存模型的权重时，tf.keras 默认采用检查点格式。请传递 save_format='h5' 以使用 HDF5。

## 构建简单的模型
### 序列模型
在 Keras 中，可以通过组合层来构建模型。模型（通常）是由层构成的图。

最常见的模型类型是层的堆叠：`tf.keras.Sequential` 模型。

要构建一个简单的全连接网络（即多层感知器），请运行以下代码：

In [2]:
model = tf.keras.Sequential()
# Adds a densely-connected layer with 64 units to the model:
model.add(layers.Dense(64, activation='relu'))
# Add another:
model.add(layers.Dense(64, activation='relu'))
# Add a softmax layer with 10 output units:
model.add(layers.Dense(10, activation='softmax'))

### 配置层
我们可以使用很多 `tf.keras.layers`，它们具有一些相同的构造函数参数：

- activation：
设置层的激活函数。此参数由内置函数的名称指定，或指定为可调用对象。默认情况下，系统不会应用任何激活函数。
- kernel_initializer 和 bias_initializer：
创建层权重（核和偏差）的初始化方案。此参数是一个名称或可调用对象，默认为 "Glorot uniform" 初始化器。
- kernel_regularizer 和 bias_regularizer：
应用层权重（核和偏差）的正则化方案，例如 L1 或 L2 正则化。默认情况下，系统不会应用正则化函数。
以下代码使用构造函数参数实例化 `tf.keras.layers.Dense` 层：

In [3]:
# Create a sigmoid layer:
layers.Dense(64, activation='sigmoid')
# Or:
layers.Dense(64, activation=tf.sigmoid)

# A linear layer with L1 regularization of factor 0.01 applied to the kernel matrix:
layers.Dense(64, kernel_regularizer=tf.keras.regularizers.l1(0.01))

# A linear layer with L2 regularization of factor 0.01 applied to the bias vector:
layers.Dense(64, bias_regularizer=tf.keras.regularizers.l2(0.01))

# A linear layer with a kernel initialized to a random orthogonal matrix:
layers.Dense(64, kernel_initializer='orthogonal')

# A linear layer with a bias vector initialized to 2.0s:
layers.Dense(64, bias_initializer=tf.keras.initializers.constant(2.0))

<tensorflow.python.keras.layers.core.Dense at 0x7f70539f0e10>

## 训练和评估
### 设置训练流程
构建好模型后，通过调用 compile 方法配置该模型的学习流程：

In [None]:
model = tf.keras.Sequential([
# Adds a densely-connected layer with 64 units to the model:
layers.Dense(64, activation='relu'),
# Add another:
layers.Dense(64, activation='relu'),
# Add a softmax layer with 10 output units:
layers.Dense(10, activation='softmax')]
)

model.compile(optimizer=tf.train.AdamOptimizer(0.001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

`tf.keras.Model.compile` 采用三个重要参数：

- optimizer：
此对象会指定训练过程。从 tf.train 模块向其传递优化器实例，例如 tf.train.AdamOptimizer、tf.train.RMSPropOptimizer 或 tf.train.GradientDescentOptimizer。
- loss：要
在优化期间最小化的函数。常见选择包括均方误差 (mse)、categorical_crossentropy 和 binary_crossentropy。损失函数由名称或通过从 tf.keras.losses 模块传递可调用对象来指定。
- metrics：
用于监控训练。它们是 tf.keras.metrics 模块中的字符串名称或可调用对象。
以下代码展示了配置模型以进行训练的几个示例

In [5]:
# Configure a model for mean-squared error regression.
model.compile(optimizer=tf.train.AdamOptimizer(0.01),
              loss='mse',       # mean squared error
              metrics=['mae'])  # mean absolute error

# Configure a model for categorical classification.
model.compile(optimizer=tf.train.RMSPropOptimizer(0.01),
              loss=tf.keras.losses.categorical_crossentropy,
              metrics=[tf.keras.metrics.categorical_accuracy])

Instructions for updating:
Use tf.cast instead.


## 输入 NumPy 数据
对于小型数据集，请使用内存中的 NumPy 数组训练和评估模型。使用 fit 方法使模型与训练数据“拟合”：

In [6]:
import numpy as np

data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

model.fit(data, labels, epochs=10, batch_size=32)

Instructions for updating:
Use tf.cast instead.
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f70534a76a0>

tf.keras.Model.fit 采用三个重要参数：

- epochs：
以周期为单位进行训练。一个周期是对整个输入数据的一次迭代（以较小的批次完成迭代）。
- batch_size：
当传递 NumPy 数据时，模型将数据分成较小的批次，并在训练期间迭代这些批次。此整数指定每个批次的大小。请注意，如果样本总数不能被批次大小整除，则最后一个批次可能更小。
- validation_data：
在对模型进行原型设计时，需要轻松监控该模型在某些验证数据上达到的效果。传递此参数（输入和标签元组）可以让该模型在每个周期结束时以推理模式显示所传递数据的损失和指标。

下面是使用 validation_data 的示例：

In [7]:
import numpy as np

data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

val_data = np.random.random((100, 32))
val_labels = np.random.random((100, 10))

model.fit(data, labels, epochs=10, batch_size=32,
          validation_data=(val_data, val_labels))

Train on 1000 samples, validate on 100 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f70500ac358>

## 输入 tf.data 数据集
使用 Datasets API 可扩展为大型数据集或多设备训练。将 tf.data.Dataset 实例传递到 fit 方法：

In [8]:
# Instantiates a toy dataset instance:
dataset = tf.data.Dataset.from_tensor_slices((data, labels))
dataset = dataset.batch(32)
dataset = dataset.repeat()

# Don't forget to specify `steps_per_epoch` when calling `fit` on a dataset.
model.fit(dataset, epochs=10, steps_per_epoch=30)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f70500acb00>

在上方代码中，fit 方法使用了 steps_per_epoch 参数（表示模型在进入下一个周期之前运行的训练步数）。由于 Dataset 会生成批次数据，因此该代码段不需要 batch_size。

数据集也可用于验证：

## 评估和预测
tf.keras.Model.evaluate 和 tf.keras.Model.predict 方法可以使用 NumPy 数据和 tf.data.Dataset。

要评估所提供数据的推理模式损失和指标，请运行以下代码：

In [15]:
data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

print(model.evaluate(data, labels))

print(model.predict(data))

[11.55795327758789, 0.107]
[[0.10135583 0.10042981 0.09321083 ... 0.10499071 0.09247445 0.09271517]
 [0.11304542 0.0936415  0.09559053 ... 0.09806406 0.09711497 0.11101819]
 [0.08773647 0.09440125 0.08379943 ... 0.09716568 0.09980063 0.08566275]
 ...
 [0.09844451 0.10513283 0.09359249 ... 0.10395192 0.09812948 0.08804629]
 [0.09220661 0.10661891 0.0846066  ... 0.11001663 0.09786028 0.07405312]
 [0.08121546 0.10571145 0.07830639 ... 0.09388811 0.11345306 0.08550307]]


## 构建高级模型
### 函数式 API
tf.keras.Sequential 模型是层的简单堆叠，无法表示任意模型。使用 Keras 函数式 API 可以构建复杂的模型拓扑，例如：

- 多输入模型
- 多输出模型
- 具有共享层的模型（同一层被调用多次），

使用函数式 API 构建的模型具有以下特征：

- 层实例可调用并返回张量。
- 输入张量和输出张量用于定义 tf.keras.Model 实例。
- 此模型的训练方式和 Sequential 模型一样。
以下示例使用函数式 API 构建一个简单的全连接网络：

In [16]:
inputs = tf.keras.Input(shape=(32,))  # Returns a placeholder tensor

# A layer instance is callable on a tensor, and returns a tensor.
x = layers.Dense(64, activation='relu')(inputs)
x = layers.Dense(64, activation='relu')(x)
predictions = layers.Dense(10, activation='softmax')(x)

在给定输入和输出的情况下实例化模型。

In [17]:
model = tf.keras.Model(inputs=inputs, outputs=predictions)

# The compile step specifies the training configuration.
model.compile(optimizer=tf.train.RMSPropOptimizer(0.001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Trains for 5 epochs
model.fit(data, labels, batch_size=32, epochs=5)


Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x7f7030167be0>

## 保存和恢复

模型可以保存到一个文件中，其中包含权重值、模型配置乃至优化器配置。这样，您就可以对模型设置检查点并稍后从完全相同的状态继续训练，而无需访问原始代码。

In [18]:
# Create a trivial model
model = tf.keras.Sequential([
  layers.Dense(10, activation='softmax', input_shape=(32,)),
  layers.Dense(10, activation='softmax')
])
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(data, labels, batch_size=32, epochs=5)

# Save entire model to a HDF5 file
model.save('my_model.h5')

# Recreate the exact same model, including weights and optimizer.
model = tf.keras.models.load_model('my_model.h5')

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


# 实践
## 构建一个完整的具有训练与评估的项目
框架：Tensorflow的Keras API
数据集：Cifar10
要求：
1. 使用Keras 的Sequential搭建一个Alexnet网络
2. 需要有训练与评估脚本
3. 使用tensorboard可视化训练过程（可视化loss）
4. 每一个epoch都保存一次模型
5. 对指定模型进行评估
6. 编码符合PEP8编码规范
7. 使用SGD优化器，学习率为0.001，momentum为0.09

### 提示1: Alexnet定义

In [None]:
#Layer 1
model.add(layers.Conv2D(48, kernel_size=(3,3),strides=(1,1), activation='relu', padding='same', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)))

#Layer 2
model.add(layers.Conv2D(128, kernel_size=(3,3), activation='relu', padding='same') )
model.add(layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)))

#Layer 3
model.add(layers.Conv2D(192, kernel_size=(3,3), activation='relu', padding='same') )

#Layer 4
model.add(layers.Conv2D(192, kernel_size=(3,3), activation='relu', padding='same') )
model.add(layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)))

#Layer 5
model.add(layers.Conv2D(128, kernel_size=(3,3), activation='relu', padding='same') )
model.add(layers.MaxPooling2D(pool_size=(2,2),strides=(2,2)))

model.add(layers.Flatten())

#Layer 6
model.add(layers.Dense(4096))

#Layer 7
model.add(layers.Dense(4096))

#Prediction
model.add(layers.Dense(num_classes, activation='softmax'))

#### 提示2: lable需要one-hot编码
#### 提示3: loss使用categorical_crossentropy