## 第17章 Keras入门

<mark style=background-color:yellow>【keras简介】</mark>   
- Keras是一个由Python编写的开源人工神经网络库，可以作为Tensorflow、Microsoft-CNTK和Theano的高阶应用程序接口，进行深度学习模型的设计、调试、评估、应用和可视化。
- Keras在代码结构上由面向对象方法编写，完全模块化并具有可扩展性、易用性 。
- Keras支持现代人工智能领域的主流算法，包括前馈结构和递归结构的神经网络，也可以通过封装参与构建统计学习模型 。
- 在硬件和开发环境方面，Keras支持多操作系统下的多GPU并行计算，可以根据后台设置转化为Tensorflow、Microsoft-CNTK等系统下的组件。
- Keras的主要开发者是François Chollet（目前在谷歌），此外其GitHub（https://github.com/keras-team/keras）项目页面包含6名主要维护者和超过800名直接贡献者。


<mark style=background-color:yellow>【keras发展】</mark>  
Keras的前身是François Chollet为ONEIROS（Open-ended Neuro-Electronic Intelligent Robot Operating System）项目所的编写的代码，在2015年分离成为开源的人工神经网络工具。Keras的最初版本以Theano为后台，设计理念参考了Torch但完全由Python编写 。
- 2015年11月的Keras测试版本0.3.0，Tensorflow【其源码:https://github.com/tensorflow/tensorflow】被加入了后台选项。
- 2016年4月，Keras在PIPy上发布了第一个稳定版本1.0.0 [5]  。
- 2017年5月，Keras版本2.0.0发布。同年6月，Keras版本2.0.5测试性地将Microsoft-CNTK加入后台选项。自2017年起，Keras得到了Tensorflow团队的支持，其大部分组件被整合至Tensorflow的Python API中。
- 在2018年Tensorflow 2.0.0公开后，Keras被正式确立为Tensorflow高阶API，即tf.keras。tf.keras与keras开始同步发展。
- 在 2019 年 6 月谷歌发布 TensorFlow2.0时，他们宣布 Keras 现在是 TensorFlow 的官方高级 API，用于快速简单的模型设计和训练
- 在2019年9月17日Keras稳定版本2.3.0的更新文档中，Keras团队宣布了计划调整：在该版本之后，Keras将集中于Tensoflow后台的有关内容，多后台Keras的开发优先度被降低，且更新将仅包含补丁（bug fix），不会有新的功能性内容移植/加入。后续主要发展tf.keras。
- Keras的命名来自古希腊语“κέρας （牛角）”或 “κραίνω（实现）”，意为将梦境化为现实的“牛角之门。  
更多内容可参考[keras简介](https://baike.baidu.com/item/Keras/22792516)

<mark style=background-color:yellow>【keras切换到tf.keras】</mark>  
非常简单，无需修改其它代码，只要修改keras的导入方式即可。
把import keras 改为：from tensorflow import keras

<mark style=background-color:yellow>【keras的后端】</mark>   
为了训练你自己的自定义神经网络，Keras 需要一个后端。后端是一个计算引擎——它可以构建网络的图和拓扑结构，运行优化器，并执行具体的数字运算。要理解后端的概念，可以试想你需要从头开始构建一个网站。你可以使用 PHP 编程语言和 SQL 数据库。这个 SQL 数据库就是是后端。你可以使用 MySQL，PostgreSQL 或者 SQL Server 作为你的数据库；但是，用于与数据库交互的 PHP 代码是不会变的（当然，前提是使用某种可以封装数据库层的 MVC 范例）。从本质上讲，PHP 并不关心正在使用哪个数据库，只要它符合 PHP 的规则即可。
 Keras 也是如此。你可以把后台看作是你的数据库，Keras 是你用来访问数据库的编程语言。你可以把后端替换成任何你喜欢的后端，只要它遵守某些规则，你的代码就不需要更改。


<mark style=background-color:yellow>更多keras介绍请参考书中对应章节</mark>

###  17.6 keras的开发流程
利用Keras实现神经网络的一般流程为：  
第1步：构造数据：定义输入数据  
第2步：构造模型：确定各个变量之间的计算关系  
第3步：编译模型：编译已确定其内部细节  
第4步：训练模型：导入数据，训练模型  
第5步：测试模型  
第6步：保存模型  
把这些步骤可用下图表示：
![image.png](attachment:image.png)

### 17.7 实例-Keras程序的开发流程
#### 17.7.1 构造数据
我们需要根据模型fit（训练）时需要的数据格式来构造数据的shape，这里我们用numpy构造两个矩阵：一个是数据矩阵，一个是标签矩阵。   
通过numpy的random生成随机矩阵，数据矩阵是1000行784列的矩阵，标签矩阵是1000行1列的句子，所以数据矩阵的一行就是一个样本，这个样本是784维的。

In [1]:
import numpy as np
from keras.models import Sequential
from keras.layers import Dense, Activation
from keras.optimizers import Adam

x_train = np.random.random((1000, 784))
y_train = np.random.randint(2, size=(1000, 1))
x_test = np.random.random((200, 784))
y_test = np.random.randint(2, size=(200, 1))


Using TensorFlow backend.


#### 17.7.2 构造模型

我们来构造一个神经网络模型（具体结构如下图），keras构造深度学习模型可以采用序列模型（基于Sequential类）或函数模型（又称为通用模型）（基于Model类）。两种模型的差异是拓扑结构不一样。这里我们采用序列模型。
![image.png](attachment:image.png)


In [2]:
model = Sequential()
model.add(Dense(32, activation='relu', input_dim=784))
model.add(Dense(1, activation='sigmoid'))


#### 17.7.3编译模型
我们编译上一步构造好的模型，并指定一些模型的参数，optimizer（优化器），loss（目标函数或损失函数），metrics（评估模型的指标）等。编译模型时损失函数和优化器这两项是必须的。

In [3]:
model.compile(optimizer='Adam',loss='binary_crossentropy',metrics=['accuracy'])

#### 17.7.4训练模型
传入要训练的数据和标签，并指定训练的一些参数，然后进行模型训练。  
其中
epochs：整数，训练的轮数。  
verbose：训练时显示实时信息，0表示不显示数据，1表示显示进度条，2表示用只显示一个数据。  
batch_size：整数，指定进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降，使目标函数优化一步。


In [4]:
model.fit(x_train, y_train, epochs=10,verbose=2, batch_size=32,)

Epoch 1/10
 - 1s - loss: 0.7354 - accuracy: 0.4910
Epoch 2/10
 - 0s - loss: 0.6963 - accuracy: 0.5180
Epoch 3/10
 - 0s - loss: 0.6937 - accuracy: 0.5320
Epoch 4/10
 - 0s - loss: 0.6784 - accuracy: 0.5740
Epoch 5/10
 - 0s - loss: 0.6658 - accuracy: 0.6110
Epoch 6/10
 - 0s - loss: 0.6538 - accuracy: 0.6280
Epoch 7/10
 - 0s - loss: 0.6475 - accuracy: 0.6130
Epoch 8/10
 - 0s - loss: 0.6412 - accuracy: 0.6400
Epoch 9/10
 - 0s - loss: 0.6208 - accuracy: 0.6670
Epoch 10/10
 - 0s - loss: 0.5981 - accuracy: 0.7100


<keras.callbacks.callbacks.History at 0x109813c8>

#### 17.7.5测试模型
用测试数据测试已经训练好的模型，并可以获得测试结果，对模型进行评估

In [7]:
score = model.evaluate(x_test, y_test, batch_size=32)



In [8]:
print("模型准确率是:{}".format(score[1]*100))

模型准确率是:54.00000214576721


这个准确率不高，这里我们主要说明Keras的开发过程。

#### 17.7.6 保存模型
(1)查看模型结构

In [9]:
json_string = model.to_json()  
#从保存的json中加载模型  
from keras.models import model_from_json  
model_re = model_from_json(json_string)


In [10]:
model_re.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 32)                25120     
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 33        
Total params: 25,153
Trainable params: 25,153
Non-trainable params: 0
_________________________________________________________________


（2）保存模型

In [11]:
model.save('my_model.h5')   

（3）恢复模型

In [12]:
from keras.models import model_from_json,load_model
re_model = load_model('my_model.h5')

In [13]:
re_model.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 32)                25120     
_________________________________________________________________
dense_2 (Dense)              (None, 1)                 33        
Total params: 25,153
Trainable params: 25,153
Non-trainable params: 0
_________________________________________________________________


<mark style=background-color:red>延伸一下</mark>   
以上代码是使用keras，现在切换为tf.keras方式。切换tf.keras,只需要修改导入语句，其它代码不变。

（1）导入模块、生成数据

In [14]:
import numpy as np
#一般由from keras 改为from tensorflow.keras 即可
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Activation
from tensorflow.keras.optimizers import Adam

x_train = np.random.random((1000, 784))
y_train = np.random.randint(2, size=(1000, 1))
x_test = np.random.random((200, 784))
y_test = np.random.randint(2, size=(200, 1))

（2）构建模型

In [15]:
model = Sequential()
model.add(Dense(32, activation='relu', input_dim=784))
model.add(Dense(1, activation='sigmoid'))


（3）编译模型

In [16]:
model.compile(optimizer='Adam',loss='binary_crossentropy',metrics=['accuracy'])

（4）训练模型

In [17]:
model.fit(x_train, y_train, epochs=10,verbose=2, batch_size=32,)

Train on 1000 samples
Epoch 1/10
1000/1000 - 1s - loss: 0.7103 - accuracy: 0.4930
Epoch 2/10
1000/1000 - 0s - loss: 0.6957 - accuracy: 0.5100
Epoch 3/10
1000/1000 - 0s - loss: 0.6847 - accuracy: 0.5540
Epoch 4/10
1000/1000 - 0s - loss: 0.6782 - accuracy: 0.5850
Epoch 5/10
1000/1000 - 0s - loss: 0.6670 - accuracy: 0.6050
Epoch 6/10
1000/1000 - 0s - loss: 0.6635 - accuracy: 0.5960
Epoch 7/10
1000/1000 - 0s - loss: 0.6468 - accuracy: 0.6490
Epoch 8/10
1000/1000 - 0s - loss: 0.6346 - accuracy: 0.6790
Epoch 9/10
1000/1000 - 0s - loss: 0.6201 - accuracy: 0.7020
Epoch 10/10
1000/1000 - 0s - loss: 0.6079 - accuracy: 0.7000


<tensorflow.python.keras.callbacks.History at 0xfecf5c8>

（5）测试模型

In [18]:
#为了与上面的score区别开了，这里用score01变量表示
score01 = model.evaluate(x_test, y_test, batch_size=32)



In [19]:
print("模型准确率是:{}".format(score01[1]*100))

模型准确率是:50.0


In [6]:
(6)查看模型结构

In [20]:
json_string = model.to_json()  
#从保存的json中加载模型，同上，在keras前加上tensorflow.  
from tensorflow.keras.models import model_from_json  
model_re = model_from_json(json_string)

In [21]:
model_re.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 32)                25120     
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 33        
Total params: 25,153
Trainable params: 25,153
Non-trainable params: 0
_________________________________________________________________


(7)保存模型

In [22]:
#为区别，这里模型名称改为my_model01
model.save('my_model01.h5')  

(8)恢复模型

In [23]:
#同上，在keras前加上tensorflow.
from tensorflow.keras.models import model_from_json,load_model
re_model01 = load_model('my_model01.h5')
re_model01.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense (Dense)                (None, 32)                25120     
_________________________________________________________________
dense_1 (Dense)              (None, 1)                 33        
Total params: 25,153
Trainable params: 25,153
Non-trainable params: 0
_________________________________________________________________


由此可见，由keras切换为tensorflow.keras(或tf.keras）非常简单，只要修改一些导入方式，代码无需修改。