# keras的总览

In [24]:
from __future__ import absolute_import, division, print_function, unicode_literals

try:
  # %tensorflow_version only exists in Colab.
  %tensorflow_version 2.x
except Exception:
  pass
import tensorflow as tf

from tensorflow import keras

## Model与layer的简介

### stack of layers by Sequential
利用layer的堆叠来建立神经网络

In [2]:
from tensorflow.keras import layers

model = tf.keras.Sequential()
# Adds a densely-connected layer with 64 units to the model:
model.add(layers.Dense(64, activation='relu'))
# Add another:
model.add(layers.Dense(64, activation='relu'))
# Add a softmax layer with 10 output units:
model.add(layers.Dense(10, activation='softmax'))

### layer的功能介绍
layer自身也有很多选项，例如， activation，kernel_initializer, regularizer等

In [None]:
# Create a sigmoid layer:
layers.Dense(64, activation='sigmoid')
# Or:
layers.Dense(64, activation=tf.keras.activations.sigmoid)

# A linear layer with L1 regularization of factor 0.01 applied to the kernel matrix:
layers.Dense(64, kernel_regularizer=tf.keras.regularizers.l1(0.01))

# A linear layer with L2 regularization of factor 0.01 applied to the bias vector:
layers.Dense(64, bias_regularizer=tf.keras.regularizers.l2(0.01))

# A linear layer with a kernel initialized to a random orthogonal matrix:
layers.Dense(64, kernel_initializer='orthogonal')

# A linear layer with a bias vector initialized to 2.0s:
layers.Dense(64, bias_initializer=tf.keras.initializers.Constant(2.0))

## train and evaluate

### 堆叠模型
建立模型结构

In [3]:
model = tf.keras.Sequential([
# Adds a densely-connected layer with 64 units to the model:
layers.Dense(64, activation='relu', input_shape=(32,)),
# Add another:
layers.Dense(64, activation='relu'),
# Add a softmax layer with 10 output units:
layers.Dense(10, activation='softmax')])


### 编译模型
选择optimizer，loss function等。

In [6]:
model.compile(optimizer=tf.keras.optimizers.Adam(0.01),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

#### 其他的一些编译方法

### train ( model.fit ( ) )
建立并编译过后的模型就可以把数据和label放进去训练了

__最基本的train的方法__
1. data和label
2. 重复dataset的次数， epochs
3. 每次训练的数据集， batch_size

In [7]:
import numpy as np

data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

model.fit(data, labels, epochs=10, batch_size=32)

W0922 16:38:42.656823 4485526976 deprecation.py:323] From /Users/allen/anaconda3/lib/python3.7/site-packages/tensorflow/python/ops/math_grad.py:1250: add_dispatch_support.<locals>.wrapper (from tensorflow.python.ops.array_ops) is deprecated and will be removed in a future version.
Instructions for updating:
Use tf.where in 2.0, which has the same broadcast rule as np.where


Train on 1000 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x6329f2940>

#### 有validation的训练
validation 的作用是利用test_set 在训练的过程中就验证其预测的能力。

注意: 不管是acc 还是 loss，都是train_set的准确度的评价，和预测无关。

In [8]:
import numpy as np

data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

val_data = np.random.random((100, 32))
val_labels = np.random.random((100, 10))

model.fit(data, labels, epochs=10, batch_size=32,
          validation_data=(val_data, val_labels))

Train on 1000 samples, validate on 100 samples
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x10d5faa90>

### 用tf.Dataset的数据作为fit的数据的方法
我们既可以直接把初始的数据直接放在fit里面。也可以把Dataset类型的迭代器产生的数据放在fit里面。效果是一样的。而bitch size会以dataset的迭代器的bitch所决定。

In [16]:
# Instantiates a toy dataset instance:
dataset = tf.data.Dataset.from_tensor_slices((data, labels))
dataset = dataset.batch(32)

model.fit(dataset, epochs=10)

W0922 16:53:28.286640 4485526976 training_utils.py:1436] Expected a shuffled dataset but input dataset `x` is not shuffled. Please invoke `shuffle()` on input dataset.


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x63344d240>

validation也可以是Dataset类型的数据

In [17]:
dataset = tf.data.Dataset.from_tensor_slices((data, labels))
dataset = dataset.batch(32)

val_dataset = tf.data.Dataset.from_tensor_slices((val_data, val_labels))
val_dataset = val_dataset.batch(32)

model.fit(dataset, epochs=10,
          validation_data=val_dataset)

W0922 16:55:12.652235 4485526976 training_utils.py:1436] Expected a shuffled dataset but input dataset `x` is not shuffled. Please invoke `shuffle()` on input dataset.


Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x63344de80>

## Evaluate 
使用model.evaluate就可以轻松的完成评价。

evaluate()接受的数据同样，既可以是原始数据，又可以是Dateset的数据。

In [18]:
# With Numpy arrays
data = np.random.random((1000, 32))
labels = np.random.random((1000, 10))

model.evaluate(data, labels, batch_size=32)

# With a Dataset
dataset = tf.data.Dataset.from_tensor_slices((data, labels))
dataset = dataset.batch(32)

model.evaluate(dataset)



[11.405467629432678, 0.102]

## prediction
model.predict

In [20]:
result = model.predict(data, batch_size=32)
print(result.shape)

(1000, 10)


## Build complex models (keras的自定义）
1. 利用变量在神经网络层之间的传递，搭建神经网络的结构
2. 将搭建的层放在keras.Model里面
3. 一旦model完成，那么一切和之前将毫无差别。

#### 搭建结构
结构的搭建主要是利用变量的相互赋值来完成的！

In [21]:
#input层

#用keras.Input 类实例化一个inputs，其返回的是 相应个数的spaceholder,留给以后的input
inputs = tf.keras.Input(shape=(32,))


In [27]:
# hidden layer

#利用变量的赋值来传递数据流。
x = layers.Dense(64,activation = 'relu')(inputs)
x = layers.Dense(64,activation = 'relu')(x)

In [28]:
# 输出层

predictions = layers.Dense(10,activation = 'softmax')(x)

__建立模型__\
利用keras.Model()

In [32]:
model = tf.keras.Model(inputs = inputs, outputs = predictions)#建立model后，与之前就完全相同了

model.compile(optimizer = tf.keras.optimizers.RMSprop(0.001),
             loss = 'categorical_crossentropy',
             metrics = ['accuracy'])

__fit__

In [31]:
model.fit(data, labels, batch_size=32, epochs=5)

Train on 1000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x6335c6c50>

## 完全自定义的Keras model
我们可以利用对keras.Model的override来完成自定义model的方法！ 这种方法给予了更多的flexible。

Model主要是由两部分函数组成：
1. \__init__：在实例化的过程中就被定义好了且不能改的部分，主要包括：
    1. 输出的维度
    2. 层的结构（只是结构，没有数据的流通和衔接）
    

2. call：在调用的时候才运行，主要完成的任务：
    1. 读取到输入。
    2. 将层的结构都连接起来（通过变量的的传递）
    3. 返回神经网络输出的值。

In [33]:
class MyModel(tf.keras.Model):
    #定义model的初始化
    
    def __init__(self, num_classes =10):
        super(MyModel,self).__init__(name = 'my_model')#继承父类的全部init
        self.num_classes = num_classes#实例变量：输出的维度
        
        #define layers
        self.dense_1 = layers.Dense(32,activation='relu')
        self.dense_2 = layers.Dense(num_classes,activation = 'sigmoid')
        
        
    def call(self, inputs):
        #这个函数利用在init函数中已经定义好的结构来用来定义数据流的（通过参数的赋值）
        
        x = self.dense_1(inputs)
        x = self.dense_2(x)
        
        return x
        
        

#### 实例化自己建立的model
从这之后就没有区别了

In [34]:
model = MyModel(num_classes = 10)

In [35]:
#编译
model.compile(optimizer=tf.keras.optimizers.RMSprop(0.001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

In [36]:
model.fit(data, labels, batch_size=32, epochs=5)

Train on 1000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x633be8c88>

## 自定义层
之前我们通过自定义keras.Model()中的\__init__函数和call，完成了在model层面的自定义。在该部分中，我们将在layer的层面上实现自定义。

Layer的自定义主要由4个部分组成分别是：
1. \__init__:\
    其主要负责初始化一些在定值且不会改变的内容（output 的维度）
    
    
2. build()\
    一般用于定义layer的结构。因为layer需要有一定的flexiability，(input的维度最好不要是个定值，不然该层layer只能接收固定维度的input。
    
    这里要记得layer(kernel)，本质上是矩阵计算！！！！！因此你要定义的就是矩阵的类型即可！！
    

3. call()\
    一般用于定义kernel和input之间的计算关系。返回值是计算结果。
    

In [43]:
class MyLayer(layers.Layer):
    def __init__(self,output_dim,**kwargs):
        self.output_dim = output_dim
        super(MyLayer,self).__init__(**kwargs)
    
    #定义该层的结构
    #定义kernel的结构为 input的第二维度*output维度的变量矩阵。
    
    def build(self,input_shape):
        self.kernel = self.add_weight(name='kernel',
                                  shape=(input_shape[1], self.output_dim),
                                      #定义矩阵的维度。
                                  initializer='uniform',
                                  trainable=True)
    ##定义kernel和input的计算关系
    def call(self, inputs):
        return tf.matmul(inputs, self.kernel)
    
    def get_config(self):
        base_config = super(MyLayer, self).get_config()
        base_config['output_dim'] = self.output_dim
        return base_config
    
    @classmethod
    def from_config(cls, config):
        return cls(**config)
                                    
        

我们这就完成了一个layer的定义，这个layer将和你用到的keras的layer完全一样，可以放在keras里面直接用，也可以放在Model，定义一个自己的model

### 使用自定义layer

In [38]:
model = tf.keras.Sequential([
    MyLayer(10),#output 维度为10，
    layers.Activation('softmax')
    ])


model.compile(optimizer=tf.keras.optimizers.RMSprop(0.001),
              loss='categorical_crossentropy',
              metrics=['accuracy'])

# Trains for 5 epochs.
model.fit(data, labels, batch_size=32, epochs=5)

Train on 1000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x6338d4a58>

## keras model的保存与重载

In [48]:
model = tf.keras.Sequential([
  layers.Dense(10, activation='softmax', input_shape=(32,)),
  layers.Dense(10, activation='softmax')
])
model.compile(optimizer='rmsprop',
              loss='categorical_crossentropy',
              metrics=['accuracy'])
model.fit(data, labels, batch_size=32, epochs=5)


Train on 1000 samples
Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x6344ab5c0>

In [49]:
#一句话，就保存了全部的model部分。
model.save('my_model.h5')

In [50]:
# Recreate the exact same model, including weights and optimizer.

model = tf.keras.models.load_model('my_model.h5')