## 模型API
- 查阅时应该找文档，这个只是为了减慢阅读速度的笔记

### Sequential模型和函数式模型的通用API

In [None]:
model.summary()#打印模型的概况
model.get_config()#返回包含模型配置信息的Python字典。

In [None]:
#模型也可以从它的config信息中重构回去
config = model.get_config()
model = Model.from_config(config)
#sequential独有：
model = Sequential.from_config(config)

In [None]:
model.get_layer() #根据层名或下标获得层对象
model.det_weights()  #模型权重列表，类型为np.ndarray
model.set_weights()  #从np.ndarray中载入权重--形状匹配
model.to_json()      #返回代表模型的JSON字符串，仅包含网络结构，不包含权值。
model.to_yaml()       #和json类似

In [None]:
#可以从JSON字符串中重构原模型：
from models import model_from_json

json_string = model.to_json()
model = model_from_json(json_string)

#yaml也是一样的
from models import model_from_yaml

yaml_string = model.to_yaml()
model = model_from_yaml(yaml_string)

In [None]:
model.save_weights(filepath) #保存权重文件，类型是HDF5(.h5)

In [None]:
"""
从HDF5文件中加载权重到当前模型中, 默认情况下模型的结构将保持不变。
如果想将权重载入不同的模型（有些层相同）中，则设置by_name=True，
只有名字匹配的层才会载入权重
"""
model.load_weights(filepath, by_name=False)

### Sequential模型API

In [None]:
model.layers  #获得模型中层的list

### 函数式模型
- [Link](http://keras-cn.readthedocs.io/en/latest/models/model/)

In [1]:
from keras.models import Model
from keras.layers import Input, Dense

a = Input(shape=(32,))
b = Dense(32)(a)
model = Model(inputs=a, outputs=b)

Using TensorFlow backend.


#### 属性

In [4]:
print(model.layers)
print(model.inputs)
print(model.outputs)

[<keras.engine.topology.InputLayer object at 0x000001C94C9CA710>, <keras.layers.core.Dense object at 0x000001C94C9CA4E0>]
[<tf.Tensor 'input_1:0' shape=(?, 32) dtype=float32>]
[<tf.Tensor 'dense_1/BiasAdd:0' shape=(?, 32) dtype=float32>]


#### 方法

##### [compile]()：编译模型以提供训练，只是predict的话，不需要
- 总体：
```python
compile(self, optimizer, loss, metrics=None, loss_weights=None, sample_weight_mode=None, weighted_metrics=None, target_tensors=None)
```
- 常见参数：
    - optimozer
    - loss
    - metrics 评估指标列表
        - 如果要在多输出模型中为**不同的输出指定不同的指标**，可像该参数传递一个字典，例如metrics={'ouput_a': 'accuracy'}

##### [fit]()：训练模型
- 总体：
```python
fit(self, x=None, y=None, batch_size=None, epochs=1, verbose=1, callbacks=None, validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None, initial_epoch=0, steps_per_epoch=None, validation_steps=None)
```
- 常见参数：
    - X
    - y
    - batch_size
    - epochs
    - verbose:日志
        - 0：不输出
        - 1：输出进度记录条
        - 2：输出每个epoch的记录--其他函数大多只能取0/1
    - validation_split:0~1之间的浮点数，用来指定训练集的一定比例数据作为验证集。验证集将不参与训练，并在每个epoch结束后测试的模型的指标，如损失函数、精确度等。
        - 注意，validation_split的划分在shuffle之后，因此如果你的数据本身是有序的，需要先手工打乱再指定validation_split，否则可能会出现验证集样本不均匀。
    - validation_data:(X, y),会覆盖validation_split
    - shuffle:**每个epoch**前随机打乱输入样本的顺序。

##### [evalute]():按batch计算给定数据的模型误差
- 总体：
```python
evaluate(self, x, y, batch_size=32, verbose=1, sample_weight=None)
```
- 参数：
    - X
    - Y
    - batch_size:
    - ver_bose:只能取0/1

##### [predict]():
- 返回的类型是ndarray
```python
predict(self, x, batch_size=32, verbose=0)
```

##### [xx_on_batch]()
- train/test/predict

## 损失函数

- 可以直接使用自己定义的函数名，或者是Tensorflow的符号函数
- 常用的目标函数：
```python
from keras import losses
loss = losses.xxx
```
    - mean_squared_error
    - mean_absolute_error
    - squared_hinge
    - categorical_crossentropy
    ...
- **注意：**在使用categorical_crossentropy作为损失函数时，对应类别应该为多类别，label应该使用one_hot编码，可以使用to_categorical直接转换

## Optimzer

In [None]:
from keraas import optimzers

sgd = optimzers.SGD(lr=0.001, decay=1e-6, momentum=0.9, nesterov=True)
model.compile(loss='mean_squared_error', optimzer=sgd)

##### 梯度剪裁
```python
from keras import optimizers

#All parameters gradients will be clipped to
#a maximun of 1.
sgd = optimzers.SGD(lr=0.001, clipnorm=1.)

#...
# a maximum value of 0.5 and
# a minimum value of -0.5.
sgd = optimzer.SGD(lr=0.1, clipvalue=0.5)
```

### 常用optimzer

#### TF优化器的包装器
```python
keras.optimizers.TFOptimizer(optimizer)
```

#### SGD
```python
keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)
```
- 参数
    - lr：
    - momentum
    - decay
    - nesterov:True or False

#### RMSprop
```python
keras.optimizers.RMSprop(lr=0.001, rho=0.9, epsilon=1e-06)
```
- 参数
    - lr
    - rho
    - epsilon：防止除0的参数

#### Adagrad
```python
keras.optimizers.Adagrad(lr=0.01, epsilon=1e-06)
```

#### 目前没用过的 Adadelte
```python
keras.optimizers.Adadelta(lr=1.0, rho=0.95, epsilon=1e-06)
```

#### Adam
```python
keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)
```

##### Adamax
- Adam的变体--在Adam论文里
```python
keras.optimizers.Adamax(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=1e-08)
```

#### Nadam
- Nesterov Adam optimizer: Adam本质上像是带有动量项的RMSprop，Nadam就是带有Nesterov 动量的Adam RMSprop
```python
keras.optimizers.Nadam(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=1e-08, schedule_decay=0.004)
```

## 激活函数
- 可以单独设置激活层或者在构造层的时候加入，或者用TF的函数
```python
#Activation层
keras.layers.core.Activation(activation)
```
- 预定义的激活函数(知道的)
    - softplus
    - relu
    - softmax
    - tanh
- 高级激活函数
    - LeaktReLU:避免ReLU可能出现的失活现象
```python
keras.layers.advanced_activations.LeakyReLU(alpha=0.3)
```
    - PReLU:参数化的ReLU,alpha可学习
```python
keras.layers.advanced_activations.PReLU(alpha_initializer='zeros', alpha_regularizer=None, alpha_constraint=None, shared_axes=None)
```
        - 参数：
            - alpha_constraint:**约束项？？**
            - shared_axes:共享参数的轴，比如输入tensor为`(batch_size,height,width,channels)`,如果希望每个filter都用相同的参数，只需要设置 `hared_axes=[1, 2]`
    - ELU层：指数线性单元
    ```python
    keras.layers.advanced_activations.ELU(alpha=1.0)
    ```
        - 表达式
```python
f(x) = alpha * (exp(x) - 1.) for x < 0, f(x) = x for x>=0
```
    - ThresholdedReLU层
    ```python
    keras.layers.advanced_activations.ThresholdedReLU(theta=1.0)
    ```
        - 表达式
        ```ptrhon
        f(x) = x for x > theta,f(x) = 0 otherwise
        ```

In [None]:
from keras import backend as K
#使用TF自带的函数作为激活函数
def tanh(x):
    return K.tanh(x)

X = Dense(64, activation=tanh)(X)

## 性能评估

##### 在上面有提过，模型编译时，通过metrics进行设置


In [None]:
from keras import metrics


model.compile(loss='mean_squared_error',
              optimizer='sgd',
              metrics=['mae', 'acc'])

model.compile(loss='mean_squared_error',
              optimizer='sgd',
              metrics=[metrics.mae, metrics.categorical_accuracy])


##### 自定义函数
- 输入
    > y_true  
     y_pred
- 返回
    > 返回单个张量,或从`metric_name`映射到`metric_value`的字典

In [None]:
import keras.backend as K

def mean_err(y_true, y_pred):
    return K.mean(y_pred -  y_true)

model.compile(optimizer='rmsprop',
              loss='binary_crossentropy',
              metrics=['mean_err', mean_pred])

## 初始化方法
- 正常对应设置中的`kernel_initializer`或者`bias_initializer`
- 使用对应初始化方法的字符串或者函数名
- 自定义估计目前没啥用

### Initializer类
- Initializer是所有初始化方法的父类，不能直接使用，如果想要定义自己的初始化方法，需要继承此类
- 常见方法：
```python
keras.initializers.Ones()
keras.initializers.Zeros()
keras.initializers.Constant(value=0)
#正态分布
keras.initializers.RandomNormal(mean=0.0, stddev=0.05, seed=None))
#均匀分布
keras.initializers.RandomUniform(minval=-0.05, maxval=0.05, seed=None)
#截尾正态分布:位于均值两边两个stddev外的数据会直接重新生成
keras.initializers.TruncatedNormal(mean=.0, stddev=0.005, seed=None)
#xavier初始化
'''
参数从[-limit, limit]范围内的均匀分布产生，limit=sqrt(6/fan_in+fan_out),fan_in,fan_out分别是输入，输出的权重张量的单元数
'''
keras.initializers.glorot_uniform(seed=None)
#...还有很多初始化方法
```