# keras.Model.fit_generator训练范例

## 实验目的    
* 掌握 keras.preprocessing.image.ImageDataGenerator图像数据生成器使用方法
* 掌握model.fit_generator 及 model.predict_generator进行训练与测试的方式方法
* 掌握callback使用方法
* 通过软链接输出预测结果，便于观察模型性能

## Tensorboard
    参考：https://blog.csdn.net/dugudaibo/article/details/77961836

    一、引入Tensorboard
        from keras.callbacks import TensorBoard

    二、设置fit回调函数，并设置日志目录
        model.fit(x_train, y_train,
              epochs=20,
              batch_size=128,
              callbacks=[TensorBoard(log_dir='tb/classes_mlp')])

    三、启动Tensorboard
        tensorboard --logdir=tb/classes_mlp

    四、浏览器打开Tensorboard
        http://localhost:6006


## 实验数据说明
    * 实验数据根目录：/to/path/img_classify
      ./train/class1/
      ......
      ./train/classN/
      ./valid/class1/
      ......
      ./valid/classN/
      ./test/class1/
      ......
      ./test/classN/
     
## 相关函数接口说明
### model.compile
compile
compile(self, optimizer, loss, metrics=[], loss_weights=None, sample_weight_mode=None)
本函数编译模型以供训练，参数有
* optimizer：优化器，为预定义优化器名或优化器对象，参考优化器
* loss：目标函数，为预定义损失函数名或一个目标函数，参考目标函数
* metrics：列表，包含评估模型在训练和测试时的性能的指标，典型用法是metrics=['accuracy']如果要在多输出模型中为不同的输出指定不同的指标，可像该参数传递一个字典，例如metrics={'ouput_a': 'accuracy'}
* sample_weight_mode：如果你需要按时间步为样本赋权（2D权矩阵），将该值设为“temporal”。默认为“None”，代表按样本赋权（1D权）。如果模型有多个输出，可以向该参数传入指定sample_weight_mode的字典或列表。在下面fit函数的解释中有相关的参考内容。
* kwargs：使用TensorFlow作为后端请忽略该参数，若使用Theano作为后端，kwargs的值将会传递给 K.function

【Tips】如果你只是载入模型并利用其predict，可以不用进行compile。在Keras中，compile主要完成损失函数和优化器的一些配置，是为训练服务的。predict会在内部进行符号函数的编译工作（通过调用_make_predict_function生成函数）【@白菜，@我是小将】

### model.fit
fit
fit(self, x, y, batch_size=32, nb_epoch=10, verbose=1, callbacks=[], validation_split=0.0, validation_data=None, shuffle=True, class_weight=None, sample_weight=None)
本函数用以训练模型，参数有：
*    x：输入数据。如果模型只有一个输入，那么x的类型是numpy array，如果模型有多个输入，那么x的类型应当为list，list的元素是对应于各个输入的numpy array。如果模型的每个输入都有名字，则可以传入一个字典，将输入名与其输入数据对应起来。
*    y：标签，numpy array。如果模型有多个输出，可以传入一个numpy array的list。如果模型的输出拥有名字，则可以传入一个字典，将输出名与其标签对应起来。
*    batch_size：整数，指定进行梯度下降时每个batch包含的样本数。训练时一个batch的样本会被计算一次梯度下降，使目标函数优化一步。
*    nb_epoch：整数，训练的轮数，训练数据将会被遍历nb_epoch次。Keras中nb开头的变量均为"number of"的意思
*    verbose：日志显示，0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个epoch输出一行记录
*    callbacks：list，其中的元素是keras.callbacks.Callback的对象。这个list中的回调函数将会在训练过程中的适当时机被调用，参考回调函数
*    validation_split：0~1之间的浮点数，用来指定训练集的一定比例数据作为验证集。验证集将不参与训练，并在每个epoch结束后测试的模型的指标，如损失函数、精确度等。
*    validation_data：形式为（X，y）或（X，y，sample_weights）的tuple，是指定的验证集。此参数将覆盖validation_spilt。
*    shuffle：布尔值，表示是否在训练过程中每个epoch前随机打乱输入样本的顺序。
*    class_weight：字典，将不同的类别映射为不同的权值，该参数用来在训练过程中调整损失函数（只能用于训练）。该参数在处理非平衡的训练数据（某些类的训练样本数很少）时，可以使得损失函数对样本数不足的数据更加关注。
*    sample_weight：权值的numpy array，用于在训练时调整损失函数（仅用于训练）。可以传递一个1D的与样本等长的向量用于对样本进行1对1的加权，或者在面对时序数据时，传递一个的形式为（samples，sequence_length）的矩阵来为每个时间步上的样本赋不同的权。这种情况下请确定在编译模型时添加了sample_weight_mode='temporal'。

fit函数返回一个History的对象，其History.history属性记录了损失函数和其他指标的数值随epoch变化的情况，如果有验证集的话，也包含了验证集的这些指标变化情况

### model.fit_generator
fit_generator
fit_generator(self, generator, samples_per_epoch, nb_epoch, verbose=1, callbacks=[], validation_data=None, nb_val_samples=None, class_weight={}, max_q_size=10)

利用Python的生成器，逐个生成数据的batch并进行训练。生成器与模型将并行执行以提高效率。例如，该函数允许我们在CPU上进行实时的数据提升，同时在GPU上进行模型训练

函数的参数是：
*    generator：生成器函数，生成器的输出应该为：
        一个形如（inputs，targets）的tuple
        一个形如（inputs, targets,sample_weight）的tuple。所有的返回值都应该包含相同数目的样本。生成器将无限在数据集上循环。每个epoch以经过模型的样本数达到samples_per_epoch时，记一个epoch结束
*    samples_per_epoch：整数，当模型处理的样本达到此数目时计一个epoch结束，执行下一个epoch
*    verbose：日志显示，0为不在标准输出流输出日志信息，1为输出进度条记录，2为每个epoch输出一行记录
*    validation_data：具有以下三种形式之一
        生成验证集的生成器
        一个形如（inputs,targets）的tuple
        一个形如（inputs,targets，sample_weights）的tuple
*    nb_val_samples：仅当validation_data是生成器时使用，用以限制在每个epoch结束时用来验证模型的验证集样本数，功能类似于samples_per_epoch
*    max_q_size：生成器队列的最大容量

函数返回一个History对象

例子

def generate_arrays_from_file(path):
    while 1:
    f = open(path)
    for line in f:
        # create numpy arrays of input data
        # and labels, from each line in the file
        x, y = process_line(line)
        yield (x, y)
    f.close()

model.fit_generator(generate_arrays_from_file('/my_file.txt'),
        samples_per_epoch=10000, nb_epoch=10)


### model.evaluate
evaluate
evaluate(self, x, y, batch_size=32, verbose=1, sample_weight=None)
本函数按batch计算在某些输入数据上模型的误差，其参数有：
*    x：输入数据，与fit一样，是numpy array或numpy array的list
*    y：标签，numpy array
*    batch_size：整数，含义同fit的同名参数
*    verbose：含义同fit的同名参数，但只能取0或1
*    sample_weight：numpy array，含义同fit的同名参数

本函数返回一个测试误差的标量值（如果模型没有其他评价指标），或一个标量的list（如果模型还有其他的评价指标）。model.metrics_names将给出list中各个值的含义。

如果没有特殊说明，以下函数的参数均保持与fit的同名参数相同的含义

如果没有特殊说明，以下函数的verbose参数（如果有）均只能取0或1

### model.evaluate_generator
evaluate_generator
evaluate_generator(self, generator, val_samples, max_q_size=10)

本函数使用一个生成器作为数据源，来评估模型，生成器应返回与test_on_batch的输入数据相同类型的数据。

函数的参数是：
*    generator：生成输入batch数据的生成器
*    val_samples：生成器应该返回的总样本数
*    max_q_size：生成器队列的最大容量
*    nb_worker：使用基于进程的多线程处理时的进程数
*    pickle_safe：若设置为True，则使用基于进程的线程。注意因为它的实现依赖于多进程处理，不可传递不可pickle的参数到生成器中，因为它们不能轻易的传递到子进程中。


### model.predict
predict
predict(self, x, batch_size=32, verbose=0)
本函数按batch获得输入数据对应的输出，其参数有：
函数的返回值是预测值的numpy array

### model.predict_generator
predict_generator
predict_generator(self, generator, val_samples, max_q_size=10, nb_worker=1, pickle_safe=False)

从一个生成器上获取数据并进行预测，生成器应返回与predict_on_batch输入类似的数据

函数的参数是：
*    generator：生成输入batch数据的生成器
*    val_samples：生成器应该返回的总样本数
*    max_q_size：生成器队列的最大容量
*    nb_worker：使用基于进程的多线程处理时的进程数
*    pickle_safe：若设置为True，则使用基于进程的线程。注意因为它的实现依赖于多进程处理，不可传递不可pickle的参数到生成器中，因为它们不能轻易的传递到子进程中。



## 参考资料
visualization of filters keras 基于Keras的卷积神经网络（CNN）可视化

http://www.cnblogs.com/bnuvincent/p/9612686.html

python深度学习{eep learning with python中文版.pdf}源码

https://github.com/fchollet/deep-learning-with-python-notebooks

数据下载：

https://www.kaggle.com/c/dogs-vs-cats/data

本地数据

~/e/dataset_tiptical/cats_and_dogs


In [1]:
%matplotlib inline

import os
import numpy as np
import cv2
import matplotlib.pyplot as plt
import tensorflow as tf
import keras
from keras.preprocessing.image import ImageDataGenerator
import keras.backend as K

Using TensorFlow backend.


## 参数设置

In [2]:
import os

data_path='%s/work/data/gtest/classify'%os.getenv('HOME')#数据目录
train_dir='%s/train'%data_path    #训练目录
valid_dir='%s/valid'%data_path    #校验目录
test_dir ='%s/test'%data_path     #测试目录

out_dir  ='%s/work/temp/fit_generator'%os.getenv('HOME')   #输出目录
log_dir  ='%s/log_dir'%out_dir    #输出日志目录
preds_dir='%s/predicts'%out_dir   #预测结果
cp_file='%s/cp_file.h5'%out_dir   #训练断点
model_file='%s/model.h5'%out_dir  #模型文件

input_shape=(224,224,3)
target_size=(224,224)
epochs=3
num_class=10
batch_size=32

## 数据生成器

In [3]:
from keras.preprocessing.image import ImageDataGenerator
import keras.backend as K

#构造图像数据生成器:train
gen_train = ImageDataGenerator(
        featurewise_center           =False,
        samplewise_center            =False,
        featurewise_std_normalization=False,
        samplewise_std_normalization =False,
        zca_whitening                =False,
        zca_epsilon                  =1e-6,
        rotation_range               =0.,
        width_shift_range            =0.,
        height_shift_range           =0.,
        shear_range                  =0.,
        zoom_range                   =0.,
        channel_shift_range          =0.,
        fill_mode                    ='nearest',
        cval                         =0.,
        horizontal_flip              =False,
        vertical_flip                =False,
        rescale                      =1./255,
        preprocessing_function       =None,
        data_format                  =K.image_data_format()
       )
data_train=gen_train.flow_from_directory(directory='%s/train'%(data_path)
                                         ,batch_size=batch_size
                                         ,target_size=target_size)
#构造图像数据生成器:valid
gen_valid = ImageDataGenerator(
        featurewise_center           =False,
        samplewise_center            =False,
        featurewise_std_normalization=False,
        samplewise_std_normalization =False,
        zca_whitening                =False,
        zca_epsilon                  =1e-6,
        rotation_range               =0.,
        width_shift_range            =0.,
        height_shift_range           =0.,
        shear_range                  =0.,
        zoom_range                   =0.,
        channel_shift_range          =0.,
        fill_mode                    ='nearest',
        cval                         =0.,
        horizontal_flip              =False,
        vertical_flip                =False,
        rescale                      =1./255,
        preprocessing_function       =None,
        data_format                  =K.image_data_format()
       )
data_valid=gen_valid.flow_from_directory(directory='%s/valid'%(data_path)
                                         ,batch_size=batch_size
                                         ,target_size=target_size)

#构造图像数据生成器:test
gen_test = ImageDataGenerator(
        featurewise_center           =False,
        samplewise_center            =False,
        featurewise_std_normalization=False,
        samplewise_std_normalization =False,
        zca_whitening                =False,
        zca_epsilon                  =1e-6,
        rotation_range               =0.,
        width_shift_range            =0.,
        height_shift_range           =0.,
        shear_range                  =0.,
        zoom_range                   =0.,
        channel_shift_range          =0.,
        fill_mode                    ='nearest',
        cval                         =0.,
        horizontal_flip              =False,
        vertical_flip                =False,
        rescale                      =1./255,
        preprocessing_function       =None,
        data_format                  =K.image_data_format()
       )
data_test=gen_test.flow_from_directory(directory='%s/test'%(data_path)
                                       ,batch_size=batch_size
                                       ,shuffle=False                                       
                                       ,target_size=target_size)

Found 1000 images belonging to 10 classes.
Found 1000 images belonging to 10 classes.
Found 1000 images belonging to 10 classes.


In [4]:
#data_test.filenames
print(data_test.class_indices)
print(data_test.classes)

{'poly8': 8, 'poly9': 9, 'poly4': 4, 'line': 2, 'poly5': 5, 'ellipse': 1, 'poly6': 6, 'poly7': 7, 'circle': 0, 'poly3': 3}
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4
 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4

## 网络创建

In [5]:
from keras import models,layers,optimizers

model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu',input_shape=input_shape,name='conv2d_1'))
model.add(layers.MaxPooling2D((2, 2),name='max_pooling2d_1'))
model.add(layers.Flatten(name='flatten_1'))
model.add(layers.Dense(512, activation='relu',name='dense_1'))
model.add(layers.Dense(num_class, activation='softmax',name='dense_2'))

#打印模型
model.summary()

#模型编译
model.compile(loss='categorical_crossentropy',
          optimizer=optimizers.RMSprop(lr=1e-4),
          metrics=['acc'])    

_________________________________________________________________
Layer (type)                 Output Shape              Param #   
conv2d_1 (Conv2D)            (None, 222, 222, 32)      896       
_________________________________________________________________
max_pooling2d_1 (MaxPooling2 (None, 111, 111, 32)      0         
_________________________________________________________________
flatten_1 (Flatten)          (None, 394272)            0         
_________________________________________________________________
dense_1 (Dense)              (None, 512)               201867776 
_________________________________________________________________
dense_2 (Dense)              (None, 10)                5130      
Total params: 201,873,802
Trainable params: 201,873,802
Non-trainable params: 0
_________________________________________________________________


## 网路训练

In [6]:
#模型训练
print('training beginning ......')

#断点加载
if os.path.exists(cp_file):
    model.load_weights(cp_file)
            
#断点训练:monitor监控参数可以通过score = model.evaluate(x_test, y_test, verbose=0)的score查询
checkpoint_cb = keras.callbacks.ModelCheckpoint(cp_file, monitor='val_acc', verbose=1, save_best_only=True, mode='auto',period=2)
#EarlyStopping
earlyStopping_cb=keras.callbacks.EarlyStopping(monitor='acc', patience=3, verbose=0, mode='max')
#TensorBoard
tensorBoard_cb=keras.callbacks.TensorBoard(log_dir=log_dir)
#回调函数序列
callbacks_list = [checkpoint_cb,earlyStopping_cb,tensorBoard_cb]

#模型训练
history = model.fit_generator(
  data_train,
  steps_per_epoch=np.ceil(data_train.samples/batch_size),
  epochs=epochs,
  validation_data=data_valid,
  validation_steps=50,
  callbacks=callbacks_list)
print('history:',history.history)

#保存模型
model.save(model_file)

training beginning ......
Epoch 1/3
Epoch 2/3

Epoch 00002: val_acc improved from -inf to 0.48711, saving model to /home/hjw/work/temp/fit_generator/cp_file.h5
Epoch 3/3
history: {'acc': [0.649, 0.784, 0.856], 'val_acc': [0.4784263959390863, 0.48711340206185566, 0.5291878172588832], 'val_loss': [1.707866078100834, 1.680048615662093, 1.6218553860175429], 'loss': [1.1472428169250488, 0.7046870613098144, 0.5008905379772186]}


## 网络测试

In [7]:
from mylibs.predicts_to_symlink import predicts_to_symlink
#计算精度
def compute_acc(y_pred,y_true):
    acc=(y_pred-y_true)==0
    return acc.sum()/acc.size

#加载模型
model.load_weights(model_file)

#模型测试
print('predicting beginning ......')
#type(y_pred)=> <class 'numpy.ndarray'>
y_pred=model.predict_generator(
    data_test, 
    steps=None, #预测轮数
    max_queue_size=32, 
    workers=1, 
    use_multiprocessing=False, 
    verbose=1)

#输出软链接目录
predicts_to_symlink(y_pred,test_dir,preds_dir,data_test)

#准确率计算
acc=compute_acc(np.argmax(y_pred,axis=1),data_test.classes)
print('samples:',data_test.samples)
print('classes[:2]:')
print(data_test.classes[:2])
print('y_pred.shape:',y_pred.shape)
print('y_pred[:2]:')
print(y_pred[:2])
print('准确率:',acc)

predicting beginning ......
samples: 1000
classes[:2]:
[0 0]
y_pred.shape: (1000, 10)
y_pred[:2]:
[[6.65797174e-01 2.20608730e-02 4.46087142e-05 1.65605758e-04
  2.87782121e-03 2.01697554e-02 1.03531443e-02 3.24518420e-02
  2.24697292e-01 2.13818196e-02]
 [2.37327412e-01 1.07521348e-01 1.31195784e-02 1.15222586e-02
  8.71749781e-03 9.05097872e-02 2.52631634e-01 1.23366654e-01
  2.23483387e-02 1.32935420e-01]]
准确率: 0.499
