In [None]:
'''
使用的数据可以从以下网址下载：
https://www.kaggle.com/c/dogs-vs-cats/data
在我们的设置中，我们：
- 创建一个 data/ 文件夹
- 在 data/ 里面 创建 train/ and validation/ 子文件夹
- 在 train/ 和 validation/ 里面 创建 cats/ and dogs/ 子文件夹
- 将猫图片索引0-999放入data/train/cats中
- 将猫图片索引1000-1400放在data/validation/cats中
- 把狗图片索引12500-13499放在data/train/dogs中
- 将狗图片索引13500-13900放在data/validation/dogs中
因此，我们每个类有1000个训练范例，每个类有400个验证范例。
总之，这是我们的目录结构：
```
data/
    train/
        dogs/
            dog001.jpg
            dog002.jpg
            ...
        cats/
            cat001.jpg
            cat002.jpg
            ...
    validation/
        dogs/
            dog001.jpg
            dog002.jpg
            ...
        cats/
            cat001.jpg
            cat002.jpg
            ...
```
'''

from keras import applications
from keras.preprocessing.image import ImageDataGenerator
from keras import optimizers
from keras.models import Sequential
from keras.layers import Dropout, Flatten, Dense

# 我们的图像的尺寸。
img_width, img_height = 150, 150

train_data_dir = 'data/train'
validation_data_dir = 'data/validation'
nb_train_samples = 2000
nb_validation_samples = 800
epochs = 50
batch_size = 16

# 构建VGG16网络

base_model = applications.VGG16(weights='imagenet',
                                include_top=False,
                                input_shape=(img_width, img_height, 3))
print('Model loaded.')

# 在卷积模型的基础上建立分类器模型
top_model = Sequential()
top_model.add(Flatten(input_shape=base_model.output_shape[1:]))
top_model.add(Dense(256, activation='relu'))
top_model.add(Dropout(0.5))
top_model.add(Dense(1, activation='sigmoid'))

# 注意，为了成功地进行微调，有必要从一个完全训练的分类器开始，包括顶级分类器

# 在基础卷积上加上模型
model = Sequential()
model.add(base_model)
model.add(top_model)
# 设置前25层（直到最后一个conv块）
# 不可训练（重量不更新）
for layer in model.layers[:25]:
    layer.trainable = False

# 用SGD/momentum优化器和非常慢的学习速度编译模型。
model.compile(loss='binary_crossentropy',
              optimizer=optimizers.SGD(lr=1e-4, momentum=0.9),
              metrics=['accuracy'])

# 准备数据扩充配置
train_datagen = ImageDataGenerator(rescale=1. / 255,
                                   shear_range=0.2,
                                   zoom_range=0.2,
                                   horizontal_flip=True)

test_datagen = ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(train_data_dir,
                                                    target_size=(img_height,
                                                                 img_width),
                                                    batch_size=batch_size,
                                                    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='binary')

# 微调模型
model.fit_generator(train_generator,
                    samples_per_epoch=nb_train_samples,
                    epochs=epochs,
                    validation_data=validation_generator,
                    nb_val_samples=nb_validation_samples)
model.save_weights('try_2.h5')