In [13]:
from keras.preprocessing.image import ImageDataGenerator, array_to_img, img_to_array, load_img
from keras.models import Sequential
from keras.layers import Conv2D, MaxPooling2D
from keras.layers import Activation, Dropout, Flatten, Dense
from keras import backend as K
import numpy as np

In [2]:
# Dimension des images du jeu de données
img_width, img_height = 150, 150

train_data_dir = 'data/train'
validation_data_dir = 'data/validation'
nb_train_samples = 2000
nb_validation_samples = 800
epochs = 50
batch_size = 16

## Augmentation du jeu de données
L'objectif de cette partie est d'augmenter la taille du jeu de données en effectuant des transformation sur les échantillons du jeu initial.

### Principe 

In [3]:
datagen = ImageDataGenerator(
    rotation_range=40, # On tourne l'image aléatoirement de 0 à 40°
    width_shift_range=0.2, # On fait une translation (sur la largeur) alétoire de 0 à 20% de la largeur de l'image
    height_shift_range=0.2, # Pareil mais sur la hauteur
    rescale=1./255, # Transforme le RGB(255) en RGB(1)
    shear_range=0.2, # Applique aléatoirement des transformations de shearing (transvection °_°)
    zoom_range=0.2, # Zoom aléatoire de maximum 20% du zoom initial
    horizontal_flip=True, # Fait aléatoirement un renversement horizontal de l'image
    fill_mode='nearest' # Type d'interpolation à appliquer pour les nouveaux pixels (qui sont créés lors des manipulations)
)

# Définie a manipulation à éffectuer sur l'image
img = load_img('data/train/cats/cat.0.jpg')
x = img_to_array(img)
x = x.reshape((1,) + x.shape)

# On applique c'est transformation au lot d'image
i= 0 
for batch in datagen.flow(x, batch_size=1, save_to_dir='preview', save_prefix='cat', save_format='jpeg'):
    i+=1
    if i > 20:
        break

### Utilisation pour le jeu de données

In [4]:
# L'augmentation pour le jeu d'entrainement
train_datagen = ImageDataGenerator(
    rescale=1. / 255,
    shear_range=0.2,
    zoom_range=0.2,
    horizontal_flip=True)

# L'augmentation pour le jeu de test
# On ne fait que changer les composantes des couleurs (255 => 1)
test_datagen = ImageDataGenerator(rescale=1. / 255) 

train_generator = train_datagen.flow_from_directory(
    train_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

validation_generator = test_datagen.flow_from_directory(
    validation_data_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

Found 25000 images belonging to 2 classes.
Found 25000 images belonging to 2 classes.


## Mise en place d'un modèle (convnet)
Todo : blabla

In [5]:
model = Sequential()
model.add(Conv2D(32, (3, 3), input_shape=(img_width, img_height, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))

# Le modèle produit des features en 3 dimensions (RGB, hauteur, largeur)

In [6]:
model.add(Flatten())  # Convertion des cara 3D en un vecteur 1D
model.add(Dense(64))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(1))
model.add(Activation('sigmoid'))

# Utilisation de la fonction de perte 'binary_crossentropy' => TODO
# Utilisation de l'algo d'optimisation 'rmsprop' => TODO 
# Utilisation de la metrique 'accuracy' => on mesure la précision (qu'il donne la bonne classe)
model.compile(loss='binary_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])b

## Entrainement du modèle

In [8]:
model.fit_generator(
    train_generator,
    steps_per_epoch=nb_train_samples // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=nb_validation_samples // batch_size)

model.save('cnn_model')

Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


### Test avec une image

In [26]:
# Chargement d'une image de test
test_img_path = "data/train/cats/cat.21.jpg"
test_img = load_img(test_img_path, target_size=(150, 150))
test_img_array = img_to_array(test_img)
test_img_array = np.expand_dims(test_img_array, axis = 0)

# Prédiction de la classe
predict = model.predict(test_img_array)
print(predict)
train_generator.class_indices

[[1.]]


{'cats': 0, 'dogs': 1}