# Projet DeepLearning Benjelloun Adam - CIFAR-10 Dataset

Le dataset CIFAR-10 est un ensemble de 60 000 images de couleur de dimensions 32x32 réparties en 10 classes : avion, voiture, oiseau, chat, cerf, chien, grenouille, cheval, bateau et camion. Au total, il y a 6000 images par classe. Le dataset est divisé en 2 : 50000 images composent le jeu de données d'entraînement et 10000 le jeu de test. Nous utiliserons la librairie Keras avec un support TensorFlow.
Voici un exemple des images qui composent le jeu de données.
<img src='images_presentations\cifar-10.png'>

Nous importons le dataset, les différents modules Keras dont nous aurons besoin ainsi qu'un module de visualisation. Nous définissons également le nombre d'epochs ainsi que la taille d'un batch. 

In [None]:
from keras.datasets import cifar10
from keras.models import Sequential
from keras.layers import Dense, Dropout, Activation, Flatten
from keras.layers import Convolution2D
from IPython.display import SVG
from keras.utils.visualize_util import model_to_dot
from keras.utils import np_utils

nb_epoch = 200
batch_size = 32
nb_classes = 10

(X_train, y_train), (X_test, y_test) = cifar10.load_data()

## Modèle standard
Nous allons ici entraîner un réseau de neurones standard. Pour cela, il nous faut transformer les données qui sont en 32x32x3 (hauteur, largeur, dimensions=3 car ce sont des images RGB).

In [None]:
X_train = X_train.reshape(50000, 3072)#33*33*3 = 3072
X_test = X_test.reshape(10000, 3072)
print('X_train shape:', X_train.shape)
print(X_train.shape[0], 'train samples')
print(X_test.shape[0], 'test samples')

Y_train = np_utils.to_categorical(y_train, nb_classes)
Y_test = np_utils.to_categorical(y_test, nb_classes)

modeleStandard = Sequential()
modeleStandard.add(Dense(2048, input_shape=(3072, )))
modeleStandard.add(Activation('relu'))
modeleStandard.add(Dense(1024))
modeleStandard.add(Activation('relu'))
modeleStandard.add(Dropout(0.5))
modeleStandard.add(Dense(512))
modeleStandard.add(Activation('relu'))
modeleStandard.add(Dense(256))
modeleStandard.add(Activation('relu'))
modeleStandard.add(Dense(nb_classes))
modeleStandard.add(Activation('softmax'))

Voici une représentation du réseau utilisé.

In [None]:
SVG(model_to_dot(modeleStandard).create(prog='dot', format='svg'))

In [None]:
modeleStandard.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

X_train = X_train.astype('float32')
X_test = X_test.astype('float32')
X_train /= 255
X_test /= 255

modeleStandard.fit(X_train, Y_train, batch_size=batch_size,
          nb_epoch=nb_epoch, validation_data=(X_test, Y_test),
          shuffle=True)

score = modeleStandard.evaluate(X_test, Y_test, verbose=0)

### Résultats

Le modèle standard n'est absolument pas concluant. Son entraînement prend un temps considérable. La modification des couches apporte peu de changements.

In [None]:
print('Test score:', score[0])
print('Test accuracy:', score[1])

## Modèle à convolution

Les réseaux de neurones à convolution arrangent les neurones sur 3 dimensions, ils prennent en compte le fait que les données d'entrée soient des images. Afin de mieux visualiser la différence, voici un exemple de réseau standard et un exemple de réseau à convolution.

<img src='images_presentations\standard.jpeg'>
<img src='images_presentations\cnn.jpeg'>

In [None]:
(X_train, y_train), (X_test, y_test) = cifar10.load_data()

modeleCnn = Sequential()
modeleCnn.add(Convolution2D(32, 3, 3, border_mode='same',
                        input_shape=X_train.shape[1:]))
modeleCnn.add(Activation('relu'))
modeleCnn.add(Convolution2D(32, 3, 3))
modeleCnn.add(Activation('relu'))

modeleCnn.add(Flatten())
modeleCnn.add(Dense(512))
modeleCnn.add(Activation('relu'))
modeleCnn.add(Dropout(0.5))
modeleCnn.add(Dense(nb_classes))
modeleCnn.add(Activation('relu'))

model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

modeleCnn.fit(X_train, Y_train, batch_size=batch_size,
          nb_epoch=nb_epoch, validation_data=(X_test, Y_test),
          shuffle=True)

### Résultats

Le réseau à convolution semble prendre moins de temps. Il est également plus performant.

In [None]:
score = modeleCnn.evaluate(X_test, Y_test, verbose=0)

print('Test score:', score[0])
print('Test accuracy:', score[1])