In [None]:
#!pip install tensorflow==2.7.0
#!pip uninstall pydot
#!pip uninstall pydotplus
#!pip uninstall graphviz

#!pip install pydot
#!pip install pydotplus
#!conda install -c anaconda graphviz

# Sequential API

## Exemple 1

In [None]:
from numpy import loadtxt
from keras.models import Sequential
from keras.layers import Dense

In [None]:
# on charge les données
dataset = loadtxt('data.csv', delimiter=',')

# split input et output
X = dataset[:,0:8]
y = dataset[:,8]

Déscription du dataset : https://raw.githubusercontent.com/jbrownlee/Datasets/master/pima-indians-diabetes.names

In [None]:
# définition du modèle
model = Sequential()
model.add(Dense(12, input_dim=###, activation='relu'))
model.add(Dense(8, activation='relu'))
model.add(Dense(###, activation='sigmoid'))

In [None]:
# on compile le modèle
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# on entraîne le modèle avec nos données
model.fit(X, y, epochs=150, batch_size=10)

In [None]:
# évaluation du modèle
_, accuracy = model.evaluate(X, y)
print('Accuracy: %.2f' % (accuracy*100))

In [None]:
# on calcule les probabilités
predictions = model.predict(X)

# on fait des prévisions avec ces probabilités
predictions = (model.predict(X) > 0.5).astype(int)

In [None]:
# résumé des 5 premiers exemples
for i in range(5):
    print('%s => %d (expected %d)' % (X[i].tolist(), predictions[i], y[i]))

## Exemple 2

In [None]:
from keras.datasets import mnist
from keras.layers import Dropout, Flatten

In [None]:
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0

In [None]:
model = Sequential([
  Flatten(input_shape=(###, ###)),
  Dense(###, activation=###),
  Dropout(###),
  Dense(###)
])

In [None]:
predictions = model(x_train[:1]).numpy()
predictions

# Functional API

L'API "Functional" de Keras est plus flexible dans la définition des modèles.

Plus spécifiquement, il nous permet de définir des modèles avec des "inputs" ou "outputs" multiples, ainsi que des modèles qui partagent des couches ("shared layers").

Les modèles sont définis en créant les couches et en les connectant directement entre elles. Ensuite, on définit un modèle et on spécifie les couches qui seront utilisés comme "input" et "output".

In [None]:
from keras.layers import Input, Dense
from keras.models import Model

## La définition des inputs
Différement du modéle Sequential, on doit créer et définir une couche "Input" pour spécifier le format des données d'entrée.
Pour définir ce format, on fournie un tuple à la couche d'entrée.

Quand les données d'entrée sont multidimensionnelles, comme pour un Perceptron multi-couches, le format doit explicitement laisser de l'espace pour la taille du mini-batch, utilisé pour splitter les données lors de l'entraînement. Ainsi, le tuple est toujours défini avec une dérnière dimension vide quand l'input est uni-dimensionnel. Par exemple, (2,).

In [None]:
visible = Input(shape=(###,))

## La connéction des couches
Les couches sont connectées par paires.

Cela est fait en spécifiant l'origine de l'input dès que l'on définit une nouvelle couche.

Regardons un petit exemple. Nous créons l'input comme on l'a fait dans l'exemple précedent, et ensuite on crée une couche cachée en utilisant Dense, qui reçoit l'input de la couche input.

In [None]:
visible = ###(shape=(###,))
hidden = ###(2)(###)

## La création du modèle
Après avoir crée les couches du modèle et les avoir connectées, il faut définir le modèle.

Dans Keras, il existe une classe "Model", utilisé pour créer un modèle à partir des couches. Il faut spécifier uniquement les couches d'entrée et de sortie.

In [None]:
visible = ###(shape=(###,))
hidden = ###(2)(###)
model = Model(inputs=###, outputs=###)
print(model.summary())

## Standard Network Models

### Multilayer Perceptron
Regardons un modèle du type "Multilayer Perceptron" pour faire de la classification binaire.

Le modèle a 10 inputs, 3 couches cachées avec 10, 20 e 10 neurons, et une couche de sorte avec 1 output. 

Pour chaque couche cachée, on utilise un fonction d'activation du type "Unité Linéaire Rectifiée" (ou ReLU), et une fonction d'activation du type "Sigmoid" pour la sortie.

In [None]:
from keras.utils.vis_utils import plot_model

visible = Input(shape=(###,))
hidden1 = ###(###, activation='relu')(###)
hidden2 = ###(###, activation='relu')(###)
hidden3 = ###(###, activation='relu')(###)
output = ###(###, activation='###')(###)
model = Model(inputs=###, outputs=###)

# summary du modèle
print(model.summary())

# graph
plot_model(model, to_file='img/multilayer_perceptron_graph.png')

### CNN
Les CNN, ou réseaux de neurones convolutifs sont plus souvent utilisés pour la classification d'images.

Le modèle prend en entrée des images en noir et blanc, de 64x64, et a une séquence de 2 couches convolutives et 2 couches de "pooling" pour l'extraction des features, suivies par une couche "fully-connected" (Dense) pour interpréter ces couches et une couche de sortie avec un fonction d'activation du type "sigmoid" pour une classification binaire.

In [None]:
from keras.layers.convolutional import Conv2D
from keras.layers.pooling import MaxPooling2D
from keras.layers import Flatten

visible = Input(shape=(###,###,1))
conv1 = Conv2D(32, kernel_size=4, activation='relu')(visible)
pool1 = MaxPooling2D(pool_size=(2, 2))(###)
conv2 = Conv2D(16, kernel_size=4, activation='relu')(###)
pool2 = MaxPooling2D(pool_size=(2, 2))(###)
flat = Flatten()(###)
hidden1 = Dense(###, activation='relu')(###)
output = Dense(###, activation='sigmoid')(###)
model = Model(inputs=###, outputs=###)

# summary du modèle
print(model.summary())

# graph
plot_model(model, to_file='img/convolutional_neural_network.png')

### RNN
Maintenant, nous alons créer un réseau de neurones récurrents du type LSTM (Long Short-Term Memory), pour classifier des séquences.

Le modèle prend en entrée 100 steps d'une même feature. Le modèle a une seule couche LSTM cachée pour extraire des features de la séquence, suivie par une couche du type "fully connected" pour interpréter la sortie de la LSTM, suivie par une couhce de sortie pour des prédictions binaires.

In [None]:
from keras.layers.recurrent import LSTM

visible = Input(shape=(###,1))
hidden1 = LSTM(###)(###)
hidden2 = Dense(###, activation='###')(###)
output = Dense(1, activation='###')(###)
model = Model(inputs=###, outputs=###)

# summary du modèle
print(model.summary())
              
# graph
plot_model(model, to_file='img/recurrent_neural_network.png')

### Shared Layers Model
Plusieurs couches peuvent partager la sortie d'une couche.

Par exemple, on peut avoir plusieurs couches d'extraction de features d'un même input, ou plusieurs couches pour interpréter la sortue d'une couche d'extraction de features.

Regardons ces 2 exemples plus en détail.

#### Shared input layer
Nous alons créer plusieurs couches de convolution avec des kernels de différentes tailles pour interpréter un image.

Le modèle prend des images en noir & blanc, et 64x64 pixels. Il y a 2 sub-modèles du type CNN d'extraction de features qui partagent cet input; le premier a un kernel de taille 4 et le 2ème un kernel de taille 8. Les sorties de ces submodèles d'extraction de features sont applatis en vecteurs et concatenés pour former un long vecteur, et après sont utilisés par une couche du type "fully connected" pour être interpretés avant qu'une couche finale de sortie fasse une classification binaire.

In [None]:
from keras.layers.merge import concatenate

# input layer
visible = ###(shape=(###,###,1))

# 1er feature extractor
conv1 = Conv2D(32, kernel_size=###, activation='relu')(visible)
pool1 = MaxPooling2D(pool_size=(2, 2))(conv1)
flat1 = Flatten()(pool1)

# 2ème feature extractor
conv2 = Conv2D(16, kernel_size=###, activation='relu')(visible)
pool2 = MaxPooling2D(pool_size=(2, 2))(conv2)
flat2 = Flatten()(pool2)

# concatenation des "feature extractors"
merge = concatenate([###, ###])

# couche d'interprétation
hidden1 = Dense(###, activation='relu')(###)

# output
output = Dense(###, activation='###')(hidden1)
model = ###(inputs=###, outputs=###)

# summary du modèle
print(model.summary())

# graph
plot_model(model, to_file='img/shared_input_layer.png')

#### Shared Feature Extraction Layer
Nous allons créer 2 sub-modèles parallels pour interpréter la sortie d'un extracteur de features, pour faire une classification de séquences.

L'input du modèle est composé par 100 "time steps" d'une feature. Une couche LSTM avec 10 célules de mémore interprète cette séquence. Le premier modèle d'interprétation est une couche du type "fully connected"; le 2ème est un modèle profond de 3 couches. La sortie des 2 modèles d'interprétation sont concatenés pour former un long vecteur, qui est ensuite utilisé par la couche finale de sortie pour faire une classification binaire.

In [None]:
# input layer
visible = ###

# feature extractor
extract1 = ###

# 1er modèle d'interpretation
interp1 = ###

# 2ème modèle d'interpretation
interp11 = ###
interp12 = ###
interp13 = ###

# concatenation des couches d'interprétation
merge = ###

# output
output = ###
model = ###

# summary do modèle
print(model.summary())

# graph
plot_model(model, to_file='img/shared_feature_extractor.png')