# Modele de réseau neuronale

Toutes les étapes pour arriver à un modele correct

## Imports

In [1]:
import matplotlib.pyplot as plt
import cv2
import numpy as np
#import seaborn as sns #On ne sait jamais que ça serve
import pandas as pd 
from sklearn.preprocessing import MinMaxScaler #Normalisation #Il faut l'installer aussi avec conda install
import random


import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, Sequential
from tensorflow.keras.layers import  Dense, Conv3D, BatchNormalization,MaxPooling3D, Dropout, LSTM, ConvLSTM2D, Input
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.callbacks import TensorBoard


#conda install pydot
#conda install pydotplus
#conda install graphviz
from tensorflow.keras.utils import plot_model
#import pydot


import threading
from queue import Queue, Empty
from time import sleep, time

### Paramètres généraux

In [55]:
nb_classes = 10 #Nombre de classes
fps = 10
size = (160,120) #(40,30)
#Parametres du generator
pack_size = 50
batch_size = 25
epochs = 3 #20
learning_rate = 0.001

In [56]:
#Verification qu'un modele avec ces paramètres n'existe pas déjà
folder = 'Saved_model'
modele_type = 'model_convLSTM2D'
param = f"_{fps}_{size[1]}_{size[0]}_{nb_classes}_{epochs}_{batch_size}_{pack_size}_{int(learning_rate*1000)}mili"
full_name = folder + '\\' + modele_type + param
print(full_name)

Saved_model\model_convLSTM2D_10_120_160_10_3_25_50_1mili


In [57]:
try:
    model_saved = keras.models.load_model(full_name)
    print("Pas besoin d'aller plus loin, le modele a déjà été fabriqué")
    model_charge = True
except:
    print("Modele non testé")
    model_charge = False
    #Enregistrement sur Tensorboard
    tensorboard = TensorBoard(log_dir='Saved_model\\logs\\{}'.format(full_name),)
    #Il faut ouvrir la commande dans le dossier Saved_model et taper:
    #tensorboard --logdir = logs/
    #Ensuite un browser s'ouvre, et sinon on a une URL à mettre dessus
    

Modele non testé


## Fonctions d'imports et preprocess

#### Import

In [58]:
def get_mov_imgs_from_path(path,fps = -1,color = 'gray'):
    '''
    Retourne une liste d'images pour une vidéo. La liste d'image a le nombre de fps voulu
    reprend que le mouvement
    '''
    
    cap = cv2.VideoCapture(path)
    fps_actu = cap.get(cv2.CAP_PROP_FPS)
#     print(f"Traitement de la video n° {path}       ",end="\r")
    if fps <= -1: fps = fps_actu #Je peux ne pas donner de fps et ça va prendre le nombre d'fps initial
    ecart_voulu = int(1000/fps)
    ecart_initial = int(1000/fps_actu)
    imgs = []
    
    ret, frame = cap.read()
    while(cap.isOpened()):
        prev = frame
        ret, frame = cap.read()
       
 
        
        if ret: #Sinon ça plante quand il n'y a plus d'images
            #Récupère seulement certaines images
            t_ms = cap.get(cv2.CAP_PROP_POS_MSEC)
            modulo = t_ms % ecart_voulu
            if modulo < ecart_initial:
                #Isoler les images
                
                if color == 'gray':
                    gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
                    prev_gray = cv2.cvtColor(prev,cv2.COLOR_BGR2GRAY)
                    diff_gray = cv2.absdiff(gray,prev_gray)
                    
                elif color == 'rgb':
                    diff_gray = cv2.absdiff(frame,prev) 

                    
                #Première normalisation (elle n'est peut-être pas obligatoire)
                max_ = np.max(diff_gray)
                if max_ == 0:
                    max_ = 1
                ratio = 255.0 / max_
                diff_gray = diff_gray * ratio
                
                
                #On va travailler avec des images en nuance de gris, c'est bcp plus simple
                imgs.append(diff_gray)
            
        else: #Va jusqu'au bout de la vidéo
            break
    else:
        print("Le fichier n'a pas pu être ouvert")
    cap.release()
    
    return imgs

#### Resize

In [59]:
def resize_imgs(imgs,nsize):
    '''
    Change la taille de l'image.
    Le premier élément de nsize est la longueur (width), le deuxième la hauteur (height)
    '''
    return [cv2.resize(img, dsize=nsize, interpolation=cv2.INTER_CUBIC) for img in imgs]

#### Normalisation

In [60]:
def scale_by_pixels(img, x_min, x_max):
    '''
    Scale une image entre 0 et 1.
    Méthode pas efficace mais fonctionnelle contrairement à d'autres méthodes 
    qui faisaient lignes par lignes ce qui causait des erreurs 
    dans le résultat (lignes dans l'image)
    '''
    new_img = img.copy()
    p_min = 1000
    p_max = -1000
    for line in img:
        for pixel in line:
            p_min = min(p_min,pixel)
            p_max = max(p_max,pixel)
    
    #p_min et p_max sont les min et max totaux de mon image
    for l, line in enumerate(img):
        for p,pixel in enumerate(line):
            nom = (pixel - p_min)*(x_max - x_min)
            denom = (p_max - p_min)
            if denom == 0: denom = 1
            new_img[l][p] = x_min + nom/denom
    return new_img

In [61]:
def normalize_imgs(imgs):
    '''
    Normalise une série d'images
    '''
    norm_imgs = []
    for img in imgs:
        norm_img = scale_by_pixels(img,0,1)
        norm_imgs.append(norm_img)
#     print(f"Après normalisation, max = {np.max(norm_imgs)} et min = {np.min(norm_imgs)}")
    return norm_imgs

## Fonction de générateur

In [62]:
def my_gen(labels_list, folder_path, pack_size = 10, pointer = 0, fps = 5, size = (160,120)):
    '''
    à partir de la liste des labels et de la position du foler
    Retourne:
    -une liste d'images de vidéos de shape (pack_size,n_frames,height,width[,channels])
        n_frames = fps*2.4
    -Une liste de numérique avec les labels correspondant aux images (de len = batch_size)
    -Un pointer qui permet de faire tourner my_gen à nouveau et recevoir les éléments suivants de la liste
    
    
    Normalement on peut envoyer X et y_num dans le modele directement (avec fit ou train_on_batch, les deux devraient fonctionner)
    Je vais essayer de travailler avec des thread pour avoir un thread en Train et un trhead en gen
    '''
    
    y_num = []
    X = []
    for i in range(pointer, pack_size + pointer):
        pointer = i+1
        if i >= len(labels_list):
            break
        label, video_name = labels_list[i]
        
        #Label en numérique
        y_num.append(labels_n[label])
        
        #Preprocess d'images
        file_path = folder_path + "\\" + video_name
        imgs_of_video = get_mov_imgs_from_path(file_path,fps,'gray') #Gray ou rgb
        resized_imgs = resize_imgs(imgs_of_video, size)
        norm_imgs = normalize_imgs(resized_imgs)
        
        X.append(norm_imgs)
        
    print() #Pour ne pas écrire sur la même ligne qu'avant
    X = np.array(X)
    y = np.array(y_num)
    
    #Ajouter une dimsension en à la fin est nécessaire pour certains modèle
    #Commenter cette ligne si ce n'est pas nécessaire
    X = np.expand_dims(X, axis=len(X.shape)) 
    
    # Si le modele est compile avec :loss='sparse_categorical_crossentropy'
    # Il faut un y catégorique , faire ça hors de la fonction
    #y = to_categorical(y, num_classes = nb_classes)

    return (X, y, pointer)

In [63]:
def gen_thread(labels_list, folder_path, pack_size = 10, fps = 5, size = (160,120)):
    '''
    S'assure que my_gen tourne toujours en parallèle du fit. Il prépare toujours 2 paquets de vidéo en avance
    '''
    pointer = 0
    while pointer < 150:#< len(labels_list):
        X,y,pointer = my_gen(labels_list, folder_path, pack_size, pointer, fps, size)
        q.put((X,y))
        print(f"Pack of {pack_size} videos put in queue")

## Fabrication des modeles

#### Imports

In [69]:
from tensorflow.keras.applications import ResNet50, VGG16, MobileNetV2

In [70]:
#def create_model(n_frames = 24, height = 120, width = 160, nb_classes = 10):
n_frames = int(fps*2.4)
height = size[1]
width = size[0]

sample_shape = (n_frames,height,width) #width = 160, height = 120, nframes = 24, 3 channels si on est en RGB (si on est en gris on sait pas)


# load the ResNet-50 network, ensuring the head FC layer sets are left
# off
# baseModel = ResNet50(weights="imagenet", include_top=False,
#     input_tensor=Input(sample_shape))
# baseModel = VGG16(weights='imagenet',include_top=False,
#                  input_tensor = Input(sample_shape))
baseModel = MobileNetV2(weights='imagenet',include_top=False,
                  input_tensor = Input(sample_shape))
# construct the head of the model that will be placed on top of the
# the base model    

model = baseModel.output

model.add(Flatten())
model.add(LSTM(units = 128,activation="tanh", recurrent_activation="sigmoid",return_sequences = False))
#model.add(ConvLSTM2D(filters = 64,kernel_size = (1,1),activation="tanh", recurrent_activation="sigmoid",return_sequences = False))


#softmax
model.add(Dense(nb_classes, activation='softmax'))

#return model

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/mobilenet_v2/mobilenet_v2_weights_tf_dim_ordering_tf_kernels_1.0_224_no_top.h5


ValueError: Shapes (3, 3, 160, 32) and (32, 3, 3, 3) are incompatible

In [None]:
n_frames = int(fps*2.4)

# if model_charge:
#     print('Modele chargé')
#     model = model_saved
# else:
#     print("Pas de modele chargé, il faut en créer un nouveau")
#     model = create_model(n_frames = n_frames, height = size[1], width = size[0], nb_classes = nb_classes)

In [66]:
model.summary()

NameError: name 'model' is not defined

In [67]:
plot_name = full_name + '_plot.png'
plot_model(model, to_file = plot_name, show_shapes=True, show_layer_names=True)

NameError: name 'model' is not defined

In [None]:
#Compilation
model.compile(optimizer=tf.keras.optimizers.Adam(lr=learning_rate),
              loss = tf.keras.losses.categorical_crossentropy,
              metrics=['accuracy'])

##### Chargement d'un modele préentrainé (par nous même)

In [None]:
#model_stolen_saved = keras.models.load_model('Saved_model\\modele_stolen_compile')

## Generator

In [None]:
def homemade_fit_gen_thread(model, labels_val,pack_size,epochs,batch_size,fps = 5,size = (160,120)):
    '''
    Charge les données à partir du csv labels_val et train le model avec
    les différents paramètres
    Le model est train.
    
    Si besoin, return de X,y et model (mais normalement le model original est train)
    '''
#     q = Queue()
    
    #Histories de train ou de batch_loss au choix 
    histories = []
    
    t = threading.Thread(target = gen_thread, daemon = True,#Daemon afin que le thread s'arrête avec le thread principal
                        args = ((labels_val, "DATA\\Videos",pack_size,fps, size))) 
    t.start()
    while True:
        X, y_num = q.get()
        print("I got the pack! I'm going to fit it")
        print()
        #Catégorisation pour train
        y = to_categorical(y_num, num_classes = nb_classes)
        
#       batch_loss = model.train_on_batch(X,y)
        history = model.fit(X, y,
                batch_size = batch_size,
                epochs=epochs,
                verbose=1,
                validation_split=0.1,  #Dans le fond je m'en fous un peu de cb je prend pour test
                callbacks = [tensorboard])
        #histories.append(batch_loss)
        histories.append(history)
        print("J'ai fini de train le paquet")
        q.task_done() #Jsp si c'est utile
        
        #Il faut que le fit prenne plus de temps que le chargement des vidéos, sinon ça va pas aller
        
        if q.empty():
            print("J'ai peut-être fini, j'attends encore qq sec pour être sur d'avoir bien fini")
            sleep(20) #Je m'assure que c'est vraiment bien fini
            if q.empty():
                print("J'ai vraiment fini")
                break
            else:
                print("Je n'avais pas fini en fait")
    
    t.join() #Je m'assure que le thread soit bien fini. 
    #Si il n'est pas fini, on plante. S'il avait fini, alors ça ne servait à rein
    
    del X
    del y
    del y_num
    
    return model, histories

In [None]:
def homemade_fit_gen(model, labels_val,pack_size,epochs,batch_size,fps = 5,size = (160,120)):
    '''
    Charge les données à partir du csv labels_val et train le model avec
    les différents paramètres
    Le model est train.
    
    my_gen et fit tournent en parallèle grâce à un thread
    Si besoin, return de X,y et model (mais normalement le model original est train)
    '''
    
    histories = []
    
    pointer = 0
    can_continue = True
    
    while can_continue:
        X, y_num, pointer = my_gen(labels_val, "DATA\\Videos",pack_size = pack_size,fps = fps, size = size, pointer = pointer)
        
        #Catégorisation pour train
        y = to_categorical(y_num, num_classes = nb_classes)
        
        if pointer >= len(labels_val):
            can_continue = False
        print()

        #print('vidéos chargées, shape:',X.shape,'. y len : ',len(y_num)) #DEBUG
        with tf.device('cpu:0'):
            history = model.fit(X, y,
                    batch_size = batch_size,
                    epochs=epochs,
                    verbose=1,
                    validation_split=0.2,
                    callbacks = [tensorboard])
        histories.append(history)
        
        
    return model, histories

## Import des données et traitement

In [None]:
#Import des labels
labels_csv = pd.read_csv("DATA\\labels.csv")
labels_name = pd.read_csv("DATA\\labels_uses.csv")
labels_tests_csv = pd.read_csv("DATA\\labels_tests.csv")

In [None]:
#Créé un dictionnaire qui associe le nom du label et un numérique afin de le mettre dans le modele
labels_n = {}
for i,label in enumerate(labels_name.values):
    labels_n[label[0]] = i
    labels_n[i] = label[0]

    
#Trier les labels pour ne prendre que ceux qui correspondent à labels_uses
labels = []
for label, video_name in labels_csv.values:
    if label in labels_n:
        labels.append((label,video_name))

#Idem pour le label de tests
labels_tests = []
for label, video_name in labels_tests_csv.values:
    if label in labels_n:
        labels_tests.append((label,video_name))


#Melange la liste de train
for j in range(5):
    random.shuffle(labels) #Il faut absolument shuffle pour train

In [None]:
#Count de chaque label
labels_c = {}
for label in labels_name.values:
    labels_c[label[0]] = 0

for label,video_name in labels:
    if label in labels_c:
        labels_c[label] += 1

print(labels_c)

## Train

In [None]:
q = Queue(maxsize = 1) #Variable globale nécessaire pour le bon fonctionnement du gen en thread

In [None]:
if model_charge:
    print('Il ne faut pas train le modele car il a déjà été chargé')
else:
    print('Il faut entrainer le modele')
    start = time()
    model, histories = homemade_fit_gen(model, labels, pack_size = pack_size,
                                                    epochs = epochs,batch_size = batch_size,
                                                    fps = fps, size = size)
    end = time()
    print(f"ça a prit {end-start} secondes d'entrainer le modele")

### Amélioration du graphes au fur et à mesure du temps

In [None]:
#Pour l'histories de fit
if not model_charge:
    acc_plot = [hist.history['accuracy'] for hist in histories]
    loss_plot = [hist.history['loss'] for hist in histories]

In [None]:
if not model_charge: plt.plot(acc_plot)

In [None]:
if not model_charge: plt.plot(loss_plot)

## Tests

In [None]:
X_test, y_test, _ = my_gen(labels_tests, "DATA\\V_tests",pack_size = 1000,fps = fps, size = size)
#Grand pack_size afin de prendre toutes les données

In [None]:
y_pred = model.predict(X_test)

## Experience: Temp à supprimer dès que ça ne fait plus de sens

In [None]:
plt.figure(figsize=(20,60)) #(20,60) pour des images en (120,160). (20,180) pour des images en (480,640)
#print(X_test.shape)
#Visu des mouvements avec une petite size (en fonction des paramètres initiaux)
columns = 3
vid_a_test = 11
print("original:",labels_n[y_test[vid_a_test]])
print("prediction:",labels_n[y_pred[vid_a_test].argmax()])
for i, img in enumerate(X_test[vid_a_test]):
    plt.subplot(int(len(img) / columns + 1), columns, i + 1)
    plt.imshow(img)

### visualisation des  résultats

In [None]:
import fidle.pwk as pwk

In [None]:
full_name

In [None]:
y_pred_arg = np.argmax(y_pred, axis=-1)
plot_confusion_name = full_name + '_confusion.png'
cfm_plot = pwk.plot_confusion_matrix(y_test,y_pred_arg,range(nb_classes),normalize=True)

In [None]:
y_test_cat = to_categorical(y_test,10)
score = model.evaluate(X_test, y_test_cat, verbose=1)

print('Test loss     :', score[0])
print('Test accuracy :', score[1])

In [None]:
y_pred

In [None]:
#On vérifie que les résultats sont normalisé
for result in y_pred:
    print('la somme est:',sum(result))

In [None]:
print(labels_n)

In [None]:
#Je peux afficher l'historique de chaque étape (je n'ai aps réussi à les faire fusionner)
#On ne peut afficher que si on a train

#history = histories[-1]
#pwk.plot_history(history, figsize=(6,4), save_as='03-history')

## Enregistrer le modèle

In [None]:
#Le nom est fabriqué en début de notebook

In [None]:
#Enregistrement du résultat dans le csv

In [None]:
def write_score(model_name,score):
    labels = open("Saved_model\\score.csv","a") #append
    labels.write("\n" + model_name + "," + "{:10.8f}".format(score[0]) + "," + "{:10.8f}".format(score[1]))
    #Ajoute une nouvelle info sur une nouvelle ligne
    labels.close()

In [None]:
print(full_name)

In [None]:
# LSTM, 5 FPS, Height = 60, Width = 80, nb_Classes = 10, 3 Epochs, Batch_size = 10, Pack_size = 50, learning_rate *1000
if not model_charge: #On ne doit charger le modele que si il a été train cette fois-ci
    write_score(full_name,score)
    model.save(full_name)