## Analyse des prédictions des modèles de 8.3 et 8.3bis 

On a dans les notebooks 8.3 et 8.3bis entraîné deux modèles identiques sur des données légèrement différentes. Les entrées de l'entraînement des deux modèles étaient strictement identiques, mais les cibles du second modèle ont été mélangées avant l'entraînement. On pouvait donc s'attendre à ce que les prédictions du premier modèle soient meilleures, or on a constaté qu'elles étaient sensiblement similaires.

On va ici analyser les prédictions des deux modèles et tenter de comprendre pourquoi les deux modèles produisent des résultats similaires.

#### Analyse des prédictions

L'analyse des prédictions nous apprend deux choses importantes sur les modèles que l'on a entraîné jusqu'ici :

* Les prédictions des modèles sont uniquement positives, alors qu'on attend en moyenne autant de prédictions positives que de prédictions négatives.

* Les prédictions des modèles ont toutes des valeurs comprises autour de 130. Cela signifie que les modèles n'apprennent pas sur la géométrie des molécules mais minimisent uniquement l'erreur moyenne en prédisant systématiquement la valeur qui va en moyenne minimiser le RMSE.


**ERRATUM : **

**
L'analyse graphique des données donne des résultats différents. Il semble y avoir eu une erreur lors de la génération des prédictions, il ne faut donc pas tenir compte du contenu de ce notebook, hors graphes à la fin **



#### Chemins des fichiers et constantes

In [149]:
path_83 = "/home/jleguy/models/DELTA_DIST+H_05/8.3/DELTA_DIST+H_05_basic.tflearn"
path_83bis = "/home/jleguy/models/DELTA_DIST+H_05/8.3bis/DELTA_DIST+H_05_basic.tflearn"

test_prepared_input_loc = "/home/jleguy/data/test_set_riken_v2_prepared_input_bruit+_anums_reduced.h2"
test_targets_loc = "/home/jleguy/data/test_set_riken_v2_labels_bruit+_anums_reduced.h2"

model_name = "DELTA_DIST+H_05"
figures_loc = "../figures/08.4-"

#### Définition des fonctions de création du réseau

In [21]:
import tensorflow as tf

def calcul_masque_atomes_definis(targets):
    """ On calcule le masque booléen des atomes donnés en entrée du RN en fonction du vecteur targets"""
    
    # On cherche à obtenir un masque booléen des atomes définis en entrée. Pour cela, on prend en entrée
    # les étiquettes sous la forme d'une matrice (200, 4) dont chaque ligne i est la distance de l'atome i avec
    # les atomes fictifs du repère. L'atome est indéfini ssi. la somme de la ligne est nulle. En effet,
    # un atome défini ne peut pas avoir une distance nulle avec les quatre atomes fictifs, et on veille
    # à ce que le vecteurs targets ne contienne que des valeurs nulles pour les atomes non définis.
    # On obtient donc un masque booléen de tous les atomes définis en entrée
    
    ## On somme les distances de chaque atome ##
    targets_dists_sums = tf.reduce_sum(targets, 1)
    
    ## On créé le masque des sommes différentes de zéro ##
    
    # Création des matrice de True et de False de la dimension de la matrice des sommes (nécessaires
    # pour tf.where)
    zeros = tf.cast(tf.zeros_like(targets_dists_sums),dtype=tf.bool)
    ones = tf.cast(tf.ones_like(targets_dists_sums),dtype=tf.bool)
    
    return tf.where(targets_dists_sums>0, ones, zeros)


In [22]:
def partial_rmse(predictions, targets):
    """ Calcule le RMSE partiel des prédictions par rapport aux valeurs attendues. Le RMSE est partiel car
    on ne le calcule que pour les sorties correspondant aux atomes donnés en entrée. En d'autres
    termes, on ne pousse pas le modèle à donner des distances nulles pour les atomes indéfinis
    en entrée"""
    
    with tf.name_scope("partial_rmse"):

        # On met les prédictions et les cibles sous la forme d'une matrice (200, 4)
        predictions = tf.reshape(predictions, [-1, 4])
        targets = tf.reshape(targets, [-1, 4])

        # On calcule le masque des atomes définis selon les cibles
        defined_atoms_mask = calcul_masque_atomes_definis(targets)
        
        # On masque les prédictions et les étiquettes selon le masque des atomes définis
        targets_masked = tf.boolean_mask(targets, defined_atoms_mask)
        predictions_masked = tf.boolean_mask(predictions, defined_atoms_mask)   

        return tf.sqrt(tf.reduce_mean(tf.squared_difference(predictions_masked, targets_masked)), name="rmse")
    

In [23]:
def partial_r2_score(predictions, targets, inputs):
    """ Renvoie le score R2 de la prédiction (le calcul est effectué uniquement sur les résultats
    des atomes donnés en entrée) """
    
    with tf.name_scope("partial_r2"):
    
        # On met les prédictions et les cibles sous la forme d'une matrice (200, 4)
        predictions = tf.reshape(predictions, [-1, 4])
        targets = tf.reshape(targets, [-1, 4])

        # On calcule le masque des atomes définis selon les cibles
        defined_atoms_mask = calcul_masque_atomes_definis(targets)

        # On masque les prédictions et les étiquettes selon le masque des atomes définis
        targets_masked = tf.boolean_mask(targets, defined_atoms_mask)
        predictions_masked = tf.boolean_mask(predictions, defined_atoms_mask)

        # Calcul de l'erreur totale
        total_error = tf.reduce_sum(tf.square(tf.subtract(targets, tf.reduce_mean(targets_masked))))

        # Calcul de l'erreur inexpliquée
        unexplained_error = tf.reduce_sum(tf.square(tf.subtract(targets_masked, predictions_masked)))

        r2 = tf.subtract(1.0, tf.divide(unexplained_error, total_error), "r2_score")
        return r2

In [24]:
from tflearn.layers.core import input_data, dropout, fully_connected
from tflearn.layers.estimator import regression
from tflearn.optimizers import Adam
from tflearn.data_preprocessing import DataPreprocessing
import tflearn as tfl
import tensorflow as tf
import math


def creer_360_x_240(epsilon=1e-8, learning_rate=0.001, dropout_val=0.99, stddev_init=0.001,
                      hidden_act='relu', outlayer_act='prelu', weight_decay=0.001, width=360, depth=3):
    """ Fonction créant un réseau de neurones de type fully connected, ayant une couche d'entrée de 360
    neurones, quatre couches cachées de 360 neurones et une sortie de 240 neurones
    Inputs : hyperparamètres
    """

    # On créé l'initialisateur de tenseur avec une loi normale tronquée. sigma = stddev_init, et les 
    # valeurs à plus de 2sigma sont re-tirées
    winit = tfl.initializations.truncated_normal(stddev=stddev_init, dtype=tf.float32, seed=None)
    
    # On créé l'input du RN
    network = input_data(shape=[None, 360], name='input')
    
    # On créé les couches cachées
    for i in range(depth):
        network = fully_connected(network, width, activation=hidden_act, name='fc'+str(i), weights_init=winit,
                                  weight_decay=weight_decay)
        # On détruit des neurones aléatoirement avec une la probabilité donnée en entrée
        network = dropout(network, dropout_val)
    
    # On ajoute la couche de sortie du réseau
    # Fonction d'activation prelu
    # Initilisée avec la loi normale tronquée
    network = fully_connected(network, 240, activation=outlayer_act, name='outlayer', weights_init=winit)
    
    adam = Adam(learning_rate=learning_rate, epsilon=epsilon)
    
    # Couche d'évaluation du modèle. Utilisation d'une descente stochastique Adam
    # Learning rate = 0.05
    # Loss = fonction définie rmse
    network = regression(network, optimizer=adam,
    loss=partial_rmse, metric=partial_r2_score, name='target')
            
    return network

#### Chargement du RN 8.3

In [17]:
tf.reset_default_graph()

network83 = creer_360_x_240(learning_rate=0.01, dropout_val=0.97, epsilon=0.001, hidden_act="relu6",
                          outlayer_act="linear")
model83 = tfl.DNN(network83)
model83.load(path_83, weights_only=True)

  "Converting sparse IndexedSlices to a dense Tensor of unknown shape. "


ResourceExhaustedError: OOM when allocating tensor with shape[360,360] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
	 [[Node: fc1_2/W/Adam/Assign = Assign[T=DT_FLOAT, _class=["loc:@fc1_2/W"], use_locking=true, validate_shape=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](fc1_2/W/Adam, fc0_1/W/Adam/Initializer/zeros)]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.


Caused by op 'fc1_2/W/Adam/Assign', defined at:
  File "/home/etudiant/anaconda3/lib/python3.6/runpy.py", line 193, in _run_module_as_main
    "__main__", mod_spec)
  File "/home/etudiant/anaconda3/lib/python3.6/runpy.py", line 85, in _run_code
    exec(code, run_globals)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel_launcher.py", line 16, in <module>
    app.launch_new_instance()
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/traitlets/config/application.py", line 658, in launch_instance
    app.start()
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/kernelapp.py", line 478, in start
    self.io_loop.start()
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/zmq/eventloop/ioloop.py", line 177, in start
    super(ZMQIOLoop, self).start()
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tornado/ioloop.py", line 888, in start
    handler_func(fd_obj, events)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tornado/stack_context.py", line 277, in null_wrapper
    return fn(*args, **kwargs)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 440, in _handle_events
    self._handle_recv()
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 472, in _handle_recv
    self._run_callback(callback, msg)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/zmq/eventloop/zmqstream.py", line 414, in _run_callback
    callback(*args, **kwargs)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tornado/stack_context.py", line 277, in null_wrapper
    return fn(*args, **kwargs)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 283, in dispatcher
    return self.dispatch_shell(stream, msg)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 233, in dispatch_shell
    handler(stream, idents, msg)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/kernelbase.py", line 399, in execute_request
    user_expressions, allow_stdin)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/ipkernel.py", line 208, in do_execute
    res = shell.run_cell(code, store_history=store_history, silent=silent)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/ipykernel/zmqshell.py", line 537, in run_cell
    return super(ZMQInteractiveShell, self).run_cell(*args, **kwargs)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2728, in run_cell
    interactivity=interactivity, compiler=compiler, result=result)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2850, in run_ast_nodes
    if self.run_code(code, result):
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/IPython/core/interactiveshell.py", line 2910, in run_code
    exec(code_obj, self.user_global_ns, self.user_ns)
  File "<ipython-input-12-e50520971a65>", line 2, in <module>
    model = tfl.DNN(network)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tflearn/models/dnn.py", line 65, in __init__
    best_val_accuracy=best_val_accuracy)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tflearn/helpers/trainer.py", line 131, in __init__
    clip_gradients)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tflearn/helpers/trainer.py", line 705, in initialize_training_ops
    name="apply_grad_op_" + str(i))
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/optimizer.py", line 552, in apply_gradients
    self._create_slots([_get_variable_for(v) for v in var_list])
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/adam.py", line 131, in _create_slots
    self._zeros_slot(v, "m", self._name)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/optimizer.py", line 984, in _zeros_slot
    new_slot_variable = slot_creator.create_zeros_slot(var, op_name)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/slot_creator.py", line 179, in create_zeros_slot
    colocate_with_primary=colocate_with_primary)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/slot_creator.py", line 153, in create_slot_with_initializer
    dtype)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/training/slot_creator.py", line 65, in _create_slot_var
    validate_shape=validate_shape)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 1297, in get_variable
    constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 1093, in get_variable
    constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 439, in get_variable
    constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 408, in _true_getter
    use_resource=use_resource, constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 800, in _get_single_variable
    use_resource=use_resource)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 2157, in variable
    use_resource=use_resource)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 2147, in <lambda>
    previous_getter = lambda **kwargs: default_variable_creator(None, **kwargs)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variable_scope.py", line 2130, in default_variable_creator
    constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variables.py", line 235, in __init__
    constraint=constraint)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/variables.py", line 381, in _init_from_args
    validate_shape=validate_shape).op
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/state_ops.py", line 281, in assign
    validate_shape=validate_shape)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/gen_state_ops.py", line 61, in assign
    use_locking=use_locking, name=name)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/framework/op_def_library.py", line 787, in _apply_op_helper
    op_def=op_def)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 3290, in create_op
    op_def=op_def)
  File "/home/etudiant/anaconda3/lib/python3.6/site-packages/tensorflow/python/framework/ops.py", line 1654, in __init__
    self._traceback = self._graph._extract_stack()  # pylint: disable=protected-access

ResourceExhaustedError (see above for traceback): OOM when allocating tensor with shape[360,360] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
	 [[Node: fc1_2/W/Adam/Assign = Assign[T=DT_FLOAT, _class=["loc:@fc1_2/W"], use_locking=true, validate_shape=true, _device="/job:localhost/replica:0/task:0/device:GPU:0"](fc1_2/W/Adam, fc0_1/W/Adam/Initializer/zeros)]]
Hint: If you want to see a list of allocated tensors when OOM happens, add report_tensor_allocations_upon_oom to RunOptions for current allocation info.



#### Chargement du RN 8.3bis

In [None]:
tf.reset_default_graph()

network83bis = creer_360_x_240(learning_rate=0.01, dropout_val=0.97, epsilon=0.001, hidden_act="relu6",
                          outlayer_act="linear")
model83bis = tfl.DNN(network83bis)
model83bis.load(path_83bis, weights_only=True)

tf.reset_default_graph()


#### Chargement du jeu de test

In [25]:
import h5py

input_h5 = h5py.File(test_prepared_input_loc, 'r')
labels_h5 = h5py.File(test_targets_loc, 'r')


OSError: Unable to open file (unable to open file: name = '/home/jleguy/data/test_set_riken_v2_prepared_input_bruit+_anums_reduced.h2', errno = 2, error message = 'No such file or directory', flags = 0, o_flags = 0)

#### Affichage des cibles pour le premier exemple

In [26]:
print(labels_h5["targets"][0])

NameError: name 'labels_h5' is not defined

#### Sortie

```
[ 150.8936     161.75629    155.25769    155.24315   -307.4228
 -289.44803   -319.50452   -305.1784    -305.59857   -435.35794
 -370.72702    -51.66783    -56.307816   -44.286842   -62.05718
  -27.74376   -285.61124   -265.13528   -305.00226   -309.06604
  175.4926     156.8657     165.52625    140.75081   -154.47044
 -174.92636   -117.71165   -140.24113      4.1387424   -8.449534
  -11.163069   -84.61809    121.20576    118.595406   123.4253
  142.31491   -260.1617    -276.94287   -253.41652   -280.0349
  176.02257    120.31651    245.13853    202.2622      99.881226
   86.55314    104.93713    155.86511   -105.745384   -90.81563
 -121.43202   -107.72897    281.1458     260.09668    295.08475
  291.6623    -321.94855   -342.52835   -294.70026   -317.48434
  -13.646374   -56.652805    31.959126    -6.4119773  181.9997
  157.7745     190.12726    137.65277    -80.957924   -82.57126
  -68.54606   -107.79049   -181.2919    -236.90584   -159.95714
 -224.67503    123.943756   146.10246    106.23672    127.92636
  -34.82667    -71.65472    -15.877649   -40.92893     50.4078
   45.0796      54.879795    50.505714    27.209991   -58.594826
   25.311113   123.06828     24.02118    -85.537964    -7.6970434
  232.0655     245.64526    263.38403    222.09859    242.77235
  232.28712    239.59323    222.80258    224.63965    -45.359547
  -65.56402    -31.24073     -5.2766542    2.0528452  -25.527798
  -15.865219   -33.99899     -7.059162     3.9235024  -18.623573
  -23.914314   -57.44517    -24.121656   -75.96469    -41.524338
  -49.628384   -19.00884    -74.71975    -72.66553    178.3821
  195.76953    152.30829    208.65167      0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.
    0.           0.           0.           0.           0.       ]
```


#### Affichage des prédictions pour le modèle 83

In [27]:
#print(model83.predict(input_h5["inputs"][0]))

NameError: name 'model83' is not defined

#### Sortie

    ValueError: Cannot feed value of shape (360,) for Tensor 'input/X:0', which has shape '(?, 360)'


La sortie indique un problème de format des données. Cela pourrait indiquer que l'on entraîne depuis le début les modèles avec des entrées au format incorrect. Nous allons vérifier cela plus tard mais dans un premier temps nous allons reformater les données pour afficher les prédictions des deux modèles

#### Affichage des prédictions pour le modèle 83

In [None]:
print(model83.predict(input_h5["inputs"][0].reshape(1, 360)))

#### Sortie

```
[[129.41498  103.10924  122.9165   125.18234  134.10721  129.27629
  131.43637  131.19785  132.77751  128.54762  129.61627  130.55632
  135.80397  133.10864  133.09712  134.00209  136.08559  133.02946
  133.97893  134.8385   135.24556  131.31682  132.23738  133.13988
  133.99158  131.47383  130.62631  131.07924  133.0204   130.17014
  129.33386  130.42998  133.79408  129.34473  131.38342  132.71068
  134.72762  129.51698  132.05725  133.59952  134.58917  130.84401
  133.11299  133.0615   134.1242   129.56953  132.34764  132.21916
  136.76381  131.94312  133.83876  133.40402  131.43782  126.14142
  128.87715  128.56311  137.36201  131.94153  133.26694  133.17809
  134.18604  129.5907   131.25453  131.50397  131.87231  126.53267
  127.36188  127.19024  133.86876  128.2605   130.35217  130.74683
  136.14334  131.03989  133.49947  133.01831  133.77303  130.8146
  131.57661  132.04445  137.32498  135.5971   135.925    136.00534
  134.62163  131.90482  132.71434  131.71202  135.93585  133.42963
  134.39272  135.03502  132.71051  130.02779  131.27045  131.3774
  134.58026  132.68643  132.5665   132.52965  135.91806  134.04642
  134.218    135.11668  135.13852  132.71832  134.98892  133.65237
  136.5741   133.6971   134.81631  135.92348  138.8739   137.04898
  137.24074  138.3196   135.48396  133.09589  133.09344  134.22682
  137.41595  134.84947  135.95563  135.59117  139.13313  137.02118
  136.99231  137.94673  136.48402  133.68436  135.3483   134.76897
  133.98817  131.33199  132.92226  132.32288  135.16467  134.20149
  133.95111  133.63696  135.24759  133.5755   134.4074   134.06798
  136.7503   134.51523  134.99556  135.22038  135.68643  133.98303
  134.65865  134.03813  134.3516   132.3951   135.14665  133.83339
  139.87154  137.56288  139.30728  139.02953  135.19934  133.53474
  133.39566  133.5374   136.13925  134.87793  133.59355  133.51877
  137.94032  136.96979  136.83652  136.73474  136.47029  134.94176
  136.1029   136.34796  139.39343  137.83693  138.98015  138.7151
  136.74988  134.42012  135.31601  135.80432  135.99928  135.04144
  134.83543  135.52068  138.25853  136.19925  138.33714  137.33301
  135.06187  132.96767  134.6407   133.74849  139.83218  138.11038
  140.41028  139.34355  136.5582   136.80571  135.74448  135.72414
  137.45589  137.56386  135.68451  136.99072  135.04941  134.23242
  133.9339   134.58838  126.258705 123.97187  124.2956   125.33747
  126.696    126.641785 126.52007  127.462616 108.43658  107.593285
  109.54873  108.7602   104.06093  102.61073  104.348015 104.09916
   76.98802   76.89965   77.27953   78.06417   62.94455   62.77887
   61.49538   61.134315  23.925323  22.94668   23.651854  25.192236]]
```

#### Affichage des prédictions pour le modèle 83bis

In [None]:
print(model83bis.predict(input_h5["inputs"][0].reshape(1, 360)))

#### Sortie

```
[[130.82724  102.37485  125.15098  125.63354  134.71205  130.56395
  130.99681  131.69283  133.03217  128.70848  129.89732  130.9096
  132.74316  129.39322  130.49988  129.98364  135.25     131.36436
  132.9498   131.95866  135.51456  131.11063  132.8507   132.30496
  135.47296  131.68004  132.85735  132.26605  135.00986  132.21568
  131.76118  131.82399  135.3448   130.0461   132.66751  132.61824
  133.59009  130.2229   130.12305  130.70174  133.5187   129.29358
  130.19853  130.48396  134.75847  130.61444  131.28154  130.33061
  134.86298  130.73991  132.2598   132.37418  134.02574  128.55734
  131.15472  130.6943   132.90128  126.8865   129.81732  129.73871
  133.49074  128.32864  129.86758  130.54988  132.37794  126.25755
  128.39075  127.91951  134.20187  129.7922   130.48625  130.93439
  133.30942  128.66316  130.71706  129.98233  132.94339  128.99054
  130.81342  131.73834  134.6895   132.32042  132.88196  133.76906
  136.98076  134.41765  135.89381  134.47054  136.2406   134.77788
  134.90614  134.88788  134.84639  132.42189  134.14444  133.42522
  135.48143  133.49936  134.0038   133.36447  135.1097   133.76434
  133.57506  133.1981   133.61218  130.53397  132.62366  132.12167
  137.1431   134.68652  134.51532  136.23886  139.1634   137.31334
  137.21304  137.41963  133.75557  131.74686  132.38644  133.00383
  137.50906  134.64009  136.81424  135.48227  135.60222  133.73611
  134.64287  134.6993   136.0222   133.78676  133.82085  134.81343
  138.08939  136.01192  137.16615  136.22932  135.93083  132.65952
  134.64473  135.6135   137.62236  135.85226  136.23349  135.60518
  136.71822  134.90181  135.98145  135.23495  137.22626  134.52492
  135.96733  136.15724  139.80177  138.1757   139.18222  138.97621
  134.81395  132.42964  134.251    133.22331  135.27264  133.66676
  134.69911  134.4731   139.59622  137.40483  137.60913  139.40083
  140.24799  138.9971   140.12206  137.96658  137.71825  136.64183
  136.39792  137.50253  135.67378  133.99583  134.79834  134.5041
  134.61511  133.48047  133.48384  133.00862  133.72691  131.83841
  132.21524  132.53824  138.73999  137.11392  137.60384  137.37772
  135.5944   134.63094  135.62268  133.96068  138.44359  136.28786
  138.00104  138.43837  135.45926  135.80753  133.99806  134.857
  133.15784  132.66916  130.57352  132.79057  134.63704  134.19833
  133.21402  134.03772  127.10493  125.2785   125.12878  126.95245
  123.85359  122.936264 123.67842  123.9649   105.1699   104.41548
  105.99911  105.23318  101.19556  100.19543  101.511894 101.416565
   73.35294   73.510735  74.06665   74.27185   59.40646   59.108223
   57.911613  58.911842  23.265882  22.000465  22.48201   24.225842]]
```

Nous remarquons que les deux modèles produisent des sorties très similaires alors qu'ils ont été entraînés sur des données différentes. On rappelle que les entrées de l'entraînement des deux modèles étaient identiques mais que les cibles du second modèle ont été mélangées avant l'entraînement. On est donc face à des résultats surprenants

On remarque également que les deux modèles ne produisent que des valeurs positives, alors qu'on attend certaines valeurs négatives.

#### Vérification qu'il n'existe aucune valeur prédite négative ou nulle sur les 100 000 premiers exemples du jeu de test

In [None]:
import numpy as np

predict83 = model83.predict(input_h5["inputs"][:100000]).reshape(1, -1)

neg_val = len(np.where(predict83[0]<0)[0])
zero_val = len(np.where(predict83[0]==0)[0])

print("Valeurs négatives : "+str(neg_val))
print("Valeurs nulles : "+str(zero_val))

##### Sortie

```
Valeurs négatives : 0
Valeurs nulles : 0
```

#### Calcul des prédictions et des distances cibles sur l'ensemble du jeu de test pour le modèle 83

In [None]:
import numpy as np

preds = np.array(model83.predict(input_h5["inputs"])).reshape(-1, 60, 4)
targets = np.array(labels_h5["targets"]).reshape(-1, 60, 4)

print(preds)


## Représentations graphiques des erreurs et des prédictions

#### Extraction des prédictions et cibles masquées selon les valeurs que le modèle doit prédire

In [139]:
def masked_preds_targets(preds, targets):
    """ Renvoie les prédictions et les cibles masquées selon les valeurs que le modèle doit prédire """
    
    mask = np.array(np.sum(targets, axis=2)!=0)
    mask = np.logical_not(np.repeat(mask,4))
    
    targets_masked = targets.reshape(1, -1)[0][~mask]
    preds_masked = preds.reshape(1, -1)[0][~mask]
    
    return preds_masked, targets_masked
    

#### Calcul de l'erreur absolue sur chaque composante de chaque prédiction du modèle

In [140]:
def erreurs(preds_masked, targets_masked):
    """ Calcul de l'erreur absolue sur chaque composante de chaque prédiction masquée par rapport aux
        cibles masquées"""
    
    return np.sqrt(np.square(np.diff([targets_masked, preds_masked], axis=0)))[0]
    

In [141]:
preds_masked, targets_masked = masked_preds_targets(preds, targets)
erreurs = erreurs(preds_masked, targets_masked)

## Distribution des erreurs

In [147]:
import matplotlib.pyplot as plt
import matplotlib as mpl

mpl.rcParams['agg.path.chunksize'] = 10000


def plot_distrib_rmses_val(rmses, padding, model_name, figures_loc):
    """ Affiche la distribution des rmses selon un pas donné """
    
    # On calcule les bornes de notre index
    debut_index = np.floor(min(rmses))
    fin_index = max(rmses)+padding
    
    # On créé l'index des rmses
    index = np.arange(debut_index, fin_index, padding)
    
    # On créé le compteur de rmses
    rmse_occ = np.zeros_like(index)
        
    # Calcul des rmse
    for rmse in rmses:
        rmse_occ[int((rmse-debut_index)/padding)] += 1
    
    fig = plt.figure()
    
    
    ## Échelle linéaire ##
    ax1 = fig.add_subplot(121)
    ax1.set_title("Modèle "+model_name+"\n Distribution des erreurs")
    ax1.set_xlabel("Erreur absolue (en mÅ, par tranches de "+str(padding)+")")
    ax1.set_ylabel("Occurrences sur le jeu de test")
    ax1.bar(index, rmse_occ)
   

    ## Échelle logarithmique
    ax2 = fig.add_subplot(122)
    ax2.set_title("Modèle "+model_name+"\n Distribution des erreurs")
    ax2.set_xlabel("Erreur absolue (en mÅ, par tranches de "+str(padding)+")")
    ax2.set_ylabel("Occurrences sur le jeu de test (échelle logarithmique)")
    ax2.set_yscale("log")
    ax2.bar(index, rmse_occ)
    
    plt.gcf().subplots_adjust(wspace=0.3)

    
    plt.savefig(figures_loc+model_name+"_distrib_rmse_val.png", dpi=200)
    plt.show()



In [None]:
plot_distrib_rmses_val(erreurs, 10, model_name, figures_loc)

![title](../figures/08.4-DELTA_DIST+H_05_distrib_erreurs_val.png)


## Prédictions selon les delta cibles

In [142]:
import matplotlib.pyplot as plt
import matplotlib as mpl

mpl.rcParams['agg.path.chunksize'] = 10000

def fun_id(x):
    return x

def plot_targets_pred(targets, preds, model_name, figures_loc):
        
    fig = plt.figure()
    ax = fig.add_subplot(111)
        
    ax.set_title("Modèle "+model_name+"\nPrédictions en fonction des valeurs cibles")
    ax.set_xlabel("Delta distance cible (mÅ)")
    ax.set_ylabel("Delta distance prédit (mÅ)")
    
    ax.plot(targets, preds, ",")

    # On trace la droite y=x
    x=np.linspace(min(targets), max(targets))
    ax.plot(x, fun_id(x), color='darkgreen')
    
    ax.text(0.65, 0.85, 'Modèle théorique\nparfait',
        transform=ax.transAxes,
        color='darkgreen')
    
    plt.savefig(figures_loc+model_name+"_preds_fonction_cibles.png", dpi=200)
    
    plt.show()



In [None]:
plot_targets_pred(targets_masked, preds_masked, model_name, figures_loc)

![title](../figures/08.4-DELTA_DIST+H_05_preds_fonction_cibles.png)


### Erreurs selon les delta cibles

In [148]:
def plot_erreurs_distrib_dist(erreurs, targets, model_name, figures_loc):
    
    fig = plt.figure()
    ax = fig.add_subplot(111)
    
    ax.set_title("Modèle "+model_name+"\nDistribution des erreurs selon les valeurs cibles")
    ax.set_xlabel("Delta distance cible (mÅ)")
    ax.set_ylabel("Erreur absolue (mÅ)")
    ax.plot(targets, rmses, ",")
    
        
    plt.savefig(figures_loc+model_name+"_distrib_rmse_dist.png", dpi=200)
    
    plt.show()


In [None]:
plot_erreurs_distrib_dist(erreurs, targets_masked, model_name, figures_loc)

![title](../figures/DELTA_DIST+H_05_distrib_rmse_dist.png)
