In [1]:
# IMPORTS
import MLP
import pandas as pd
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score



# TOY DATASET (logic)

Nous allons montrer la performance de notre implémentation du *Multi Layer Perceptron* grâce à deux exemples. 

D'abord, avec un *toy* dataset qui simule la logique (a and b or c). 

Ensuite, avec le dataset connu du *breast cancer*, où un score de test sera calculé pour démontrer le pouvoir de généralisation de notre MLP. 

Enfin, sur ce dernier exemple, nous comparons la performance de notre MLP avec celle d'une regression logistique. 

In [2]:
# a, b, c
# fn => (a and b) or c
toy = [[1, 1, 1],  # true
       [1, 0, 0],  # false
       [0, 0, 0],  # false
       [1, 0, 1],  # true
       [1, 1, 0],  # true
       [0, 0, 1],  # true
       [0, 1, 1], # true
       ]
y = [
    1,
    0,
    0,
    1,
    1,
    1,
    1
]
X = pd.DataFrame(toy)

In [3]:
# %%
mlp = MLP.MutiLayerPerceptron(X, [3, 5, 3, 2, 1]) # 3 features a,b,c


# SUMMARY : MultiLayerPercetron with architecture : [3, 3, 5, 3, 2, 1]


Le réseau MLP est maintenant crée. 

La classe comporte des méthodes pour montrer les Neuronnes par couche ainsi que les connexions (synapses) existantes. 



**Montrer les Neuronnes**

Nous pouvons voir: 
- Les Neuronnes par couche, avec leurs index (*i*,*j*)
- Les Synapses auxquelles chaque neuronne appartient (*in* ou *out*)

Enfin, nous voyons aussi que les poids ont été aléatoirement initialisés entre -1 et 1. 

In [4]:
# PROVE NEURONS
mlp.prove_neurons()

We will see that none of the Nodes in Layer 0 is the output node of a synapse (No previous synapses)


We will see that none of the Nodes in the last layer is the input to further synapses (No further synapses)




Connected Neurons layer 0
Node Neuron00(-0.1) is in for  Synapse from Neuron00(-0.1) to Neuron10(0.4)
Node Neuron00(-0.1) is in for  Synapse from Neuron00(-0.1) to Neuron11(0.6)
Node Neuron00(-0.1) is in for  Synapse from Neuron00(-0.1) to Neuron12(0.0)
Node Neuron01(0.9) is in for  Synapse from Neuron01(0.9) to Neuron10(0.4)
Node Neuron01(0.9) is in for  Synapse from Neuron01(0.9) to Neuron11(0.6)
Node Neuron01(0.9) is in for  Synapse from Neuron01(0.9) to Neuron12(0.0)
Node Neuron02(0.6) is in for  Synapse from Neuron02(0.6) to Neuron10(0.4)
Node Neuron02(0.6) is in for  Synapse from Neuron02(0.6) to Neuron11(0.6)
Node Neuron02(0.6) is in for  Synapse from Neuron02(0.6) to Neuron12(0.0)


Connected Neurons layer 1
Node Neuron10(0.4) is in for  Synapse from Neuron10(0.4) to

**Montrer les Synapses**

Les synapses connectent les neuronnes d'une couche à une autre. 

In [5]:
mlp.prove_synapses()



Connections layer 0 to 1
Synapse from Neuron00(-0.1) to Neuron10(0.4)
Synapse from Neuron01(0.9) to Neuron10(0.4)
Synapse from Neuron02(0.6) to Neuron10(0.4)
Synapse from Neuron00(-0.1) to Neuron11(0.6)
Synapse from Neuron01(0.9) to Neuron11(0.6)
Synapse from Neuron02(0.6) to Neuron11(0.6)
Synapse from Neuron00(-0.1) to Neuron12(0.0)
Synapse from Neuron01(0.9) to Neuron12(0.0)
Synapse from Neuron02(0.6) to Neuron12(0.0)


Connections layer 1 to 2
Synapse from Neuron10(0.4) to Neuron20(-0.9)
Synapse from Neuron11(0.6) to Neuron20(-0.9)
Synapse from Neuron12(0.0) to Neuron20(-0.9)
Synapse from Neuron10(0.4) to Neuron21(-0.5)
Synapse from Neuron11(0.6) to Neuron21(-0.5)
Synapse from Neuron12(0.0) to Neuron21(-0.5)
Synapse from Neuron10(0.4) to Neuron22(0.6)
Synapse from Neuron11(0.6) to Neuron22(0.6)
Synapse from Neuron12(0.0) to Neuron22(0.6)
Synapse from Neuron10(0.4) to Neuron23(0.9)
Synapse from Neuron11(0.6) to Neuron23(0.9)
Synapse from Neuron12(0.0) to Neuron23(0.9)
Synapse from 

## Entrainement sur le Toy Dataset. 

Nous allons entraîner notre modèle avec le *toy* example du *and* suivi du *or*. 
La classe fait du "Early stop" toute seule. 

In [6]:
l = mlp.train(X,y, epochs=30)


Epoch 0. line : 0 Pred : 1  Target : 1
Epoch 0. line : 1 Pred : 1  Target : 0
Epoch 0. line : 2 Pred : 0  Target : 0
Epoch 0. line : 3 Pred : 0  Target : 1
Epoch 0. line : 4 Pred : 1  Target : 1
Epoch 0. line : 5 Pred : 0  Target : 1
Epoch 0. line : 6 Pred : 1  Target : 1
Epoch 0. Absolute Loss 0.42857142857142855. Accuracy 0.8571428571428571


Epoch 1. line : 0 Pred : 1  Target : 1
Epoch 1. line : 1 Pred : 1  Target : 0
Epoch 1. line : 2 Pred : 0  Target : 0
Epoch 1. line : 3 Pred : 0  Target : 1
Epoch 1. line : 4 Pred : 1  Target : 1
Epoch 1. line : 5 Pred : 1  Target : 1
Epoch 1. line : 6 Pred : 1  Target : 1
Epoch 1. Absolute Loss 0.2857142857142857. Accuracy 0.8571428571428571


Epoch 2. line : 0 Pred : 1  Target : 1
Epoch 2. line : 1 Pred : 1  Target : 0
Epoch 2. line : 2 Pred : 0  Target : 0
Epoch 2. line : 3 Pred : 0  Target : 1
Epoch 2. line : 4 Pred : 1  Target : 1
Epoch 2. line : 5 Pred : 1  Target : 1
Epoch 2. line : 6 Pred : 1  Target : 1
Epoch 2. Absolute Loss 0.285714285

Nous pouvons voir qu'après quelques *epochs*, le modèle ne fait plus d'érreurs. C'est à dire que la classe (1 ou 0) de chaque exemple est prédite correctement.  

#  BREAST CANCER TRAINING

Ce dataset permet d'illuster à nouveau la classification binaire, mais cette fois-ci avec un exemple réel et plus conséquent (30 *features*, 569 *instances*).

- 0 : Pas de cancer
- 1: Cancer

Le dataset comporte 30 colonnes pour l'entraînement. 

### Description du Dataset


In [7]:
data = load_breast_cancer()
print(data.DESCR)

.. _breast_cancer_dataset:

Breast cancer wisconsin (diagnostic) dataset
--------------------------------------------

**Data Set Characteristics:**

    :Number of Instances: 569

    :Number of Attributes: 30 numeric, predictive attributes and the class

    :Attribute Information:
        - radius (mean of distances from center to points on the perimeter)
        - texture (standard deviation of gray-scale values)
        - perimeter
        - area
        - smoothness (local variation in radius lengths)
        - compactness (perimeter^2 / area - 1.0)
        - concavity (severity of concave portions of the contour)
        - concave points (number of concave portions of the contour)
        - symmetry
        - fractal dimension ("coastline approximation" - 1)

        The mean, standard error, and "worst" or largest (mean of the three
        worst/largest values) of these features were computed for each image,
        resulting in 30 features.  For instance, field 0 is Mean Radi

In [8]:
# EXRACT X AND Y
X = pd.DataFrame(data["data"])
X.columns = data["feature_names"]
ys = data["target"]

# TRAIN TEST SPLIT
X_train, X_test, y_train, y_test  = train_test_split(X, ys, random_state=1)
X_train.reset_index(drop=True, inplace = True)
X_test.reset_index(drop= True, inplace = True);

## Entraînement du modèle pour le Brest Cancer

In [24]:
# MLP TRAINING 
# On peut voir qu'il y a 30 features
mlp = MLP.MutiLayerPerceptron(pd.DataFrame(X_train), [10, 10, 5, 3, 1])


# SUMMARY : MultiLayerPercetron with architecture : [30, 10, 10, 5, 3, 1]


In [25]:
l = mlp.train(X_train,y_train, epochs=70, verbose = 1)

Epoch 0. Absolute Loss 0.568075117370892. Accuracy 0.3685446009389671
Epoch 1. Absolute Loss 0.5492957746478874. Accuracy 0.3685446009389671
Epoch 2. Absolute Loss 0.5258215962441315. Accuracy 0.6314553990610329
Epoch 3. Absolute Loss 0.5234741784037559. Accuracy 0.6314553990610329
Epoch 4. Absolute Loss 0.5305164319248826. Accuracy 0.6314553990610329
Epoch 5. Absolute Loss 0.5328638497652582. Accuracy 0.6314553990610329
Epoch 6. Absolute Loss 0.5164319248826291. Accuracy 0.6314553990610329
Epoch 7. Absolute Loss 0.528169014084507. Accuracy 0.6314553990610329
Epoch 8. Absolute Loss 0.5211267605633803. Accuracy 0.6314553990610329
Epoch 9. Absolute Loss 0.5187793427230047. Accuracy 0.6314553990610329
Epoch 10. Absolute Loss 0.5070422535211268. Accuracy 0.6314553990610329
Epoch 11. Absolute Loss 0.5093896713615024. Accuracy 0.6314553990610329
Epoch 12. Absolute Loss 0.5211267605633803. Accuracy 0.6314553990610329
Epoch 13. Absolute Loss 0.5023474178403756. Accuracy 0.6314553990610329
Epoc

## EVALUATION : Score pour des données jamais vues.

Notre modèle MLP a obtenu un score d'*accuracy* très élevé pour les données de test (donc jamais vues). L'accuracy de *train* étant inférieur à celle de *test*, nous pouvons conclure qu'il n'y a pas eu d'*overfitting*. 

Le modèle à donc un bon pouvoir de généralisation et la performace prédictive est très bonne. 

In [26]:
y_test_pred = mlp.predict(X_test)
accuracy_score(y_test, y_test_pred) ## Very good accuracy score. 

0.951048951048951

#### Comparaison avec un modèle classique.

La performace de notre modèle est comparable à celle du classificateur logistique. 

In [12]:
clf = LogisticRegression(random_state=1, max_iter=10000).fit(X_train, y_train)
y_test_pred_logistic = clf.predict(X_test)
accuracy_score(y_test, y_test_pred_logistic)

0.9440559440559441