# Chargement du jeu de données MNIST

In [2]:
from sklearn.datasets import fetch_openml
mnist=fetch_openml('mnist_784')

.On divise la base de données en 49000 lignes pour l'apprentissage et le reste pour les tests.

In [3]:
from sklearn.model_selection import train_test_split

size_train = 49000
xtrain, xtest, ytrain, ytest = train_test_split(mnist.data, mnist.target, train_size=size_train/len(mnist.target))

# Méthode des neurones artificiels

## 1. Application de la méthode

In [4]:
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import precision_score
from time import time 

In [5]:
tps1=time()
clf= MLPClassifier(hidden_layer_sizes=50).fit(xtrain,ytrain)
tps2=time()
tpsapp=tps2-tps1
score=clf.score(xtest,ytest)
tps1=time()
ypred=ypred=clf.predict(xtest)
tps2=time()
tpspred=tps2-tps1
prec=precision_score(ytest,ypred,average="micro")
print(f"Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")

Accuracy: 0.9444761904761905, Précision: 0.9444761904761905, Temps d'apprentissage: 76.34305667877197 seconde, Temps prédiction: 0.06183481216430664 secondes


In [7]:
print(clf.predict(xtest)[5])
print(ytest[5])

8
8


## 2. Variation du nombre de couches cachées

In [14]:
import numpy as np
indices_random=np.random.randint(70000,size=5000)
xtrain, xtest, ytrain, ytest = train_test_split(mnist.data[indices_random], mnist.target[indices_random], train_size=0.8)

In [15]:
for i in range(2,30,1):
    tps1=time()
    clf= MLPClassifier(hidden_layer_sizes=(50,)*i).fit(xtrain,ytrain)
    tps2=time()
    tpsapp=tps2-tps1
    score=clf.score(xtest,ytest)
    tps1=time()
    ypred=ypred=clf.predict(xtest)
    tps2=time()
    tpspred=tps2-tps1
    prec=precision_score(ytest,ypred,average="micro")
    print(f"Nombre de couches:{i}, Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")
    print(" ")

Nombre de couches:2, Accuracy: 0.816, Précision: 0.816, Temps d'apprentissage: 3.9065568447113037 seconde, Temps prédiction: 0.0039899349212646484 secondes
 
Nombre de couches:3, Accuracy: 0.828, Précision: 0.828, Temps d'apprentissage: 4.727361679077148 seconde, Temps prédiction: 0.00598454475402832 secondes
 
Nombre de couches:4, Accuracy: 0.865, Précision: 0.865, Temps d'apprentissage: 5.75760817527771 seconde, Temps prédiction: 0.0059850215911865234 secondes
 
Nombre de couches:5, Accuracy: 0.849, Précision: 0.849, Temps d'apprentissage: 6.669171333312988 seconde, Temps prédiction: 0.008975744247436523 secondes
 
Nombre de couches:6, Accuracy: 0.865, Précision: 0.865, Temps d'apprentissage: 5.468379020690918 seconde, Temps prédiction: 0.012966632843017578 secondes
 
Nombre de couches:7, Accuracy: 0.861, Précision: 0.861, Temps d'apprentissage: 5.323765993118286 seconde, Temps prédiction: 0.014915227890014648 secondes
 
Nombre de couches:8, Accuracy: 0.894, Précision: 0.894, Temps d

## 3. Variation aléatoire du nombre de couches et du nombre neurone par couche

In [18]:
from random import randint 

for _ in range(5):
    # 1 à 10 layers comprenant entre 10 et 300 neurones aléatoirements
    layers=tuple(randint(10,300) for _ in range(randint(1,10)))
    tps1=time()
    clf= MLPClassifier(hidden_layer_sizes=layers).fit(xtrain,ytrain)
    tps2=time()
    tpsapp=tps2-tps1
    score=clf.score(xtest,ytest)
    tps1=time()
    ypred=ypred=clf.predict(xtest)
    tps2=time()
    tpspred=tps2-tps1
    prec=precision_score(ytest,ypred,average="micro")
    print(f"Layers:{layers}, Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")
    print(" ")
    

Layers:(149, 176, 86, 60, 277, 290, 55, 185, 196, 171), Accuracy: 0.93, Précision: 0.93, Temps d'apprentissage: 18.78475022315979 seconde, Temps prédiction: 0.057802438735961914 secondes
 
Layers:(19, 151, 241, 205), Accuracy: 0.868, Précision: 0.868, Temps d'apprentissage: 9.887566089630127 seconde, Temps prédiction: 0.018949508666992188 secondes
 
Layers:(44,), Accuracy: 0.852, Précision: 0.852, Temps d'apprentissage: 5.741650819778442 seconde, Temps prédiction: 0.0039899349212646484 secondes
 
Layers:(134, 176, 223, 16, 282, 43), Accuracy: 0.902, Précision: 0.902, Temps d'apprentissage: 19.529795169830322 seconde, Temps prédiction: 0.026974201202392578 secondes
 
Layers:(14, 270, 140, 195, 195, 13, 192, 127, 289, 279), Accuracy: 0.905, Précision: 0.905, Temps d'apprentissage: 20.506138563156128 seconde, Temps prédiction: 0.0468747615814209 secondes
 


## 4. Variation de l'algorithme d'optimisation

In [19]:
import matplotlib.pyplot as plt
solvers=["lbfgs","sgd","adam"]
for solver in solvers:
    tps1=time()
    clf= MLPClassifier(hidden_layer_sizes=50,solver=solver).fit(xtrain,ytrain)
    tps2=time()
    tpsapp=tps2-tps1
    score=clf.score(xtest,ytest)
    tps1=time()
    ypred=ypred=clf.predict(xtest)
    tps2=time()
    tpspred=tps2-tps1
    prec=precision_score(ytest,ypred,average="micro")
    print(f"Solver:{solver}, Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")
    print(" ")

Solver:lbfgs, Accuracy: 0.12, Précision: 0.12, Temps d'apprentissage: 0.0827631950378418 seconde, Temps prédiction: 0.002992391586303711 secondes
 




Solver:sgd, Accuracy: 0.521, Précision: 0.521, Temps d'apprentissage: 6.878611087799072 seconde, Temps prédiction: 0.002992391586303711 secondes
 
Solver:adam, Accuracy: 0.812, Précision: 0.812, Temps d'apprentissage: 1.5777826309204102 seconde, Temps prédiction: 0.0029926300048828125 secondes
 


## 5. Variation de la fonction d'activation

In [22]:
activators=["identity","logistic","tanh","relu"]
for activation in activators:
    tps1=time()
    clf= MLPClassifier(hidden_layer_sizes=50,activation=activation).fit(xtrain,ytrain)
    tps2=time()
    tpsapp=tps2-tps1
    score=clf.score(xtest,ytest)
    tps1=time()
    ypred=ypred=clf.predict(xtest)
    tps2=time()
    tpspred=tps2-tps1
    prec=precision_score(ytest,ypred,average="micro")
    print(f"Activation:{activation}, Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")
    print(" ")

Activation:identity, Accuracy: 0.853, Précision: 0.853, Temps d'apprentissage: 2.0584962368011475 seconde, Temps prédiction: 0.0030241012573242188 secondes
 
Activation:logistic, Accuracy: 0.899, Précision: 0.899, Temps d'apprentissage: 6.619268894195557 seconde, Temps prédiction: 0.0019948482513427734 secondes
 
Activation:tanh, Accuracy: 0.86, Précision: 0.86, Temps d'apprentissage: 2.0584969520568848 seconde, Temps prédiction: 0.001995086669921875 secondes
 
Activation:relu, Accuracy: 0.842, Précision: 0.842, Temps d'apprentissage: 4.226699352264404 seconde, Temps prédiction: 0.003989458084106445 secondes
 


## 6. Variation de régularisation

In [23]:
import numpy as np
alphas = np.logspace(-1, 1, 10)
for alpha in alphas:
    tps1=time()
    clf= MLPClassifier(hidden_layer_sizes=50,alpha=alpha).fit(xtrain,ytrain)
    tps2=time()
    tpsapp=tps2-tps1
    score=clf.score(xtest,ytest)
    tps1=time()
    ypred=ypred=clf.predict(xtest)
    tps2=time()
    tpspred=tps2-tps1
    prec=precision_score(ytest,ypred,average="micro")
    print(f"Alpha:{alpha}, Accuracy: {score}, Précision: {prec}, Temps d'apprentissage: {tpsapp} seconde, Temps prédiction: {tpspred} secondes")
    print(" ")

Alpha:0.1, Accuracy: 0.822, Précision: 0.822, Temps d'apprentissage: 3.0239365100860596 seconde, Temps prédiction: 0.0029921531677246094 secondes
 
Alpha:0.16681005372000587, Accuracy: 0.839, Précision: 0.839, Temps d'apprentissage: 2.3028435707092285 seconde, Temps prédiction: 0.002992391586303711 secondes
 
Alpha:0.2782559402207124, Accuracy: 0.831, Précision: 0.831, Temps d'apprentissage: 4.0013041496276855 seconde, Temps prédiction: 0.002991199493408203 secondes
 
Alpha:0.46415888336127786, Accuracy: 0.874, Précision: 0.874, Temps d'apprentissage: 4.2237091064453125 seconde, Temps prédiction: 0.001995563507080078 secondes
 
Alpha:0.774263682681127, Accuracy: 0.844, Précision: 0.844, Temps d'apprentissage: 3.657222270965576 seconde, Temps prédiction: 0.003989458084106445 secondes
 
Alpha:1.291549665014884, Accuracy: 0.844, Précision: 0.844, Temps d'apprentissage: 3.522582769393921 seconde, Temps prédiction: 0.001995563507080078 secondes
 
Alpha:2.1544346900318834, Accuracy: 0.826, P