In [3]:
"""
    Documentation scikitlearn: https://scikit-learn.org
    exemple: https://scikit-learn.org/stable/auto_examples/text/plot_document_classification_20newsgroups.html#load-data-from-the-training-set
"""

import sklearn
print(sklearn.__all__)
"""
    Ce qui nous intéresse:
    datasets, model_selection, linear_model, neighbors, neural_network, svm
"""
print()

import sklearn.datasets
print(sklearn.datasets.__all__)
"""
    On utilise surtout les module qui commencent par "load_" et "fetch"
"""
print()

['calibration', 'cluster', 'covariance', 'cross_decomposition', 'datasets', 'decomposition', 'dummy', 'ensemble', 'exceptions', 'experimental', 'externals', 'feature_extraction', 'feature_selection', 'gaussian_process', 'inspection', 'isotonic', 'kernel_approximation', 'kernel_ridge', 'linear_model', 'manifold', 'metrics', 'mixture', 'model_selection', 'multiclass', 'multioutput', 'naive_bayes', 'neighbors', 'neural_network', 'pipeline', 'preprocessing', 'random_projection', 'semi_supervised', 'svm', 'tree', 'discriminant_analysis', 'impute', 'compose', 'clone', 'get_config', 'set_config', 'config_context', 'show_versions']

['clear_data_home', 'dump_svmlight_file', 'fetch_20newsgroups', 'fetch_20newsgroups_vectorized', 'fetch_lfw_pairs', 'fetch_lfw_people', 'fetch_olivetti_faces', 'fetch_species_distributions', 'fetch_california_housing', 'fetch_covtype', 'fetch_rcv1', 'fetch_kddcup99', 'fetch_openml', 'get_data_home', 'load_boston', 'load_diabetes', 'load_digits', 'load_files', 'load

In [4]:
"""===================================================
    Chargement de la base de données "iris"
==================================================="""
from sklearn.datasets import load_iris
donnees_iris = load_iris()
print(donnees_iris.filename) # Chemin vers le fichier de la base de données iris
print(donnees_iris.keys()) # Contenu du fichier de la base iris
print(donnees_iris.DESCR) # Description de la base de données iris
print(donnees_iris['DESCR']) # Équivalente à la ligne précédente
print(donnees_iris['data'][:3]) # Afficher les 3 première lignes de la table des données iris

/usr/lib/python3/dist-packages/sklearn/datasets/data/iris.csv
dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'])
.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

                    Min  Max   Mean    SD   Class Correlation
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)

    :Missing Attribute Values: None

In [5]:
"""====================================================================================
    Subdivision de la base de données "iris" en base d'apprentissage et base de test
===================================================================================="""
from sklearn.model_selection import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(donnees_iris.data, donnees_iris.target)
print(X_train.shape) # Taille de la base de données d'entraînement
print(X_test.shape) # Taille de la base de données de test

(112, 4)
(38, 4)


In [15]:
"""==============================================================
    Classification des données iris par perceptron multicouche
=============================================================="""
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier().fit(X_train, Y_train)
print(mlp.predict(X_train))
print(mlp.predict([[6.3,2.5,5,1.9]]))
print('%.2f' % (mlp.score(X_train, Y_train)*100) + '%')
print('%.2f' % (mlp.score(X_test, Y_test)*100) + '%')


[1 2 0 0 0 2 2 0 0 2 1 1 2 0 0 0 1 1 1 0 0 0 0 0 0 0 2 1 1 2 0 2 1 2 0 2 0
 1 0 1 0 2 1 0 2 1 2 2 0 2 0 0 1 0 2 1 2 0 1 1 1 2 1 0 1 1 2 0 1 1 0 2 0 0
 0 1 0 0 2 1 2 2 1 1 2 0 1 2 0 1 1 1 1 0 1 2 2 2 0 2 0 0 2 0 0 1 1 1 2 2 2
 1]
[2]
98.21%
94.74%




In [16]:
"""==============================================================
    Classification des données iris par perceptron multicouche
=============================================================="""
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(max_iter=1000).fit(X_train, Y_train)
predictions = mlp.predict(X_train)
print(predictions)
print('%.2f' % (mlp.score(X_train, Y_train)*100) + '%')
print('%.2f' % (mlp.score(X_test, Y_test)*100) + '%')

[1 2 0 0 0 2 2 0 0 2 1 1 2 0 0 0 1 1 1 0 0 0 0 0 0 0 2 1 1 2 0 2 1 2 0 2 0
 1 0 1 0 2 1 0 2 1 2 2 0 2 0 0 1 0 2 1 2 0 1 1 1 2 1 0 1 1 2 0 1 1 0 1 0 0
 0 1 0 0 2 1 2 2 1 1 2 0 1 2 0 1 1 1 1 0 1 2 2 2 0 2 0 0 2 0 0 1 1 1 2 2 2
 1]
99.11%
94.74%


In [17]:
"""==============================================================
    Classification des données iris par perceptron multicouche
=============================================================="""
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(learning_rate_init=.2).fit(X_train, Y_train)
print(mlp.predict(X_train))
print('%.2f' % (mlp.score(X_train, Y_train)*100) + '%')
print('%.2f' % (mlp.score(X_test, Y_test)*100) + '%')


[1 2 0 0 0 2 2 0 0 2 1 1 2 0 0 0 1 1 1 0 0 0 0 0 0 0 2 1 1 2 0 2 1 2 0 2 0
 1 0 1 0 2 1 0 2 1 2 2 0 2 0 0 1 0 2 1 2 0 1 1 1 2 1 0 1 1 2 0 1 1 0 1 0 0
 0 1 0 0 2 1 2 2 1 1 2 0 1 2 0 1 1 1 1 0 1 2 2 2 0 2 0 0 2 0 0 1 1 1 2 2 2
 1]
99.11%
94.74%


In [18]:
"""==============================================================
    Classification des données iris par perceptron multicouche
=============================================================="""
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(learning_rate_init=.2, hidden_layer_sizes=[15,17]).fit(X_train, Y_train)
print(mlp.predict(X_train))
print('%.2f' % (mlp.score(X_train, Y_train)*100) + '%')
print('%.2f' % (mlp.score(X_test, Y_test)*100) + '%')


[1 2 0 0 0 2 2 0 0 2 1 1 1 0 0 0 1 1 1 0 0 0 0 0 0 0 1 2 1 2 0 2 1 2 0 2 0
 1 0 1 0 2 1 0 1 1 2 2 0 2 0 0 1 0 1 1 2 0 1 1 1 2 1 0 1 1 2 0 2 1 0 1 0 0
 0 1 0 0 2 1 1 1 1 1 2 0 1 1 0 1 2 1 1 0 1 1 2 2 0 1 0 0 1 0 0 1 1 1 2 2 2
 2]
88.39%
86.84%


In [19]:
"""==============================================================
    Classification des données iris par perceptron multicouche
=============================================================="""
from sklearn.neural_network import MLPClassifier
mlp = MLPClassifier(max_iter=1000).fit(X_train, Y_train)
# Évaluation des statistiques ou metrics
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
predictions = mlp.predict(X_train)
print(classification_report(Y_train, predictions, target_names=donnees_iris['target_names']))
print(confusion_matrix(Y_train, predictions))
predictions = mlp.predict(X_test)
print(classification_report(Y_test, predictions, target_names=donnees_iris['target_names']))
print(confusion_matrix(Y_test, predictions))

              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        42
  versicolor       1.00      0.97      0.99        39
   virginica       0.97      1.00      0.98        31

    accuracy                           0.99       112
   macro avg       0.99      0.99      0.99       112
weighted avg       0.99      0.99      0.99       112

[[42  0  0]
 [ 0 38  1]
 [ 0  0 31]]
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00         8
  versicolor       0.92      1.00      0.96        11
   virginica       1.00      0.95      0.97        19

    accuracy                           0.97        38
   macro avg       0.97      0.98      0.98        38
weighted avg       0.98      0.97      0.97        38

[[ 8  0  0]
 [ 0 11  0]
 [ 0  1 18]]


In [20]:
"""==========================================
    Parametres du perceptron multicouche
=========================================="""

print(mlp.get_params) # Afficher tous les paramétres

print("Nombre de couches: {}".format(mlp.n_layers_))
print("Nombre de neurones dans les couches cachées: {}".format(mlp.hidden_layer_sizes[0]))
print("Type de fonction d'activivation: {}".format(mlp.activation))

print("Mode de mise à jour du taux d'apprentissage: {}".format(mlp.learning_rate))
print("Valeur iniales du taux d'apprentissage: {}".format(mlp.learning_rate_init))
print("Alpha: {}".format(mlp.alpha))
print("Momentum: {}".format(mlp.momentum))

print("Seuil de différence entre les poids dans deux itérations successives (Critère d'arrêt): {}".format(mlp.epsilon))
print("Nombre max d'itération (Critère d'arrêt): {}".format(mlp.max_iter))
print("Nombre atteint d'itérations: {}".format(mlp.n_iter_))

"""
    plus d'info sur la page web
    https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html
"""
print()



<bound method BaseEstimator.get_params of MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=(100,), learning_rate='constant',
              learning_rate_init=0.001, max_fun=15000, max_iter=1000,
              momentum=0.9, n_iter_no_change=10, nesterovs_momentum=True,
              power_t=0.5, random_state=None, shuffle=True, solver='adam',
              tol=0.0001, validation_fraction=0.1, verbose=False,
              warm_start=False)>
Nombre de couches: 3
Nombre de neurones dans les couches cachées: 100
Type de fonction d'activivation: relu
Mode de mise à jour du taux d'apprentissage: constant
Valeur iniales du taux d'apprentissage: 0.001
Alpha: 0.0001
Momentum: 0.9
Seuil de différence entre les poids dans deux itérations successives (Critère d'arrêt): 1e-08
Nombre max d'itération (Critère d'arrêt): 1000
Nombre atteint d'itérations: 579



In [21]:
"""
Refait ce travail pour d'autre bases de données, en minimisant le nombre de neurones utilisés 
"""
print()





In [22]:
"""
Évaluer la matrice de confusion
"""
print()


