In [102]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder, MinMaxScaler
from multilayerPerceptron import MLP
from function import one_hot_encoder

# Charger et préparer les données
iris = datasets.load_iris()

# Charger les caractéristiques (features) et les étiquettes (labels)
X = iris.data  # Caractéristiques
y = iris.target.reshape(-1, 1)  # Labels

# Normaliser les caractéristiques (X) entre 0 et 1
scaler = MinMaxScaler()
X_scaled = scaler.fit_transform(X)

# Appliquer one-hot encoding aux labels
encoder = OneHotEncoder(sparse_output=False)
y_encoded = encoder.fit_transform(y)

# Diviser le jeu de données en ensemble d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y_encoded, test_size=0.2)
    # Étape 2 : Créer et entraîner le MLP
mlp = MLP(num_inputs=4, hidden_layers=[5], num_outputs=3)  # 4 entrées, 1 couche cachée avec 5 neurones, 3 sorties
mlp.train(X_train, y_train, epochs=250, learning_rate=0.1)

    # Étape 3 : Tester le MLP sur les données de test
correct = 0
for i, input in enumerate(X_test):
    # Faire une prédiction
    output = mlp.forward_propagate(input)

        # Trouver l'index de la classe prédite (avec la plus grande probabilité)
    predicted_class = np.argmax(output)
        
        # Trouver l'index de la vraie classe
    true_class = np.argmax(y_test[i])
        
    if predicted_class == true_class:
        correct += 1

    # Afficher les résultats
print()
print("Précision sur l'ensemble de test: {:.2f}%".format((correct / len(X_test)) * 100))

Training complete!
=====

Précision sur l'ensemble de test: 100.00%


In [103]:
from random import randint
nb = randint(1,29)
print(X_test[nb], y_test[nb])
output = mlp.forward_propagate(X_test[nb])
predicted_class = np.argmax(output)
true_class = np.argmax(y_test[nb])
print("Class prédite", predicted_class, " vrai classe", true_class)


[0.55555556 0.20833333 0.6779661  0.75      ] [0. 0. 1.]
Class prédite 2  vrai classe 2


Import des datas

In [106]:
# #On va maintenant utiliser d'autres data plus complexe.
# from ucimlrepo import fetch_ucirepo  
# # fetch dataset 
# adult = fetch_ucirepo(id=2) 
  
# # metadata and variables informations
# print(adult.metadata) 
# print(adult.variables) 

# # data (as pandas dataframes) 
# X = adult.data.features 
# y = adult.data.targets 

# #nb de val: 48842
# X_raccourci = X[0:1000]
# Y_raccourci = y[0:1000]

# #Normalisé les données afin de rendre l'algo plus éfficace et performant
# #scaler = MinMaxScaler()
# #X_scaled = scaler.fit_transform(X)

In [108]:
import pandas as pd
train = pd.read_csv('../input/titanic/train.csv')
# BEGIN: Préparation des données pour le modèle MLP
# Sélectionner les colonnes pertinentes et gérer les valeurs manquantes
train = train[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']]
train = train.dropna()

# Convertir les colonnes catégorielles en numériques
train['Sex'] = train['Sex'].map({'male': 0, 'female': 1})
train = pd.get_dummies(train, columns=['Embarked'], drop_first=True)

# Normaliser les caractéristiques
scaler = MinMaxScaler()
X_train = scaler.fit_transform(train.drop('Pclass', axis=1))  # Supposons que 'Pclass' est la cible pour cet exemple

# Appliquer one-hot encoding à la cible
encoder = OneHotEncoder(sparse_output=False)
y_train = encoder.fit_transform(train[['Pclass']])
# END: Préparation des données pour le modèle MLP

print(X_train)
# Le nombre de sorties doit être 3 (one-hot encoding pour les classes 1, 2, 3)
mlp = MLP(num_inputs=7, hidden_layers=[3,4], num_outputs=3)
mlp.train(X_train, y_train, epochs=250, learning_rate=0.1)

# Préparation des données de test pour le modèle MLP
test = pd.read_csv('../input/titanic/test.csv')
test = test[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']]
test = test.dropna()

# Convertir les colonnes catégorielles en numériques
test['Sex'] = test['Sex'].map({'male': 0, 'female': 1})
test = pd.get_dummies(test, columns=['Embarked'], drop_first=True)

# Normaliser les caractéristiques
X_test = scaler.transform(test.drop('Pclass', axis=1))  # Supposons que 'Pclass' est la cible pour cet exemple
print(X_test)
# Appliquer one-hot encoding à la cible
y_test = encoder.transform(test[['Pclass']])

# Tester le modèle sur les données de test
correct = 0
for i, input in enumerate(X_test):
    output = mlp.forward_propagate(input)
    predicted_class = np.argmax(output)
    true_class = np.argmax(y_test[i])
    if predicted_class == true_class:
        correct += 1

print("Précision sur l'ensemble de test: {:.2f}%".format((correct / len(X_test)) * 100))

[[0.         0.27117366 0.2        ... 0.01415106 0.         1.        ]
 [1.         0.4722292  0.2        ... 0.13913574 0.         0.        ]
 [1.         0.32143755 0.         ... 0.01546857 0.         1.        ]
 ...
 [1.         0.23347575 0.         ... 0.0585561  0.         1.        ]
 [0.         0.32143755 0.         ... 0.0585561  0.         0.        ]
 [0.         0.39683338 0.         ... 0.01512699 1.         0.        ]]
Training complete!
=====
[[0.         0.4282483  0.         ... 0.01528158 1.         0.        ]
 [1.         0.58532295 0.2        ... 0.01366309 0.         1.        ]
 [0.         0.77381252 0.         ... 0.01890874 1.         0.        ]
 ...
 [1.         0.34656949 0.         ... 0.01517579 0.         1.        ]
 [1.         0.48479517 0.         ... 0.21255864 0.         0.        ]
 [0.         0.47851219 0.         ... 0.01415106 0.         1.        ]]
Précision sur l'ensemble de test: 86.71%
