In [2]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

In [3]:
class Perceptron:
    def __init__(self, nb_of_inputs, nb_epochs=500, learning_rate=0.0001):
        
        # - no_of_inputs : Nombre de caractéristiques en entrée
        # - nb_epochs : Nombre d'itérations d'entraînement
        # - learning_rate : Taux d'apprentissage
        
        self.nb_epochs = nb_epochs
        self.learning_rate = learning_rate
        self.weights = np.zeros(nb_of_inputs + 1)  # +1 pour le biais
        # Permet d'initialiser le nombre de poids entré en paramètre à zéro dans un tableau

    def predict(self, inputs):
        summation = np.dot(inputs, self.weights[1:]) + self.weights[0] # somme des multiplications des inputs * poids via la méthode "dot" 
        return 1 if summation > 0 else 0

    def train(self, training_inputs, labels):
        for _ in range(self.nb_epochs):
            for inputs, label in zip(training_inputs, labels):
                prediction = self.predict(inputs)
                self.weights[1:] += self.learning_rate * (label - prediction) * inputs
                self.weights[0] += self.learning_rate * (label - prediction) * 1

In [11]:
# Charger le dataset
file_path = '../WineQT.csv'
wine_data = pd.read_csv(file_path)
wine_data.isnull().sum()

fixed acidity           0
volatile acidity        0
citric acid             0
residual sugar          0
chlorides               0
free sulfur dioxide     0
total sulfur dioxide    0
density                 0
pH                      0
sulphates               0
alcohol                 0
quality                 0
Id                      0
dtype: int64

In [5]:
# Séparer les caractéristiques et la cible
features = wine_data.iloc[:, :-2].values  # Toutes les colonnes sauf 'quality' et 'Id'
labels = wine_data['quality'].values

In [6]:
# Transformation des étiquettes en catégories binaires (qualité >= 6 : bonne, < 6 : mauvaise)
labels = (labels >= 6).astype(int)

In [7]:
# Diviser les données en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(features, labels, test_size=0.2, random_state=42)

In [8]:
# Normaliser les caractéristiques
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

input_size = X_train_scaled.shape[1]
perceptron = Perceptron(nb_of_inputs=input_size, nb_epochs=100, learning_rate=0.1)

In [9]:
# Entraîner le perceptron
perceptron.train(X_train_scaled, y_train)

y_pred = [perceptron.predict(x) for x in X_test_scaled]

print("Précision :", accuracy_score(y_test, y_pred) * 100)
print("Prédictions :", y_pred[:10])  # Afficher les 10 premières prédictions
print("Étiquettes réelles :", y_test[:10])  # Afficher les 10 premières étiquettes

print("Poids appris :", perceptron.weights)

Précision : 70.3056768558952
Prédictions : [1, 1, 0, 0, 1, 1, 1, 0, 1, 1]
Étiquettes réelles : [0 1 0 1 1 1 0 0 1 0]
Poids appris : [ 0.5         0.20699922 -0.40798591 -0.05079846  0.41030639 -0.43741212
 -0.02965161 -0.38134046  0.18378144  0.25444806  0.53703445  0.14312207]


In [10]:
# Exemple de données brutes (valeurs non normalisées)
raw_inputs = np.array([
    [7.4, 0.7, 0.0, 1.9, 0.076, 11.0, 34.0, 0.9978, 3.51, 0.56, 9.4],  # Exemple 1
    [6.7, 0.58, 0.08, 2.1, 0.056, 15.0, 54.0, 0.9958, 3.25, 0.59, 10.3],  # Exemple 2
    [8.1, 0.56, 0.28, 1.7, 0.368, 16.0, 56.0, 0.9969, 3.3, 1.2, 9.8]  # Exemple 3
])

# Appliquer la normalisation aux données brutes
raw_inputs_scaled = scaler.transform(raw_inputs)

# Prédire les résultats pour les données brutes
raw_predictions = [perceptron.predict(x) for x in raw_inputs_scaled]

# Afficher les résultats
print("Données brutes :")
print(raw_inputs)
print("Prédictions pour les données brutes :", raw_predictions)

Données brutes :
[[ 7.4     0.7     0.      1.9     0.076  11.     34.      0.9978  3.51
   0.56    9.4   ]
 [ 6.7     0.58    0.08    2.1     0.056  15.     54.      0.9958  3.25
   0.59   10.3   ]
 [ 8.1     0.56    0.28    1.7     0.368  16.     56.      0.9969  3.3
   1.2     9.8   ]]
Prédictions pour les données brutes : [1, 0, 0]
