In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split

from sklearn.metrics import mean_squared_error, r2_score
import pandas as pnd

# <h1 style="color: red;">Section 1: Data</h1>

# <h2>1) Préparation de données</h2>

In [None]:
np.random.seed(44) #à chaque exécution,générer le même dataset de manière aléatoire
# Coefficients
a1, a2, b = 2, 3, 5  # y = 2*X1 + 3*X2 + 5 + bruit
nombre_points = 100 # Nombre de points
# Génération des deux features (X1 et X2)
X1 = np.random.rand(nombre_points) * 10
X2 = np.random.rand(nombre_points) * 10
# Empilement des features dans une seule matrice (shape: (100, 2))
X = np.column_stack((X1, X2))
# Génération du bruit
bruit = np.random.randn(nombre_points) * 2  # Bruit
# Calcul de la target
y = a1 * X1 + a2 * X2 + b + bruit

# Split data
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=23)

# <h1 style="color: red;">Section 2: Neural network avec tensorflow</h1>

In [None]:
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense

# <h2>2) Modèle de réseau de neurones</h2>

# <h3>2-a) Architecture de réseau de neurones</h3>

# <h4>2-a-1) Proposition d'une architecture</h4>
# Un réseau de neurones composé de :
# - 2 inputs (X1,x2). Chaque input est accompagné par un weight.
# - Un bias
# - Unité de calcul 1 : Une sommation pondérée, z=w1.X1+w2.X2+bias
# - Unité de calcul 2 : Une activation, f(z). f peut être linear, sigmoid, relu,...

# <h4>2-a-2) À partir de la nature du dataset, établir les inputs du réseau de neurones</h4>
# Les inputs de notre réseau de neurones sont X1 et X2, soit 2 inputs.
# En termes de dimensions, notre input_shape est (2,) car il y a 2 features.

# <h4>2-a-3) À partir de la nature du dataset, établir le nombre de neurones à mettre dans outputlayer du réseau de neurones</h4>
# Comme nous réalisons une régression pour prédire une seule valeur y, 
# nous avons besoin d'un seul neurone dans la couche de sortie.

# <h4>2-a-4) À partir de la nature de target, établir la fonction d'activation de la couche d'output</h4>
# Comme nous faisons une régression linéaire, la fonction d'activation appropriée 
# pour la couche de sortie est 'linear' (ou pas d'activation).

# <h3>2-b) Sans aucune couche cachée, créer un modèle basé sur un réseau de neurones « model_nn » qui correspond à ce problème</h3>

In [None]:
model_nn = Sequential([
    # Un seul neurone en sortie avec activation linéaire, sans couche cachée
    Dense(units=1, activation='linear', input_shape=(2,))
])

# <h3>2-c) Compiler le modèle</h3>

In [None]:
model_nn.compile(optimizer='adam', loss='mse', metrics=['mse'])

# <h3>2-d) Entraîner le modèle</h3>

In [None]:
history = model_nn.fit(X_train, y_train, epochs=100, batch_size=8, verbose=1)

# <h3>2-e) Préciser ce que fait la fonction fit</h3>
# La fonction fit:
# 1. Prend les données d'entrée (X_train) et les cibles (y_train)
# 2. Divise les données en batchs de taille spécifiée (batch_size=8)
# 3. Propage les données à travers le réseau pour chaque batch
# 4. Calcule l'erreur entre les prédictions et les vraies valeurs
# 5. Rétropropage l'erreur pour ajuster les poids à l'aide de l'optimiseur (adam)
# 6. Répète ce processus pour le nombre d'époques spécifié (epochs=100)
# 7. Retourne un historique contenant les métriques d'entraînement

# <h3>2-f) Quel est le nombre de paramètres du réseau</h3>
# Calcul à la main:
# - 2 poids (w1, w2) pour les 2 entrées
# - 1 biais
# Total: 3 paramètres

In [None]:
# Affichage du détail du réseau
model_nn.summary()

# <h3>2-g) Afficher les paramètres du réseau de neurones</h3>

In [None]:
weights, bias = model_nn.layers[0].get_weights()
print("Poids du réseau de neurones:")
print(f"w1: {weights[0][0]}")
print(f"w2: {weights[1][0]}")
print(f"bias: {bias[0]}")
print(f"Vrais coefficients: a1={a1}, a2={a2}, b={b}")

# <h3>2-h) Dessiner le réseau de neurones en utilisant les paramètres trouvés</h3>

In [None]:
plt.figure(figsize=(10, 6))
plt.plot([0, 1], [0, 0], 'k-', linewidth=2)  # Ligne horizontale
plt.plot([1, 2], [0, 0], 'k-', linewidth=2)  # Ligne horizontale

# Inputs
plt.scatter([0, 0], [-0.5, 0.5], s=100, c='blue', label='Inputs')
plt.annotate('X1', (0, 0.5), fontsize=12)
plt.annotate('X2', (0, -0.5), fontsize=12)

# Poids
plt.annotate(f'w1={weights[0][0]:.3f}', (0.5, 0.25), fontsize=10)
plt.annotate(f'w2={weights[1][0]:.3f}', (0.5, -0.25), fontsize=10)

# Neurone de sortie
plt.scatter([1], [0], s=200, c='red', label='Sommation')
plt.annotate('Σ', (1, 0), fontsize=15, ha='center', va='center')
plt.annotate(f'bias={bias[0]:.3f}', (1, -0.2), fontsize=10)

# Output
plt.scatter([2], [0], s=150, c='green', label='Output (Linear)')
plt.annotate('ŷ', (2, 0), fontsize=15, ha='center', va='center')

plt.title('Architecture du réseau de neurones linéaire')
plt.grid(False)
plt.axis('off')
plt.legend(loc='upper center', bbox_to_anchor=(0.5, -0.05), ncol=3)
plt.tight_layout()
plt.show()

# <h3>2-i) Dans quels cas il est important de faire des régulations (tuning)</h3>
# Les régulations (tuning) sont importantes dans les cas suivants:
# 1. Surapprentissage (overfitting): Quand le modèle performe bien sur les données d'entraînement mais mal sur les données de test
# 2. Sous-apprentissage (underfitting): Quand le modèle ne capture pas bien la structure des données
# 3. Données complexes: Quand les relations entre variables sont non-linéaires ou complexes
# 4. Grands réseaux: Plus un réseau est grand, plus il risque de surapprendre
# 5. Données limitées: Quand on dispose de peu d'exemples d'entraînement
#
# Les techniques de régulation incluent:
# - La régularisation L1/L2 pour pénaliser les grands poids
# - Le dropout pour réduire la co-adaptation des neurones
# - La normalisation par lots (batch normalization)
# - L'arrêt précoce (early stopping) basé sur la performance de validation

# <h2>3) Prédiction en utilisant le modèle</h2>

# <h3>3-a) En utilisant le modèle, faire les prédictions en utilisant X_test</h3>

In [None]:
yhat_nn = model_nn.predict(X_test)
yhat_nn = yhat_nn.flatten()

# <h3>3-b) En utilisant les paramètres du modèle, faire une prédiction sans utiliser predict</h3>
# Calcul manuel des prédictions

In [None]:
yhat_manual = np.dot(X_test, weights) + bias[0]

In [None]:
# Évaluer le modèle en utilisant MSE, R²
mse_train = mean_squared_error(y_train, yhat_train)
r2_train = r2_score(y_train, yhat_train)

print(f"Performance sur l'ensemble d'entraînement:")
print(f"MSE: {mse_train:.4f}")
print(f"R²: {r2_train:.4f}")

# Calculer les résidus
residus_train = y_train - yhat_train

# Tracer le graphique des résidus
plt.figure(figsize=(10, 6))
plt.scatter(yhat_train, residus_train)
plt.axhline(y=0, color='r', linestyle='-')
plt.title('Graphique des résidus (ensemble d\'entraînement)')
plt.xlabel('Valeurs prédites')
plt.ylabel('Résidus')
plt.grid(True)
plt.show()

# Interprétation des résultats
# La répartition des résidus autour de zéro nous indique si notre modèle est biaisé.
# Des résidus uniformément répartis autour de zéro indiquent un bon modèle.
# Des tendances dans les résidus indiquent que le modèle ne capture pas certaines relations.

# <h3>4-b) Performance du modèle sur test set</h3>
# Évaluer le modèle sur l'ensemble de test
mse_test = mean_squared_error(y_test, yhat_nn)
r2_test = r2_score(y_test, yhat_nn)

print(f"Performance sur l'ensemble de test:")
print(f"MSE: {mse_test:.4f}")
print(f"R²: {r2_test:.4f}")

# Calculer les résidus
residus_test = y_test - yhat_nn

# Tracer le graphique des résidus
plt.figure(figsize=(10, 6))
plt.scatter(yhat_nn, residus_test)
plt.axhline(y=0, color='r', linestyle='-')
plt.title('Graphique des résidus (ensemble de test)')
plt.xlabel('Valeurs prédites')
plt.ylabel('Résidus')
plt.grid(True)
plt.show()

# <h3>4-c) À quoi peut servir d'évaluer le modèle en utilisant training set et test set en même temps</h3>
# Évaluer le modèle sur les ensembles d'entraînement et de test en même temps permet de:
#
# 1. Détecter le surapprentissage (overfitting):
#    - Si les performances sont bonnes sur l'ensemble d'entraînement mais mauvaises sur l'ensemble de test,
#      cela indique un surapprentissage.
#
# 2. Évaluer la capacité de généralisation:
#    - Une faible différence entre les performances sur les deux ensembles indique une bonne généralisation.
#
# 3. Guider le réglage des hyperparamètres:
#    - Permet d'ajuster les hyperparamètres pour optimiser la généralisation plutôt que juste la performance
#      sur les données d'entraînement.
#
# 4. Valider la stabilité du modèle:
#    - Un modèle stable devrait avoir des performances similaires sur les deux ensembles.
#
# 5. Détecter les problèmes de distribution:
#    - Des différences importantes peuvent révéler que les distributions des ensembles d'entraînement
#      et de test sont différentes.

# <h1>From scratch</h1>

# <h1 style="color: red;"> Section 3: Régression linéaire from scratch </h1>

# <h2>Modèle (version1) de régression linéaire from scratch avec utilisation des matrices</h2>

In [None]:
class LinearRegressionScratch:
    def __init__(self):
        self.weights = None
        self.bias = None
    
    def fit(self, X, y, learning_rate=0.01, epochs=1000):
        # Initialisation des paramètres
        n_samples, n_features = X.shape
        self.weights = np.zeros(n_features)
        self.bias = 0
        
        # Historique des pertes pour visualisation
        losses = []
        
        # Algorithme de descente de gradient
        for i in range(epochs):
            # Prédictions avec les paramètres actuels
            y_pred = np.dot(X, self.weights) + self.bias
            
            # Calcul des gradients
            dw = (1/n_samples) * np.dot(X.T, (y_pred - y))
            db = (1/n_samples) * np.sum(y_pred - y)
            
            # Mise à jour des paramètres
            self.weights -= learning_rate * dw
            self.bias -= learning_rate * db
            
            # Calcul de la perte (MSE)
            loss = (1/n_samples) * np.sum((y_pred - y)**2)
            losses.append(loss)
            
            # Affichage de la progression tous les 100 epochs
            if i % 100 == 0:
                print(f'Epoch {i}, Loss: {loss:.4f}')
        
        return losses
    
    def predict(self, X):
        return np.dot(X, self.weights) + self.bias

# Création et entraînement du modèle from scratch
linear_reg_scratch = LinearRegressionScratch()
losses = linear_reg_scratch.fit(X_train, y_train, learning_rate=0.01, epochs=1000)

# Visualisation de l'évolution de la perte
plt.figure(figsize=(10, 6))
plt.plot(losses)
plt.title('Évolution de la perte (MSE) pendant l\'entraînement')
plt.xlabel('Epochs')
plt.ylabel('Loss (MSE)')
plt.grid(True)
plt.show()

# Prédictions sur l'ensemble de test
yhat_scratch = linear_reg_scratch.predict(X_test)

# Évaluation du modèle from scratch
mse_scratch = mean_squared_error(y_test, yhat_scratch)
r2_scratch = r2_score(y_test, yhat_scratch)

print(f"MSE (modèle from scratch): {mse_scratch:.4f}")
print(f"R² (modèle from scratch): {r2_scratch:.4f}")

# Comparaison des poids appris avec les vrais coefficients
print("Poids appris (from scratch):", linear_reg_scratch.weights)
print("Biais appris (from scratch):", linear_reg_scratch.bias)
print("Vrais coefficients: a1 =", a1, ", a2 =", a2, ", b =", b)

# Comparaison des deux modèles
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.scatter(y_test, yhat_nn)
plt.plot([min(y_test), max(y_test)], [min(y_test), max(y_test)], 'r--')
plt.title('Prédictions (Réseau de neurones)')
plt.xlabel('Valeurs réelles')
plt.ylabel('Prédictions')
plt.grid(True)

plt.subplot(1, 2, 2)
plt.scatter(y_test, yhat_scratch)
plt.plot([min(y_test), max(y_test)], [min(y_test), max(y_test)], 'r--')
plt.title('Prédictions (Régression linéaire from scratch)')
plt.xlabel('Valeurs réelles')
plt.ylabel('Prédictions')
plt.grid(True)

plt.tight_layout()
plt.show()

# Tableau comparatif des performances
comparaison = {
    'Modèle': ['Réseau de neurones', 'Régression linéaire from scratch'],
    'MSE sur test': [mse_test, mse_scratch],
    'R² sur test': [r2_test, r2_scratch]
}

df_comparaison = pnd.DataFrame(comparaison)
print(df_comparaison)


In [None]:
import numpy as np

# Dataset fourni
X = np.array([[1, 2], 
              [3, 4], 
              [5, 6], 
              [7, 8]])
y = np.array([10, 20, 30, 40])

# Paramètres initiaux
bias = 0.1
weights = np.array([[0.2], [0.3]])

# a) Calcul de la prédiction
def predict(X, weights, bias):
    return np.dot(X, weights) + bias

y_pred = predict(X, weights, bias)
print("a) Prédictions:")
print(y_pred.flatten())  # Aplatir pour un affichage plus propre

# b) Calcul des erreurs
def calculate_errors(y_true, y_pred):
    return y_pred - y_true

errors = calculate_errors(y, y_pred)
print("\nb) Erreurs:")
print(errors.flatten())

# c) Calcul des gradients
def calculate_gradients(X, errors):
    n_samples = X.shape[0]
    # Gradient pour les poids
    dw = (1/n_samples) * np.dot(X.T, errors)
    # Gradient pour le biais
    db = (1/n_samples) * np.sum(errors)
    return dw, db

dw, db = calculate_gradients(X, errors)
print("\nc) Gradients:")
print("dw:", dw.flatten())
print("db:", db)

# d) Mise à jour du modèle
def update_parameters(weights, bias, dw, db, learning_rate=0.01):
    weights = weights - learning_rate * dw
    bias = bias - learning_rate * db
    return weights, bias

learning_rate = 0.01
new_weights, new_bias = update_parameters(weights, bias, dw, db, learning_rate)
print("\nd) Paramètres mis à jour:")
print("Nouveaux poids:", new_weights.flatten())
print("Nouveau biais:", new_bias)