In [3]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

In [4]:
class FederatedClient:
    """
    Classe représentant un client (assureur) dans le système d'apprentissage fédéré
    """
    def __init__(self, name, data, features, target):
        self.name = name
        self.data = data
        self.features = features
        self.target = target
        self.model = None
        self.weights = None
        self.prepare_data()
    
    def prepare_data(self):
        """
        Prépare les données pour l'entraînement
        """
        X = self.data[self.features]
        y = self.data[self.target]
        
        self.X_train, self.X_test, self.y_train, self.y_test = train_test_split(X, y, test_size=0.2, random_state=42)
    
    def train_local_model(self):
        """
        Entraîne un modèle GLM (régression logistique) localement
        """
        self.model = LogisticRegression(max_iter=1000, random_state=42)
        self.model.fit(self.X_train, self.y_train)
        self.weights = np.concatenate([self.model.intercept_, self.model.coef_[0]])
        
        print(f"\nPoids du modèle local pour {self.name}:")
        feature_names = ['Intercept'] + self.features
        for i, (name, weight) in enumerate(zip(feature_names, self.weights)):
            print(f"  {name}: {weight:.6f}")
        
        self.evaluate_model()
        
        return self.weights
    
    def update_weights(self, global_weights):
        """
        Met à jour les poids du modèle local avec les poids globaux
        """
        self.weights = global_weights
        
        # Si modèle existe déjà, mettre à jour ses coefficients
        if self.model is not None:
            self.model.intercept_ = np.array([global_weights[0]])
            self.model.coef_ = global_weights[1:].reshape(1, -1)
    
    def evaluate_model(self):
        """
        Évalue le modèle sur les données de test
        """
        if self.model is None:
            print(f"Aucun modèle entraîné pour {self.name}")
            return None
        
        y_pred = self.model.predict(self.X_test)
        
        accuracy = accuracy_score(self.y_test, y_pred)
        precision = precision_score(self.y_test, y_pred, zero_division=0)
        recall = recall_score(self.y_test, y_pred, zero_division=0)
        f1 = f1_score(self.y_test, y_pred, zero_division=0)
        
        print(f"Performance du modèle pour {self.name}:")
        print(f"  Accuracy: {accuracy:.4f}")
        print(f"  Precision: {precision:.4f}")
        print(f"  Recall: {recall:.4f}")
        print(f"  F1 Score: {f1:.4f}")
        
        return {
            'accuracy': accuracy,
            'precision': precision,
            'recall': recall,
            'f1': f1
        }

In [5]:

class FederatedServer:
    """
    Classe représentant le serveur central dans le système d'apprentissage fédéré
    """
    def __init__(self):
        self.clients = []
        self.global_weights = None
    
    def add_client(self, client):
        """
        Ajoute un client au système
        """
        self.clients.append(client)
    
    def federated_averaging(self, weights_list, sample_sizes=None):
        """
        Implémente l'algorithme FedAvg pour agréger les poids
        
        min F(w) := ∑ pk Fk(w) où pk sont les poids d'importance de chaque client
        """
        if sample_sizes is None:
            # Si aucune taille d'échantillon n'est fournie, utiliser une pondération uniforme
            weights = np.mean(weights_list, axis=0)
        else:
            total_samples = sum(sample_sizes)
            weights_array = np.array(weights_list)
            weights = np.zeros_like(weights_array[0])
            
            for i, client_weights in enumerate(weights_array):
                pk = sample_sizes[i] / total_samples  # Poids d'importance
                weights += pk * client_weights
        
        return weights
    
    def train_global_model(self, num_rounds=3):
        """
        Entraîne le modèle global en utilisant l'apprentissage fédéré
        """
        print(f"\nDémarrage de l'apprentissage fédéré avec {len(self.clients)} clients")
        
        # Initialisation des poids globaux (w0)
        if self.global_weights is None and len(self.clients) > 0:
            first_client = self.clients[0]
            num_features = len(first_client.features)
            self.global_weights = np.zeros(num_features + 1)  # +1 pour l'intercept
        
        for round_num in range(num_rounds):
            print(f"\n--- Cycle d'apprentissage fédéré {round_num + 1}/{num_rounds} ---")
            
            if round_num > 0:  # Seulement après le premier round
                for client in self.clients:
                    client.update_weights(self.global_weights)
            
            local_weights = []
            sample_sizes = []
            
            for client in self.clients:
                # Entraînement du modèle local
                weights = client.train_local_model()
                local_weights.append(weights)
                sample_sizes.append(len(client.data))
            
            self.global_weights = self.federated_averaging(local_weights, sample_sizes)
            
            print(f"\nPoids globaux après le cycle {round_num + 1}:")
            if len(self.clients) > 0:
                feature_names = ['Intercept'] + self.clients[0].features
                for i, (name, weight) in enumerate(zip(feature_names, self.global_weights)):
                    print(f"  {name}: {weight:.6f}")
        
        return self.global_weights

In [6]:
class FederatedLearning:
    """
    Classe principale pour coordonner l'apprentissage fédéré
    """
    def __init__(self, data_dict, features, target):
        """
        Initialise le système d'apprentissage fédéré
        
        Args:
            data_dict: Dictionnaire {nom_client: dataframe_pandas}
            features: Liste des variables explicatives
            target: Nom de la variable cible
        """
        self.data_dict = data_dict
        self.features = features
        self.target = target
        self.server = FederatedServer()
    
    def setup(self):
        """
        Configure le système en créant les clients
        """
        for client_name, data in self.data_dict.items():
            try:
                print(f"Configuration du client '{client_name}' avec {len(data)} observations")
                
                # Création du client
                client = FederatedClient(client_name, data, self.features, self.target)
                self.server.add_client(client)
                
                print(f"Client '{client_name}' ajouté avec succès")
            except Exception as e:
                print(f"Erreur lors de la configuration du client '{client_name}': {str(e)}")
    
    def train(self, num_rounds=3):
        """
        Lance l'entraînement fédéré
        
        Args:
            num_rounds: Nombre de cycles d'entraînement
            
        Returns:
            Les poids du modèle global final
        """
        return self.server.train_global_model(num_rounds)


In [None]:
def main():
    """
    Fonction principale
    """
    try:
        features = ['Exposure', 'DriverAge', 'Gender', 'VehiculeUsage']
        target = 'Sinistre'
        
        fr = pd.read_csv('french_data.csv')
        be = pd.read_csv('belgium_data.csv')
        eu = pd.read_csv('european_data.csv')
    
        
        data_dict = {
            'France': fr,
            'Belgium': be,
            'Europe': eu
        }
        
        print("Configuration du système d'apprentissage fédéré...")
        fl_system = FederatedLearning(data_dict, features, target)
        fl_system.setup()
        
        print("\nDémarrage de l'entraînement...")
        global_weights = fl_system.train(num_rounds=3)
        
        print("\nApprentissage fédéré terminé!")
        print("Poids finaux du modèle global:")
        feature_names = ['Intercept'] + features
        for i, (name, weight) in enumerate(zip(feature_names, global_weights)):
            print(f"  {name}: {weight:.6f}")
    
    except Exception as e:
        print(f"Erreur lors de l'exécution: {str(e)}")


if __name__ == "__main__":
    main()

Configuration du système d'apprentissage fédéré...
Configuration du client 'France' avec 243065 observations
Client 'France' ajouté avec succès
Configuration du client 'Belgium' avec 163212 observations
Client 'Belgium' ajouté avec succès
Configuration du client 'Europe' avec 0 observations
Erreur lors de la configuration du client 'Europe': With n_samples=0, test_size=0.2 and train_size=None, the resulting train set will be empty. Adjust any of the aforementioned parameters.

Démarrage de l'entraînement...

Démarrage de l'apprentissage fédéré avec 2 clients

--- Cycle d'apprentissage fédéré 1/3 ---

Poids du modèle local pour France:
  Intercept: -3.289210
  Exposure: 2.014750
  DriverAge: -0.005810
  Gender: 0.002711
  VehiculeUsage: -0.164039
Performance du modèle pour France:
  Accuracy: 0.9351
  Precision: 0.0000
  Recall: 0.0000
  F1 Score: 0.0000

Poids du modèle local pour Belgium:
  Intercept: -2.258029
  Exposure: 1.007289
  DriverAge: -0.015609
  Gender: 0.024640
  VehiculeU