In [None]:
import pandas as pd

# Étape 1 : Chargement des données prétraitées


In [None]:
def load_preprocessed_data(article_path, dispo_path, tiers_path):
    """
    Charge les données prétraitées des tables ARTICLE, DISPO, et TIERS.
    """
    try:
        article = pd.read_csv(article_path)
        dispo = pd.read_csv(dispo_path)
        tiers = pd.read_csv(tiers_path)
        print("Données prétraitées chargées avec succès.")
        return article, dispo, tiers
    except Exception as e:
        print(f"Erreur lors du chargement des données : {e}")
        return None, None, None

# Étape 2 : Fusionner les données


In [None]:
def merge_data(article, dispo, tiers):
    """
    Fusionne les tables ARTICLE, DISPO, et TIERS en utilisant les relations définies.
    """
    # Jointure entre ARTICLE et DISPO
    merged_data = pd.merge(article, dispo, left_on="GA_ARTICLE", right_on="GQ_ARTICLE", how="left")
    print("Jointure entre ARTICLE et DISPO terminée.")

    # Jointure entre le résultat précédent et TIERS
    merged_data = pd.merge(merged_data, tiers, left_on="GA_FOURNPRINC", right_on="T_AUXILIAIRE", how="left")
    print("Jointure entre ARTICLE+DISPO et TIERS terminée.")

    print(f"Taille de la table fusionnée : {merged_data.shape}")
    return merged_data

# Étape 3 : Sauvegarder la table finale

In [None]:
def save_merged_data(data, output_path):
    """
    Sauvegarde la table fusionnée dans un fichier CSV.
    """
    try:
        data.to_csv(output_path, index=False)
        print(f"Données fusionnées sauvegardées dans '{output_path}'.")
    except Exception as e:
        print(f"Erreur lors de la sauvegarde des données : {e}")

# Pipeline principal


In [None]:
def concatenate_tables(article_path, dispo_path, tiers_path, output_path):
    """
    Concatène les tables ARTICLE, DISPO, et TIERS en une seule table.
    """
    # Étape 1 : Chargement des données prétraitées
    article, dispo, tiers = load_preprocessed_data(article_path, dispo_path, tiers_path)
    if article is None or dispo is None or tiers is None:
        return None

    # Étape 2 : Fusionner les données
    merged_data = merge_data(article, dispo, tiers)

    # Étape 3 : Sauvegarder la table finale
    save_merged_data(merged_data, output_path)

    return merged_data

# Exécution du pipeline


In [None]:
if __name__ == "__main__":
    # Chemins vers les fichiers prétraités
    article_path = "ArticlePreprocessed.csv"
    dispo_path = "DISPO_Preprocessed.csv"
    tiers_path = "TIERS_Preprocessed.csv"

    # Chemin de sortie pour la table fusionnée
    output_path = "Concatenated_Data.csv"

    # Concaténer les tables
    concatenated_data = concatenate_tables(article_path, dispo_path, tiers_path, output_path)

    # Afficher un aperçu des données fusionnées
    if concatenated_data is not None:
        print(concatenated_data.head())