In [2]:
import pandas as pd
import numpy as np

# Charger les fichiers Excel dans des dataframes pandas
df_v0 = pd.read_excel('../DB/old/All-at-once_DB_v0.xlsx', skiprows=0, sheet_name='screen')
df_v1 = pd.read_excel('../DB/old/All-at-once_DB_v1.xlsx', skiprows=0, sheet_name='screen')

def clean_column(col):
    if col.dtype == object:  # Assumer que 'object' contient des chaînes
        return col.astype(str).str.strip()
    return col

def compare_dataframes(df1, df2):
    df1_clean = df1.apply(clean_column)
    df2_clean = df2.apply(clean_column)
    
    # Créer un masque où NaN est traité comme équivalent
    mask_changes = ~(df1_clean.eq(df2_clean) | (df1_clean.isna() & df2_clean.isna()))
    diff_df = pd.DataFrame()
    
    for col in df1.columns:
        if mask_changes[col].any():
            diff_df[f'{col}_before'] = df1[col]
            diff_df[f'{col}_after'] = df2[col]
        else:
            diff_df[col] = df1[col]  # Les valeurs n'ont pas changé

    # Filtrer pour ne garder que les lignes avec des changements
    diff_df = diff_df.loc[mask_changes.any(axis=1)]

    return diff_df


# Comparaison des dataframes et stockage des différences
df_differences = compare_dataframes(df_v0, df_v1)

# Exporter les détails des changements
if not df_differences.empty:
    df_differences.to_csv('../DB/old/detailed_differences.csv')
    print("Les détails des changements ont été exportés dans 'detailed_differences.csv'.")
    print(f"Nombre de lignes dans le fichier CSV: {df_differences.shape[0]}")
    print("Indices avec changements détectés :", df_differences.index.tolist())
else:
    print("Aucun changement détecté.")


Les détails des changements ont été exportés dans 'detailed_differences.csv'.
Nombre de lignes dans le fichier CSV: 258
Indices avec changements détectés : [104, 105, 106, 107, 108, 109, 110, 111, 112, 113, 114, 115, 116, 117, 118, 119, 120, 121, 122, 123, 124, 125, 126, 127, 128, 129, 130, 131, 132, 133, 134, 135, 136, 137, 138, 139, 140, 141, 142, 143, 144, 145, 146, 147, 148, 149, 150, 151, 152, 153, 154, 155, 156, 157, 158, 159, 160, 161, 162, 163, 164, 165, 166, 167, 168, 169, 170, 171, 172, 173, 174, 175, 176, 177, 178, 179, 180, 181, 182, 183, 184, 185, 186, 187, 188, 189, 190, 191, 192, 193, 194, 195, 196, 197, 199, 200, 201, 202, 203, 204, 205, 206, 207, 208, 209, 210, 211, 212, 213, 214, 215, 217, 218, 219, 220, 221, 222, 223, 224, 225, 226, 227, 228, 230, 231, 232, 233, 234, 235, 236, 237, 238, 239, 240, 241, 243, 244, 245, 246, 247, 248, 249, 250, 251, 252, 253, 254, 256, 257, 258, 259, 260, 261, 262, 263, 264, 266, 267, 269, 270, 271, 272, 273, 274, 275, 276, 277, 279, 280