In [1]:
import pyodbc

# Définir les paramètres de connexion
server = 'localhost\\SQLEXPRESS'  # Nom du serveur correct
database = 'Lallemand_oenologie'

# Établir la connexion
connection_string = f'DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={server};DATABASE={database};Trusted_Connection=yes;'
conn = pyodbc.connect(connection_string)
print("Connexion réussie!")

# Créer un curseur
cursor = conn.cursor()

# Définir la commande SQL pour créer la table Fermentation (table principale)
create_table_fermentation = '''
CREATE TABLE Fermentation(
    Code VARCHAR(20) PRIMARY KEY,
    Souche VARCHAR(35),
    Milieu VARCHAR(35),
    Volume VARCHAR(5),
    Csg_T INT,
    Type_fermentation VARCHAR(10)
)
'''

# Définir la commande SQL pour créer la table Données_Fermentation
create_table_donnees_fermentation = '''
CREATE TABLE Donnees_Fermentation(
    Id INT PRIMARY KEY IDENTITY(1,1),
    Temps FLOAT,
    CO2 FLOAT,
    V FLOAT,
    Code VARCHAR(20),
    FOREIGN KEY (Code) REFERENCES Fermentation(Code) ON DELETE CASCADE
)
'''

# Définir la commande SQL pour créer la table Phase_fermentation
create_table_phase_fermentation = '''
CREATE TABLE Phase_fermentation(
    Code VARCHAR(20) PRIMARY KEY,
    FIN_LATENCE FLOAT,
    Max_V FLOAT,
    TempsmaxV FLOAT,
    max_co2 FLOAT,
    tempsmaxco2 FLOAT,
    Maxco2_95 FLOAT,
    Maxco2_90 FLOAT,
    Maxco2_70 FLOAT,
    Maxco2_80 FLOAT,
    tempsmaxco2_95 FLOAT,
    tempsmaxco2_90 FLOAT,
    tempsmaxco2_70 FLOAT,
    tempsmaxco2_80 FLOAT,
    Fin_fermentation FLOAT,
    FOREIGN KEY (Code) REFERENCES Fermentation(Code) ON DELETE CASCADE
)
'''

# Définir la commande SQL pour créer la table Analyse_Vin
create_table_analyse_vin = '''
CREATE TABLE Analyse_Vin(
    Code VARCHAR(20) PRIMARY KEY,
    Glucose_fructose_g_l VARCHAR(6),
    Titre_alcoometrique_vol VARCHAR(6),
    pH VARCHAR(6),
    Acidite_volatile_gH2SO4_l VARCHAR(6),
    Acidite_totale_gH2SO4_l VARCHAR(6),
    Dioxyde_soufre_Libre_mg_l VARCHAR(6),
    Dioxyde_soufre_Total_mg_l VARCHAR(6),
    AcideL_malique_g_L VARCHAR(6),
    Nuance_IR VARCHAR(6),
    IC VARCHAR(6),
    FOREIGN KEY (Code) REFERENCES Fermentation(Code) ON DELETE CASCADE
)
'''

# Définir la commande SQL pour créer la table Analyse_Mout
create_table_analyse_mout = '''
CREATE TABLE Analyse_Mout(
    Code VARCHAR(20) PRIMARY KEY,
    Synonymes VARCHAR(35),
    Code_Milieu VARCHAR(35),
    Sucres FLOAT,
    Azote FLOAT,
    pH FLOAT,
    Turbidite FLOAT,
    Acide_Malic FLOAT,
    Phytosterols_mg_L FLOAT,
    Ergosterol_mg_L FLOAT,
    SO2_libre VARCHAR(6),
    SO2_Total VARCHAR(6),
    Desaere BIT,
    AT FLOAT,
    phyt_NTU FLOAT,
    ergo_NTU FLOAT,
    Turb_phyto FLOAT,
    FOREIGN KEY (Code) REFERENCES Fermentation(Code) ON DELETE CASCADE
)
'''

# Définir la commande SQL pour créer la table Compositions
create_table_compositions = '''
CREATE TABLE Compositions (
    Code varchar(20) primary key,
    Code_Souche VARCHAR(35),
    modelisation Bit,
    protectant bit,
	T0_nut_compl bit,
	T0_nut_org bit,
	un_tiers_FA_nut_comp bit,
	un_tiers_FA_nut_org bit,
	NSc bit,
	NSC_sc_seq bit,
	NSC_tps_seq bit,
	FOREIGN KEY (Code) REFERENCES Fermentation(Code)
)
'''

try:
    # Vérifier si les tables existent déjà et les supprimer si nécessaire
    tables_to_drop = [
        'Compositions',
        'Analyse_Mout', 
        'Analyse_Vin', 
        'Phase_fermentation', 
        'Donnees_Fermentation', 
        'Fermentation'
    ]
    
    for table in tables_to_drop:
        try:
            cursor.execute(f"DROP TABLE IF EXISTS {table}")
            print(f"Table {table} supprimée si elle existait.")
        except:
            pass
    
    # Exécuter les commandes SQL dans l'ordre correct (table principale d'abord)
    print("Création de la table Fermentation...")
    cursor.execute(create_table_fermentation)
    
    print("Création de la table Donnees_Fermentation...")
    cursor.execute(create_table_donnees_fermentation)
    
    print("Création de la table Phase_fermentation...")
    cursor.execute(create_table_phase_fermentation)
    
    print("Création de la table Analyse_Vin...")
    cursor.execute(create_table_analyse_vin)
    
    print("Création de la table Analyse_Mout...")
    cursor.execute(create_table_analyse_mout)
    
    print("Création de la table Compositions...")
    cursor.execute(create_table_compositions)
    
    # Valider la transaction
    conn.commit()
    print("Toutes les tables ont été créées avec succès!")
    
except pyodbc.Error as e:
    print(f"Erreur lors de la création des tables: {e}")
    conn.rollback()
    
finally:
    # Fermer le curseur et la connexion
    cursor.close()
    conn.close()
    print("Connexion fermée.")

# Instructions d'utilisation:
"""
Structure des relations:
- Fermentation (1) -> Donnees_Fermentation (N)
- Fermentation (1) -> Phase_fermentation (1)
- Fermentation (1) -> Analyse_Vin (1)
- Fermentation (1) -> Analyse_Mout (1)
- Fermentation (1) -> Compositions (1)
"""

Connexion réussie!
Table Compositions supprimée si elle existait.
Table Analyse_Mout supprimée si elle existait.
Table Analyse_Vin supprimée si elle existait.
Table Phase_fermentation supprimée si elle existait.
Table Donnees_Fermentation supprimée si elle existait.
Table Fermentation supprimée si elle existait.
Création de la table Fermentation...
Création de la table Donnees_Fermentation...
Création de la table Phase_fermentation...
Création de la table Analyse_Vin...
Création de la table Analyse_Mout...
Création de la table Compositions...
Toutes les tables ont été créées avec succès!
Connexion fermée.


'\nStructure des relations:\n- Fermentation (1) -> Donnees_Fermentation (N)\n- Fermentation (1) -> Phase_fermentation (1)\n- Fermentation (1) -> Analyse_Vin (1)\n- Fermentation (1) -> Analyse_Mout (1)\n- Fermentation (1) -> Compositions (1)\n'

In [1]:
import os
os.chdir("C:/Users/ibigirimana/OneDrive - lallemand.com/Bureau")
print("Répertoire courant :", os.getcwd())

Répertoire courant : C:\Users\ibigirimana\OneDrive - lallemand.com\Bureau


# *Table Phase_fermentation*

In [10]:
import pyodbc
import pandas as pd
import logging
from typing import Optional

# Configuration du logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

def create_connection(server: str, database: str) -> Optional[pyodbc.Connection]:
    """
    Crée une connexion à la base de données SQL Server
    """
    try:
        connection_string = f'DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={server};DATABASE={database};Trusted_Connection=yes;'
        conn = pyodbc.connect(connection_string)
        logger.info(f"Connexion réussie à la base de données {database}")
        return conn
    except pyodbc.Error as e:
        logger.error(f"Erreur de connexion à la base de données: {e}")
        return None

def read_excel_file(file_path: str) -> Optional[pd.DataFrame]:
    """
    Lit le fichier Excel et retourne un DataFrame
    """
    try:
        df = pd.read_excel(file_path)
        logger.info(f"Fichier Excel lu avec succès. {len(df)} lignes trouvées.")
        return df
    except FileNotFoundError:
        logger.error(f"Fichier {file_path} non trouvé")
        return None
    except Exception as e:
        logger.error(f"Erreur lors de la lecture du fichier Excel: {e}")
        return None

def clean_and_validate_dataframe(df: pd.DataFrame) -> Optional[pd.DataFrame]:
    """
    Nettoie et valide le DataFrame
    """
    required_columns = [
        'Code', 'FIN_LATENCE', 'Max_V', 'TempsmaxV', 'max_co2', 'tempsmaxco2',
        'Maxco2_95', 'Maxco2_90', 'Maxco2_70', 'Maxco2_80',
        'tempsmaxco2_95', 'tempsmaxco2_90', 'tempsmaxco2_70', 'tempsmaxco2_80',
        'Fin_fermentation'
    ]
    
    # Vérifier les colonnes manquantes
    missing_columns = [col for col in required_columns if col not in df.columns]
    if missing_columns:
        logger.error(f"Colonnes manquantes dans le fichier Excel: {missing_columns}")
        return None
    
    # Créer une copie pour ne pas modifier l'original
    df_clean = df[required_columns].copy()
    
    # Colonnes numériques (toutes sauf 'Code')
    numeric_columns = [col for col in required_columns if col != 'Code']
    
    # Nettoyer les données
    for col in numeric_columns:
        # Remplacer les valeurs non-numériques par NaN
        df_clean[col] = pd.to_numeric(df_clean[col], errors='coerce')
        # Remplacer NaN par None pour SQL Server
        df_clean[col] = df_clean[col].where(pd.notnull(df_clean[col]), None)
    
    # Nettoyer la colonne Code (enlever les espaces)
    df_clean['Code'] = df_clean['Code'].astype(str).str.strip()
    
    # Vérifier s'il y a des codes vides
    empty_codes = df_clean['Code'].isin(['', 'nan', 'None'])
    if empty_codes.any():
        logger.warning(f"Trouvé {empty_codes.sum()} lignes avec des codes vides - elles seront ignorées")
        df_clean = df_clean[~empty_codes]
    
    logger.info(f"Données nettoyées. {len(df_clean)} lignes valides à insérer")
    
    # Afficher un échantillon des données nettoyées
    logger.info("Échantillon des données nettoyées:")
    logger.info(f"\n{df_clean.head().to_string()}")
    
    return df_clean

def insert_data_batch(conn: pyodbc.Connection, df: pd.DataFrame) -> bool:
    """
    Insère les données par batch pour améliorer les performances
    """
    try:
        cursor = conn.cursor()
        
        # Préparer la requête d'insertion
        insert_query = '''
            INSERT INTO Phase_fermentation (
                Code, FIN_LATENCE, Max_V, TempsmaxV, max_co2, tempsmaxco2,
                Maxco2_95, Maxco2_90, Maxco2_70, Maxco2_80,
                tempsmaxco2_95, tempsmaxco2_90, tempsmaxco2_70, tempsmaxco2_80,
                Fin_fermentation
            ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
        '''
        
        # Insérer ligne par ligne avec gestion d'erreur individuelle
        successful_inserts = 0
        failed_inserts = 0
        
        for index, row in df.iterrows():
            try:
                # Préparer les valeurs en s'assurant que None est bien passé pour les valeurs manquantes
                values = (
                    row['Code'], row['FIN_LATENCE'], row['Max_V'], row['TempsmaxV'],
                    row['max_co2'], row['tempsmaxco2'], row['Maxco2_95'], row['Maxco2_90'],
                    row['Maxco2_70'], row['Maxco2_80'], row['tempsmaxco2_95'], 
                    row['tempsmaxco2_90'], row['tempsmaxco2_70'], row['tempsmaxco2_80'],
                    row['Fin_fermentation']
                )
                
                cursor.execute(insert_query, values)
                successful_inserts += 1
                
            except pyodbc.Error as e:
                failed_inserts += 1
                logger.error(f"Erreur ligne {index + 1} (Code: {row['Code']}): {e}")
                logger.error(f"Valeurs problématiques: {values}")
                # Continue avec la ligne suivante
                continue
        
        # Commit toutes les insertions réussies
        conn.commit()
        
        logger.info(f"Insertion terminée: {successful_inserts} réussies, {failed_inserts} échouées")
        cursor.close()
        
        return successful_inserts > 0
        
    except pyodbc.Error as e:
        logger.error(f"Erreur générale lors de l'insertion des données: {e}")
        conn.rollback()
        return False

def diagnose_excel_data(file_path: str):
    """
    Fonction de diagnostic pour analyser les données Excel problématiques
    """
    try:
        df = pd.read_excel(file_path)
        print(f"Shape du DataFrame: {df.shape}")
        print(f"Colonnes: {list(df.columns)}")
        print(f"\nTypes de données:")
        print(df.dtypes)
        print(f"\nValeurs manquantes par colonne:")
        print(df.isnull().sum())
        print(f"\nPremières lignes:")
        print(df.head())
        
        # Vérifier les valeurs non-numériques dans les colonnes numériques
        numeric_columns = ['FIN_LATENCE', 'Max_V', 'TempsmaxV', 'max_co2', 'tempsmaxco2',
                          'Maxco2_95', 'Maxco2_90', 'Maxco2_70', 'Maxco2_80',
                          'tempsmaxco2_95', 'tempsmaxco2_90', 'tempsmaxco2_70', 
                          'tempsmaxco2_80', 'Fin_fermentation']
        
        for col in numeric_columns:
            if col in df.columns:
                non_numeric = pd.to_numeric(df[col], errors='coerce').isna()
                if non_numeric.any():
                    print(f"\nValeurs non-numériques dans {col}:")
                    print(df[non_numeric][col].unique())
                    
    except Exception as e:
        print(f"Erreur lors du diagnostic: {e}")

def main():
    """
    Fonction principale
    """
    # Configuration
    server = 'localhost\\SQLEXPRESS'
    database = 'Lallemand'
    excel_file = 'Fin_Fermentation.xlsx'
    
    logger.info("Début du processus d'insertion des données")
    
    # Diagnostic optionnel - décommentez si nécessaire
    # print("=== DIAGNOSTIC DES DONNÉES EXCEL ===")
    # diagnose_excel_data(excel_file)
    # print("=====================================")
    
    # Lire le fichier Excel
    df = read_excel_file(excel_file)
    if df is None:
        return
    
    # Nettoyer et valider les données
    df_clean = clean_and_validate_dataframe(df)
    if df_clean is None or len(df_clean) == 0:
        logger.error("Aucune donnée valide à insérer")
        return
    
    # Créer la connexion à la base de données
    conn = create_connection(server, database)
    if conn is None:
        return
    
    try:
        # Insérer les données
        if insert_data_batch(conn, df_clean):
            logger.info("Processus terminé avec succès!")
        else:
            logger.error("Échec de l'insertion des données")
    
    finally:
        # Fermer la connexion
        conn.close()
        logger.info("Connexion fermée")

if __name__ == "__main__":
    main()

2025-06-13 12:10:49,926 - INFO - Début du processus d'insertion des données
2025-06-13 12:10:51,249 - INFO - Fichier Excel lu avec succès. 6187 lignes trouvées.
2025-06-13 12:10:51,259 - INFO - Données nettoyées. 6187 lignes valides à insérer
2025-06-13 12:10:51,260 - INFO - Échantillon des données nettoyées:
2025-06-13 12:10:51,269 - INFO - 
            Code  FIN_LATENCE  Max_V  TempsmaxV  max_co2  tempsmaxco2  Maxco2_95  Maxco2_90  Maxco2_70  Maxco2_80  tempsmaxco2_95  tempsmaxco2_90  tempsmaxco2_70  tempsmaxco2_80  Fin_fermentation
0  C8_2020-07-30    13.729034   1.45      33.20   111.20       327.02   105.6400    100.080     77.840     88.960          257.87          182.49          106.58          132.95        352.880815
1  A1_2020-08-05    14.775600   1.77      26.65    69.49       256.68    66.0155     62.541     48.643     55.592          167.76           95.59           24.91           51.12        182.682151
2  A2_2020-08-05    14.858590   1.83      26.65    69.72       264.

# *Table Analyse de vin*

In [26]:
import pyodbc
import pandas as pd
import logging
from datetime import datetime

# Configuration du logging
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

# Configuration - MODIFIEZ CES VALEURS
server = 'localhost\\SQLEXPRESS'
database = 'Lallemand'
file_path = 'Analyse de vin.xlsx'

def clean_for_varchar(value):
    """Nettoie pour VARCHAR - vide = NULL, gère les valeurs spéciales comme '<7'"""
    if pd.isna(value) or value is None:
        return None
    
    str_value = str(value).strip()
    
    # Gérer les cas vides
    if str_value == '' or str_value.lower() == 'nan':
        return None
    
    # Gérer les valeurs comme '<7', '<25' (les garder telles quelles)
    return str_value

def main():
    try:
        print("Lecture du fichier...")
        logger.info(f"Début du traitement du fichier: {file_path}")
        
        # Lire le fichier Excel
        df = pd.read_excel(file_path)
        logger.info(f"Fichier lu avec succès: {len(df)} lignes")
        
        # Afficher les colonnes originales pour diagnostic
        print("Colonnes originales du fichier:")
        for i, col in enumerate(df.columns, 1):
            print(f"  {i}. '{col}'")
        
        # Nettoyer toutes les colonnes
        for col in df.columns:
            df[col] = df[col].apply(clean_for_varchar)
        
        # Filtrer les codes valides (ne pas inclure les lignes où Code est None/vide)
        df_valid = df[df['Code'].notna()].copy()
        print(f"Codes trouvés après nettoyage: {len(df_valid)}")
        
        # MAPPING CORRECT basé sur votre table SQL Server exacte
        # Fichier Excel → Table SQL Server
        column_mapping = {
            'Code': 'Code',
            'Glucose+fructoseg_l': 'Glucose_fructose_g_l',        # + → _ et correction 
            'Titrealcoométrivolumique% vol': 'Titre_alcoometrique_vol',  # Simplification
            'pH': 'pH',
            'AciditévolatilegH2SO4_l': 'Acidite_volatile_gH2SO4_l',      # Suppression accents
            'AciditétotalegH2SO4_l': 'Acidite_totale_gH2SO4_l',         # Suppression accents
            'Dioxydede soufreLibremg_l': 'Dioxyde_soufre_Libre_mg_l',   # Correction orthographe
            'Dioxydede soufreTotalmg_l': 'Dioxyde_soufre_Total_mg_l',   # Correction + ajout _l
            'AcideL_ malique g_L': 'AcideL_malique_g_L',
            'Nuance IR': 'Nuance_IR',                                     # Espace → underscore
            'IC': 'IC'
        }
        
        # Renommer les colonnes
        df_mapped = df_valid.rename(columns=column_mapping)
        
        # Colonnes attendues par la table SQL Server (dans l'ordre exact)
        expected_sql_columns = [
            'Code',
            'Glucose_fructose_g_l',
            'Titre_alcoometrique_vol', 
            'pH',
            'Acidite_volatile_gH2SO4_l',
            'Acidite_totale_gH2SO4_l',
            'Dioxyde_soufre_Libre_mg_l',
            'Dioxyde_soufre_Total_mg_l',
            'AcideL_malique_g_L',
            'Nuance_IR',
            'IC'
        ]
        
        # Vérifier que toutes les colonnes sont présentes
        missing_cols = set(expected_sql_columns) - set(df_mapped.columns)
        if missing_cols:
            logger.error(f"Colonnes manquantes après mapping: {missing_cols}")
            print("Colonnes disponibles après mapping:", list(df_mapped.columns))
            return
        
        # Réorganiser les colonnes dans l'ordre attendu
        df_final = df_mapped[expected_sql_columns].copy()
        
        print(f"Données préparées: {len(df_final)} lignes")
        print("\nAperçu des données mappées:")
        print(df_final.head())
        
        # Connexion à la base de données
        logger.info("Connexion à la base de données...")
        connection_string = f'DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={server};DATABASE={database};Trusted_Connection=yes;'
        conn = pyodbc.connect(connection_string)
        cursor = conn.cursor()
        
        # Vérifier que la table existe et a la bonne structure
        cursor.execute("""
            SELECT COLUMN_NAME 
            FROM INFORMATION_SCHEMA.COLUMNS 
            WHERE TABLE_NAME = 'Analyse_Vin' 
            ORDER BY ORDINAL_POSITION
        """)
        db_columns = [row[0] for row in cursor.fetchall()]
        
        if not db_columns:
            logger.error("Table 'Analyse_Vin' non trouvée!")
            return
        
        print(f"\nColonnes de la table SQL: {db_columns}")
        
        # Vérifier la correspondance
        if db_columns != expected_sql_columns:
            logger.warning("Structure de la table différente de celle attendue!")
            logger.warning(f"Attendu: {expected_sql_columns}")
            logger.warning(f"Trouvé:  {db_columns}")
        
        # Vérifier les codes existants pour éviter les doublons
        logger.info("Vérification des codes existants...")
        cursor.execute("SELECT Code FROM Analyse_Vin")
        existing_codes = set(row[0] for row in cursor.fetchall())
        logger.info(f"Codes existants en base: {len(existing_codes)}")
        
        # Filtrer les nouveaux enregistrements
        new_data = df_final[~df_final['Code'].isin(existing_codes)].copy()
        logger.info(f"Nouveaux enregistrements à insérer: {len(new_data)}")
        
        if len(new_data) == 0:
            print("Aucun nouvel enregistrement à insérer.")
            return
        
        # Afficher quelques exemples de ce qui va être inséré
        print(f"\nExemple des {min(3, len(new_data))} premiers enregistrements à insérer:")
        for i, (_, row) in enumerate(new_data.head(3).iterrows()):
            print(f"  {i+1}. Code: {row['Code']}")
            print(f"     pH: {row['pH']}, Titre: {row['Titre_alcoometrique_vol']}")
        
        # Demander confirmation pour les gros imports
        if len(new_data) > 1000:
            response = input(f"\nVoulez-vous vraiment insérer {len(new_data)} enregistrements? (oui/non): ")
            if response.lower() not in ['oui', 'o', 'yes', 'y']:
                print("Import annulé.")
                return
        
        # Insertion avec gestion d'erreurs détaillée
        success_count = 0
        error_count = 0
        
        # Requête d'insertion avec les noms exacts de la table SQL
        insert_query = """
            INSERT INTO Analyse_Vin (
                Code, Glucose_fructose_g_l, Titre_alcoometrique_vol, pH,
                Acidite_volatile_gH2SO4_l, Acidite_totale_gH2SO4_l, 
                Dioxyde_soufre_Libre_mg_l, Dioxyde_soufre_Total_mg_l,
                AcideL_malique_g_L, Nuance_IR, IC
            ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
        """
        
        logger.info("Début de l'insertion...")
        
        for index, row in new_data.iterrows():
            try:
                # Préparer les valeurs dans l'ordre exact de la requête
                values = (
                    row['Code'],
                    row['Glucose_fructose_g_l'],
                    row['Titre_alcoometrique_vol'],
                    row['pH'],
                    row['Acidite_volatile_gH2SO4_l'],
                    row['Acidite_totale_gH2SO4_l'],
                    row['Dioxyde_soufre_Libre_mg_l'],
                    row['Dioxyde_soufre_Total_mg_l'],
                    row['AcideL_malique_g_L'],
                    row['Nuance_IR'],
                    row['IC']
                )
                
                cursor.execute(insert_query, values)
                success_count += 1
                
                # Afficher le progrès tous les 500 enregistrements
                if success_count % 500 == 0:
                    logger.info(f"Inséré: {success_count} enregistrements")
                    
            except Exception as e:
                error_count += 1
                logger.error(f"Erreur ligne {index} (Code: {row['Code']}): {e}")
                
                # Afficher les premières erreurs pour diagnostic
                if error_count <= 5:
                    logger.error(f"Valeurs problématiques: {values}")
                
                # Si trop d'erreurs, arrêter
                if error_count > 100:
                    logger.error("Trop d'erreurs, arrêt du processus")
                    break
        
        # Valider les changements
        if success_count > 0:
            conn.commit()
            logger.info(f"Transaction validée - {success_count} enregistrements insérés")
        else:
            conn.rollback()
            logger.warning("Aucun enregistrement inséré, transaction annulée")
        
        print(f"\n{'='*50}")
        print(f"RÉSULTAT FINAL:")
        print(f"✅ Succès: {success_count} enregistrements")
        print(f"❌ Erreurs: {error_count} enregistrements")
        print(f"{'='*50}")
        
    except Exception as e:
        logger.error(f"Erreur critique: {e}")
        if 'conn' in locals():
            conn.rollback()
        raise
    
    finally:
        # Fermer les connexions
        if 'cursor' in locals():
            cursor.close()
        if 'conn' in locals():
            conn.close()

if __name__ == "__main__":
    main()

2025-06-18 13:51:58,202 - INFO - Début du traitement du fichier: Analyse de vin.xlsx


Lecture du fichier...


2025-06-18 13:51:58,884 - INFO - Fichier lu avec succès: 6179 lignes
2025-06-18 13:51:58,921 - INFO - Connexion à la base de données...
2025-06-18 13:51:58,939 - INFO - Vérification des codes existants...
2025-06-18 13:51:58,941 - INFO - Codes existants en base: 0
2025-06-18 13:51:58,944 - INFO - Nouveaux enregistrements à insérer: 6179


Colonnes originales du fichier:
  1. 'Code'
  2. 'Glucose+fructoseg_l'
  3. 'Titrealcoométrivolumique% vol'
  4. 'pH'
  5. 'AciditévolatilegH2SO4_l'
  6. 'AciditétotalegH2SO4_l'
  7. 'Dioxydede soufreLibremg_l'
  8. 'Dioxydede soufreTotalmg_l'
  9. 'AcideL_ malique g_L'
  10. 'Nuance IR'
  11. 'IC'
Codes trouvés après nettoyage: 6179
Données préparées: 6179 lignes

Aperçu des données mappées:
            Code Glucose_fructose_g_l Titre_alcoometrique_vol    pH  \
0  A1_2021-03-03                 None                    None  None   
1  A1_2022-11-03                 None                    None  None   
2  A1_2024-02-28                 None                    None  None   
3  A1_2024-09-17                 None                    None  None   
4  A1_2024-09-24                 None                    None  None   

  Acidite_volatile_gH2SO4_l Acidite_totale_gH2SO4_l Dioxyde_soufre_Libre_mg_l  \
0                      None                    None                      None   
1              


Voulez-vous vraiment insérer 6179 enregistrements? (oui/non):  oui


2025-06-18 13:52:07,366 - INFO - Début de l'insertion...
2025-06-18 13:52:07,556 - INFO - Inséré: 500 enregistrements
2025-06-18 13:52:07,877 - INFO - Inséré: 1000 enregistrements
2025-06-18 13:52:08,178 - INFO - Inséré: 1500 enregistrements
2025-06-18 13:52:08,475 - INFO - Inséré: 2000 enregistrements
2025-06-18 13:52:08,712 - INFO - Inséré: 2500 enregistrements
2025-06-18 13:52:09,003 - INFO - Inséré: 3000 enregistrements
2025-06-18 13:52:09,394 - INFO - Inséré: 3500 enregistrements
2025-06-18 13:52:09,748 - INFO - Inséré: 4000 enregistrements
2025-06-18 13:52:10,095 - INFO - Inséré: 4500 enregistrements
2025-06-18 13:52:10,394 - INFO - Inséré: 5000 enregistrements
2025-06-18 13:52:10,683 - INFO - Inséré: 5500 enregistrements
2025-06-18 13:52:10,867 - INFO - Inséré: 6000 enregistrements
2025-06-18 13:52:10,930 - INFO - Transaction validée - 6179 enregistrements insérés



RÉSULTAT FINAL:
✅ Succès: 6179 enregistrements
❌ Erreurs: 0 enregistrements


# *Table Analyse de Moût*

In [23]:
import pyodbc
import pandas as pd
import numpy as np

# Définir les paramètres de connexion
server = 'localhost\\SQLEXPRESS'
database = 'Lallemand'

# Nom du fichier Excel à traiter
excel_file = 'Analyse Mout.xlsx'

# Établir la connexion
connection_string = f'DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={server};DATABASE={database};Trusted_Connection=yes;'
conn = pyodbc.connect(connection_string)
print("Connexion réussie!")

# Créer un curseur
cursor = conn.cursor()

try:
    # Lire le fichier Excel
    print(f"Lecture du fichier Excel '{excel_file}'...")
    df = pd.read_excel(excel_file)
    print(f"Nombre de lignes lues: {len(df)}")
    print(f"Colonnes disponibles: {list(df.columns)}")
    
    # Remplacer les NaN par None pour SQL Server
    df = df.replace({np.nan: None})
    
    # Définir la requête d'insertion
    insert_query = '''
    INSERT INTO [Lallemand].[dbo].[Analyse_Mout] (
        [Code], [Synonymes], [Code_Milieu], [Sucres], [Azote], [pH], 
        [Turbidite], [Acide_Malic], [Phytosterols_mg_L], [Ergosterol_mg_L], 
        [SO2_libre], [SO2_Total], [Desaere], [AT], [phyt_NTU], 
        [ergo_NTU], [Turb_phyto]
    ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
    '''
    
    # Statistiques pour le suivi
    inserted_count = 0
    error_count = 0
    errors = []
    
    print(f"\nInsertion de {len(df)} lignes...")
    
    # Insérer les données ligne par ligne pour un meilleur contrôle des erreurs
    for index, row in df.iterrows():
        try:
            # Préparer les valeurs
            values = [
                row['Code'],
                row['Synonymes'],
                row['Code_Milieu'],
                row['Sucres'],
                row['Azote'],
                row['pH'],
                row['Turbidite'],
                row['Acide_Malic'],
                row['Phytosterols_mg_L'],
                row['Ergosterol_mg_L'],
                row['SO2_libre'],
                row['SO2_Total'],
                row['Desaere'],
                row['AT'],
                row['phyt_NTU'],
                row['ergo_NTU'],
                row['Turb_phyto']
            ]
            
            # Exécuter l'insertion
            cursor.execute(insert_query, values)
            inserted_count += 1
            
            # Afficher le progrès tous les 500 enregistrements
            if inserted_count % 500 == 0:
                print(f"Inséré: {inserted_count} lignes...")
                
        except Exception as e:
            error_count += 1
            error_msg = f"Erreur ligne {index + 1}: {str(e)}"
            errors.append(error_msg)
            print(f"Erreur ligne {index + 1}: {str(e)}")
            
            # Arrêter après 10 erreurs pour éviter de spammer
            if error_count >= 10:
                print("Trop d'erreurs, arrêt du processus...")
                break
    
    # Valider la transaction
    conn.commit()
    
    # Afficher les statistiques finales
    print(f"\n=== RÉSUMÉ ===")
    print(f"Lignes insérées avec succès: {inserted_count}")
    print(f"Erreurs rencontrées: {error_count}")
    
    if errors:
        print(f"\nPremières erreurs:")
        for error in errors[:5]:
            print(f"- {error}")
    
    # Vérifier l'insertion
    cursor.execute("SELECT COUNT(*) FROM [Lallemand].[dbo].[Analyse_Mout]")
    count = cursor.fetchone()[0]
    print(f"\nNombre total de lignes dans la table Analyse_Mout: {count}")
    
    # Afficher quelques exemples de données insérées
    cursor.execute("SELECT TOP 5 * FROM [Lallemand].[dbo].[Analyse_Mout] ORDER BY Code DESC")
    rows = cursor.fetchall()
    print("\nExemples de données insérées:")
    for row in rows:
        print(row)

except Exception as e:
    print(f"Erreur générale: {e}")
    conn.rollback()
    
finally:
    # Fermer la connexion
    cursor.close()
    conn.close()
    print("\nConnexion fermée.")

Connexion réussie!
Lecture du fichier Excel 'Analyse Mout.xlsx'...
Nombre de lignes lues: 6179
Colonnes disponibles: ['Code', 'Synonymes', 'Code_Milieu', 'Sucres', 'Azote', 'pH', 'Turbidite', 'Acide_Malic', 'Phytosterols_mg_L', 'Ergosterol_mg_L', 'SO2_libre', 'SO2_Total', 'Desaere', 'AT', 'phyt_NTU', 'ergo_NTU', 'Turb_phyto']

Insertion de 6179 lignes...
Inséré: 500 lignes...
Inséré: 1000 lignes...
Inséré: 1500 lignes...
Inséré: 2000 lignes...
Inséré: 2500 lignes...
Inséré: 3000 lignes...
Inséré: 3500 lignes...
Inséré: 4000 lignes...
Inséré: 4500 lignes...
Inséré: 5000 lignes...
Inséré: 5500 lignes...
Inséré: 6000 lignes...

=== RÉSUMÉ ===
Lignes insérées avec succès: 6179
Erreurs rencontrées: 0

Nombre total de lignes dans la table Analyse_Mout: 6179

Exemples de données insérées:
('F9_2024-12-24', 'MS N180 S220 P8', 'MSN180S220P8', '220', '180', '3.3', '240', '6', '8', '0', '0', '0', False, None, '240', '0', '240')
('F9_2024-12-04', None, 'Chardo PR24', '212', '125', '3.48', '68', '3

# *Table Compositions*

In [13]:
import pyodbc
import pandas as pd
import numpy as np

# Définir les paramètres de connexion
server = 'localhost\\SQLEXPRESS'
database = 'Lallemand'

# Établir la connexion
connection_string = f'DRIVER={{ODBC Driver 17 for SQL Server}};SERVER={server};DATABASE={database};Trusted_Connection=yes;'
conn = pyodbc.connect(connection_string)
print("Connexion réussie!")

# Créer un curseur
cursor = conn.cursor()

try:
    # Lire le fichier Excel
    print("Lecture du fichier Excel...")
    df = pd.read_excel('compositions.xlsx')
    print(f"Nombre de lignes lues: {len(df)}")
    print(f"Colonnes disponibles: {list(df.columns)}")
    
   
    # Vérifier les colonnes manquantes et les ajouter avec des valeurs NULL
    required_columns = [
        'Code', 'Code_Souche', 'modelisation', 'protectant', 
        'T0_nut_compl', 'T0_nut_org', 'un_tiers_FA_nut_comp', 
        'un_tiers_FA_nut_org', 'NSc', 'NSC_sc_seq', 'NSC_tps_seq'
    ]
    
    # Ajouter les colonnes manquantes avec des valeurs NULL
    for col in required_columns:
        if col not in df.columns:
            df[col] = None
            print(f"Colonne '{col}' ajoutée avec valeurs NULL")
    
    # S'assurer que les colonnes sont dans le bon ordre
    df = df[required_columns]
    
    # Remplacer les NaN par None pour SQL Server
    df = df.replace({np.nan: None})
    
    # Définir la requête d'insertion
    insert_query = '''
    INSERT INTO Compositions (
        Code, Code_Souche, modelisation, protectant, T0_nut_compl, 
        T0_nut_org, un_tiers_FA_nut_comp, un_tiers_FA_nut_org, 
        NSc, NSC_sc_seq, NSC_tps_seq
    ) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)
    '''
    
    # Statistiques pour le suivi
    inserted_count = 0
    error_count = 0
    errors = []
    
    print(f"\nInsertion de {len(df)} lignes...")
    
    # Insérer les données ligne par ligne pour un meilleur contrôle des erreurs
    for index, row in df.iterrows():
        try:
            # Préparer les valeurs
            values = [
                row['Code'],
                row['Code_Souche'],
                row['modelisation'],
                row['protectant'],
                row['T0_nut_compl'],
                row['T0_nut_org'],
                row['un_tiers_FA_nut_comp'],
                row['un_tiers_FA_nut_org'],
                row['NSc'],
                row['NSC_sc_seq'],
                row['NSC_tps_seq']
            ]
            
            # Exécuter l'insertion
            cursor.execute(insert_query, values)
            inserted_count += 1
            
            # Afficher le progrès tous les 500 enregistrements
            if inserted_count % 500 == 0:
                print(f"Inséré: {inserted_count} lignes...")
                
        except Exception as e:
            error_count += 1
            error_msg = f"Erreur ligne {index + 1}: {str(e)}"
            errors.append(error_msg)
            print(f"Erreur ligne {index + 1}: {str(e)}")
            
            # Arrêter après 10 erreurs pour éviter de spammer
            if error_count >= 10:
                print("Trop d'erreurs, arrêt du processus...")
                break
    
    # Valider la transaction
    conn.commit()
    
    # Afficher les statistiques finales
    print(f"\n=== RÉSUMÉ ===")
    print(f"Lignes insérées avec succès: {inserted_count}")
    print(f"Erreurs rencontrées: {error_count}")
    
    if errors:
        print(f"\nPremières erreurs:")
        for error in errors[:5]:
            print(f"- {error}")
    
    # Vérifier l'insertion
    cursor.execute("SELECT COUNT(*) FROM Compositions")
    count = cursor.fetchone()[0]
    print(f"\nNombre total de lignes dans la table Compositions: {count}")
    
    # Afficher quelques exemples de données insérées
    cursor.execute("SELECT TOP 5 * FROM Compositions")
    rows = cursor.fetchall()
    print("\nExemples de données insérées:")
    for row in rows:
        print(row)

except Exception as e:
    print(f"Erreur générale: {e}")
    conn.rollback()
    
finally:
    # Fermer la connexion
    cursor.close()
    conn.close()
    print("\nConnexion fermée.")


Connexion réussie!
Lecture du fichier Excel...
Nombre de lignes lues: 6187
Colonnes disponibles: ['Code', 'Code_Souche', 'modelisation', 'protectant', 'T0_nut_compl', 'T0_nut_org', 'un_tiers_FA_nut_comp', 'un_tiers_FA_nut_org', 'NSc', 'NSC_sc_seq', 'NSC_tps_seq']

Insertion de 6187 lignes...
Inséré: 500 lignes...
Inséré: 1000 lignes...
Inséré: 1500 lignes...
Inséré: 2000 lignes...
Inséré: 2500 lignes...
Inséré: 3000 lignes...
Inséré: 3500 lignes...
Inséré: 4000 lignes...
Inséré: 4500 lignes...
Inséré: 5000 lignes...
Erreur ligne 5448: ('23000', '[23000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]L\'instruction INSERT est en conflit avec la contrainte FOREIGN KEY "FK__Compositio__Code__4AB81AF0". Le conflit s\'est produit dans la base de données "Lallemand", table "dbo.Fermentation", column \'Code\'. (547) (SQLExecDirectW); [23000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]L\'instruction a été arrêtée. (3621)')
Erreur ligne 5452: ('23000', '[23000] [Microsoft][ODB