In [43]:
import os
import pandas as pd
import psycopg2
from psycopg2 import sql, extras

# Configuration PostgreSQL
PG_HOST = "localhost"
PG_PORT = "5432"
PG_USER = "waouhmonde"
PG_PASSWORD = "waouhmonde"
PG_DATABASE = "Base"
PG_TABLE = "youy"

# Chemin du dossier contenant les fichiers CSV
dossier_csv = 'wm'

def connect_to_postgresql():
    connection = psycopg2.connect(
        host=PG_HOST,
        port=PG_PORT,
        user=PG_USER,
        password=PG_PASSWORD,
        database=PG_DATABASE
    )
    return connection

def create_table_if_not_exists(connection):
    cursor = connection.cursor()
    create_table_query = sql.SQL("""
        CREATE TABLE IF NOT EXISTS {} (
            NPN TEXT,
            ADRESSE TEXT,
            CP TEXT,
            ville TEXT,
            TEL TEXT,
            EMAIL TEXT NULL
        );
    """).format(sql.Identifier(PG_TABLE))
    cursor.execute(create_table_query)
    connection.commit()
    cursor.close()

def load_data_into_postgres(connection, data):
    cursor = connection.cursor()
    insert_query = sql.SQL("""
        INSERT INTO {} (NPN, ADRESSE, CP, ville, TEL, EMAIL) VALUES %s;
    """).format(sql.Identifier(PG_TABLE))

    # Convertir les valeurs None en NULL pour PostgreSQL
    data_with_null = [[val if val is not None else None for val in row] for row in data]

    extras.execute_values(cursor, insert_query, data_with_null, page_size=100)  # Vous pouvez ajuster la taille de la page selon votre besoin

    connection.commit()
    cursor.close()

def main():
    postgres_connection = None

    try:
        postgres_connection = connect_to_postgresql()
        create_table_if_not_exists(postgres_connection)

        for root, dirs, files in os.walk(dossier_csv):
            for file in files:
                if file.endswith('.csv'):
                    file_path = os.path.join(root, file)
                    print(f'Traitement du fichier CSV : {file_path}')

                    # Charger les données depuis le fichier CSV en tant que DataFrame
                    df = pd.read_csv(file_path, sep=';', encoding='latin1', dtype={'CP': str})
                    # Ajouter la colonne "EMAIL" si elle n'est pas déjà présente
                    if 'EMAIL' not in df.columns:
                        df.insert(loc=len(df.columns), column='EMAIL', value=None)
                    # Traitement des valeurs manquantes
                    df = df.where(pd.notna(df), None)

                    # Charger les données dans PostgreSQL
                    load_data_into_postgres(postgres_connection, df.values)

        print("Chargement de données terminé.")

    except psycopg2.Error as pg_error:
        print(f"Erreur PostgreSQL: {pg_error}")

    except Exception as e:
        print(f"Une erreur inattendue est survenue : {str(e)}")

    finally:
        if postgres_connection:
            postgres_connection.close()

if __name__ == "__main__":
    main()

Traitement du fichier CSV : wm\1_OP_FR_250000_2500000_2533274790396334.csv
Traitement du fichier CSV : wm\5_OP_FR_250000_250000_2533274790396334.csv
Traitement du fichier CSV : wm\5_OP_FR_250000_500000_2533274790396334.csv
Traitement du fichier CSV : wm\5_OP_FR_56712__2533274790396334.csv
Erreur PostgreSQL: ERREUR:  INSERT a plus d'expressions que les colonnes cibles
LINE 2: ...05/1958','5 RUE MAYRAN','75000','PARIS',663413194,'helenajac...
                                                             ^

