In [41]:
import os
import sqlite3
import pandas as pd

In [42]:
def creer_table_si_absente(cursor, nom_table, colonnes):
    """
    Crée une table dans la base de données si elle n'existe pas déjà,
    en utilisant les colonnes extraites de l'en-tête du fichier CSV.
    """
    colonnes_avec_types = ', '.join([f"{colonne} TEXT" for colonne in colonnes])
    requete_creation = f"CREATE TABLE IF NOT EXISTS {nom_table} ({colonnes_avec_types});"
    cursor.execute(requete_creation)


In [43]:
def inserer_donnees(cursor, nom_table, colonnes, donnees):
    """
    Insère les données dans la table. 
    """
    placeholders = ', '.join(['?' for _ in colonnes])
    colonnes_str = ', '.join(colonnes)
    requete_insertion = f"INSERT INTO {nom_table} ({colonnes_str}) VALUES ({placeholders});"
    cursor.executemany(requete_insertion, donnees)

In [62]:
def traiter_fichier(chemin_fichier, connection):
    """
    Traite un fichier CSV en créant une table correspondante et en y insérant les données.
    """
    #nom_table = os.path.splitext(os.path.basename(chemin_fichier))[0]  # Utilise le nom du fichier pour la table
    df = pd.read_csv(chemin_fichier,sep=',')  # Charge le fichier CSV avec pandas
    colonnes = list(df.columns)  # Remplace les espaces par des underscores
    colonnes = [colonne.replace(' ', '') for colonne in colonnes]
    colonnes = [colonne.replace('-', '') for colonne in colonnes]
    colonnes = [colonne.replace('_', '') for colonne in colonnes]
    cursor = connection.cursor()

    # définir le nom de la table en fonction de l'en-tête du fichier
    liste_nom_table = ['outcomes','stop-and-search','street']
    for nom_table in liste_nom_table:
        if nom_table in chemin_fichier:
            nom_table = nom_table.replace('-', '')
            break
    else:
        nom_table = 'autre'
    
    print(f"nom de la table : {nom_table}")
    # Créer la table si elle n'existe pas
    creer_table_si_absente(cursor, nom_table, colonnes)

    # Insérer les données dans la table
    inserer_donnees(cursor, nom_table, colonnes, df.values.tolist())

    # Commit les changements
    connection.commit()

    print(f"Traitement du fichier : {chemin_fichier} terminé.")

In [63]:
def parcourir_arborescence(chemin_racine, db_path):
    """
    Parcourt récursivement l'arborescence et traite chaque fichier CSV trouvé.
    """
    # Créer ou se connecter à la base de données
    connection = sqlite3.connect(db_path)

    print(f"Parcours de l'arborescence à partir de : {chemin_racine}")

    for racine, sous_repertoires, fichiers in os.walk(chemin_racine):
        print(f"Répertoire courant : {racine}")
        for sous_repertoire in sous_repertoires:
            print(f"Répertoire trouvé : {sous_repertoire}")
        for fichier in fichiers:
            if fichier.endswith(".csv"):
                chemin_fichier = os.path.join(racine, fichier)
                traiter_fichier(chemin_fichier, connection)

    # Fermer la connexion à la base de données
    connection.close()

In [64]:

chemin_racine = "C:/Users/Admin.local/Documents/projetint/files"
db_path = "data4.db" 
parcourir_arborescence(chemin_racine, db_path)


Parcours de l'arborescence à partir de : C:/Users/Admin.local/Documents/projetint/files
Répertoire courant : C:/Users/Admin.local/Documents/projetint/files
Répertoire trouvé : 2019-11
Répertoire trouvé : 2019-12
Répertoire trouvé : 2020-01
Répertoire trouvé : 2020-02
Répertoire trouvé : 2020-03
Répertoire trouvé : 2020-04
Répertoire trouvé : 2020-05
Répertoire trouvé : 2020-06
Répertoire trouvé : 2020-07
Répertoire trouvé : 2020-08
Répertoire trouvé : 2020-09
Répertoire trouvé : 2020-10
Répertoire trouvé : 2020-11
Répertoire trouvé : 2020-12
Répertoire trouvé : 2021-01
Répertoire trouvé : 2021-02
Répertoire trouvé : 2021-03
Répertoire trouvé : 2021-04
Répertoire trouvé : 2021-05
Répertoire trouvé : 2021-06
Répertoire trouvé : 2021-07
Répertoire trouvé : 2021-08
Répertoire trouvé : 2021-09
Répertoire trouvé : 2021-10
Répertoire trouvé : 2021-11
Répertoire trouvé : 2021-12
Répertoire trouvé : 2022-01
Répertoire trouvé : 2022-02
Répertoire trouvé : 2022-03
Répertoire trouvé : 2022-04
Répe