In [1]:
import pandas as pd

In [2]:
# Chemins relatifs 
fichier1 = "../CSV/S&P500.csv"
fichier2 = "../CSV/XAU(GOLD).csv"

In [3]:

# Liste des fichiers à analyser
fichiers = [fichier1, fichier2]

for fichier in fichiers:
    print(f"\n=== Vérification du fichier : {fichier} ===")
    try:
        # Lecture du CSV en considérant la première ligne comme en-tête
        df = pd.read_csv(fichier, header=0)
        print("Nombre de lignes lues :", len(df))
        print("Colonnes détectées :", df.columns.tolist())
    except Exception as e:
        print("Erreur lors de la lecture du fichier :", fichier)
        print("Détails :", e)
        continue

    # Vérifier que les colonnes requises existent
    colonnes_requises = ["Open", "High", "Low"]
    if not all(col in df.columns for col in colonnes_requises):
        print("Erreur : colonnes manquantes. Colonnes attendues :", colonnes_requises)
        continue

    # Conversion des colonnes "Open", "High" et "Low" en type numérique
    # Les valeurs non convertibles seront transformées en NaN
    df["Open_numeric"] = pd.to_numeric(df["Open"], errors='coerce')
    df["High_numeric"] = pd.to_numeric(df["High"], errors='coerce')
    df["Low_numeric"] = pd.to_numeric(df["Low"], errors='coerce')
    
    # Compter le nombre de lignes où "Open", "High" et "Low" valent exactement 0.00
    nb_lignes_0 = ((df["Open_numeric"] == 0.0) &
                   (df["High_numeric"] == 0.0) &
                   (df["Low_numeric"] == 0.0)).sum()
    
    if nb_lignes_0 > 0:
        print(f"ALERTE : {nb_lignes_0} ligne(s) contiennent 0.00 pour Open, High et Low")
    else:
        print("Aucune ligne avec des 0.00 détectée pour Open, High et Low.")



=== Vérification du fichier : ../CSV/S&P500.csv ===
Nombre de lignes lues : 2522
Colonnes détectées : ['Date', 'Close', 'Open', 'High', 'Low']
ALERTE : 7 ligne(s) contiennent 0.00 pour Open, High et Low

=== Vérification du fichier : ../CSV/XAU(GOLD).csv ===
Nombre de lignes lues : 2539
Colonnes détectées : ['Date', 'Close/Last', 'High', 'Low', 'Open', 'Volume']
Aucune ligne avec des 0.00 détectée pour Open, High et Low.


In [4]:


# Liste des fichiers à traiter
fichiers = [fichier1, fichier2]

for fichier in fichiers:
    print(f"\n=== Traitement du fichier : {fichier} ===")
    try:
        # Lecture du CSV en considérant la première ligne comme en-tête
        df = pd.read_csv(fichier, header=0)
        print("Nombre de lignes avant filtrage :", len(df))
        print("Colonnes détectées :", df.columns.tolist())
    except Exception as e:
        print("Erreur lors de la lecture du fichier :", fichier)
        print("Détails :", e)
        continue

    try:
        # Conversion explicite des colonnes "Open", "High" et "Low" en type float
        df[["Open", "High", "Low"]] = df[["Open", "High", "Low"]].astype(float)
    except Exception as e:
        print("Erreur lors de la conversion des colonnes en float dans le fichier :", fichier)
        print("Détails :", e)
        continue

    try:
        # Création du masque pour sélectionner les lignes où les colonnes "Open", "High" et "Low" valent toutes 0.00
        masque = (df["Open"] == 0.00) & (df["High"] == 0.00) & (df["Low"] == 0.00)
        nb_lignes_a_filtrer = masque.sum()
        print("Nombre de lignes à filtrer (Open, High et Low égales à 0.00) :", nb_lignes_a_filtrer)
        
        # Filtrage : supprimer les lignes pour lesquelles le masque est True
        df_filtre = df[~masque]
        print("Nombre de lignes après filtrage :", len(df_filtre))
    except Exception as e:
        print("Erreur lors du filtrage du fichier :", fichier)
        print("Détails :", e)
        continue

    try:
        # Création d'un nouveau nom de fichier en ajoutant le suffixe "_filtered"
        nouveau_fichier = fichier.replace(".csv", "_filtered.csv")
        # Sauvegarde du DataFrame filtré dans un nouveau fichier (avec en-tête)
        df_filtre.to_csv(nouveau_fichier, index=False)
        print("Fichier sauvegardé avec succès :", nouveau_fichier)
    except Exception as e:
        print("Erreur lors de la sauvegarde du fichier :", fichier)
        print("Détails :", e)
        continue

print("\nTraitement terminé pour tous les fichiers.")



=== Traitement du fichier : ../CSV/S&P500.csv ===
Nombre de lignes avant filtrage : 2522
Colonnes détectées : ['Date', 'Close', 'Open', 'High', 'Low']
Nombre de lignes à filtrer (Open, High et Low égales à 0.00) : 7
Nombre de lignes après filtrage : 2515
Fichier sauvegardé avec succès : ../CSV/S&P500_filtered.csv

=== Traitement du fichier : ../CSV/XAU(GOLD).csv ===
Nombre de lignes avant filtrage : 2539
Colonnes détectées : ['Date', 'Close/Last', 'High', 'Low', 'Open', 'Volume']
Nombre de lignes à filtrer (Open, High et Low égales à 0.00) : 0
Nombre de lignes après filtrage : 2539
Fichier sauvegardé avec succès : ../CSV/XAU(GOLD)_filtered.csv

Traitement terminé pour tous les fichiers.
