## Générer des dossiers de nouveaux actifs"

In [7]:
import pandas as pd

chemin_fichier = "CAC40.csv" 
df = pd.read_csv(chemin_fichier, dtype=str)  

chemin_fichier = "CAC40.csv"  
df = pd.read_csv(chemin_fichier, dtype=str)  

colonnes_numeriques = ["Dernier", "Ouv.", " Plus Haut", "Plus Bas", "Vol."]  
for col in colonnes_numeriques:
    if col in df.columns:
        df[col] = df[col].str.replace(r"\.(?=\d{3})", "", regex=True)  

fichier_sortie = "new actions csv/CAC40.csv"
df.to_csv(fichier_sortie, index=False, encoding="utf-8")

print(f"Prétraitement terminé, fichier sauvegardé sous {fichier_sortie}")

Prétraitement terminé, fichier sauvegardé sous new actions csv/CAC40.csv


In [9]:
import os
import pandas as pd
from openpyxl.styles import numbers

# Définir les dossiers d'entrée et de sortie
dossier_entree = "new actions csv"  # Dossier contenant les fichiers CSV
dossier_sortie = "new actions"  # Dossier pour enregistrer les fichiers XLSX

# Vérifier si le dossier de sortie existe, sinon le créer
if not os.path.exists(dossier_sortie):
    os.makedirs(dossier_sortie)

# Parcourir tous les fichiers CSV dans le dossier d'entrée
for fichier in os.listdir(dossier_entree):
    if fichier.endswith(".csv"):  # Vérifier que le fichier est un CSV
        chemin_fichier = os.path.join(dossier_entree, fichier)
        
        try:
            # Lire le fichier CSV en tant que texte brut
            df = pd.read_csv(chemin_fichier, dtype=str)
            df.columns = df.columns.str.strip()  # Supprimer les espaces des noms de colonnes

            # Extraire le nom du fichier sans extension pour l'utiliser comme "Actif"
            nom_actif = os.path.splitext(fichier)[0]

            # Dictionnaire de correspondance des noms de colonnes
            correspondance_colonnes = {
                "Date": "Date",
                "Ouv.": "Ouverture",
                "Plus Haut": "Max",
                "Plus Bas": "Min",
                "Dernier": "Fermeture",
                "Vol.": "Volume"
            }

            # Renommer les colonnes existantes si elles sont présentes dans le fichier
            colonnes_valides = {ancien: nouveau for ancien, nouveau in correspondance_colonnes.items() if ancien in df.columns}
            df = df.rename(columns=colonnes_valides)

            # Conserver uniquement les colonnes souhaitées
            colonnes_finales = ["Date", "Ouverture", "Max", "Min", "Fermeture", "Volume"]
            df = df.reindex(columns=colonnes_finales)

            # Ajouter la colonne "Actif"
            df.insert(0, "Actif", nom_actif)

            # Convertir la colonne "Date" au format datetime et trier par ordre chronologique
            df["Date"] = pd.to_datetime(df["Date"], format="%d/%m/%Y", errors="coerce")
            df = df.sort_values(by="Date")

            # Convertir les colonnes numériques en float (en remplaçant les virgules par des points)
            colonnes_numeriques = ["Ouverture", "Max", "Min", "Fermeture"]
            for col in colonnes_numeriques:
                df[col] = df[col].str.replace(",", ".", regex=True).astype(float)

            # Convertir la colonne "Volume" en valeurs numériques
            def convertir_volume(volume):
                if isinstance(volume, str):
                    volume = volume.replace(",", ".")  # Remplacer la virgule par un point
                    if "K" in volume:
                        return float(volume.replace("K", "")) * 1000  # Convertir en milliers
                    elif "M" in volume:
                        return float(volume.replace("M", "")) * 1000000  # Convertir en millions
                return pd.to_numeric(volume, errors="coerce")  # Autres cas, conversion en numérique

            df["Volume"] = df["Volume"].apply(convertir_volume)

            # Générer le chemin de sortie avec le format .xlsx (Excel)
            fichier_sortie = os.path.join(dossier_sortie, f"{nom_actif}.xlsm")

            # Enregistrer les données dans un fichier Excel avec mise en forme correcte
            with pd.ExcelWriter(fichier_sortie, engine="openpyxl") as writer:
                df.to_excel(writer, sheet_name="Actions Data", index=False, header=False)
                workbook = writer.book
                worksheet = writer.sheets["Actions Data"]
                
                # Appliquer le format de date correct dans Excel
                for row in range(2, worksheet.max_row + 1):
                    cell = worksheet.cell(row=row, column=2)  # B colonne est la date
                    cell.number_format = 'm/d/yyyy'  # Format d'affichage Excel

            print(f"Conversion terminée : {fichier} → {fichier_sortie} (avec en-tête et format datetime correct)")
        
        except Exception as e:
            print(f"Erreur lors de la lecture du fichier {fichier} : {e}")


Conversion terminée : DassaultSystemes.csv → new actions/DassaultSystemes.xlsm (avec en-tête et format datetime correct)
Conversion terminée : Capgemini.csv → new actions/Capgemini.xlsm (avec en-tête et format datetime correct)
Conversion terminée : Hermes.csv → new actions/Hermes.xlsm (avec en-tête et format datetime correct)
Conversion terminée : Michelin.csv → new actions/Michelin.xlsm (avec en-tête et format datetime correct)
Conversion terminée : Sanofi.csv → new actions/Sanofi.xlsm (avec en-tête et format datetime correct)
Conversion terminée : SaintGobain.csv → new actions/SaintGobain.xlsm (avec en-tête et format datetime correct)
Conversion terminée : SchneiderElectric.csv → new actions/SchneiderElectric.xlsm (avec en-tête et format datetime correct)
Conversion terminée : PernodRicard.csv → new actions/PernodRicard.xlsm (avec en-tête et format datetime correct)
Conversion terminée : CreditAgricole.csv → new actions/CreditAgricole.xlsm (avec en-tête et format datetime correct)
C