In [1]:
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

# 1. Charger ta base de données réelle (vérifie bien le nom du fichier)
df_base = pd.read_csv('trafic-annuel-entrant-par-station-du-reseau-ferre-2021.csv', sep=';')

# 2. Paramètres de simulation
date_debut = datetime(2023, 1, 1)
nb_jours = 30  
stations_test = df_base.head(10)  # On prend les 10 premières pour commencer

data_list = []

for idx, row in stations_test.iterrows():
    # Trafic moyen par heure (approximation)
    trafic_moyen_journalier = row['Trafic'] / 365
    
    for jour in range(nb_jours):
        date_actuelle = date_debut + timedelta(days=jour)
        est_weekend = date_actuelle.weekday() >= 5
        
        # Simulation météo (0: Beau, 1: Pluie/Froid)
        meteo = np.random.choice([0, 1], p=[0.7, 0.3])
        
        for heure in range(24):
            # Courbe d'affluence : pics 8h/18h en semaine, 15h le weekend
            if est_weekend:
                coeff_heure = np.exp(-((heure - 15)**2) / 10)
            else:
                coeff_heure = np.exp(-((heure - 8)**2) / 2) + np.exp(-((heure - 18)**2) / 3)
            
            # Facteurs aléatoires
            bruit = np.random.normal(1, 0.1)
            coeff_meteo = 1.2 if meteo == 1 else 1.0 # +20% s'il pleut
            
            affluence = int(trafic_moyen_journalier / 15 * coeff_heure * bruit * coeff_meteo)
            
            data_list.append({
                'station': row['Station'],
                'date': date_actuelle.strftime('%Y-%m-%d'),
                'heure': heure,
                'jour_semaine': date_actuelle.weekday(),
                'est_weekend': int(est_weekend),
                'meteo': meteo,
                'affluence': max(0, affluence)
            })

df_final = pd.DataFrame(data_list)
df_final.to_csv('dataset_pret_pour_ml.csv', index=False)
print(f"Terminé ! Fichier 'dataset_pret_pour_ml.csv' créé avec {len(df_final)} lignes.")

Terminé ! Fichier 'dataset_pret_pour_ml.csv' créé avec 7200 lignes.
