In [3]:
import numpy as np
import pandas as pd

from pathlib import Path # <-- Importa la libreria per gestire i percorsi

# --- Parametri del Dataset Fittizio ---
NUM_PARTICLES = 10000
OUTPUT_FILENAME = "dummy_dataset.csv"

# --- Definizione del Percorso di Salvataggio ---
# 1. Prendi la cartella corrente in cui si trova lo script
current_dir = Path.cwd()

# 2. Vai un livello indietro (.parent) e poi entra in 'data/raw'
# L'operatore '/' è un modo elegante che pathlib usa per unire i percorsi
output_dir = current_dir.parent / "data" / "raw"

# 3. Assicurati che la cartella di destinazione esista, altrimenti creala
# `parents=True` crea anche le cartelle intermedie (es. 'data') se mancano
# `exist_ok=True` non dà errore se la cartella esiste già
output_dir.mkdir(parents=True, exist_ok=True)

# 4. Crea il percorso completo del file
output_path = output_dir / OUTPUT_FILENAME


print(f"Generazione di un dummy dataset con {NUM_PARTICLES} particelle...")

# --- Creazione delle Features (condizioni iniziali) ---
# ... (il codice per generare i dati rimane identico a prima)
particle_ids = np.arange(1, NUM_PARTICLES + 1)
initial_pos_x = np.random.uniform(-1.5, 1.5, size=NUM_PARTICLES)
initial_pos_y = np.random.uniform(-1.5, 1.5, size=NUM_PARTICLES)
initial_pos_z = np.random.uniform(-0.5, 0.5, size=NUM_PARTICLES)
initial_vel_x = np.random.uniform(-0.2, 0.2, size=NUM_PARTICLES)
initial_vel_y = np.random.uniform(-0.2, 0.2, size=NUM_PARTICLES)
initial_vel_z = np.random.uniform(-0.1, 0.1, size=NUM_PARTICLES)
particle_sizes = np.random.uniform(0.01, 10.0, size=NUM_PARTICLES)

# --- Creazione della Label (destino finale) ---
# 0 = Re-impatto, 1 = Fuga, 2 = Sopravvissuto
final_fates = np.random.randint(0, 3, size=NUM_PARTICLES)

# --- Assemblaggio del Dataset con Pandas ---
data = {
    'particle_id': particle_ids,
    'initial_pos_x': initial_pos_x,
    'initial_pos_y': initial_pos_y,
    'initial_pos_z': initial_pos_z,
    'initial_vel_x': initial_vel_x,
    'initial_vel_y': initial_vel_y,
    'initial_vel_z': initial_vel_z,
    'particle_size_m': particle_sizes,
    'final_fate': final_fates
}
df = pd.DataFrame(data)

# --- Salvataggio del file in formato CSV nel percorso specificato ---
df.to_csv(output_path, index=False)

print(f"✅ Dataset fittizio salvato con successo in '{output_path}'!")
print("\nEcco un'anteprima delle prime 5 righe:")
print(df.head())


Generazione di un dummy dataset con 10000 particelle...
✅ Dataset fittizio salvato con successo in 'c:\Users\Lorenzo\Desktop\Università\Magistrale\Tesi\DART-Ejecta-Fate-Prediction\data\raw\dummy_dataset.csv'!

Ecco un'anteprima delle prime 5 righe:
   particle_id  initial_pos_x  initial_pos_y  initial_pos_z  initial_vel_x  \
0            1       0.304375      -0.633838       0.053272       0.135520   
1            2       0.159246       0.340435      -0.194976      -0.042586   
2            3      -1.176994      -0.080534       0.222635      -0.001535   
3            4       0.001023       1.427614       0.344154      -0.058543   
4            5       0.492595      -0.966896       0.461470      -0.124245   

   initial_vel_y  initial_vel_z  particle_size_m  final_fate  
0       0.037043       0.089517         5.777573           0  
1      -0.028529       0.011150         2.568175           0  
2       0.039187      -0.000454         3.043068           0  
3      -0.046020       0.09135