In [2]:
import pandas as pd
import numpy as np

# --- PARAMETRI DI CONFIGURAZIONE ---
NUM_PARTICELLE = 10000
RAGGIO_DIMORPHOS = 80.0
VELOCITA_FISSA_MS = 0.2  # Velocità fissa di 20 cm/s
FILE_OUTPUT = 'dummy_ejecta_dataset_velocita_fissa.csv'

print(f"Inizio la generazione di un dataset con {NUM_PARTICELLE} particelle...")

# 1. GENERAZIONE DEGLI ID
ids = np.arange(1, NUM_PARTICELLE + 1)

# 2. GENERAZIONE DELLE POSIZIONI INIZIALI (x, y, z)
posizioni_raw = np.random.randn(NUM_PARTICELLE, 3)
norme = np.linalg.norm(posizioni_raw, axis=1, keepdims=True)
posizioni_normalizzate = posizioni_raw / norme
posizioni = posizioni_normalizzate * RAGGIO_DIMORPHOS
posizioni += np.random.normal(scale=0.1, size=posizioni.shape)

# 3. GENERAZIONE DELLE VELOCITÀ INIZIALI (vx, vy, vz) - CORRETTO
velocita = posizioni_normalizzate * VELOCITA_FISSA_MS
modulo_di_controllo = np.linalg.norm(velocita[0])
print(f"\nVerifica modulo velocità prima particella: {modulo_di_controllo:.4f} m/s")

# 4. GENERAZIONE DELLA DIMENSIONE DELLE PARTICELLE
dimensioni = (np.random.pareto(a=1.5, size=NUM_PARTICELLE)) + 0.001

# 5. GENERAZIONE DEL DESTINO FINALE (Etichetta di Classificazione) - CORRETTO
fates = []
Z_THRESHOLD = RAGGIO_DIMORPHOS * 0.8
SIZE_THRESHOLD_IMPACT = 0.5

for i in range(NUM_PARTICELLE):
    pos_z = posizioni[i, 2]
    dimensione = dimensioni[i]

    if abs(pos_z) > Z_THRESHOLD:
        destino = np.random.choice(['fuga', 'sopravvivenza'], p=[0.85, 0.15])
    elif dimensione > SIZE_THRESHOLD_IMPACT:
        destino = np.random.choice(['impatto', 'sopravvivenza'], p=[0.9, 0.1])
    else:
        destino = np.random.choice(['sopravvivenza', 'impatto', 'fuga'], p=[0.8, 0.1, 0.1])
    
    fates.append(destino)

# 6. CREAZIONE DEL DATAFRAME PANDAS
df = pd.DataFrame({
    'id_particella': ids,
    'pos_x_m': posizioni[:, 0],
    'pos_y_m': posizioni[:, 1],
    'pos_z_m': posizioni[:, 2],
    'vel_x_ms': velocita[:, 0],
    'vel_y_ms': velocita[:, 1],
    'vel_z_ms': velocita[:, 2],
    'dimensione_m': dimensioni,
    'destino': fates
})

df = df.round(4)

# 7. SALVATAGGIO IN FORMATO CSV
df.to_csv(FILE_OUTPUT, index=False)

print(f"\nDataset generato e salvato con successo in '{FILE_OUTPUT}'")
print("\n--- Anteprima del Dataset (prime 5 righe): ---")
print(df.head())
print("\n--- Distribuzione delle etichette 'destino': ---")
print(df['destino'].value_counts())

Inizio la generazione di un dataset con 10000 particelle...

Verifica modulo velocità prima particella: 0.2000 m/s

Dataset generato e salvato con successo in 'dummy_ejecta_dataset_velocita_fissa.csv'

--- Anteprima del Dataset (prime 5 righe): ---
   id_particella  pos_x_m  pos_y_m  pos_z_m  vel_x_ms  vel_y_ms  vel_z_ms  \
0              1  19.9030  67.4731 -38.0087    0.0501    0.1688   -0.0949   
1              2  34.9072  65.9746 -28.5569    0.0870    0.1653   -0.0714   
2              3 -26.2311   2.6385 -75.6511   -0.0653    0.0063   -0.1889   
3              4 -17.9695  77.6405   6.3397   -0.0452    0.1942    0.0157   
4              5  41.1885  64.8654  22.2446    0.1026    0.1624    0.0556   

   dimensione_m        destino  
0        0.2718  sopravvivenza  
1        2.2977        impatto  
2        0.0303           fuga  
3        0.4187  sopravvivenza  
4        0.3600           fuga  

--- Distribuzione delle etichette 'destino': ---
destino
impatto          4269
sopravvive