In [1]:
import pandas as pd
import numpy as np
from google.colab import files  # Necesario para descargar el archivo desde Colab

# 1. Configuración
np.random.seed(42)  # Semilla para que siempre salgan los mismos datos
n_por_grupo = 64    # 64 Control + 64 Tratamiento = 128 Total

# 2. Generación de Datos
ids = [f"P{i:03d}" for i in range(1, (n_por_grupo * 2) + 1)] # P001 hasta P128

# Grupos
grupos = ['Control'] * n_por_grupo + ['Tratamiento'] * n_por_grupo

# Distancias (Simulación de la Hipótesis)
# Control: Media 300cm, Desviación 60cm
dist_control = np.random.normal(300, 60, n_por_grupo)
# Tratamiento: Media 420cm, Desviación 60cm (Efecto positivo de la práctica)
dist_tratamiento = np.random.normal(420, 60, n_por_grupo)

todas_distancias = np.concatenate([dist_control, dist_tratamiento])

# Crear DataFrame y redondear decimales (cm enteros)
df = pd.DataFrame({
    'id_participante': ids,
    'grupo': grupos,
    'distancia_apuesta_cm': todas_distancias.astype(int)
})

# 3. Mezclar los datos (Shuffle)
# Para que parezca un experimento real y no estén ordenados por grupo
df = df.sample(frac=1).reset_index(drop=True)

# 4. Guardar y Descargar
nombre_archivo = 'aero_risk_128.csv'
df.to_csv(nombre_archivo, index=False)

print(f"✅ Archivo '{nombre_archivo}' generado con 128 registros.")
print(df.head()) # Muestra las primeras filas

# Esta línea descarga el archivo a tu ordenador local
files.download(nombre_archivo)

✅ Archivo 'aero_risk_128.csv' generado con 128 registros.
  id_participante        grupo  distancia_apuesta_cm
0            P026      Control                   306
1            P103  Tratamiento                   399
2            P077  Tratamiento                   425
3            P013      Control                   314
4            P058      Control                   281


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>