# Generación de datos sintéticos

### Descripción

<font size="4"> Genera un dataset con datos sintéticos a partir de distribuciones normales con media y desviación típica dadas.

---

### Requerimientos

In [1]:
import numpy as np
import pandas as pd

### Generar datos con media y desviación típidas dadas

In [2]:
def GetDataForEachAlgorithm(nombresAlgoritmos, medias, desviaciones, n, filename):
    
    datos_dict = {}    
    
    # Generar datos para cada par (media, desviación)
    for nombre, media, desviacion in zip(nombresAlgoritmos, medias, desviaciones):
        datos_dict[nombre] = np.random.normal(media, desviacion, n)  
    # equivalente a:
    # for i in range(len(nombresAlgoritmos))
    #     datos_dict[nombresAlgoritmos[i]] = np.random.normal(medias[i], desviaciones[i], n)  
    
    # Convertir los datos en un DataFrame de pandas y guardarlos como un CSV
    df = pd.DataFrame(datos_dict)
    df.to_csv(filename+".csv", index=False)

### Ejemplo de utilización

In [3]:
np.random.seed(1)

nombresAlgoritmos = ["A1","A2","A3","A4","A5"] # Nombres de los algoritmos (columnas)
medias = [100.0, 100.0, 100.0, 70.0, 50.0]  # Lista de medias
desviaciones = [10.0, 10.0, 10.0, 10.0, 10.0]  # Lista de desviaciones estándar
n = 10  # Número de datos (filas) por cada par de media y desviación
filename = "datosPrueba"

GetDataForEachAlgorithm(nombresAlgoritmos, medias, desviaciones, n, filename)