Este proyecto tiene como objetivo la creación de un dataset sintético utilizando Python, seguido de una exploración de datos básica y análisis de correlación entre las variables.
- Pandas: para manipulación y análisis de datos.
- Random y Numpy: para generar datos aleatorios.
- Dataframe_image (opcional): para guardar dataframes como imágenes.
- Matplotlib / Seaborn: para visualizaciones gráficas.
-
Generación del Dataset:
- Se creó un dataset simulado utilizando funciones aleatorias para representar variables numéricas y categóricas.
-
Exploración de Datos:
- Visualización general del dataframe (head, tail, describe, info).
- Detección de valores faltantes y tipos de datos.
- Estadísticas descriptivas básicas.
-
Análisis de Correlación:
- Se calculó la matriz de correlación.
- Se generó un mapa de calor para visualizar mejor las relaciones entre variables numéricas.