# 📊 Análisis Exploratorio de Datos con Python  

## Daniel Mauricio Cárdenas Forero

[LinkedIn](https://www.linkedin.com/in/dcardenasf/) | [Github](https://github.com/dcardenasf)

---

## 🎯 Objetivo:

Realizar un análisis exploratorio de datos, utilizando un conjuno de datos (dataset) en ``Python``


## 🧠 Introducción
El Análisis Exploratorio de Datos (AED o EDA, por sus siglas en inglés) es una etapa fundamental dentro del proceso de ciencia de datos. Su objetivo principal es comprender la estructura, calidad y características generales de un conjunto de datos antes de aplicar modelos estadísticos o de machine learning. En este ejercicio, se utilizará Python y sus bibliotecas más comunes para realizar un análisis exploratorio completo, desde la carga de datos hasta la visualización de patrones y relaciones clave.

## 🛠️ Metodología
Para llevar a cabo el análisis exploratorio, se seguirán los siguientes pasos:

1. **Carga del dataset**
Se utilizará la biblioteca pandas para importar el conjunto de datos desde una fuente local o en línea, y así comenzar su manipulación y análisis.

2. **Revisión inicial de los datos**
Incluye una inspección general de las dimensiones del dataset, tipos de datos, valores nulos, duplicados y primeras filas para tener una visión preliminar.

3. **Limpieza de datos**
En esta etapa se tratarán valores faltantes, datos atípicos (outliers) y conversiones necesarias de tipos de datos para asegurar la calidad del análisis.

4. **Análisis univariado y estadístico descriptivo**
Se explorarán las variables de forma individual utilizando pandas, numpy y seaborn para generar métricas como la media, mediana, desviación estándar, entre otros.

5. **Análisis bivariado y multivariado**
Se analizarán las relaciones entre variables usando gráficos de dispersión, mapas de calor y análisis de correlaciones, con ayuda de matplotlib, seaborn y plotly.

6. **Visualización de datos**
Se utilizarán herramientas gráficas para identificar patrones, distribuciones, relaciones y comportamientos anómalos dentro del conjunto de datos. Esto permite obtener insights valiosos de manera visual y comprensible.

7. **Conclusiones**
Finalmente, se presentarán los hallazgos más relevantes del análisis exploratorio, destacando aspectos interesantes que podrían guiar análisis posteriores o la toma de decisiones.

## 0. Preliminares  

Vamos a realizar la carga de las librerias básicas que se van a utilizar para este ejercicio.

- pandas: Permite la carga, manipulación y limpieza eficiente de datasets tabulares.
- numpy: Complementa el análisis numérico con funciones matemáticas y estadísticas rápidas.
- matplotlib: Proporciona las herramientas básicas para generar gráficos estáticos.
- seaborn: Se basa en matplotlib, pero ofrece una forma más sencilla y atractiva de crear gráficos estadísticos.
- plotly: Permite generar visualizaciones interactivas que mejoran la exploración y comprensión de los datos.

In [None]:
import pandas as pd        # Manipulación y análisis de datos estructurados
import numpy as np         # Operaciones matemáticas y estadísticas de bajo nivel
import matplotlib.pyplot as plt  # Visualización básica de datos (gráficos de líneas, barras, etc.)
import seaborn as sns      # Visualización avanzada y estética sobre Matplotlib
import plotly.express as px # Visualización interactiva de datos

## 1. Carga del dataset.

Vamos a realizar el AED de las ventas globales de videojuegos.

In [6]:
path = r"Data\Raw\vgsales.csv" # Ruta al archivo CSV
df = pd.read_csv(path)  # Cargar el archivo CSV en un DataFrame de pandas
print(df.head()) # Mostrar las primeras filas del DataFrame 

FileNotFoundError: [Errno 2] No such file or directory: 'Data\\Raw\\vgsales.csv'