# Visualización de Datos con Matplotlib y Seaborn

Curso: **Fundamentos de Programación y Analítica de Datos con Python**

**Duración estimada del bloque:** 2 horas

## Objetivos específicos
- Construir visualizaciones básicas (líneas, barras y dispersión) usando Matplotlib y Seaborn.
- Aplicar estilos, títulos, ejes y leyendas siguiendo buenas prácticas de comunicación visual.
- Comparar la API imperativa (stateful) de Matplotlib con el enfoque orientado a objetos.
- Emplear Seaborn para visualizaciones estadísticas con datos en DataFrames.
- Guardar figuras con parámetros de resolución y tamaño adecuados para informes.

## Prerrequisitos
- Conocimientos básicos de Python (variables, listas, funciones) y manejo de entornos (venv/conda).
- Nociones elementales de Pandas (DataFrame) son deseables pero no obligatorias.


## Tema 1. Fundamentos de Matplotlib

### Definición
Matplotlib es una biblioteca de visualización 2D para Python que permite crear gráficos de alta calidad de forma programable. Ofrece dos estilos principales: una API **stateful** (similar a MATLAB) mediante `pyplot` y una API **orientada a objetos** donde el usuario manipula explícitamente objetos `Figure` y `Axes`.

### Importancia en programación y analítica de datos
- Es el **estándar de facto** para visualización en el ecosistema científico de Python.
- Proporciona control fino sobre cada elemento del gráfico (títulos, ejes, ticks, estilos, anotaciones), crucial para reportes técnicos.
- Sirve de base para bibliotecas de más alto nivel, como **Seaborn** y **Pandas plotting**.

### Buenas prácticas profesionales y errores comunes
- **Titular y etiquetar** siempre los ejes y unidades; evitar abreviaturas ambiguas.
- Preferir el enfoque **orientado a objetos** (`fig, ax = plt.subplots()`) para composiciones complejas.
- Usar `tight_layout()` o `constrained_layout=True` para evitar solapamientos.
- Ajustar `dpi`, `figsize` y `bbox_inches='tight'` al **guardar** figuras.
- Evitar excesos de color y estilo que distraigan; priorizar la legibilidad.


In [None]:

# TODO: Ejemplo 1 (Matplotlib - API stateful): gráfico de líneas básico

In [None]:

# TODO: Ejemplo 2 (Matplotlib - API orientada a objetos): dos series y personalización

### Gráficos de barras y dispersión en Matplotlib
Los gráficos de **barras** son útiles para comparar categorías discretas; los de **dispersión** muestran la relación entre dos variables numéricas, facilitando la identificación de correlaciones o patrones no lineales.


In [None]:

# TODO: Ejemplo 3 (Barras): comparación de ventas por producto

In [None]:

# TODO: Ejemplo 4 (Dispersión): relación entre tamaño y precio

### Estilos, paletas y guardado de figuras
- Los **estilos** (`plt.style.use(...)`) permiten aplicar configuraciones coherentes para reportes.
- Las **paletas** deben ser legibles y, cuando sea posible, **accesibles** (por ejemplo, combinaciones aptas para personas con daltonismo).
- Para guardar figuras, usar `plt.savefig("nombre.png", dpi=300, bbox_inches='tight')`.


In [None]:

# TODO: Ejemplo 5 (Guardar figura con parámetros de calidad)

## Tema 2. Visualización estadística con Seaborn

### Definición
Seaborn es una biblioteca de **alto nivel** que se construye sobre Matplotlib y facilita la creación de gráficos estadísticos con sintaxis concisa, operando directamente sobre **DataFrames** de Pandas. Incluye funciones para estimación de relaciones, visualización de distribuciones y comparaciones por categorías.

### Importancia en programación y analítica de datos
- Simplifica tareas comunes: gráficos por categorías, mapas de calor, regresiones y visualización de distribuciones.
- Integra estilos y paletas por defecto, acelerando la creación de visualizaciones **consistentes**.
- Favorece flujos de trabajo **exploratorios** al operar con datos tabulares de Pandas.

### Buenas prácticas profesionales y errores comunes
- Verificar tipos de datos (numéricos vs. categóricos) antes de graficar.
- Usar `hue`, `style` o `size` con moderación; demasiadas agrupaciones pueden dificultar la lectura.
- Documentar supuestos y **transformaciones** aplicadas a los datos (filtros, agregaciones, normalizaciones).


In [None]:

# TODO: Ejemplo 6 (Seaborn - barras): comparación por categoría

In [None]:

# TODO: Ejemplo 7 (Seaborn - dispersión con agrupación): relación y color por categoría

In [None]:

# TODO: Ejemplo 8 (Seaborn - regresión): estimación lineal simple

### Estilos y paletas en Seaborn
Seaborn ofrece `set_theme`, `set_style` y paletas como `deep`, `muted`, `pastel`, `dark`, `colorblind`. Se recomienda `colorblind` para mejorar accesibilidad. Las leyendas, títulos y escalas deben reforzar la comunicación del mensaje principal.


In [None]:

# TODO: Ejemplo 9 (Seaborn - estilos y paletas)

## Ejercicios integradores

### Ejercicio 1: Informe de ventas trimestrales
**Contexto técnico:** Eres analista en una empresa de retail. Debes preparar un gráfico para el comité gerencial, mostrando la evolución de ventas trimestrales de dos líneas de producto y resaltando el trimestre con mayor incremento. El objetivo es facilitar la toma de decisiones sobre inversión en inventario.

**Datos/entradas:** Genera dos series de ventas trimestrales (4 a 8 puntos) para Línea A y Línea B.

**Requerimientos:** Crear un gráfico de líneas comparativo (Matplotlib, API orientada a objetos), con título, etiquetas, leyenda y anotación en el punto de mayor incremento.

**Criterios de aceptación:** El gráfico debe ser legible, con rejilla, e incluir una anotación (`ax.annotate`) que describa el trimestre de mayor crecimiento. Guardar la figura (comentado si no deseas escribir archivos).

**Pistas:** Usa `fig, ax = plt.subplots()`, calcula diferencias con `numpy.diff` y el índice del máximo con `argmax`.

In [None]:

# TODO: Solución Ejercicio 1


### Ejercicio 2: Comparación por categoría con barras
**Contexto técnico:** Como parte de un reporte de marketing, debes comparar el rendimiento de 5 campañas. El gráfico debe permitir identificar rápidamente la mejor campaña y mostrar etiquetas con los valores.

**Datos/entradas:** DataFrame con columnas `campaña` y `conversiones` (valores enteros). Puedes generarlo manualmente o aleatoriamente.

**Requerimientos:** Crear un **barplot** (Seaborn) con título y etiquetas en cada barra. Mostrar el valor exacto encima de cada barra.

**Criterios de aceptación:** Barras ordenadas de mayor a menor, etiquetas legibles, y paleta apta para daltónicos.

**Pistas:** Usa `sns.barplot`, `ax.bar_label` (Matplotlib 3.4+), y `sns.set_palette('colorblind')`.


In [None]:

# TODO: Solución Ejercicio 2


### Ejercicio 3: Relación y tendencia
**Contexto técnico:** En un estudio de precios inmobiliarios, necesitas visualizar la relación entre tamaño de vivienda (m²) y precio (USD), además de estimar una línea de tendencia.

**Datos/entradas:** Genera 60 observaciones con ruido (distribución normal) alrededor de una relación lineal.

**Requerimientos:** Crear un `scatterplot` (Seaborn) y superponer una **regresión lineal** (`sns.regplot`). Agregar título y etiquetas claras.

**Criterios de aceptación:** La figura debe mostrar los puntos, la línea de tendencia y comunicar correctamente variables y unidades.

**Pistas:** Genera datos con `numpy.random.normal` y controla la semilla para reproducibilidad.


In [None]:

# TODO: Solución Ejercicio 3


### Ejercicio 4 (opcional): Distribuciones y estilo
**Contexto técnico:** Preparas un anexo metodológico para un informe de propinas en restaurantes. Debes visualizar la **distribución** de la variable `tip` y aplicar un estilo coherente de reporte.

**Datos/entradas:** Usa el dataset `tips` de Seaborn (`sns.load_dataset('tips')`).

**Requerimientos:** Graficar un histograma/densidad con `sns.histplot` o `sns.displot`, aplicar `sns.set_style('whitegrid')` y `sns.set_palette('colorblind')`. Añadir título y ejes descriptivos.

**Criterios de aceptación:** El gráfico debe ser claro, con bins adecuados (al menos 15–30), y leyendas si corresponde.

**Pistas:** Ajusta `bins` y considera `stat='density'` para comparar distribuciones.


In [None]:

# TODO: Solución Ejercicio 4