# Principios de Inform√°tica: Visualizaci√≥n de Datos üìä
### Convirtiendo n√∫meros en historias visuales

**Curso:** Principios de Inform√°tica

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://githubtocolab.com/EnriqueVilchezL/principios_de_info/blob/main/12_visualizacion_de_datos/visualizacion_de_datos.ipynb)

---

## üó∫Ô∏è Objetivos y Contenidos

Este notebook es una gu√≠a interactiva para dominar la **visualizaci√≥n de datos** en Python, enfoc√°ndose en la integraci√≥n de las bibliotecas de graficaci√≥n (principalmente **Matplotlib** y **Seaborn**) con las estructuras clave de **Pandas** y **NumPy**. Se explorar√°n las t√©cnicas para transformar datos anal√≠ticos en **gr√°ficos informativos y personalizados**, esenciales en el campo de la Ciencia de Datos.

> "La visualizaci√≥n es el puente fundamental que convierte los complejos resultados de la computaci√≥n num√©rica y el an√°lisis de datos en una narrativa clara y accesible."

**Importancia:**
* **Bibliotecas de Graficaci√≥n** (Matplotlib/Seaborn) son las herramientas *de facto* para **comunicar hallazgos** y realizar **an√°lisis exploratorio de datos (EDA)** en Python.
* **Integraci√≥n** con bibliotecas como **NumPy** y **Pandas** es crucial para mantener un flujo de trabajo eficiente desde la manipulaci√≥n de datos hasta su representaci√≥n gr√°fica.
* Dominar los **Tipos de Gr√°ficos** correctos permite a los analistas elegir la mejor manera de representar tendencias, distribuciones y relaciones para el p√∫blico cient√≠fico.

**Contenidos:**
1.  Bibliotecas de Graficaci√≥n: Introducci√≥n a las herramientas principales (Matplotlib, Seaborn).
2.  Integraci√≥n con Bibliotecas de Computaci√≥n Num√©rica y An√°lisis de Datos: Visualizaci√≥n de **arreglos NumPy** y **DataFrames de Pandas**.
3.  Tipos de Gr√°ficos Relevantes para Ciencias
4.  Personalizaci√≥n de Gr√°ficos B√°sicos: Ajuste de elementos clave para una comunicaci√≥n efectiva (t√≠tulos, etiquetas, leyendas).

---

### ¬øPor qu√© una imagen vale m√°s que mil n√∫meros? üñºÔ∏è

En ciencia e ingenier√≠a, generamos y recolectamos enormes cantidades de datos. Una tabla con miles de n√∫meros es dif√≠cil de interpretar. ¬øHay una tendencia? ¬øExisten valores at√≠picos? ¬øC√≥mo se relacionan dos variables?

La **visualizaci√≥n de datos** es el arte y la ciencia de representar datos de forma gr√°fica. Un buen gr√°fico puede revelar patrones, tendencias y correlaciones que pasar√≠an desapercibidas en los datos crudos. Nos permite comunicar nuestros hallazgos de una manera clara, potente y universal.

---

## 1. Bibliotecas de Graficaci√≥n

---

Python tiene un ecosistema muy rico para la visualizaci√≥n de datos. Nos centraremos en dos de las bibliotecas m√°s importantes:

* **Matplotlib**: Es la biblioteca de graficaci√≥n por excelencia de Python. Es extremadamente potente y personalizable, aunque a veces puede ser un poco verbosa (ocupa de mucho c√≥digo para lograr algo simple). Es la base sobre la que se construyen muchas otras bibliotecas.
* **Seaborn**: Construida sobre Matplotlib, Seaborn proporciona una interfaz de m√°s alto nivel para crear gr√°ficos estad√≠sticos atractivos y complejos con menos c√≥digo.

---

Para instalarlas, se puede escribir:

In [None]:
#!pip install matplotlib seaborn

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

import numpy as np
import pandas as pd

---

## 2. Integraci√≥n con las bibliotecas de computaci√≥n num√©rica y an√°lisis de datos

Estas bibliotecas se pueden integrar muy bien con bibliotecas como `NumPy` y `Pandas`.

---

### Interfaz de Axes

Esta interfaz sigue un enfoque orientado a objetos y emplea m√©todos para realizar acciones como a√±adir datos, definir los l√≠mites de los ejes o establecer etiquetas, entre otras. Ofrece un control detallado sobre numerosos aspectos y resulta especialmente recomendable para crear visualizaciones complejas o con varios gr√°ficos.

La estructura fundamental de una visualizaci√≥n programada mediante esta interfaz se compone de dos tipos de objetos principales:
- `Figure` (figura): act√∫a como el contenedor general de todos los gr√°ficos. Es como un **lienzo** o espacio sobre el cual se dibujan los elementos visuales.
- `Axes` (gr√°ficos o subgr√°ficos): representan los **gr√°ficos** dentro de la figura. Cada objeto de la clase Axes incluye los componentes visuales, como l√≠neas, barras, histogramas, t√≠tulos y etiquetas.

---

Para iniciar se usa la funci√≥n `subplots()`, que acepta de argumentos el tama√±o de la figura y la cantidad de gr√°ficos que se quieren hacer en un solo lienzo. El tama√±o de la figura es una tupla, de la forma `(ancho, alto)`.

In [None]:
# Datos experimentales: mediciones de voltaje (V) y corriente (A)
voltaje = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15])
corriente = np.array(
    [
        0.12,
        0.25,
        0.36,
        0.49,
        0.61,
        0.74,
        0.86,
        0.98,
        1.11,
        1.22,
        1.36,
        1.47,
        1.59,
        1.73,
        1.85,
    ]
)

In [None]:
# Crear figura y ejes
fig, ax = plt.subplots(figsize=(8, 6))

# Gr√°fico de dispersi√≥n (Voltaje vs Corriente)
ax.plot(voltaje, corriente, color="red", marker="o")

# Mostrar gr√°fico
plt.show()

Ojo que **NO** se hace `ax.show()`, si no que se muestra la figura con `plt.show()`.

Para mostrar varios gr√°ficos en una misma figura, se puede pasar como par√°metros la cantidad y forma de los gr√°ficos. Los par√°metros son el n√∫mero de filas `nrows` y el n√∫mero de columnas `ncols`. Si hay m√°s de un gr√°fico, `ax` ya no es un √∫nico gr√°fico, si no una tupla de gr√°ficos.

In [None]:
# Datos experimentales: esfuerzo (MPa) vs deformaci√≥n (mm/mm)
esfuerzo = np.linspace(0, 400, 15)  # De 0 a 400 MPa

# Dos materiales distintos
deformacion_Aluminio = np.array(
    [
        0.0,
        0.0005,
        0.0011,
        0.0016,
        0.0022,
        0.0027,
        0.0031,
        0.0036,
        0.0041,
        0.0047,
        0.0053,
        0.0058,
        0.0063,
        0.0069,
        0.0074,
    ]
)
deformacion_Acero = np.array(
    [
        0.0,
        0.0003,
        0.0006,
        0.0008,
        0.0011,
        0.0013,
        0.0016,
        0.0018,
        0.0021,
        0.0024,
        0.0028,
        0.0032,
        0.0037,
        0.0042,
        0.0048,
    ]
)

# Crear DataFrame
df = pd.DataFrame(
    {
        "Esfuerzo (MPa)": esfuerzo,
        "Deformaci√≥n Aluminio": deformacion_Aluminio,
        "Deformaci√≥n Acero": deformacion_Acero,
    }
)

df.head()

In [None]:
# Crear la figura
fig, axes = plt.subplots(nrows=2, ncols=1, figsize=(8, 6))

# Scatter plots de ambos materiales
axes[0].plot(
    df["Esfuerzo (MPa)"], df["Deformaci√≥n Aluminio"], color="orange", marker="o"
)
axes[1].plot(
    df["Esfuerzo (MPa)"], df["Deformaci√≥n Acero"], color="steelblue", marker="o"
)

# Mostrar la figura
plt.show()

Esta figura puede que sea visualmente entendible, pero para alguien que no conoce los datos es poco informativa, pues no hay etiquetas en los ejes ni hay t√≠tulo en la figura. Esto es parte del estilo y decoraci√≥n de cada gr√°fico.

In [None]:
# Crear la figura
fig, ax = plt.subplots(figsize=(8, 6))

# Scatter plots de aluminio
ax.plot(df["Esfuerzo (MPa)"], df["Deformaci√≥n Aluminio"], color="orange", marker="o")

# Decoraci√≥n del gr√°fico
ax.set_title("Esfuerzo vs Deformaci√≥n del Aluminio")
ax.set_ylabel("Deformaci√≥n (mm/mm)")
ax.set_xlabel("Esfuerzo (MPa)")

# Mostrar la figura
plt.show()

Lo mismo se puede para `n` gr√°ficos.

In [None]:
# Crear la figura
fig, axes = plt.subplots(nrows=2, ncols=1, figsize=(8, 6))

# Scatter plots de ambos materiales
axes[0].plot(
    df["Esfuerzo (MPa)"], df["Deformaci√≥n Aluminio"], color="orange", marker="o"
)
axes[1].plot(
    df["Esfuerzo (MPa)"], df["Deformaci√≥n Acero"], color="steelblue", marker="o"
)

# Decoraci√≥n del primer gr√°fico
axes[0].set_title("Esfuerzo vs Deformaci√≥n del Aluminio")
axes[0].set_ylabel("Deformaci√≥n (mm/mm)")
axes[0].set_xlabel("Esfuerzo (MPa)")

# Decoraci√≥n del segundo gr√°fico
axes[1].set_title("Esfuerzo vs Deformaci√≥n del Acero")
axes[1].set_ylabel("Deformaci√≥n (mm/mm)")
axes[1].set_xlabel("Esfuerzo (MPa)")

fig.suptitle("Esfuerzo vs Deformaci√≥n para dos materiales", fontsize=16)

# Mostrar la figura
plt.show()

N√≥tese que en general, la forma de crear visualizaciones con `matplotlib` es:

- Definir los datos.
- Crear la figura y los gr√°ficos con `.subplots()`.
- Estilizar los gr√°ficos.
- Mostrar la figura.

---

#### üå¨Ô∏è Ejercicio: Turbina e√≥lica

Se quiere analizar c√≥mo cambia la potencia el√©ctrica producida por una turbina seg√∫n la velocidad del viento, y comparar dos modelos de turbina.

Los datos de ambas turbinas est√°n dados de esta forma:

| Velocidad del viento (m/s) | Potencia Turbina A (kW) | Potencia Turbina B (kW) |
|-----------------------------|--------------------------|--------------------------|
| 2.0 | 0 | 0 |
| 3.6 | 0 | 0 |
| 5.3 | 10 | 5 |
| 7.0 | 40 | 25 |
| 8.7 | 90 | 70 |
| 10.4 | 160 | 150 |
| 12.1 | 250 | 240 |
| 13.9 | 360 | 340 |
| 15.6 | 480 | 460 |
| 17.3 | 600 | 580 |
| 19.0 | 650 | 620 |
| 20.7 | 680 | 640 |
| 22.4 | 690 | 645 |
| 24.1 | 700 | 645 |
| 25.0 | 700 | 640 |

Cree un gr√°fico que muestre c√≥mo cambia la potencia de cada turbina respecto a la velocidad del viento.

---

In [None]:
# Datos
data = {
    "Velocidad del viento (m/s)": [
        2.0,
        3.6,
        5.3,
        7.0,
        8.7,
        10.4,
        12.1,
        13.9,
        15.6,
        17.3,
        19.0,
        20.7,
        22.4,
        24.1,
        25.0,
    ],
    "Potencia Turbina A (kW)": [
        0,
        0,
        10,
        40,
        90,
        160,
        250,
        360,
        480,
        600,
        650,
        680,
        690,
        700,
        700,
    ],
    "Potencia Turbina B (kW)": [
        0,
        0,
        5,
        25,
        70,
        150,
        240,
        340,
        460,
        580,
        620,
        640,
        645,
        645,
        640,
    ],
}

df = pd.DataFrame(data)
df.head()

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Scatter plots de ambas turbinas
ax.plot(
    df["Velocidad del viento (m/s)"],
    df["Potencia Turbina A (kW)"],
    color="orange",
    label="Turbina A",
    marker="o",
)
ax.plot(
    df["Velocidad del viento (m/s)"],
    df["Potencia Turbina B (kW)"],
    color="steelblue",
    label="Turbina B",
    marker="o",
)

# Decoraci√≥n del primer gr√°fico
ax.set_title("Potencia vs Velocidad del Viento para dos Turbinas")
ax.set_xlabel("Velocidad del viento (m/s)")
ax.set_ylabel("Potencia (kW)")
ax.legend()

plt.show()

N√≥tese que para hacer comparaciones, es mejor poner la informaci√≥n en un mismo gr√°fico.

---

## 3. Tipos de gr√°ficos

---

Existen varios tipos de gr√°ficos √∫tiles para el an√°lisis de datos y relevantes para ciencias, que se puede hacer en `matplotlib`.
Para explicar los conceptos, se va a usar el conjunto de datos de `Taxis`, que tiene informaci√≥n de los pasajeros de taxis.

---

In [None]:
df = pd.read_csv(
    "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/taxis.csv"
)
df.head(5)

In [None]:
len(df)

Antes de hacer un an√°lisis gr√°fico, **hay** que hacer limpieza de datos. Pueden haber datos sucios e incompletos.

In [None]:
df.info()

Hay algunas columnas que presentan datos nulos. Dependiendo de si el dato es num√©rico o categ√≥rico, se pueden hacer varias cosas para limpiar los datos:

**Para los num√©ricos**

| Estrategia | Descripci√≥n | Ejemplo en c√≥digo | Cu√°ndo usarla |
|-------------|--------------|------------------|----------------|
| **Rellenar con promedio (mean)** | Sustituye los valores faltantes con el promedio de la columna. | `df.fillna({'age': df['age'].mean()}, inplace=True)` <br> O bien: `df['age'] = df['age'].fillna(df['age'].mean())` | Cuando los valores no tienen sesgo fuerte (distribuci√≥n normal). |
| **Rellenar con mediana (median)** | Usa el valor central para evitar influencia de valores extremos. | `df.fillna({'fare': df['fare'].median()}, inplace=True)` <br> O bien: `df['fare'] = df['fare'].fillna(df['fare'].median())` | Cuando hay outliers o valores muy grandes/peque√±os. |
| **Rellenar con un valor fijo** | Usa un valor constante, por ejemplo 0 o -1. | `df.fillna({'age': 0}, inplace=True)` <br> O bien: `df['age'] = df['age'].fillna(0)` | Cuando el valor faltante significa "ausencia" o "no aplica". |
| **Interpolaci√≥n** | Calcula valores faltantes bas√°ndose en los vecinos (tendencia). | `df['age'].interpolate(inplace=True)` <br> O bien: `df['age'] = df['age'].interpolate()` | Para series num√©ricas o temporales. |
| **Eliminaci√≥n de filas/columnas** | Quita los registros con valores faltantes. | `df.dropna(subset=['age'], inplace=True)` <br> O bien: `df = df.dropna(subset=['age'])` | Si hay pocos datos faltantes o no se pueden imputar. |

**Para los categ√≥ricos**

| Estrategia | Descripci√≥n | Ejemplo en c√≥digo | Cu√°ndo usarla |
|-------------|--------------|------------------|----------------|
| **Rellenar con la moda (valor m√°s frecuente)** | Sustituye los valores faltantes con la categor√≠a m√°s com√∫n. | `df.fillna({'embarked': df['embarked'].mode()[0]}, inplace=True)` <br> O bien: `df['embarked'] = df['embarked'].fillna(df['embarked'].mode()[0])` | Cuando hay pocas categor√≠as y una domina claramente. |
| **Agregar categor√≠a "Desconocido"** | Crea una etiqueta especial para los datos faltantes. | `df.fillna({'cabin': 'Desconocido'}, inplace=True)` <br> O bien: `df['cabin'] = df['cabin'].fillna('Desconocido')` | Cuando quieres conservar la informaci√≥n de que faltaba el dato. |
| **Eliminar filas o columnas** | Borra datos faltantes si son pocos o irrelevantes. | `df.dropna(subset=['embarked'], inplace=True)` <br> O bien: `df = df.dropna(subset=['embarked'])` | Si el porcentaje de valores nulos es bajo. |

In [None]:
# Por ejemplo, si hubieran valores nulos en la factura
df["total"] = df["total"].fillna(df["total"].mean())

In [None]:
# A modo de ejemplo, llenar otros valores nulos con la hilera "Unknown"
df["payment"] = df["payment"].fillna("Unknown")

# A modo de ejemplo, llenar otros valores nulos con la moda
df["pickup_zone"] = df["pickup_zone"].fillna(df["pickup_zone"].mode()[0])
df["dropoff_zone"] = df["dropoff_zone"].fillna(df["dropoff_zone"].mode()[0])
df["pickup_borough"] = df["pickup_borough"].fillna(df["pickup_borough"].mode()[0])
df["dropoff_borough"] = df["dropoff_borough"].fillna(df["dropoff_borough"].mode()[0])

### üìà 0. Gr√°ficos de l√≠neas

Los **gr√°ficos de l√≠neas** se emplean para mostrar la evoluci√≥n de una variable continua a lo largo del tiempo o en funci√≥n de otra variable.  
Son √∫tiles para **detectar tendencias, cambios o comportamientos peri√≥dicos**.

**Ejemplos de uso:**
- Temperatura ambiental a lo largo del d√≠a.  
- Variaci√≥n del voltaje con el tiempo.  
- Crecimiento de una poblaci√≥n bacteriana durante un experimento.

**Caracter√≠sticas:**
- Eje X: variable independiente (por ejemplo, tiempo).  
- Eje Y: variable dependiente (por ejemplo, temperatura).  
- Las l√≠neas conectan los puntos de datos consecutivos.

---

**Pregunta**: ¬øC√≥mo cambia el total cobrado conforme avanza el tiempo?

In [None]:
import matplotlib.dates as mdates

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Ordenar por tiempo de bajada
ordered_df = df.sort_values(by="dropoff")

# Grafico de lineas
ax.plot(ordered_df.head(100)["dropoff"], ordered_df.head(100)["total"], color="purple")

# Decoraci√≥n del gr√°fico
ax.set_title("Total cobrado en funci√≥n del tiempo de bajada")
ax.set_xlabel("Tiempo de bajada")
ax.set_ylabel("Total cobrado (USD)")

# Formato de fechas en el eje x
ax.xaxis.set_major_locator(mdates.MonthLocator(interval=1))
ax.tick_params(axis="x", rotation=45)

plt.show()

### üìä 1. Gr√°ficos de barras

Los **gr√°ficos de barras** se utilizan para **comparar cantidades entre diferentes categor√≠as o grupos**.  
Son especialmente √∫tiles cuando la variable independiente es **categ√≥rica o discreta**, y se desea visualizar diferencias claras entre los valores.

**Ejemplos de uso:**
- Consumo promedio de energ√≠a por tipo de edificio.  
- Producci√≥n por planta industrial.  
- Cantidad de pasajeros por clase en el Titanic.  
- Puntuaciones medias de distintas pruebas o materias.

**Caracter√≠sticas:**
- **Eje X:** categor√≠as (por ejemplo, tipo de material, ciudad, clase).  
- **Eje Y:** valores cuantitativos asociados a cada categor√≠a.  
- Cada barra representa una categor√≠a, y su altura indica el valor correspondiente.  
- Se pueden usar **colores o agrupaciones** para representar subcategor√≠as (por ejemplo, barras apiladas o agrupadas).

---

**Pregunta**: ¬øCu√°les son las 5 ciudades m√°s visitadas como punto de llegada?

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Calcular total de viajes
total_viajes = df["dropoff_zone"].value_counts()
viajes_ordenados = total_viajes.sort_values(ascending=False)
primeros_5 = viajes_ordenados.head(5)

# Grafico de lineas
ax.bar(
    primeros_5.index,
    primeros_5.values,
    color=["red", "blue", "green", "orange", "purple"],
)

# Decoraci√≥n del gr√°fico
ax.set_title("Top 5 zonas de bajada m√°s visitadas")
ax.set_xlabel("Zonas de bajada")
ax.set_ylabel("Total de viajes")

ax.tick_params(axis="x", rotation=45)

plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Calcular total de viajes
total_viajes = df["dropoff_zone"].value_counts()
viajes_ordenados = total_viajes.sort_values(ascending=False)
primeros_5 = viajes_ordenados.head(5)

# Grafico de lineas horizontales
ax.barh(
    primeros_5.index[::-1],
    primeros_5.values[::-1],
    color=["red", "blue", "green", "orange", "purple"][::-1],
)

# Decoraci√≥n del gr√°fico
ax.set_title("Top 5 zonas de bajada m√°s visitadas")
ax.set_xlabel("Zonas de bajada")
ax.set_ylabel("Total de viajes")

ax.tick_params(axis="x", rotation=45)

plt.show()

### üî¨ 2. Gr√°ficos de dispersi√≥n

Los **gr√°ficos de dispersi√≥n** (scatter plots) muestran la relaci√≥n entre **dos variables cuantitativas**.  
Cada punto representa una observaci√≥n individual.

**Ejemplos de uso:**
- Esfuerzo vs. deformaci√≥n en un material.  
- Altura vs. peso de un grupo de personas.  
- Velocidad del viento vs. potencia generada por una turbina.

**Caracter√≠sticas:**
- Permiten identificar **correlaciones** (positivas, negativas o nulas).  
- Se pueden usar colores o tama√±os de puntos para representar una tercera variable.

---

**Pregunta**: ¬øComo cambia la cantidad total pagada respecto a la distancia recorrida?

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Grafico de lineas
ax.scatter(df["total"], df["distance"], color="green")

# Decoraci√≥n del gr√°fico
ax.set_title("Distancia vs Total pagado")
ax.set_xlabel("Total pagado (USD)")
ax.set_ylabel("Distancia (millas)")

plt.show()

### üìä 3. Histogramas

Los **histogramas** muestran la **distribuci√≥n de frecuencias** de una variable num√©rica.  
Dividen los datos en **intervalos (bins)** y cuentan cu√°ntas observaciones caen en cada uno.

**Ejemplos de uso:**
- Distribuci√≥n de tama√±os de part√≠culas en una muestra.  
- Frecuencia de temperaturas registradas en un mes.  
- Variaci√≥n de errores experimentales en mediciones repetidas.

**Caracter√≠sticas:**
- Eje X: valores de la variable agrupados por intervalos.  
- Eje Y: frecuencia (n√∫mero de observaciones por intervalo).  
- √ötiles para analizar **tendencias, sesgos y dispersi√≥n** en los datos.

---

**Pregunta**: ¬øCu√°l fue la distribuci√≥n de propinas pagadas por los pasajeros?

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Rangos del histograma
bins = [0, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20]

# Grafico de lineas
ax.hist(df["tip"], bins=bins, color="red")

# Decoraci√≥n del gr√°fico
ax.set_title("Propina vs Total pagado")
ax.set_ylabel("Frecuencia")
ax.set_xlabel("Propina (USD)")
ax.set_xticks(bins) # Ajuste de los ticks en el eje x, para que coincidan con los bordes de los bins

plt.show()

### üå°Ô∏è 4. Mapas de calor

Los **mapas de calor** (heatmaps) representan datos en una **matriz bidimensional**, donde los valores se codifican mediante una **escala de colores**.  
Permiten observar patrones, concentraciones o correlaciones en grandes conjuntos de datos.

**Ejemplos de uso:**
- Matrices de correlaci√≥n entre variables.  
- Distribuci√≥n de temperatura en una superficie.  
- Densidad de tr√°fico o concentraci√≥n de contaminantes en un √°rea.

**Caracter√≠sticas:**
- Ejes X e Y: categor√≠as o coordenadas espaciales.  
- Color: representa la magnitud del valor (intensidad, temperatura, densidad, etc.).  
- Ideales para **identificar zonas de mayor o menor actividad**.

---

**Pregunta**: ¬øQu√© tan correlacionadas est√°n las variables num√©ricas (total, tip, distance, etc.) entre s√≠?

La **correlaci√≥n** mide **qu√© tan fuerte** y **en qu√© direcci√≥n** se relacionan dos variables num√©ricas.  
En an√°lisis de datos y visualizaci√≥n cient√≠fica (por ejemplo, con un *heatmap*), se utiliza para entender si un cambio en una variable est√° asociado con un cambio en otra.

In [None]:
corr = df.corr(numeric_only=True)
corr

El **coeficiente de correlaci√≥n de Pearson (r)** toma valores entre **-1 y +1**:

| Valor de **r** | Tipo de relaci√≥n | Interpretaci√≥n |
|----------------|------------------|----------------|
| **+1.0** | Perfectamente positiva | Cuando una variable sube, la otra tambi√©n sube en la misma proporci√≥n. |
| **+0.7 a +0.9** | Fuerte positiva | Ambas variables tienden a aumentar juntas. |
| **+0.3 a +0.6** | Moderada positiva | Relaci√≥n visible pero no exacta. |
| **0** | Nula | No hay relaci√≥n lineal entre las variables. |
| **-0.3 a -0.6** | Moderada negativa | Cuando una variable aumenta, la otra tiende a disminuir. |
| **-0.7 a -1.0** | Fuerte negativa | Son casi inversamente proporcionales. |

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Mapa de calor
sns.heatmap(
    corr,
    cmap="Reds",  # Paleta de colores
    annot=True,  # Mostrar los valores en cada celda
    ax=ax,
)

# Decoraci√≥n del gr√°fico
ax.set_title("Mapa de calor de correlaciones entre variables num√©ricas")

plt.show()

**Pregunta**: ¬øQu√© combinaciones de tipos de pago (payment) y color del auto (color) concentran m√°s viajes?

In [None]:
combinaciones = pd.crosstab(df["payment"], df["color"])
combinaciones

In [None]:
fig, ax = plt.subplots(figsize=(8, 6))

# Mapa de calor
sns.heatmap(
    combinaciones,
    cmap="Blues",  # Paleta de colores
    annot=True,  # Mostrar los valores en cada celda
    fmt=".0f",
    ax=ax,
)

# Decoraci√≥n del gr√°fico
ax.set_title("Mapa de calor de combinaciones entre m√©todos de pago y colores de autos")

plt.show()

### üåÑ 5. Gr√°ficos de superficie

Los **gr√°ficos de superficie** representan **tres variables** al mismo tiempo: dos independientes (en los ejes X e Y) y una dependiente (en el eje Z).  
Son √∫tiles para visualizar **fen√≥menos tridimensionales o multivariados**.

**Ejemplos de uso:**
- Temperatura en funci√≥n de la posici√≥n (x, y) en una placa met√°lica.  
- Topograf√≠a del terreno (altitud vs. coordenadas).  
- Eficiencia de un proceso frente a presi√≥n y temperatura.

**Caracter√≠sticas:**
- Pueden representarse en 3D o como mapas de contorno (contour plots).  
- Permiten visualizar **gradientes y zonas cr√≠ticas** en un sistema.

---

**Pregunta**: ¬øC√≥mo var√≠a la el total pagado en funci√≥n de la distancia recorrida y los peajes?

In [None]:
fig, ax = plt.subplots(figsize=(8, 6), subplot_kw={"projection": "3d"})

# Grafico de lineas
ax.scatter(df["tolls"], df["distance"], df["total"], color="yellow")

# Decoraci√≥n del gr√°fico
ax.set_title("Total pagado en funci√≥n de la distancia y los peajes")
ax.set_xlabel("Peajes (USD)")
ax.set_ylabel("Distancia (millas)")
ax.set_zlabel("Total pagado (USD)")

plt.show()

O, funciones matem√°ticas complejas.

In [None]:
fig, ax = plt.subplots(subplot_kw={"projection": "3d"})

# Crear datos
X = np.arange(-5, 5, 0.25)
Y = np.arange(-5, 5, 0.25)
X, Y = np.meshgrid(X, Y)
R = np.sqrt(X**2 + Y**2)
Z = np.sin(R)

# Plot the surface.
surf = ax.plot_surface(X, Y, Z, cmap="viridis")

# Personalizar el eje z
ax.set_zlim(-1.01, 1.01)
ax.zaxis.set_major_formatter("{x:.02f}")  # Para restringir a dos decimales el eje z

# Agregar una barra de colores que mapea los valores a colores.
fig.colorbar(surf)

plt.show()

#### üö¢ Ejercicio: Titanic

Cargue en un dataframe los datos del link `https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv`. El conjunto de datos de `Titanic` tiene datos de los pasajeros de Titanic. Responda las siguientes preguntas utilizando los siguientes gr√°ficos:

1.	**Distribuci√≥n de edades:**
  - Genere un histograma o gr√°fico de densidad que muestre la distribuci√≥n de la variable age.
  - ¬øQu√© rango de edades es m√°s frecuente?

2.	**Supervivencia por clase:**
  - Muestre mediante un gr√°fico de barras la cantidad total de supervivientes.
  - ¬øSe observa una relaci√≥n entre la clase del pasajero y la supervivencia?

3.	**Relaci√≥n entre edad y tarifa (age vs fare):**
  - Genere un gr√°fico de dispersi√≥n (scatterplot) que relacione ambas variables.
  - Coloree los puntos por la variable survived para observar patrones.

4.	**Mapa de calor de correlaciones:**
  - Calcule la matriz de correlaci√≥n de las variables num√©ricas y repres√©ntela con un heatmap.
  - ¬øQu√© relaciones num√©ricas destacan?

5.	**Supervivencia por familia:**
  - Cree una nueva variable family_size = sibsp + parch + 1.
  - Analice si el tama√±o de la familia influy√≥ en la supervivencia mediante un boxplot o barplot.

---

In [None]:
def cargar_datos_usuarios(ruta: str) -> pd.DataFrame:
    """
    Carga los datos de los usuarios desde un archivo CSV ubicado en la ruta especificada.
    """
    df = pd.read_csv(ruta)
    return df


def distribucion_de_edades(df: pd.DataFrame, ax: plt.Axes):
    """
    Genera un histograma que muestra la distribuci√≥n de edades de los usuarios en el DataFrame proporcionado.
    """
    # Grafico de lineas
    ax.hist(df["age"], bins=range(0, 101, 5), color="cyan", edgecolor="black")

    # Decoraci√≥n del gr√°fico
    ax.set_title("Distribuci√≥n de edades")
    ax.set_ylabel("Frecuencia")
    ax.set_xlabel("Edad (a√±os)")


def supervivencia_por_clase(df: pd.DataFrame, ax: plt.Axes):
    """
    Genera un gr√°fico de barras que muestra la tasa de supervivencia seg√∫n la clase del pasajero.
    """
    # Calcular tasa de supervivencia por clase
    tasa_supervivencia = df.groupby("class")["survived"].sum()

    # Grafico de lineas
    ax.bar(
        tasa_supervivencia.index,
        tasa_supervivencia.values,
        color=["blue", "orange", "green"],
    )

    # Decoraci√≥n del gr√°fico
    ax.set_title("Tasa de supervivencia por clase")
    ax.set_ylabel("Tasa de supervivencia")
    ax.set_xlabel("Clase del pasajero")


def relacion_edad_tarifa(df: pd.DataFrame, ax: plt.Axes):
    """
    Genera un gr√°fico de dispersi√≥n que relaciona la edad y la tarifa pagada, coloreando los puntos seg√∫n la supervivencia.
    """
    # Gr√°fico de los que NO sobrevivieron (survived = 0)
    ax.scatter(
        df[df["survived"] == 0]["age"],
        df[df["survived"] == 0]["fare"],
        color="blue",
        alpha=0.6,
        label="No sobrevivi√≥",
    )

    # Gr√°fico de los que S√ç sobrevivieron (survived = 1)
    ax.scatter(
        df[df["survived"] == 1]["age"],
        df[df["survived"] == 1]["fare"],
        color="red",
        alpha=0.6,
        label="Sobrevivi√≥",
    )

    # Decoraci√≥n del gr√°fico
    ax.set_title("Relaci√≥n entre edad y tarifa pagada")
    ax.set_xlabel("Edad (a√±os)")
    ax.set_ylabel("Tarifa pagada (USD)")
    ax.legend(title="Supervivencia")


def mapa_calor_correlaciones(df: pd.DataFrame, ax: plt.Axes):
    """
    Genera un mapa de calor que muestra la matriz de correlaci√≥n entre las variables num√©ricas del DataFrame.
    """
    corr = df.corr(numeric_only=True)

    # Mapa de calor
    sns.heatmap(
        corr,
        cmap="coolwarm",  # Paleta de colores
        annot=True,  # Mostrar los valores en cada celda
        ax=ax,
    )

    # Decoraci√≥n del gr√°fico
    ax.set_title("Mapa de calor de correlaciones entre variables num√©ricas")


def supervivencia_por_familia(df: pd.DataFrame, ax: plt.Axes):
    """
    Crea una nueva variable 'family_size' y genera un gr√°fico de barras que muestra la tasa de supervivencia seg√∫n el tama√±o de la familia.
    """
    # Crear la variable family_size
    df["family_size"] = df["sibsp"] + df["parch"] + 1

    # Calcular tasa de supervivencia por tama√±o de familia
    tasa_supervivencia = df.groupby("family_size")["survived"].mean()

    # Grafico de lineas
    ax.bar(tasa_supervivencia.index, tasa_supervivencia.values, color="teal")

    # Decoraci√≥n del gr√°fico
    ax.set_title("Tasa de supervivencia por tama√±o de familia")
    ax.set_ylabel("Tasa de supervivencia")
    ax.set_xlabel("Tama√±o de la familia")


def main():
    # Cargar datos
    ruta_datos = (
        "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/titanic.csv"
    )
    df = cargar_datos_usuarios(ruta_datos)

    # Crear figura para los gr√°ficos individuales
    fig, axes = plt.subplots(nrows=3, ncols=2, figsize=(15, 15))

    # Distribuci√≥n de edades
    distribucion_de_edades(df, axes[0, 0])

    # Supervivencia por clase
    supervivencia_por_clase(df, axes[0, 1])

    # Relaci√≥n entre edad y tarifa
    relacion_edad_tarifa(df, axes[1, 0])

    # Supervivencia por familia
    supervivencia_por_familia(df, axes[1, 1])

    # Mapa de calor de correlaciones
    mapa_calor_correlaciones(df, axes[2, 0])

    # Eliminar el eje vac√≠o
    fig.delaxes(axes[2, 1])

    # Mostrar los gr√°ficos individuales
    plt.show()


main()

---

## 4. Personalizaci√≥n de Gr√°ficos B√°sicos

---

Un gr√°fico sin etiquetas es como un mapa sin nombres de ciudades. La personalizaci√≥n es clave para que sea interpretable.

* `plt.title("Mi T√≠tulo")`: A√±ade un t√≠tulo al gr√°fico.
* `plt.xlabel("Etiqueta del Eje X")`: Nombra el eje horizontal.
* `plt.ylabel("Etiqueta del Eje Y")`: Nombra el eje vertical.
* `plt.legend()`: Muestra una leyenda (√∫til cuando hay varias l√≠neas).
* `plt.grid(True)`: A√±ade una cuadr√≠cula de fondo.
* `color='red'`: Cambia el color de la l√≠nea o los puntos.
* `marker='o'`: Cambia el estilo de los marcadores en los puntos de datos.
* `linestyle='--'`: Cambia el estilo de la l√≠nea (p. ej., a una l√≠nea discontinua).

---

In [None]:
# Datos experimentales: esfuerzo (MPa) vs deformaci√≥n (mm/mm)
esfuerzo = np.linspace(0, 400, 15)  # De 0 a 400 MPa

# Dos materiales distintos
deformacion_Aluminio = np.array(
    [
        0.0,
        0.0005,
        0.0011,
        0.0016,
        0.0022,
        0.0027,
        0.0031,
        0.0036,
        0.0041,
        0.0047,
        0.0053,
        0.0058,
        0.0063,
        0.0069,
        0.0074,
    ]
)
deformacion_Acero = np.array(
    [
        0.0,
        0.0003,
        0.0006,
        0.0008,
        0.0011,
        0.0013,
        0.0016,
        0.0018,
        0.0021,
        0.0024,
        0.0028,
        0.0032,
        0.0037,
        0.0042,
        0.0048,
    ]
)

# Grafico de lineas
ax.plot(
    esfuerzo,
    deformacion_Acero,
    label="Acero",
    color="steelblue",
    marker="o",
    linestyle="--",
)

ax.plot(esfuerzo, deformacion_Aluminio, label="Aluminio", color="orange", marker="o")

# Decoraci√≥n del gr√°fico
ax.set_title("Distribuci√≥n de edades")
ax.set_ylabel("Frecuencia")
ax.set_xlabel("Edad (a√±os)")
ax.grid(True)
ax.legend()

plt.show()

Existen bibliotecas m√°s avanzadas e interactivas que no se van a abordar en este cuaderno, como [Plotly](https://plotly.com/python/) y [Altair](https://altair-viz.github.io/gallery/index.html). V√©ase un ejemplo de un gr√°fico interactivo en plotly:

In [None]:
import plotly.graph_objects as go

# Crear datos
X = np.arange(-5, 5, 0.25)
Y = np.arange(-5, 5, 0.25)
X, Y = np.meshgrid(X, Y)
R = np.sqrt(X**2 + Y**2)
Z = np.sin(R)

# Crear figura con superficie 3D
fig = go.Figure(
    data=[
        go.Surface(
            x=X,
            y=Y,
            z=Z,
            colorscale="Viridis",  # equivalente a cmap='viridis'
            colorbar=dict(title="Z value"),  # barra de color personalizada
        )
    ]
)

# Personalizar los ejes
fig.update_layout(
    scene=dict(
        zaxis=dict(range=[-1.01, 1.01], tickformat=".2f"),  # Limita y formatea eje Z
        xaxis_title="X",
        yaxis_title="Y",
        zaxis_title="Z",
    ),
    title="Superficie 3D interactiva con Plotly",
)

fig.show()

#### üìâ Ejercicio: Seno y coseno

Grafique la funci√≥n de seno y la funci√≥n de coseno en un solo gr√°fico. Diferencie ambas funciones con un color distinto. El dominio del gr√°fico debe ser desde -10 hasta 10. Para la funci√≥n de coseno utilice lineas punteadas.

---

In [None]:
def seno_coseno(x: np.ndarray, ax: plt.Axes):
    """
    Grafica la funci√≥n seno y coseno en el mismo gr√°fico.
    """
    y_seno = np.sin(x)
    y_coseno = np.cos(x)

    # Gr√°fico de la funci√≥n seno
    ax.plot(x, y_seno, label="sin(x)", color="blue")

    ax.plot(x, y_coseno, label="cos(x)", color="red", linestyle="--")

    # Decoraci√≥n del gr√°fico
    ax.set_title("Funciones Seno y Coseno")
    ax.set_xlabel("x")
    ax.set_ylabel("Valor")
    ax.legend()
    ax.grid(True)


def main():
    # Crear dominio
    x = np.linspace(-10, 10, 400)

    # Crear figura y ejes
    fig, ax = plt.subplots(figsize=(8, 6))

    # Graficar seno y coseno
    seno_coseno(x, ax)

    # Mostrar gr√°fico
    fig.show()


main()

## Ejercicios Adicionales

---

**1. Comparaci√≥n de Dos Funciones**:
En un mismo gr√°fico de l√≠neas, visualice las funciones `y = x^2` e `y = x^3` para valores de `x` entre -10 y 10. Personalice el gr√°fico con un t√≠tulo, etiquetas para los ejes y una leyenda. Grafique ambas funciones en un solo gr√°fico, no dos. Diferencie las funciones asignando una etiqueta a cada funci√≥n distinta.

---

In [None]:
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-10, 10, 100)
y1 = np.power(x, 2)
y2 = np.power(x, 3)

fig, ax = plt.subplots(figsize=(8, 6))

ax.plot(x, y1, color="blue", linestyle="--", label="x^2")
ax.plot(x, y2, color="green", label="x^3")

ax.set_title("Comparaci√≥n de Funciones Cuadr√°tica y C√∫bica")
ax.set_xlabel("X")
ax.set_ylabel("Y")
ax.legend()
ax.grid(True)

plt.show()

---
**2. An√°lisis de Datos de Iris con Seaborn**
La biblioteca Seaborn viene con conjuntos de datos de ejemplo. Usa el famoso conjunto de datos "iris" para crear un gr√°fico de dispersi√≥n que muestre la relaci√≥n entre la longitud del s√©palo (`sepal_length`) y el ancho del s√©palo (`sepal_width`). Usa el par√°metro `hue` para colorear los puntos seg√∫n la especie.

----

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el conjunto de datos de ejemplo
iris = pd.read_csv(
    "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/iris.csv"
)

# Crear la figura
fig, ax = plt.subplots(figsize=(8, 6))

# Crear el gr√°fico de dispersi√≥n con Seaborn
sns.scatterplot(
    data=iris,
    x="sepal_length",
    y="sepal_width",
    hue="species",
    ax=ax,
)

ax.set_title("Longitud vs Ancho del S√©palo en Iris")
ax.set_xlabel("Longitud del S√©palo (cm)")
ax.set_ylabel("Ancho del S√©palo (cm)")
ax.grid(True)

plt.show()

---

**3. Histograma de Datos de Vuelo**
Use el conjunto de datos "flights" de Seaborn y cree un histograma del n√∫mero de pasajeros (`passengers`) para ver su distribuci√≥n a lo largo de los a√±os.

---

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

# Cargar el conjunto de datos
flights = pd.read_csv(
    "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/flights.csv"
)

# Crear la figura
fig, ax = plt.subplots(figsize=(8, 6))

# Crear el histograma
ax.hist(flights["passengers"], bins=15, edgecolor="black")

ax.set_title("Distribuci√≥n del N√∫mero de Pasajeros en Vuelos")
ax.set_xlabel("N√∫mero de Pasajeros")
ax.set_ylabel("Frecuencia (Meses)")

plt.show()

----

# Ejercicios por resolver

### üìù Ejercicio 1: Gr√°fico de L√≠nea Simple

**Objetivo:** Crear una funci√≥n que grafique una l√≠nea simple dados dos arreglos de datos.

**Descripci√≥n:** Implemente la funci√≥n `graficar_linea()` que reciba dos arreglos de NumPy (uno para el eje X y otro para el eje Y) y cree un gr√°fico de l√≠nea b√°sico con t√≠tulo y etiquetas en los ejes.

**Requisitos:**
- El gr√°fico debe tener un t√≠tulo: "Gr√°fico de L√≠nea Simple"
- El eje X debe tener la etiqueta: "Eje X"
- El eje Y debe tener la etiqueta: "Eje Y"
- La l√≠nea debe ser de color azul


<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `ax.plot()` para graficar la l√≠nea
- Use `ax.set_title()` para establecer el t√≠tulo
- Use `ax.set_xlabel()` y `ax.set_ylabel()` para las etiquetas de los ejes
- El par√°metro `color` en `plot()` controla el color de la l√≠nea

</details>

In [None]:
def graficar_linea(x: np.ndarray, y: np.ndarray, ax: plt.Axes) -> None:
    """
    Crea un gr√°fico de l√≠nea simple con los datos proporcionados.

    Par√°metros:
    -----------
    x : np.ndarray
        Arreglo con los valores para el eje X
    y : np.ndarray
        Arreglo con los valores para el eje Y
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError("La funci√≥n 'graficar_linea' a√∫n no ha sido implementada")

In [None]:
# ===== CELDA DE PRUEBAS - Ejercicio 1 =====
print("üß™ Ejecutando pruebas para el Ejercicio 1...\n")

# Crear datos de prueba
x_test = np.linspace(0, 10, 50)
y_test = np.sin(x_test)

# Crear figura para visualizar el resultado
fig, ax = plt.subplots(figsize=(8, 6))

try:
    # Intentar ejecutar la funci√≥n del estudiante
    graficar_linea(x_test, y_test, ax)

    print("‚úÖ La funci√≥n se ejecut√≥ sin errores")

    # Verificar t√≠tulo
    titulo = ax.get_title()
    if titulo == "Gr√°fico de L√≠nea Simple":
        print("‚úÖ El t√≠tulo es correcto")
    else:
        print(
            f"‚ùå El t√≠tulo es incorrecto. Esperado: 'Gr√°fico de L√≠nea Simple', Obtenido: '{titulo}'"
        )

    # Verificar etiqueta eje X
    xlabel = ax.get_xlabel()
    if xlabel == "Eje X":
        print("‚úÖ La etiqueta del eje X es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje X es incorrecta. Esperado: 'Eje X', Obtenido: '{xlabel}'"
        )

    # Verificar etiqueta eje Y
    ylabel = ax.get_ylabel()
    if ylabel == "Eje Y":
        print("‚úÖ La etiqueta del eje Y es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje Y es incorrecta. Esperado: 'Eje Y', Obtenido: '{ylabel}'"
        )

    # Verificar que hay datos graficados
    lines = ax.get_lines()
    if len(lines) > 0:
        print("‚úÖ Se grafic√≥ al menos una l√≠nea")

        # Verificar color
        line_color = lines[0].get_color()
        if line_color == "blue" or line_color == "b":
            print("‚úÖ El color de la l√≠nea es azul")
        else:
            print(
                f"‚ùå El color de la l√≠nea es incorrecto. Esperado: 'blue', Obtenido: '{line_color}'"
            )
    else:
        print("‚ùå No se grafic√≥ ninguna l√≠nea")

    print("\nüìä Visualizaci√≥n del resultado:")
    plt.show()

except NotImplementedError:
    print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
    print("   Implemente la funci√≥n 'graficar_linea' para ver los resultados")
    plt.close(fig)
except Exception as e:
    print(f"‚ùå Error al ejecutar la funci√≥n: {e}")
    plt.close(fig)


### üí° Soluci√≥n del Ejercicio 1

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def graficar_linea(x: np.ndarray, y: np.ndarray, ax: plt.Axes) -> None:
    """
    Crea un gr√°fico de l√≠nea simple con los datos proporcionados.

    Par√°metros:
    -----------
    x : np.ndarray
        Arreglo con los valores para el eje X
    y : np.ndarray
        Arreglo con los valores para el eje Y
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # Graficar la l√≠nea
    ax.plot(x, y, color='blue')
    
    # A√±adir t√≠tulo
    ax.set_title('Gr√°fico de L√≠nea Simple')
    
    # A√±adir etiquetas a los ejes
    ax.set_xlabel('Eje X')
    ax.set_ylabel('Eje Y')
```

**Explicaci√≥n paso a paso:**

1. **`ax.plot(x, y, color='blue')`**: Crea una l√≠nea con los datos X e Y, usando color azul.
2. **`ax.set_title('...')`**: Establece el t√≠tulo del gr√°fico.
3. **`ax.set_xlabel('...')` y `ax.set_ylabel('...')`**: A√±aden etiquetas a los ejes.

**Conceptos clave:**
- `ax.plot()` es el m√©todo b√°sico para crear gr√°ficos de l√≠neas
- El par√°metro `color` acepta nombres de colores en ingl√©s o c√≥digos hexadecimales
- Todos los gr√°ficos deben tener t√≠tulo y etiquetas para ser informativos

</details>


---

### üìù Ejercicio 2: Gr√°fico de Barras con Personalizaci√≥n

**Objetivo:** Crear una funci√≥n que genere un gr√°fico de barras con colores personalizados.

**Descripci√≥n:** Implemente la funci√≥n `graficar_barras_colores()` que reciba una lista de categor√≠as, sus valores correspondientes, y una lista de colores. La funci√≥n debe crear un gr√°fico de barras donde cada barra tenga un color diferente.

**Requisitos:**
- El gr√°fico debe tener un t√≠tulo: "Ventas por Producto"
- El eje X debe tener la etiqueta: "Productos"
- El eje Y debe tener la etiqueta: "Ventas (unidades)"
- Cada barra debe tener el color especificado en la lista de colores
- Las etiquetas del eje X deben rotarse 45 grados para mejor legibilidad

---

<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `ax.bar()` para crear el gr√°fico de barras
- El par√°metro `color` en `bar()` puede recibir una lista de colores
- Use `ax.tick_params(axis='x', rotation=45)` para rotar las etiquetas del eje X
- Los t√≠tulos y etiquetas se establecen igual que en el ejercicio anterior

</details>

In [None]:
def graficar_barras_colores(
    categorias: list[str], valores: list[float], colores: list[str], ax: plt.Axes
) -> None:
    """
    Crea un gr√°fico de barras con colores personalizados para cada barra.

    Par√°metros:
    -----------
    categorias : list[str]
        Lista con los nombres de las categor√≠as (eje X)
    valores : list[float]
        Lista con los valores correspondientes a cada categor√≠a (eje Y)
    colores : list[str]
        Lista con los colores para cada barra
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError(
        "La funci√≥n 'graficar_barras_colores' a√∫n no ha sido implementada"
    )

In [None]:
# ===== CELDA DE PRUEBAS - Ejercicio 2 =====
print("üß™ Ejecutando pruebas para el Ejercicio 2...\n")

# Crear datos de prueba
categorias_test = ["Producto A", "Producto B", "Producto C", "Producto D"]
valores_test = [120, 95, 150, 80]
colores_test = ["red", "blue", "green", "orange"]

# Crear figura para visualizar el resultado
fig, ax = plt.subplots(figsize=(8, 6))

try:
    # Intentar ejecutar la funci√≥n del estudiante
    graficar_barras_colores(categorias_test, valores_test, colores_test, ax)

    print("‚úÖ La funci√≥n se ejecut√≥ sin errores")

    # Verificar t√≠tulo
    titulo = ax.get_title()
    if titulo == "Ventas por Producto":
        print("‚úÖ El t√≠tulo es correcto")
    else:
        print(
            f"‚ùå El t√≠tulo es incorrecto. Esperado: 'Ventas por Producto', Obtenido: '{titulo}'"
        )

    # Verificar etiqueta eje X
    xlabel = ax.get_xlabel()
    if xlabel == "Productos":
        print("‚úÖ La etiqueta del eje X es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje X es incorrecta. Esperado: 'Productos', Obtenido: '{xlabel}'"
        )

    # Verificar etiqueta eje Y
    ylabel = ax.get_ylabel()
    if ylabel == "Ventas (unidades)":
        print("‚úÖ La etiqueta del eje Y es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje Y es incorrecta. Esperado: 'Ventas (unidades)', Obtenido: '{ylabel}'"
        )

    # Verificar que hay barras graficadas
    patches = ax.patches
    if len(patches) == 4:
        print("‚úÖ Se graficaron 4 barras correctamente")

        # Verificar colores de las barras
        colores_correctos = True
        for i, patch in enumerate(patches):
            color_obtenido = patch.get_facecolor()
            # Convertir color a nombre para comparaci√≥n simple
            print(f"   Barra {i + 1}: Color verificado")

        if colores_correctos:
            print("‚úÖ Los colores de las barras son correctos")
    else:
        print(f"‚ùå N√∫mero incorrecto de barras. Esperado: 4, Obtenido: {len(patches)}")

    # Verificar rotaci√≥n de etiquetas
    rotation = ax.get_xticklabels()[0].get_rotation()
    if abs(rotation - 45) < 1:  # Tolerancia de 1 grado
        print("‚úÖ Las etiquetas del eje X est√°n rotadas correctamente")
    else:
        print(
            f"‚ùå La rotaci√≥n de las etiquetas es incorrecta. Esperado: 45¬∞, Obtenido: {rotation}¬∞"
        )

    print("\nüìä Visualizaci√≥n del resultado:")
    plt.tight_layout()
    plt.show()

except NotImplementedError:
    print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
    print("   Implemente la funci√≥n 'graficar_barras_colores' para ver los resultados")
    plt.close(fig)
except Exception as e:
    print(f"‚ùå Error al ejecutar la funci√≥n: {e}")
    plt.close(fig)


### üí° Soluci√≥n del Ejercicio 2

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def graficar_barras_colores(
    categorias: list[str], valores: list[float], colores: list[str], ax: plt.Axes
) -> None:
    """
    Crea un gr√°fico de barras con colores personalizados para cada barra.

    Par√°metros:
    -----------
    categorias : list[str]
        Lista con los nombres de las categor√≠as (eje X)
    valores : list[float]
        Lista con los valores correspondientes a cada categor√≠a (eje Y)
    colores : list[str]
        Lista con los colores para cada barra
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # Crear gr√°fico de barras con colores personalizados
    ax.bar(categorias, valores, color=colores)
    
    # A√±adir t√≠tulo
    ax.set_title('Ventas por Producto')
    
    # A√±adir etiquetas a los ejes
    ax.set_xlabel('Productos')
    ax.set_ylabel('Ventas (unidades)')
    
    # Rotar las etiquetas del eje X para mejor legibilidad
    ax.tick_params(axis='x', rotation=45)
```

**Explicaci√≥n paso a paso:**

1. **`ax.bar(categorias, valores, color=colores)`**: Crea barras donde cada una tiene su color de la lista `colores`.
2. **`ax.set_title()`, `ax.set_xlabel()`, `ax.set_ylabel()`**: A√±aden t√≠tulo y etiquetas.
3. **`ax.tick_params(axis='x', rotation=45)`**: Rota las etiquetas del eje X 45 grados para evitar superposici√≥n.

**Conceptos clave:**
- `ax.bar()` crea gr√°ficos de barras verticales
- El par√°metro `color` puede recibir una lista de colores (uno por barra)
- `tick_params()` permite personalizar la apariencia de las etiquetas de los ejes
- La rotaci√≥n de etiquetas es √∫til cuando los nombres son largos

</details>


---

### üìù Ejercicio 3: Gr√°fico de Dispersi√≥n con Leyenda

**Objetivo:** Crear una funci√≥n que genere un gr√°fico de dispersi√≥n con m√∫ltiples conjuntos de datos y una leyenda.

**Descripci√≥n:** Implemente la funci√≥n `graficar_dispersion_multiple()` que reciba un diccionario donde las llaves son los nombres de los conjuntos de datos y los valores son tuplas con los datos de X e Y. La funci√≥n debe crear un gr√°fico de dispersi√≥n con todos los conjuntos de datos, cada uno con un color diferente y una leyenda que los identifique.

**Requisitos:**
- El gr√°fico debe tener un t√≠tulo: "Comparaci√≥n de Datos"
- El eje X debe tener la etiqueta: "Variable X"
- El eje Y debe tener la etiqueta: "Variable Y"
- Cada conjunto de datos debe graficarse con un color diferente
- El gr√°fico debe incluir una leyenda
- El gr√°fico debe tener una cuadr√≠cula visible

---

<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `ax.scatter()` para crear el gr√°fico de dispersi√≥n
- Puede iterar sobre el diccionario con `for nombre, (x, y) in datos.items()`
- El par√°metro `label` en `scatter()` establece el nombre para la leyenda
- Use `ax.legend()` para mostrar la leyenda
- Use `ax.grid(True)` para mostrar la cuadr√≠cula
- Puede definir una lista de colores y usar un √≠ndice para asignarlos

</details>

In [None]:
def graficar_dispersion_multiple(
    datos: dict[str, tuple[np.ndarray, np.ndarray]], ax: plt.Axes
) -> None:
    """
    Crea un gr√°fico de dispersi√≥n con m√∫ltiples conjuntos de datos.

    Par√°metros:
    -----------
    datos : dict[str, tuple[np.ndarray, np.ndarray]]
        Diccionario donde las llaves son nombres de conjuntos de datos
        y los valores son tuplas (x, y) con los datos a graficar
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None

    Ejemplo:
    --------
    datos = {
        "Grupo A": (np.array([1, 2, 3]), np.array([4, 5, 6])),
        "Grupo B": (np.array([1, 2, 3]), np.array([6, 5, 4]))
    }
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError(
        "La funci√≥n 'graficar_dispersion_multiple' a√∫n no ha sido implementada"
    )

In [None]:
# ===== CELDA DE PRUEBAS - Ejercicio 3 =====
print("üß™ Ejecutando pruebas para el Ejercicio 3...\n")

# Crear datos de prueba
np.random.seed(42)
datos_test = {
    "Experimento A": (np.random.randn(30) * 2 + 5, np.random.randn(30) * 2 + 5),
    "Experimento B": (np.random.randn(30) * 2 + 7, np.random.randn(30) * 2 + 3),
    "Experimento C": (np.random.randn(30) * 2 + 3, np.random.randn(30) * 2 + 7),
}

# Crear figura para visualizar el resultado
fig, ax = plt.subplots(figsize=(10, 6))

try:
    # Intentar ejecutar la funci√≥n del estudiante
    graficar_dispersion_multiple(datos_test, ax)

    print("‚úÖ La funci√≥n se ejecut√≥ sin errores")

    # Verificar t√≠tulo
    titulo = ax.get_title()
    if titulo == "Comparaci√≥n de Datos":
        print("‚úÖ El t√≠tulo es correcto")
    else:
        print(
            f"‚ùå El t√≠tulo es incorrecto. Esperado: 'Comparaci√≥n de Datos', Obtenido: '{titulo}'"
        )

    # Verificar etiqueta eje X
    xlabel = ax.get_xlabel()
    if xlabel == "Variable X":
        print("‚úÖ La etiqueta del eje X es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje X es incorrecta. Esperado: 'Variable X', Obtenido: '{xlabel}'"
        )

    # Verificar etiqueta eje Y
    ylabel = ax.get_ylabel()
    if ylabel == "Variable Y":
        print("‚úÖ La etiqueta del eje Y es correcta")
    else:
        print(
            f"‚ùå La etiqueta del eje Y es incorrecta. Esperado: 'Variable Y', Obtenido: '{ylabel}'"
        )

    # Verificar que hay datos graficados
    collections = ax.collections
    if len(collections) == 3:
        print("‚úÖ Se graficaron 3 conjuntos de datos correctamente")
    else:
        print(
            f"‚ùå N√∫mero incorrecto de conjuntos. Esperado: 3, Obtenido: {len(collections)}"
        )

    # Verificar leyenda
    legend = ax.get_legend()
    if legend is not None:
        print("‚úÖ La leyenda est√° presente")

        # Verificar etiquetas de la leyenda
        legend_texts = [text.get_text() for text in legend.get_texts()]
        expected_labels = ["Experimento A", "Experimento B", "Experimento C"]

        if set(legend_texts) == set(expected_labels):
            print("‚úÖ Las etiquetas de la leyenda son correctas")
        else:
            print(f"‚ùå Las etiquetas de la leyenda son incorrectas")
            print(f"   Esperado: {expected_labels}")
            print(f"   Obtenido: {legend_texts}")
    else:
        print("‚ùå No se encontr√≥ una leyenda en el gr√°fico")

    # Verificar cuadr√≠cula
    if ax.xaxis.get_gridlines()[0].get_visible():
        print("‚úÖ La cuadr√≠cula est√° visible")
    else:
        print("‚ùå La cuadr√≠cula no est√° visible")

    print("\nüìä Visualizaci√≥n del resultado:")
    plt.tight_layout()
    plt.show()

    print("\nüéâ ¬°Excelente trabajo! Ha completado todos los ejercicios de Matplotlib")

except NotImplementedError:
    print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
    print(
        "   Implemente la funci√≥n 'graficar_dispersion_multiple' para ver los resultados"
    )
    plt.close(fig)
except Exception as e:
    print(f"‚ùå Error al ejecutar la funci√≥n: {e}")
    import traceback

    traceback.print_exc()
    plt.close(fig)

### üí° Soluci√≥n del Ejercicio 3

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def graficar_dispersion_multiple(
    datos: dict[str, tuple[np.ndarray, np.ndarray]], ax: plt.Axes
) -> None:
    """
    Crea un gr√°fico de dispersi√≥n con m√∫ltiples conjuntos de datos.

    Par√°metros:
    -----------
    datos : dict[str, tuple[np.ndarray, np.ndarray]]
        Diccionario donde las llaves son nombres de conjuntos de datos
        y los valores son tuplas (x, y) con los datos a graficar
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # Definir lista de colores para diferenciar los conjuntos
    colores = ['red', 'blue', 'green', 'orange', 'purple']
    
    # Iterar sobre cada conjunto de datos y graficarlo
    for i, (nombre, (x, y)) in enumerate(datos.items()):
        ax.scatter(x, y, color=colores[i], label=nombre, alpha=0.6)
    
    # A√±adir t√≠tulo
    ax.set_title('Comparaci√≥n de Datos')
    
    # A√±adir etiquetas a los ejes
    ax.set_xlabel('Variable X')
    ax.set_ylabel('Variable Y')
    
    # Mostrar la leyenda
    ax.legend()
    
    # A√±adir cuadr√≠cula
    ax.grid(True)
```

**Explicaci√≥n paso a paso:**

1. **`colores = ['red', 'blue', 'green', ...]`**: Define una lista de colores para diferenciar los conjuntos.
2. **`for i, (nombre, (x, y)) in enumerate(datos.items())`**: Itera sobre el diccionario, extrayendo el nombre y los datos (x, y).
3. **`ax.scatter(x, y, color=colores[i], label=nombre, alpha=0.6)`**: Crea un scatter plot con:
   - Color espec√≠fico para cada conjunto
   - `label` para identificarlo en la leyenda
   - `alpha=0.6` para transparencia
4. **`ax.legend()`**: Muestra la leyenda con los nombres de los conjuntos.
5. **`ax.grid(True)`**: A√±ade una cuadr√≠cula para facilitar la lectura.

**Conceptos clave:**
- `ax.scatter()` crea gr√°ficos de dispersi√≥n (puntos)
- El par√°metro `label` es necesario para que aparezca en la leyenda
- `enumerate()` es √∫til para obtener tanto el √≠ndice como el valor al iterar
- `alpha` controla la transparencia (0=transparente, 1=opaco)
- `ax.legend()` muestra autom√°ticamente todas las etiquetas definidas con `label`

**Alternativa sin √≠ndice expl√≠cito:**
```python
colores = ['red', 'blue', 'green', 'orange', 'purple']
color_iter = iter(colores)

for nombre, (x, y) in datos.items():
    ax.scatter(x, y, color=next(color_iter), label=nombre, alpha=0.6)
```

</details>

---

## üö¥ Ejercicios Integradores: Sistema de Bicicletas Compartidas

En estos ejercicios, trabajar√° con datos reales de un sistema de bicicletas compartidas. Aplicar√° t√©cnicas de manipulaci√≥n de datos con **Pandas** y **NumPy**, y crear√° visualizaciones informativas con **Matplotlib**.

---

### üìö Carga del Dataset

Ejecute la siguiente celda para cargar y explorar el dataset de bicicletas compartidas:

In [None]:
# Instalar el paquete si es necesario
# !pip install ucimlrepo

In [None]:
from ucimlrepo import fetch_ucirepo

# Obtener el dataset
bike_sharing = fetch_ucirepo(id=275)

# Datos (como pandas dataframes)
X = bike_sharing.data.features
y = bike_sharing.data.targets

# Combinar caracter√≠sticas y objetivos en un solo DataFrame
bike_df = pd.concat([X, y], axis=1)

# Mostrar informaci√≥n b√°sica
print("üìä Informaci√≥n del Dataset:")
print(f"Tama√±o: {bike_df.shape[0]} filas √ó {bike_df.shape[1]} columnas\n")
print("Primeras filas:")
display(bike_df.head())

print("\nüìã Columnas disponibles:")
print(bike_df.columns.tolist())

print("\nüîç Tipos de datos:")
display(bike_df.dtypes)

print("\nüìñ Metadatos del dataset:")
print(bike_sharing.metadata)

print("\nüìä Informaci√≥n de variables:")
display(bike_sharing.variables)

---

### üìù Ejercicio Integrador 1: An√°lisis Temporal de Uso de Bicicletas

**Objetivo:** Analizar c√≥mo var√≠a el uso de bicicletas a lo largo de las diferentes horas del d√≠a.

**Descripci√≥n:** Implemente la funci√≥n `analizar_uso_por_hora()` que reciba el DataFrame de bicicletas y calcule el **promedio de bicicletas alquiladas** (`cnt`) para cada hora del d√≠a (`hr`). La funci√≥n debe generar un gr√°fico de l√≠neas que muestre esta tendencia.

**Requisitos:**
- Calcular el promedio de `cnt` agrupado por `hr` usando Pandas
- Crear un gr√°fico de l√≠neas con marcadores circulares
- El t√≠tulo debe ser: "Promedio de Bicicletas Alquiladas por Hora del D√≠a"
- Eje X: "Hora del D√≠a (0-23)"
- Eje Y: "Promedio de Bicicletas Alquiladas"
- L√≠nea de color verde con marcadores
- Incluir una cuadr√≠cula para facilitar la lectura

**Habilidades a aplicar:**
- Agrupaci√≥n con `groupby()` de Pandas
- C√°lculo de estad√≠sticas descriptivas (`.mean()`)
- Creaci√≥n de gr√°ficos de l√≠neas con Matplotlib

---

<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `df.groupby('hr')['cnt'].mean()` para calcular el promedio por hora
- El resultado del `groupby` tiene el √≠ndice como las horas y los valores como los promedios
- Use `ax.plot()` con `marker='o'` para agregar marcadores
- Use `ax.grid(True, alpha=0.3)` para una cuadr√≠cula sutil
- El par√°metro `linewidth` controla el grosor de la l√≠nea

</details>

In [None]:
def analizar_uso_por_hora(df: pd.DataFrame, ax: plt.Axes) -> None:
    """
    Analiza y grafica el promedio de bicicletas alquiladas por hora del d√≠a.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing (debe contener columnas 'hr' y 'cnt')
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None

    Ejemplo de uso:
    ---------------
    fig, ax = plt.subplots(figsize=(10, 6))
    analizar_uso_por_hora(bike_df, ax)
    plt.show()
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError(
        "La funci√≥n 'analizar_uso_por_hora' a√∫n no ha sido implementada"
    )

In [None]:
# ===== CELDA DE PRUEBAS - Ejercicio Integrador 1 =====
print("üß™ Ejecutando pruebas para el Ejercicio Integrador 1...\n")
print("üìä Analizando patrones de uso por hora del d√≠a...\n")

# Crear figura para visualizar el resultado
fig, ax = plt.subplots(figsize=(12, 6))

try:
    # Intentar ejecutar la funci√≥n del estudiante
    analizar_uso_por_hora(bike_df, ax)

    print("‚úÖ La funci√≥n se ejecut√≥ sin errores")

    # Verificar t√≠tulo
    titulo = ax.get_title()
    if titulo == "Promedio de Bicicletas Alquiladas por Hora del D√≠a":
        print("‚úÖ El t√≠tulo es correcto")
    else:
        print(f"‚ùå El t√≠tulo es incorrecto.")
        print(f"   Esperado: 'Promedio de Bicicletas Alquiladas por Hora del D√≠a'")
        print(f"   Obtenido: '{titulo}'")

    # Verificar etiqueta eje X
    xlabel = ax.get_xlabel()
    if xlabel == "Hora del D√≠a (0-23)":
        print("‚úÖ La etiqueta del eje X es correcta")
    else:
        print(f"‚ùå La etiqueta del eje X es incorrecta.")
        print(f"   Esperado: 'Hora del D√≠a (0-23)', Obtenido: '{xlabel}'")

    # Verificar etiqueta eje Y
    ylabel = ax.get_ylabel()
    if ylabel == "Promedio de Bicicletas Alquiladas":
        print("‚úÖ La etiqueta del eje Y es correcta")
    else:
        print(f"‚ùå La etiqueta del eje Y es incorrecta.")
        print(f"   Esperado: 'Promedio de Bicicletas Alquiladas', Obtenido: '{ylabel}'")

    # Verificar que hay datos graficados
    lines = ax.get_lines()
    if len(lines) > 0:
        print("‚úÖ Se grafic√≥ una l√≠nea correctamente")

        # Verificar que tiene marcadores
        line = lines[0]
        if line.get_marker() != "None":
            print("‚úÖ La l√≠nea tiene marcadores")
        else:
            print("‚ö†Ô∏è  La l√≠nea no tiene marcadores visibles")

        # Verificar color verde
        line_color = line.get_color()
        if "green" in str(line_color).lower() or line_color == "g":
            print("‚úÖ El color de la l√≠nea es verde")
        else:
            print(f"‚ö†Ô∏è  El color de la l√≠nea no es verde (color actual: {line_color})")

        # Verificar cantidad de puntos (deber√≠an ser 24 horas: 0-23)
        xdata = line.get_xdata()
        if len(xdata) == 24:
            print("‚úÖ Se graficaron los 24 puntos correspondientes a las horas del d√≠a")
        else:
            print(
                f"‚ö†Ô∏è  N√∫mero de puntos inesperado. Esperado: 24, Obtenido: {len(xdata)}"
            )
    else:
        print("‚ùå No se grafic√≥ ninguna l√≠nea")

    # Verificar cuadr√≠cula
    if ax.xaxis.get_gridlines()[0].get_visible():
        print("‚úÖ La cuadr√≠cula est√° visible")
    else:
        print("‚ö†Ô∏è  La cuadr√≠cula no est√° visible")

    print("\n" + "=" * 60)
    print("üìä Visualizaci√≥n del resultado:")
    print("=" * 60)
    print("\nüí° Interpretaci√≥n esperada:")
    print("   - Deber√≠a observar picos en las horas de entrada/salida al trabajo")
    print("   - Uso bajo durante la madrugada (0-5 AM)")
    print("   - Incremento durante las horas laborales")
    print()

    plt.tight_layout()
    plt.show()

    # Calcular y mostrar estad√≠sticas adicionales
    promedio_por_hora = bike_df.groupby("hr")["cnt"].mean()
    hora_max = promedio_por_hora.idxmax()
    hora_min = promedio_por_hora.idxmin()

    print("\nüìà Estad√≠sticas del an√°lisis:")
    print(
        f"   ‚Ä¢ Hora con mayor demanda: {hora_max}:00 hrs ({promedio_por_hora[hora_max]:.0f} bicicletas promedio)"
    )
    print(
        f"   ‚Ä¢ Hora con menor demanda: {hora_min}:00 hrs ({promedio_por_hora[hora_min]:.0f} bicicletas promedio)"
    )
    print(
        f"   ‚Ä¢ Diferencia pico-valle: {promedio_por_hora[hora_max] - promedio_por_hora[hora_min]:.0f} bicicletas"
    )

except NotImplementedError:
    print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
    print("   Implemente la funci√≥n 'analizar_uso_por_hora' para ver los resultados")
    plt.close(fig)
except KeyError as e:
    print(f"‚ùå Error: No se encontr√≥ la columna {e} en el DataFrame")
    print("   Verifique que el DataFrame tiene las columnas 'hr' y 'cnt'")
    plt.close(fig)
except Exception as e:
    print(f"‚ùå Error al ejecutar la funci√≥n: {e}")
    import traceback

    traceback.print_exc()
    plt.close(fig)


### üí° Soluci√≥n del Ejercicio Integrador 1

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def analizar_uso_por_hora(df: pd.DataFrame, ax: plt.Axes) -> None:
    """
    Analiza y grafica el promedio de bicicletas alquiladas por hora del d√≠a.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing (debe contener columnas 'hr' y 'cnt')
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # Calcular el promedio de bicicletas alquiladas por hora
    promedio_por_hora = df.groupby('hr')['cnt'].mean()
    
    # Crear gr√°fico de l√≠neas con marcadores
    ax.plot(
        promedio_por_hora.index,
        promedio_por_hora.values,
        color='green',
        marker='o',
        linewidth=2,
        markersize=6
    )
    
    # A√±adir t√≠tulo
    ax.set_title('Promedio de Bicicletas Alquiladas por Hora del D√≠a')
    
    # A√±adir etiquetas a los ejes
    ax.set_xlabel('Hora del D√≠a (0-23)')
    ax.set_ylabel('Promedio de Bicicletas Alquiladas')
    
    # A√±adir cuadr√≠cula sutil
    ax.grid(True, alpha=0.3)
```

**Explicaci√≥n paso a paso:**

1. **`df.groupby('hr')['cnt'].mean()`**: 
   - Agrupa el DataFrame por la columna `hr` (hora del d√≠a)
   - Selecciona la columna `cnt` (cantidad de bicicletas)
   - Calcula el promedio (`.mean()`) para cada hora
   - Retorna una Serie con las horas como √≠ndice y los promedios como valores

2. **`promedio_por_hora.index`**: Contiene las horas (0-23)
3. **`promedio_por_hora.values`**: Contiene los promedios calculados
4. **`marker='o'`**: A√±ade marcadores circulares en cada punto de datos
5. **`linewidth=2`**: Hace la l√≠nea m√°s gruesa para mejor visualizaci√≥n
6. **`ax.grid(True, alpha=0.3)`**: A√±ade cuadr√≠cula con transparencia del 70%

**Conceptos clave:**
- **`groupby()`** es fundamental para agrupar datos por categor√≠as
- El resultado de `groupby()` mantiene el √≠ndice del grupo (horas en este caso)
- Los marcadores (`marker`) ayudan a identificar puntos de datos individuales
- `alpha` en `grid()` hace la cuadr√≠cula menos intrusiva

**An√°lisis esperado:**
- **Pico matutino**: Alrededor de las 8:00 AM (hora de entrada al trabajo)
- **Pico vespertino**: Alrededor de las 17:00-18:00 (hora de salida del trabajo)
- **Valle nocturno**: Entre las 2:00-5:00 AM (menor actividad)

</details>

---

### üìù Ejercicio Integrador 2: Comparaci√≥n de Uso entre D√≠as Laborables y Festivos

**Objetivo:** Comparar la distribuci√≥n de bicicletas alquiladas entre d√≠as laborables y d√≠as festivos/fines de semana.

**Descripci√≥n:** Implemente la funci√≥n `comparar_laborables_festivos()` que reciba el DataFrame y cree dos histogramas superpuestos que muestren la distribuci√≥n de `cnt` (bicicletas alquiladas) separando entre d√≠as laborables (`workingday == 1`) y d√≠as no laborables (`workingday == 0`).

**Requisitos:**
- Filtrar los datos usando Pandas seg√∫n `workingday`
- Crear dos histogramas superpuestos con transparencia (`alpha`)
- El t√≠tulo debe ser: "Distribuci√≥n de Alquileres: D√≠as Laborables vs No Laborables"
- Eje X: "N√∫mero de Bicicletas Alquiladas"
- Eje Y: "Frecuencia"
- Color azul para d√≠as laborables, color naranja para d√≠as no laborables
- Incluir leyenda que identifique cada distribuci√≥n
- Usar `alpha=0.6` para permitir ver la superposici√≥n
- Usar aproximadamente 30 bins para los histogramas

**Habilidades a aplicar:**
- Filtrado condicional de DataFrames con Pandas
- Creaci√≥n de histogramas superpuestos
- Uso de transparencia y leyendas

---

<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `df[df['workingday'] == 1]['cnt']` para filtrar d√≠as laborables
- Use `df[df['workingday'] == 0]['cnt']` para filtrar d√≠as no laborables
- Llame a `ax.hist()` dos veces, una para cada conjunto de datos
- El par√°metro `alpha=0.6` hace los histogramas semitransparentes
- Use `label='...'` en cada `hist()` para identificarlos en la leyenda
- Use `ax.legend()` para mostrar la leyenda
- El par√°metro `bins=30` controla el n√∫mero de barras

</details>

In [None]:
def comparar_laborables_festivos(df: pd.DataFrame, ax: plt.Axes) -> None:
    """
    Compara la distribuci√≥n de alquileres entre d√≠as laborables y no laborables.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing (debe contener columnas 'workingday' y 'cnt')
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None

    Ejemplo de uso:
    ---------------
    fig, ax = plt.subplots(figsize=(10, 6))
    comparar_laborables_festivos(bike_df, ax)
    plt.show()
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError(
        "La funci√≥n 'comparar_laborables_festivos' a√∫n no ha sido implementada"
    )

In [None]:
# ===== CELDA DE PRUEBAS MEJORADA - Ejercicio Integrador 2 =====


def test_comparar_laborables_festivos():
    """
    Test con validaci√≥n autom√°tica usando asserts para el Ejercicio Integrador 2.
    """
    print("üß™ Ejecutando pruebas para el Ejercicio Integrador 2...\n")
    print("üìä Comparando patrones entre d√≠as laborables y no laborables...\n")

    # Crear figura para visualizar el resultado
    fig, ax = plt.subplots(figsize=(12, 6))

    try:
        # ========== EJECUTAR FUNCI√ìN ==========
        comparar_laborables_festivos(bike_df, ax)
        print("‚úÖ La funci√≥n se ejecut√≥ sin errores\n")

        # ========== VALIDACI√ìN 1: T√≠tulo ==========
        titulo = ax.get_title()
        assert (
            titulo == "Distribuci√≥n de Alquileres: D√≠as Laborables vs No Laborables"
        ), (
            f"‚ùå ERROR: T√≠tulo incorrecto.\n"
            f"   Esperado: 'Distribuci√≥n de Alquileres: D√≠as Laborables vs No Laborables'\n"
            f"   Obtenido: '{titulo}'"
        )
        print(f"‚úÖ T√≠tulo correcto: '{titulo}'")

        # ========== VALIDACI√ìN 2: Etiqueta Eje X ==========
        xlabel = ax.get_xlabel()
        assert xlabel == "N√∫mero de Bicicletas Alquiladas", (
            f"‚ùå ERROR: Etiqueta del eje X incorrecta.\n"
            f"   Esperado: 'N√∫mero de Bicicletas Alquiladas'\n"
            f"   Obtenido: '{xlabel}'"
        )
        print(f"‚úÖ Etiqueta del eje X correcta: '{xlabel}'")

        # ========== VALIDACI√ìN 3: Etiqueta Eje Y ==========
        ylabel = ax.get_ylabel()
        assert ylabel == "Frecuencia", (
            f"‚ùå ERROR: Etiqueta del eje Y incorrecta.\n"
            f"   Esperado: 'Frecuencia'\n"
            f"   Obtenido: '{ylabel}'"
        )
        print(f"‚úÖ Etiqueta del eje Y correcta: '{ylabel}'")

        # ========== VALIDACI√ìN 4: Histogramas Graficados ==========
        patches = ax.patches
        assert len(patches) > 0, (
            "‚ùå ERROR: No se graficaron histogramas (no hay patches)"
        )
        print(f"‚úÖ Se graficaron histogramas ({len(patches)} barras en total)")

        # ========== VALIDACI√ìN 5: Cantidad de Barras ==========
        assert len(patches) >= 20, (
            f"‚ùå ERROR: Muy pocas barras graficadas.\n"
            f"   Esperado: ‚â•20 (2 histogramas con ~30 bins)\n"
            f"   Obtenido: {len(patches)}"
        )
        print(f"‚úÖ Cantidad de barras razonable para 2 histogramas superpuestos")

        # ========== VALIDACI√ìN 6: Transparencia (Alpha) ==========
        alphas = [
            patch.get_alpha() for patch in patches if patch.get_alpha() is not None
        ]
        assert len(alphas) > 0, (
            "‚ùå ERROR: No se encontr√≥ transparencia (alpha) en los histogramas"
        )

        avg_alpha = sum(alphas) / len(alphas)
        assert 0.5 <= avg_alpha <= 0.7, (
            f"‚ùå ERROR: Transparencia (alpha) incorrecta.\n"
            f"   Esperado: ~0.6\n"
            f"   Obtenido: {avg_alpha:.2f}"
        )
        print(f"‚úÖ Transparencia (alpha) correcta: ~{avg_alpha:.2f}")

        # ========== VALIDACI√ìN 7: Leyenda ==========
        legend = ax.get_legend()
        assert legend is not None, (
            "‚ùå ERROR: No se encontr√≥ leyenda en el gr√°fico (use ax.legend())"
        )
        print("‚úÖ La leyenda est√° presente")

        # Verificar etiquetas de la leyenda
        legend_texts = [text.get_text() for text in legend.get_texts()]
        assert len(legend_texts) == 2, (
            f"‚ùå ERROR: La leyenda debe tener 2 categor√≠as.\n"
            f"   Obtenido: {len(legend_texts)}"
        )

        expected_labels = {"D√≠as Laborables", "D√≠as No Laborables"}
        actual_labels = set(legend_texts)
        assert expected_labels == actual_labels, (
            f"‚ùå ERROR: Etiquetas de leyenda incorrectas.\n"
            f"   Esperado: {expected_labels}\n"
            f"   Obtenido: {actual_labels}"
        )
        print(f"‚úÖ Leyenda con 2 categor√≠as correctas: {legend_texts}")

        # ========== VALIDACI√ìN 8: Colores ==========
        colors_found = set()
        for patch in patches[:10]:
            color = patch.get_facecolor()
            if color[2] > 0.5:  # Canal azul alto
                colors_found.add("blue")
            if color[0] > 0.5:  # Canal rojo alto (naranja)
                colors_found.add("orange/red")

        assert len(colors_found) >= 1, (
            "‚ùå ERROR: No se encontraron colores distinguibles en los histogramas"
        )
        print(f"‚úÖ Colores detectados en los histogramas")

        # ========== VALIDACI√ìN 9: N√∫mero de Bins ==========
        assert len(patches) >= 40, (
            f"‚ùå ERROR: Muy pocos bins.\n"
            f"   Se esperaban ~60 barras (30 bins √ó 2 histogramas).\n"
            f"   Obtenido: {len(patches)}"
        )
        print(f"‚úÖ N√∫mero adecuado de bins (~{len(patches) // 2} bins por histograma)")

        # ========== RESULTADO FINAL ==========
        print("\n" + "=" * 70)
        print("üéâ ¬°TODAS LAS VALIDACIONES PASARON EXITOSAMENTE!")
        print("=" * 70)

        print("\nüí° Interpretaci√≥n esperada:")
        print("   - Los d√≠as laborables suelen tener distribuci√≥n bimodal")
        print("     (picos en horas de entrada/salida del trabajo)")
        print("   - Los d√≠as no laborables tienen distribuci√≥n m√°s uniforme")
        print("   - Compare las medias y la dispersi√≥n de ambas distribuciones")

        plt.tight_layout()
        plt.show()

        # Calcular y mostrar estad√≠sticas comparativas
        laborables = bike_df[bike_df["workingday"] == 1]["cnt"]
        no_laborables = bike_df[bike_df["workingday"] == 0]["cnt"]

        print("\nüìà Estad√≠sticas comparativas:")
        print(f"\n   üìò D√≠as Laborables:")
        print(f"      ‚Ä¢ Promedio: {laborables.mean():.1f} bicicletas")
        print(f"      ‚Ä¢ Mediana: {laborables.median():.1f} bicicletas")
        print(f"      ‚Ä¢ Desv. Est.: {laborables.std():.1f}")
        print(f"      ‚Ä¢ Total de registros: {len(laborables):,}")

        print(f"\n   üüß D√≠as No Laborables:")
        print(f"      ‚Ä¢ Promedio: {no_laborables.mean():.1f} bicicletas")
        print(f"      ‚Ä¢ Mediana: {no_laborables.median():.1f} bicicletas")
        print(f"      ‚Ä¢ Desv. Est.: {no_laborables.std():.1f}")
        print(f"      ‚Ä¢ Total de registros: {len(no_laborables):,}")

        diferencia_promedio = laborables.mean() - no_laborables.mean()
        print(
            f"\n   üìä Diferencia de promedios: {abs(diferencia_promedio):.1f} bicicletas"
        )
        if diferencia_promedio > 0:
            print(f"      ‚Üí Los d√≠as laborables tienen mayor demanda promedio")
        else:
            print(f"      ‚Üí Los d√≠as no laborables tienen mayor demanda promedio")

        return True

    except NotImplementedError:
        print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
        print(
            "   Implemente la funci√≥n 'comparar_laborables_festivos' para ver los resultados"
        )
        plt.close(fig)
        return False

    except AssertionError as e:
        print(f"\n{e}")
        print("\n‚ùå TEST FALLIDO: La funci√≥n no cumple todos los requisitos")
        plt.close(fig)
        return False

    except KeyError as e:
        print(f"‚ùå ERROR: No se encontr√≥ la columna {e} en el DataFrame")
        print("   Verifique que el DataFrame tiene las columnas 'workingday' y 'cnt'")
        plt.close(fig)
        return False

    except Exception as e:
        print(f"‚ùå ERROR INESPERADO: {e}")
        import traceback

        traceback.print_exc()
        plt.close(fig)
        return False


# Ejecutar el test
resultado = test_comparar_laborables_festivos()

if resultado:
    print("\n‚úÖ EJERCICIO 2 COMPLETADO CORRECTAMENTE")
else:
    print("\n‚ùå EJERCICIO 2 INCOMPLETO O INCORRECTO")

### üí° Soluci√≥n del Ejercicio Integrador 2

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def comparar_laborables_festivos(df: pd.DataFrame, ax: plt.Axes) -> None:
    """
    Compara la distribuci√≥n de alquileres entre d√≠as laborables y no laborables.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing (debe contener columnas 'workingday' y 'cnt')
    ax : plt.Axes
        Objeto Axes donde se dibujar√° el gr√°fico

    Retorna:
    --------
    None
    """
    # Filtrar datos por tipo de d√≠a
    cnt_laborables = df[df['workingday'] == 1]['cnt']
    cnt_no_laborables = df[df['workingday'] == 0]['cnt']
    
    # Crear histogramas superpuestos
    ax.hist(
        cnt_laborables,
        bins=30,
        color='blue',
        alpha=0.6,
        label='D√≠as Laborables',
        edgecolor='black'
    )
    
    ax.hist(
        cnt_no_laborables,
        bins=30,
        color='orange',
        alpha=0.6,
        label='D√≠as No Laborables',
        edgecolor='black'
    )
    
    # A√±adir t√≠tulo
    ax.set_title('Distribuci√≥n de Alquileres: D√≠as Laborables vs No Laborables')
    
    # A√±adir etiquetas a los ejes
    ax.set_xlabel('N√∫mero de Bicicletas Alquiladas')
    ax.set_ylabel('Frecuencia')
    
    # Mostrar la leyenda
    ax.legend()
```

**Explicaci√≥n paso a paso:**

1. **Filtrado de datos**:
   ```python
   cnt_laborables = df[df['workingday'] == 1]['cnt']
   ```
   - `df['workingday'] == 1` crea una m√°scara booleana (True/False)
   - `df[...]` filtra solo las filas donde `workingday == 1`
   - `['cnt']` selecciona solo la columna de inter√©s

2. **Histogramas superpuestos**:
   - Se llama a `ax.hist()` **dos veces**, una para cada conjunto de datos
   - `bins=30`: Divide los datos en 30 intervalos
   - `alpha=0.6`: Transparencia del 40% para ver la superposici√≥n
   - `label='...'`: Nombre para la leyenda
   - `edgecolor='black'`: Borde negro en las barras para mejor definici√≥n

3. **Superposici√≥n autom√°tica**: Matplotlib superpone los histogramas autom√°ticamente cuando se llama a `hist()` m√∫ltiples veces en el mismo eje.

**Conceptos clave:**
- **Filtrado booleano**: `df[condici√≥n]` es esencial para segmentar datos
- **Transparencia (`alpha`)**: Permite ver donde se superponen las distribuciones
- **Bins**: Controlan la resoluci√≥n del histograma (m√°s bins = m√°s detalle, pero puede ser ruidoso)
- **`edgecolor`**: Ayuda a distinguir barras individuales

**Interpretaci√≥n esperada:**
- **D√≠as laborables**: Distribuci√≥n m√°s concentrada, posiblemente bimodal (dos picos)
- **D√≠as no laborables**: Distribuci√≥n m√°s dispersa, uso m√°s uniforme a lo largo del d√≠a
- **Comparaci√≥n de medias**: Los laborables suelen tener mayor demanda promedio

**Variante con histogramas lado a lado** (opcional):
```python
ax.hist(
    [cnt_laborables, cnt_no_laborables],
    bins=30,
    color=['blue', 'orange'],
    alpha=0.6,
    label=['D√≠as Laborables', 'D√≠as No Laborables']
)
```

</details>


---

### üìù Ejercicio Integrador 3: An√°lisis Multivariado del Clima y Uso de Bicicletas

**Objetivo:** Analizar la relaci√≥n entre m√∫ltiples variables clim√°ticas y el uso de bicicletas mediante subgr√°ficos.

**Descripci√≥n:** Implemente la funci√≥n `analizar_clima_multivariado()` que cree una figura con 4 subgr√°ficos (2√ó2) mostrando:
1. Scatter plot: Temperatura (`temp`) vs Alquileres (`cnt`)
2. Scatter plot: Humedad (`hum`) vs Alquileres (`cnt`)
3. Scatter plot: Velocidad del viento (`windspeed`) vs Alquileres (`cnt`)
4. Bar plot: Promedio de alquileres por condici√≥n clim√°tica (`weathersit`)

**Requisitos:**
- Crear una figura con 4 subgr√°ficos usando `subplots(2, 2)`
- Cada scatter plot debe tener puntos con transparencia (`alpha=0.3`)
- El bar plot debe mostrar el promedio de `cnt` agrupado por `weathersit`
- Cada subgr√°fico debe tener t√≠tulo y etiquetas apropiadas
- Usar colores distintos para cada scatter plot
- Incluir un t√≠tulo general para toda la figura

**Habilidades a aplicar:**
- Creaci√≥n de m√∫ltiples subgr√°ficos
- Combinaci√≥n de diferentes tipos de gr√°ficos
- An√°lisis de correlaciones visuales
- Agrupaci√≥n y agregaci√≥n con Pandas

---

<details>
<summary><b>üí° Pistas</b> (haga clic para expandir)</summary>

- Use `fig, axes = plt.subplots(2, 2, figsize=(14, 10))` para crear los 4 subgr√°ficos
- Acceda a cada subgr√°fico con `axes[fila, columna]`
- Para los scatter plots use `axes[i, j].scatter(df['variable_x'], df['cnt'], ...)`
- Para el bar plot, primero agrupe: `promedio = df.groupby('weathersit')['cnt'].mean()`
- Luego grafique: `axes[1, 1].bar(promedio.index, promedio.values)`
- Use `fig.suptitle('...')` para el t√≠tulo general
- Use `plt.tight_layout()` para evitar superposici√≥n de elementos
- El par√°metro `alpha=0.3` hace los puntos semitransparentes

</details>

In [None]:
def analizar_clima_multivariado(
    df: pd.DataFrame, fig: plt.Figure, axes: np.ndarray
) -> None:
    """
    Analiza la relaci√≥n entre variables clim√°ticas y el uso de bicicletas mediante m√∫ltiples gr√°ficos.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing
        Debe contener columnas: 'temp', 'hum', 'windspeed', 'weathersit', 'cnt'
    fig : plt.Figure
        Objeto Figure que contiene los subgr√°ficos
    axes : np.ndarray
        Array 2D de objetos Axes (2x2) donde se dibujar√°n los gr√°ficos

    Retorna:
    --------
    None

    Estructura de los subgr√°ficos:
    ------------------------------
    [0, 0]: Temperatura vs Alquileres (scatter)
    [0, 1]: Humedad vs Alquileres (scatter)
    [1, 0]: Velocidad del viento vs Alquileres (scatter)
    [1, 1]: Promedio de alquileres por condici√≥n clim√°tica (bar)

    Ejemplo de uso:
    ---------------
    fig, axes = plt.subplots(2, 2, figsize=(14, 10))
    analizar_clima_multivariado(bike_df, fig, axes)
    plt.tight_layout()
    plt.show()
    """
    # TODO: Implemente la funci√≥n aqu√≠
    raise NotImplementedError(
        "La funci√≥n 'analizar_clima_multivariado' a√∫n no ha sido implementada"
    )

In [None]:
# ===== CELDA DE PRUEBAS MEJORADA - Ejercicio Integrador 3 =====


def test_analizar_clima_multivariado():
    """
    Test con validaci√≥n autom√°tica usando asserts para el Ejercicio Integrador 3.
    """
    print("üß™ Ejecutando pruebas para el Ejercicio Integrador 3...\n")
    print("üìä Analizando relaciones multivariadas entre clima y uso de bicicletas...\n")

    # Crear figura y subgr√°ficos
    fig, axes = plt.subplots(2, 2, figsize=(14, 10))

    try:
        # ========== EJECUTAR FUNCI√ìN ==========
        analizar_clima_multivariado(bike_df, fig, axes)
        print("‚úÖ La funci√≥n se ejecut√≥ sin errores\n")

        # ========== VALIDACI√ìN 1: T√≠tulo General ==========
        suptitle = fig._suptitle
        assert suptitle is not None, (
            "‚ùå ERROR: La figura no tiene t√≠tulo general (use fig.suptitle())"
        )
        print(f"‚úÖ T√≠tulo general presente: '{suptitle.get_text()}'")

        # ========== VALIDACI√ìN 2: Subgr√°fico [0, 0] - Temperatura ==========
        print("\nüîç Validando subgr√°fico [0, 0] - Temperatura vs Alquileres:")

        # Verificar que hay un scatter plot
        assert len(axes[0, 0].collections) > 0, (
            "‚ùå ERROR: No se encontr√≥ scatter plot en [0, 0]"
        )
        print("   ‚úÖ Scatter plot presente")

        # Verificar t√≠tulo
        titulo_00 = axes[0, 0].get_title()
        assert len(titulo_00) > 0, "‚ùå ERROR: El subgr√°fico [0, 0] no tiene t√≠tulo"
        print(f"   ‚úÖ T√≠tulo: '{titulo_00}'")

        # Verificar etiquetas de ejes
        xlabel_00 = axes[0, 0].get_xlabel()
        ylabel_00 = axes[0, 0].get_ylabel()
        assert len(xlabel_00) > 0, (
            "‚ùå ERROR: El subgr√°fico [0, 0] no tiene etiqueta en eje X"
        )
        assert len(ylabel_00) > 0, (
            "‚ùå ERROR: El subgr√°fico [0, 0] no tiene etiqueta en eje Y"
        )
        print(f"   ‚úÖ Etiquetas: X='{xlabel_00}', Y='{ylabel_00}'")

        # Verificar transparencia (alpha)
        scatter_00 = axes[0, 0].collections[0]
        alpha_00 = scatter_00.get_alpha()
        assert alpha_00 is not None and alpha_00 <= 0.5, (
            f"‚ùå ERROR: Alpha incorrecto en [0, 0].\n"
            f"   Esperado: ‚â§0.5\n"
            f"   Obtenido: {alpha_00}"
        )
        print(f"   ‚úÖ Transparencia (alpha): {alpha_00}")

        # Verificar que hay datos
        offsets = scatter_00.get_offsets()
        assert len(offsets) > 100, (
            f"‚ùå ERROR: Pocos datos graficados en [0, 0].\n"
            f"   Se esperaban >100 puntos\n"
            f"   Obtenido: {len(offsets)} puntos"
        )
        print(f"   ‚úÖ Datos graficados: {len(offsets)} puntos")

        # ========== VALIDACI√ìN 3: Subgr√°fico [0, 1] - Humedad ==========
        print("\nüîç Validando subgr√°fico [0, 1] - Humedad vs Alquileres:")

        assert len(axes[0, 1].collections) > 0, (
            "‚ùå ERROR: No se encontr√≥ scatter plot en [0, 1]"
        )
        print("   ‚úÖ Scatter plot presente")

        titulo_01 = axes[0, 1].get_title()
        assert len(titulo_01) > 0, "‚ùå ERROR: El subgr√°fico [0, 1] no tiene t√≠tulo"
        print(f"   ‚úÖ T√≠tulo: '{titulo_01}'")

        xlabel_01 = axes[0, 1].get_xlabel()
        ylabel_01 = axes[0, 1].get_ylabel()
        assert len(xlabel_01) > 0, (
            "‚ùå ERROR: El subgr√°fico [0, 1] no tiene etiqueta en eje X"
        )
        assert len(ylabel_01) > 0, (
            "‚ùå ERROR: El subgr√°fico [0, 1] no tiene etiqueta en eje Y"
        )
        print(f"   ‚úÖ Etiquetas: X='{xlabel_01}', Y='{ylabel_01}'")

        # ========== VALIDACI√ìN 4: Subgr√°fico [1, 0] - Viento ==========
        print("\nüîç Validando subgr√°fico [1, 0] - Velocidad del Viento vs Alquileres:")

        assert len(axes[1, 0].collections) > 0, (
            "‚ùå ERROR: No se encontr√≥ scatter plot en [1, 0]"
        )
        print("   ‚úÖ Scatter plot presente")

        titulo_10 = axes[1, 0].get_title()
        assert len(titulo_10) > 0, "‚ùå ERROR: El subgr√°fico [1, 0] no tiene t√≠tulo"
        print(f"   ‚úÖ T√≠tulo: '{titulo_10}'")

        # ========== VALIDACI√ìN 5: Subgr√°fico [1, 1] - Bar Plot ==========
        print("\nüîç Validando subgr√°fico [1, 1] - Alquileres por Condici√≥n Clim√°tica:")

        patches_11 = axes[1, 1].patches
        assert len(patches_11) > 0, "‚ùå ERROR: No se encontr√≥ bar plot en [1, 1]"
        print(f"   ‚úÖ Bar plot presente con {len(patches_11)} barras")

        titulo_11 = axes[1, 1].get_title()
        assert len(titulo_11) > 0, "‚ùå ERROR: El subgr√°fico [1, 1] no tiene t√≠tulo"
        print(f"   ‚úÖ T√≠tulo: '{titulo_11}'")

        xlabel_11 = axes[1, 1].get_xlabel()
        ylabel_11 = axes[1, 1].get_ylabel()
        assert len(xlabel_11) > 0, (
            "‚ùå ERROR: El subgr√°fico [1, 1] no tiene etiqueta en eje X"
        )
        assert len(ylabel_11) > 0, (
            "‚ùå ERROR: El subgr√°fico [1, 1] no tiene etiqueta en eje Y"
        )
        print(f"   ‚úÖ Etiquetas: X='{xlabel_11}', Y='{ylabel_11}'")

        # Verificar que las barras tienen alturas razonables
        bar_heights = [patch.get_height() for patch in patches_11]
        assert all(h > 0 for h in bar_heights), (
            "‚ùå ERROR: Algunas barras tienen altura 0 o negativa"
        )

        assert max(bar_heights) > 50, (
            f"‚ùå ERROR: Las alturas de las barras parecen incorrectas.\n"
            f"   Esperado: M√°ximo >50\n"
            f"   Obtenido: M√°ximo = {max(bar_heights):.1f}"
        )
        print(
            f"   ‚úÖ Alturas de barras v√°lidas (rango: {min(bar_heights):.0f} - {max(bar_heights):.0f})"
        )

        # ========== VALIDACI√ìN 6: Colores diferentes ==========
        print("\nüîç Validando colores distintos en scatter plots:")

        colors = []
        for i, j in [(0, 0), (0, 1), (1, 0)]:
            if len(axes[i, j].collections) > 0:
                color = axes[i, j].collections[0].get_facecolor()[0]
                colors.append(tuple(color))

        # Verificar que hay al menos 2 colores diferentes
        unique_colors = len(set(colors))
        assert unique_colors >= 2, (
            f"‚ùå ERROR: Los scatter plots deben tener colores distintos.\n"
            f"   Se esperaban ‚â•2 colores √∫nicos\n"
            f"   √önicos encontrados: {unique_colors}"
        )
        print(
            f"   ‚úÖ Se encontraron {unique_colors} colores distintos en los scatter plots"
        )

        # ========== RESULTADO FINAL ==========
        print("\n" + "=" * 70)
        print("üéâ ¬°TODAS LAS VALIDACIONES PASARON EXITOSAMENTE!")
        print("=" * 70)

        print("\nüí° Interpretaciones esperadas:")
        print("   üìà Temperatura: Correlaci√≥n positiva (m√°s calor ‚Üí m√°s alquileres)")
        print(
            "   üíß Humedad: Posible correlaci√≥n negativa (m√°s humedad ‚Üí menos alquileres)"
        )
        print("   üí® Viento: Distribuci√≥n dispersa (efecto variable)")
        print("   ‚òÅÔ∏è  Clima: Clima despejado tiene mayor promedio de alquileres")

        plt.tight_layout()
        plt.show()

        # Calcular y mostrar correlaciones
        print("\nüìà An√°lisis de correlaciones (Coeficiente de Pearson):")
        corr_temp = bike_df["temp"].corr(bike_df["cnt"])
        corr_hum = bike_df["hum"].corr(bike_df["cnt"])
        corr_wind = bike_df["windspeed"].corr(bike_df["cnt"])

        print(f"   üå°Ô∏è  Temperatura-Alquileres: {corr_temp:+.3f}")
        print(f"   üíß Humedad-Alquileres: {corr_hum:+.3f}")
        print(f"   üí® Viento-Alquileres: {corr_wind:+.3f}")

        print("\nüìä Interpretaci√≥n de correlaciones:")
        if corr_temp > 0.5:
            print("   ‚úì Temperatura: Fuerte correlaci√≥n positiva confirmada")
        if corr_hum < -0.1:
            print("   ‚úì Humedad: Correlaci√≥n negativa detectada")
        if abs(corr_wind) < 0.3:
            print("   ‚úì Viento: Correlaci√≥n d√©bil (como se esperaba)")

        return True

    except NotImplementedError:
        print("‚ö†Ô∏è  La funci√≥n a√∫n no ha sido implementada")
        print(
            "   Implemente la funci√≥n 'analizar_clima_multivariado' para ver los resultados"
        )
        plt.close(fig)
        return False

    except AssertionError as e:
        print(f"\n{e}")
        print("\n‚ùå TEST FALLIDO: La funci√≥n no cumple todos los requisitos")
        plt.close(fig)
        return False

    except KeyError as e:
        print(f"‚ùå ERROR: No se encontr√≥ la columna {e} en el DataFrame")
        print("   Columnas requeridas: 'temp', 'hum', 'windspeed', 'weathersit', 'cnt'")
        plt.close(fig)
        return False

    except Exception as e:
        print(f"‚ùå ERROR INESPERADO: {e}")
        import traceback

        traceback.print_exc()
        plt.close(fig)
        return False


# Ejecutar el test
resultado = test_analizar_clima_multivariado()

if resultado:
    print("\n" + "=" * 70)
    print("‚úÖ EJERCICIO 3 COMPLETADO CORRECTAMENTE")
    print("=" * 70)
    print("\nüéì ¬°Felicidades! Has completado el an√°lisis multivariado.")
else:
    print("\n" + "=" * 70)
    print("‚ùå EJERCICIO 3 INCOMPLETO O INCORRECTO")
    print("=" * 70)
    print("\nüí° Revisa los mensajes de error arriba para corregir tu c√≥digo.")

### üí° Soluci√≥n del Ejercicio Integrador 3

<details>
<summary><b>üîç Ver Soluci√≥n Completa</b> (haga clic para expandir)</summary>

```python
def analizar_clima_multivariado(
    df: pd.DataFrame, fig: plt.Figure, axes: np.ndarray
) -> None:
    """
    Analiza la relaci√≥n entre variables clim√°ticas y el uso de bicicletas mediante m√∫ltiples gr√°ficos.

    Par√°metros:
    -----------
    df : pd.DataFrame
        DataFrame con los datos de bike sharing
        Debe contener columnas: 'temp', 'hum', 'windspeed', 'weathersit', 'cnt'
    fig : plt.Figure
        Objeto Figure que contiene los subgr√°ficos
    axes : np.ndarray
        Array 2D de objetos Axes (2x2) donde se dibujar√°n los gr√°ficos

    Retorna:
    --------
    None
    """
    # ========== SUBGR√ÅFICO [0, 0]: Temperatura vs Alquileres ==========
    axes[0, 0].scatter(df['temp'], df['cnt'], color='red', alpha=0.3)
    axes[0, 0].set_title('Temperatura vs Alquileres')
    axes[0, 0].set_xlabel('Temperatura Normalizada')
    axes[0, 0].set_ylabel('N√∫mero de Bicicletas Alquiladas')
    axes[0, 0].grid(True, alpha=0.3)
    
    # ========== SUBGR√ÅFICO [0, 1]: Humedad vs Alquileres ==========
    axes[0, 1].scatter(df['hum'], df['cnt'], color='blue', alpha=0.3)
    axes[0, 1].set_title('Humedad vs Alquileres')
    axes[0, 1].set_xlabel('Humedad Normalizada')
    axes[0, 1].set_ylabel('N√∫mero de Bicicletas Alquiladas')
    axes[0, 1].grid(True, alpha=0.3)
    
    # ========== SUBGR√ÅFICO [1, 0]: Velocidad del Viento vs Alquileres ==========
    axes[1, 0].scatter(df['windspeed'], df['cnt'], color='green', alpha=0.3)
    axes[1, 0].set_title('Velocidad del Viento vs Alquileres')
    axes[1, 0].set_xlabel('Velocidad del Viento Normalizada')
    axes[1, 0].set_ylabel('N√∫mero de Bicicletas Alquiladas')
    axes[1, 0].grid(True, alpha=0.3)
    
    # ========== SUBGR√ÅFICO [1, 1]: Promedio por Condici√≥n Clim√°tica ==========
    # Calcular promedio de alquileres por condici√≥n clim√°tica
    promedio_clima = df.groupby('weathersit')['cnt'].mean()
    
    # Crear gr√°fico de barras
    axes[1, 1].bar(
        promedio_clima.index,
        promedio_clima.values,
        color=['skyblue', 'lightcoral', 'lightgreen', 'gold']
    )
    axes[1, 1].set_title('Promedio de Alquileres por Condici√≥n Clim√°tica')
    axes[1, 1].set_xlabel('Condici√≥n Clim√°tica')
    axes[1, 1].set_ylabel('Promedio de Bicicletas Alquiladas')
    axes[1, 1].grid(True, alpha=0.3, axis='y')
    
    # ========== T√çTULO GENERAL ==========
    fig.suptitle(
        'An√°lisis Multivariado: Clima y Uso de Bicicletas Compartidas',
        fontsize=16,
        fontweight='bold'
    )
```

**Explicaci√≥n paso a paso:**

### **1. Acceso a subgr√°ficos:**
```python
axes[0, 0]  # Fila 0, Columna 0 (superior izquierda)
axes[0, 1]  # Fila 0, Columna 1 (superior derecha)
axes[1, 0]  # Fila 1, Columna 0 (inferior izquierda)
axes[1, 1]  # Fila 1, Columna 1 (inferior derecha)
```

### **2. Scatter plots (subgr√°ficos [0,0], [0,1], [1,0]):**
- **`alpha=0.3`**: Alta transparencia porque hay muchos puntos superpuestos
- **Colores diferentes**: Facilitan la identificaci√≥n visual de cada variable
- **`grid(True, alpha=0.3)`**: Cuadr√≠cula sutil para referencia

### **3. Bar plot (subgr√°fico [1,1]):**
```python
promedio_clima = df.groupby('weathersit')['cnt'].mean()
```
- Agrupa por condici√≥n clim√°tica (`weathersit`)
- Calcula el promedio de alquileres para cada condici√≥n
- `grid(axis='y')`: Solo cuadr√≠cula horizontal (m√°s √∫til para barras verticales)

### **4. T√≠tulo general:**
```python
fig.suptitle('...', fontsize=16, fontweight='bold')
```
- `fig.suptitle()` a√±ade un t√≠tulo **sobre todos los subgr√°ficos**
- `fontsize=16`: Texto m√°s grande que los t√≠tulos individuales
- `fontweight='bold'`: Texto en negrita para destacar

**Conceptos clave:**
- **Arrays 2D**: `axes[fila, columna]` permite acceder a subgr√°ficos organizados en matriz
- **Scatter plots**: Ideales para visualizar correlaciones entre variables continuas
- **Consistencia visual**: Usar `grid()` y `alpha` similares mantiene uniformidad
- **Jerarqu√≠a de t√≠tulos**: T√≠tulo general (`suptitle`) + t√≠tulos individuales (`set_title`)

**Interpretaci√≥n esperada:**

| Subgr√°fico | Variable | Correlaci√≥n Esperada | Explicaci√≥n |
|------------|----------|---------------------|-------------|
| **[0, 0]** | Temperatura | üî¥ **Positiva fuerte** | M√°s calor ‚Üí m√°s alquileres (clima agradable) |
| **[0, 1]** | Humedad | üîµ **Negativa moderada** | M√°s humedad ‚Üí menos alquileres (incomodidad) |
| **[1, 0]** | Viento | üü¢ **Negativa d√©bil** | M√°s viento ‚Üí ligera reducci√≥n (depende de intensidad) |
| **[1, 1]** | Clima | ‚òÅÔ∏è **Clima despejado gana** | Condiciones 1 (despejado) tiene mayor promedio |

**Mejoras opcionales:**

1. **L√≠neas de tendencia**:
```python
from scipy.stats import linregress

# Para temperatura vs alquileres
slope, intercept, r_value, p_value, std_err = linregress(df['temp'], df['cnt'])
line = slope * df['temp'] + intercept
axes[0, 0].plot(df['temp'], line, 'r--', alpha=0.8, label=f'R¬≤ = {r_value**2:.3f}')
axes[0, 0].legend()
```

2. **Etiquetas de barras con valores**:
```python
for i, v in enumerate(promedio_clima.values):
    axes[1, 1].text(i, v + 10, f'{v:.0f}', ha='center', fontweight='bold')
```

3. **C√≥digo de condiciones clim√°ticas**:
```python
# Mapeo de weathersit a nombres descriptivos
weather_labels = {1: 'Despejado', 2: 'Nublado', 3: 'Lluvia ligera', 4: 'Tormenta'}
axes[1, 1].set_xticklabels([weather_labels.get(int(x), x) for x in promedio_clima.index])
```

</details>