<a href="https://colab.research.google.com/github/heldigard/Electiva-Analitica-IA/blob/main/Clase2-Analisis-Visualizacion.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üìä Clase 2: An√°lisis Exploratorio y Visualizaci√≥n de Datos

## Universidad UdeColombia - Especializaci√≥n en Anal√≠tica de Datos

---

### üéØ Objetivos de esta clase

Al finalizar esta sesi√≥n, ser√°s capaz de:

1. **Dominar** los 5 tipos de gr√°ficos estad√≠sticos m√°s importantes
2. **Interpretar** patrones, tendencias y outliers en los datos
3. **Extraer** insights de negocio a partir de visualizaciones
4. **Comunicar** hallazgos de forma clara y profesional

---

## üìö Los 5 Gr√°ficos Esenciales para An√°lisis de Datos

| # | Tipo de Gr√°fico | ¬øCu√°ndo usarlo? | Ejemplo de pregunta |
|---|-----------------|-----------------|--------------------|
| 1 | **Histograma** | Distribuci√≥n de UNA variable num√©rica | ¬øC√≥mo se distribuyen los precios? |
| 2 | **Barras** | Comparar categor√≠as | ¬øQu√© categor√≠a vende m√°s? |
| 3 | **L√≠neas** | Tendencias en el tiempo | ¬øC√≥mo han evolucionado las ventas? |
| 4 | **Dispersi√≥n (Scatter)** | Relaci√≥n entre DOS variables | ¬øM√°s precio = m√°s calificaci√≥n? |
| 5 | **Boxplot** | Distribuci√≥n y outliers | ¬øHay valores at√≠picos? |

---

## üõ†Ô∏è Configuraci√≥n Inicial

In [None]:
# Importar librer√≠as
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configuraci√≥n de visualizaci√≥n
plt.style.use('seaborn-v0_8-whitegrid')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = [10, 6]
plt.rcParams['font.size'] = 11

# Configuraci√≥n de pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.float_format', '{:,.2f}'.format)

print("‚úÖ ¬°Librer√≠as cargadas correctamente!")

## üìÇ Cargar los Datasets

Trabajaremos con **dos datasets** para practicar diferentes tipos de an√°lisis:

1. **Netflix** - Para an√°lisis categ√≥rico y temporal
2. **Retail Sales** - Para an√°lisis num√©rico y de ventas

In [None]:
# Dataset 1: Netflix Movies & TV Shows
url_netflix = "https://raw.githubusercontent.com/prasertcbs/basic-dataset/master/netflix_titles.csv"
df_netflix = pd.read_csv(url_netflix)
print(f"‚úÖ Netflix: {df_netflix.shape[0]:,} t√≠tulos")

# Dataset 2: Retail Sales (Ventas minoristas)
url_retail = "https://raw.githubusercontent.com/datasets/retail-sales/main/data/retail-sales.csv"
df_retail = pd.read_csv(url_retail)
print(f"‚úÖ Retail: {df_retail.shape[0]:,} registros")

In [None]:
# Vista r√°pida de Netflix
print("üì∫ Dataset Netflix:")
df_netflix.head(3)

In [None]:
# Vista r√°pida de Retail
print("üõí Dataset Retail:")
df_retail.head(3)

---

## üìä GR√ÅFICO 1: Histograma

### ¬øQu√© es?
Un histograma muestra **c√≥mo se distribuyen los valores** de una variable num√©rica. Divide los datos en "barras" (bins) y muestra cu√°ntos valores caen en cada rango.

### ¬øCu√°ndo usarlo?
- Para entender la distribuci√≥n de precios, edades, cantidades, etc.
- Para identificar si los datos est√°n concentrados o dispersos
- Para detectar si hay m√∫ltiples "picos" (modas) en los datos

### Ejemplo: Distribuci√≥n de A√±os de Lanzamiento en Netflix

In [None]:
# Histograma de a√±os de lanzamiento
plt.figure(figsize=(12, 5))

# Filtrar a√±os recientes para mejor visualizaci√≥n
a√±os_recientes = df_netflix[df_netflix['release_year'] >= 1990]['release_year']

plt.hist(a√±os_recientes, bins=30, color='steelblue', edgecolor='white', alpha=0.7)

plt.title('üìä Distribuci√≥n de T√≠tulos por A√±o de Lanzamiento', fontsize=14, fontweight='bold')
plt.xlabel('A√±o de Lanzamiento')
plt.ylabel('Cantidad de T√≠tulos')

# Agregar l√≠nea vertical en la mediana
mediana = a√±os_recientes.median()
plt.axvline(x=mediana, color='red', linestyle='--', label=f'Mediana: {mediana:.0f}')
plt.legend()

plt.tight_layout()
plt.show()

print(f"\nüìà Estad√≠sticas:")
print(f"   A√±o promedio: {a√±os_recientes.mean():.1f}")
print(f"   A√±o mediano: {mediana:.0f}")
print(f"   A√±o m√≠nimo: {a√±os_recientes.min()}")
print(f"   A√±o m√°ximo: {a√±os_recientes.max()}")

### üéì Interpretaci√≥n del Histograma

**Observaciones clave:**
- La mayor√≠a del contenido de Netflix es **reciente** (√∫ltimos 10 a√±os)
- Hay un crecimiento exponencial en producci√≥n de contenido
- La distribuci√≥n est√° **sesgada hacia la derecha** (hacia a√±os recientes)

**Insight de negocio:**
> Netflix prioriza contenido nuevo. Esto sugiere que la plataforma invierte constantemente en producciones recientes para mantener el cat√°logo actualizado.

### ‚úèÔ∏è ACTIVIDAD 1: Tu Histograma (10 min)

Usa un chatbot para generar c√≥digo que:
1. Extraiga la duraci√≥n num√©rica de las pel√≠culas (columna `duration` tiene valores como "90 min")
2. Cree un histograma de la duraci√≥n de pel√≠culas
3. Interprete: ¬øCu√°nto dura una pel√≠cula "t√≠pica" de Netflix?

**Prompt sugerido:**
```
Tengo un DataFrame 'df_netflix' con una columna 'duration' que tiene valores como:
- '90 min' (para pel√≠culas)
- '2 Seasons' (para series)

TAREA:
1. Filtra solo las pel√≠culas (type == 'Movie')
2. Extrae el n√∫mero de minutos de la columna duration
3. Crea un histograma de la duraci√≥n en minutos
4. Agrega t√≠tulo y etiquetas claras
```

In [None]:
# üìù PEGA AQU√ç TU C√ìDIGO
# ========================



---

## üìä GR√ÅFICO 2: Gr√°fico de Barras

### ¬øQu√© es?
Un gr√°fico de barras **compara cantidades entre diferentes categor√≠as**. Cada barra representa una categor√≠a y su altura representa el valor.

### ¬øCu√°ndo usarlo?
- Comparar ventas por categor√≠a de producto
- Comparar cantidad de empleados por departamento
- Mostrar frecuencias de variables categ√≥ricas

### Ejemplo: Tipos de Contenido en Netflix

In [None]:
# Gr√°fico de barras: Pel√≠culas vs Series
fig, axes = plt.subplots(1, 2, figsize=(14, 5))

# Gr√°fico 1: Conteo simple
conteo_tipo = df_netflix['type'].value_counts()
colores = ['#3498db', '#e74c3c']

axes[0].bar(conteo_tipo.index, conteo_tipo.values, color=colores, edgecolor='white')
axes[0].set_title('üì∫ Cantidad de T√≠tulos por Tipo', fontsize=13, fontweight='bold')
axes[0].set_ylabel('Cantidad')

# Agregar etiquetas de valor
for i, v in enumerate(conteo_tipo.values):
    axes[0].text(i, v + 100, f'{v:,}', ha='center', fontweight='bold')

# Gr√°fico 2: Porcentaje
porcentaje = conteo_tipo / conteo_tipo.sum() * 100
axes[1].pie(porcentaje, labels=porcentaje.index, autopct='%1.1f%%', colors=colores, explode=[0.02, 0.02])
axes[1].set_title('üìä Distribuci√≥n Porcentual', fontsize=13, fontweight='bold')

plt.tight_layout()
plt.show()

### Ejemplo Avanzado: Ratings por Tipo de Contenido

In [None]:
# Gr√°fico de barras agrupadas
# Top 6 ratings m√°s comunes
top_ratings = df_netflix['rating'].value_counts().head(6).index.tolist()
df_filtrado = df_netflix[df_netflix['rating'].isin(top_ratings)]

# Crear tabla cruzada
tabla_cruzada = pd.crosstab(df_filtrado['rating'], df_filtrado['type'])

# Graficar
tabla_cruzada.plot(kind='bar', figsize=(12, 5), color=['#3498db', '#e74c3c'], edgecolor='white')

plt.title('üìä Clasificaci√≥n de Contenido: Pel√≠culas vs Series', fontsize=14, fontweight='bold')
plt.xlabel('Clasificaci√≥n (Rating)')
plt.ylabel('Cantidad de T√≠tulos')
plt.xticks(rotation=45)
plt.legend(title='Tipo')

plt.tight_layout()
plt.show()

### üéì Interpretaci√≥n

**Observaciones:**
- TV-MA (contenido para adultos) domina en ambos tipos
- Las series tienden a tener m√°s clasificaci√≥n TV-14
- Las pel√≠culas tienen m√°s variedad de clasificaciones

**Insight de negocio:**
> Netflix se enfoca principalmente en audiencias adultas. El contenido familiar (TV-G, TV-Y) representa una porci√≥n menor del cat√°logo.

---

## üìä GR√ÅFICO 3: Gr√°fico de L√≠neas

### ¬øQu√© es?
Un gr√°fico de l√≠neas muestra **c√≥mo cambia un valor a lo largo del tiempo**. Es perfecto para identificar tendencias y patrones temporales.

### ¬øCu√°ndo usarlo?
- Analizar ventas mensuales o anuales
- Ver la evoluci√≥n de m√©tricas en el tiempo
- Identificar estacionalidad

### Ejemplo: Crecimiento del Cat√°logo de Netflix

In [None]:
# Preparar datos: Contenido agregado por a√±o
# Convertir date_added a datetime
df_netflix['date_added'] = pd.to_datetime(df_netflix['date_added'], errors='coerce')

# Extraer a√±o de la fecha de adici√≥n
df_netflix['year_added'] = df_netflix['date_added'].dt.year

# Contar t√≠tulos agregados por a√±o y tipo
agregados_por_a√±o = df_netflix.groupby(['year_added', 'type']).size().unstack(fill_value=0)
agregados_por_a√±o = agregados_por_a√±o.dropna()

# Graficar
fig, ax = plt.subplots(figsize=(12, 6))

agregados_por_a√±o.plot(kind='line', ax=ax, marker='o', linewidth=2, markersize=6)

plt.title('üìà Crecimiento del Cat√°logo de Netflix por A√±o', fontsize=14, fontweight='bold')
plt.xlabel('A√±o')
plt.ylabel('T√≠tulos Agregados')
plt.legend(title='Tipo de Contenido')
plt.grid(True, alpha=0.3)

# Agregar anotaci√≥n en el pico
max_year = agregados_por_a√±o['Movie'].idxmax()
max_value = agregados_por_a√±o.loc[max_year, 'Movie']
plt.annotate(f'Pico: {max_value:,.0f} pel√≠culas', 
             xy=(max_year, max_value), 
             xytext=(max_year-2, max_value+200),
             arrowprops=dict(arrowstyle='->', color='gray'),
             fontsize=10)

plt.tight_layout()
plt.show()

### üéì Interpretaci√≥n

**Tendencias observadas:**
- Netflix experiment√≥ un crecimiento exponencial hasta ~2019
- Hay una ca√≠da notable despu√©s de 2019-2020
- Las pel√≠culas siempre superan en cantidad a las series

**Insight de negocio:**
> La ca√≠da en contenido agregado puede deberse a: (1) Mayor enfoque en producciones originales de calidad, (2) P√©rdida de licencias de estudios, (3) Cambio de estrategia post-pandemia.

### ‚úèÔ∏è ACTIVIDAD 2: An√°lisis de Tendencias (15 min)

Usa un chatbot para generar c√≥digo que analice la **producci√≥n de contenido por pa√≠s** a lo largo del tiempo.

**Prompt sugerido:**
```
Tengo un DataFrame 'df_netflix' con las columnas:
- 'country': pa√≠s de origen (ej: 'United States', 'India', 'United Kingdom')
- 'year_added': a√±o en que se agreg√≥ a Netflix

TAREA:
1. Filtra los 5 pa√≠ses con m√°s contenido
2. Agrupa por a√±o y pa√≠s
3. Crea un gr√°fico de l√≠neas mostrando la evoluci√≥n de cada pa√≠s
4. Usa diferentes colores para cada pa√≠s
```

In [None]:
# üìù PEGA AQU√ç TU C√ìDIGO
# ========================



---

## üìä GR√ÅFICO 4: Diagrama de Dispersi√≥n (Scatter Plot)

### ¬øQu√© es?
Un scatter plot muestra la **relaci√≥n entre dos variables num√©ricas**. Cada punto representa una observaci√≥n con sus valores en ambas variables.

### ¬øCu√°ndo usarlo?
- Buscar correlaciones entre variables
- ¬øM√°s precio = m√°s ventas? ¬øM√°s horas = mejor calificaci√≥n?
- Identificar grupos o clusters

### Ejemplo: A√±o de Lanzamiento vs Duraci√≥n de Pel√≠culas

In [None]:
# Preparar datos: extraer duraci√≥n de pel√≠culas
peliculas = df_netflix[df_netflix['type'] == 'Movie'].copy()
peliculas['duracion_min'] = peliculas['duration'].str.extract('(\d+)').astype(float)

# Filtrar valores v√°lidos
peliculas = peliculas.dropna(subset=['duracion_min', 'release_year'])
peliculas = peliculas[peliculas['release_year'] >= 1980]

# Crear scatter plot
plt.figure(figsize=(12, 6))

plt.scatter(peliculas['release_year'], peliculas['duracion_min'], 
            alpha=0.3, color='steelblue', s=20)

# Agregar l√≠nea de tendencia
z = np.polyfit(peliculas['release_year'], peliculas['duracion_min'], 1)
p = np.poly1d(z)
plt.plot(peliculas['release_year'].sort_values(), 
         p(peliculas['release_year'].sort_values()), 
         "r--", linewidth=2, label='Tendencia')

plt.title('üìä Relaci√≥n: A√±o de Lanzamiento vs Duraci√≥n de Pel√≠culas', fontsize=14, fontweight='bold')
plt.xlabel('A√±o de Lanzamiento')
plt.ylabel('Duraci√≥n (minutos)')
plt.legend()

# Agregar l√≠nea horizontal en 90 minutos (duraci√≥n est√°ndar)
plt.axhline(y=90, color='green', linestyle=':', alpha=0.7, label='90 min (est√°ndar)')

plt.tight_layout()
plt.show()

# Calcular correlaci√≥n
correlacion = peliculas['release_year'].corr(peliculas['duracion_min'])
print(f"\nüìà Correlaci√≥n: {correlacion:.3f}")
print("   (Valores cercanos a 0 indican poca relaci√≥n)")

### üéì Interpretaci√≥n

**Observaciones:**
- No hay una correlaci√≥n fuerte entre a√±o y duraci√≥n
- La mayor√≠a de pel√≠culas est√°n entre 80-120 minutos
- Hay m√°s variabilidad en pel√≠culas recientes

**Insight:**
> El formato de pel√≠cula de ~90 minutos se ha mantenido estable a lo largo de d√©cadas. Las pel√≠culas m√°s largas (+150 min) son m√°s comunes en a√±os recientes.

---

## üìä GR√ÅFICO 5: Boxplot (Diagrama de Caja)

### ¬øQu√© es?
Un boxplot muestra la **distribuci√≥n de datos y sus valores at√≠picos (outliers)**. Muestra:
- La mediana (l√≠nea central)
- El rango intercuart√≠lico (la caja)
- Los valores extremos (bigotes)
- Los outliers (puntos fuera de los bigotes)

### ¬øCu√°ndo usarlo?
- Comparar distribuciones entre grupos
- Identificar valores at√≠picos
- Ver si los datos est√°n sesgados

### Ejemplo: Duraci√≥n de Pel√≠culas por Clasificaci√≥n

In [None]:
# Preparar datos
top_ratings = ['TV-MA', 'TV-14', 'TV-PG', 'R', 'PG-13', 'PG']
peliculas_ratings = peliculas[peliculas['rating'].isin(top_ratings)].copy()

# Crear boxplot
plt.figure(figsize=(12, 6))

# Usar seaborn para un boxplot m√°s atractivo
orden = peliculas_ratings.groupby('rating')['duracion_min'].median().sort_values(ascending=False).index

sns.boxplot(data=peliculas_ratings, x='rating', y='duracion_min', 
            order=orden, palette='viridis')

plt.title('üìä Distribuci√≥n de Duraci√≥n por Clasificaci√≥n', fontsize=14, fontweight='bold')
plt.xlabel('Clasificaci√≥n')
plt.ylabel('Duraci√≥n (minutos)')

# Agregar l√≠nea de referencia
plt.axhline(y=90, color='red', linestyle='--', alpha=0.5, label='90 min')
plt.legend()

plt.tight_layout()
plt.show()

### üîç C√≥mo Leer un Boxplot

```
                    ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îê
           M√°ximo ‚îÄ‚îÄ‚îÇ        ‚îÇ        ‚îÇ
                    ‚îÇ   ‚îå‚îÄ‚îÄ‚îÄ‚îÄ‚î¥‚îÄ‚îÄ‚îÄ‚îÄ‚îê   ‚îÇ
              Q3 ‚îÄ‚îÄ‚îÄ‚îÇ   ‚îÇ         ‚îÇ   ‚îÇ‚îÄ‚îÄ 75% de los datos
                    ‚îÇ   ‚îÇ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÇ   ‚îÇ
         Mediana ‚îÄ‚îÄ‚îÄ‚îÇ   ‚îÇ    ‚óè    ‚îÇ   ‚îÇ‚îÄ‚îÄ 50% (valor central)
                    ‚îÇ   ‚îÇ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÇ   ‚îÇ
              Q1 ‚îÄ‚îÄ‚îÄ‚îÇ   ‚îÇ         ‚îÇ   ‚îÇ‚îÄ‚îÄ 25% de los datos
                    ‚îÇ   ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚î¨‚îÄ‚îÄ‚îÄ‚îÄ‚îò   ‚îÇ
           M√≠nimo ‚îÄ‚îÄ‚îÇ        ‚îÇ        ‚îÇ
                    ‚îî‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îÄ‚îò
              ‚óè     ‚Üê Outliers (valores at√≠picos)
```

### üéì Interpretaci√≥n

**Observaciones:**
- Las pel√≠culas con clasificaci√≥n R (adultos) tienden a ser m√°s largas
- Contenido para ni√±os (PG) tiende a ser m√°s corto
- Hay muchos outliers (pel√≠culas muy largas) en todas las categor√≠as

**Insight de negocio:**
> El contenido para adultos tiene m√°s libertad creativa en duraci√≥n, mientras que el contenido familiar se mantiene en duraciones m√°s est√°ndar, posiblemente considerando la atenci√≥n de los ni√±os.

---

## ‚úèÔ∏è ACTIVIDAD 3: An√°lisis Completo (20 min)

### El Reto:

Imagina que trabajas para Netflix y te piden analizar el contenido **por pa√≠s**.

**Preguntas a responder:**

1. ¬øCu√°les son los 10 pa√≠ses que m√°s contenido aportan a Netflix?
2. ¬øC√≥mo se compara la proporci√≥n de pel√≠culas vs series entre los top 5 pa√≠ses?
3. ¬øHay diferencias en la duraci√≥n de pel√≠culas entre pa√≠ses?

### Instrucciones:

Usa chatbots para generar el c√≥digo necesario. Para cada pregunta:
1. Crea un prompt claro
2. Genera y ejecuta el c√≥digo
3. Escribe una interpretaci√≥n

In [None]:
# PREGUNTA 1: Top 10 pa√≠ses por cantidad de contenido
# ===================================================



In [None]:
# PREGUNTA 2: Proporci√≥n pel√≠culas vs series por pa√≠s
# ===================================================



In [None]:
# PREGUNTA 3: Comparaci√≥n de duraci√≥n entre pa√≠ses (boxplot)
# ==========================================================



### üìù Tu An√°lisis:

**Hallazgo 1 (Top pa√≠ses):**
> [Tu interpretaci√≥n]

**Hallazgo 2 (Pel√≠culas vs Series):**
> [Tu interpretaci√≥n]

**Hallazgo 3 (Duraci√≥n por pa√≠s):**
> [Tu interpretaci√≥n]

**Recomendaci√≥n para Netflix:**
> [Tu recomendaci√≥n basada en los datos]

---

## üé® BONUS: Gr√°ficos Combinados

Un an√°lisis profesional a menudo requiere m√∫ltiples visualizaciones juntas.

In [None]:
# Dashboard resumen de Netflix
fig, axes = plt.subplots(2, 2, figsize=(14, 10))

# 1. Tipo de contenido (Pie)
conteo_tipo = df_netflix['type'].value_counts()
axes[0, 0].pie(conteo_tipo, labels=conteo_tipo.index, autopct='%1.1f%%', 
               colors=['#3498db', '#e74c3c'], explode=[0.02, 0.02])
axes[0, 0].set_title('Tipo de Contenido', fontsize=12, fontweight='bold')

# 2. Top 5 g√©neros (Barras horizontales)
generos = df_netflix['listed_in'].str.split(', ').explode().value_counts().head(5)
axes[0, 1].barh(generos.index, generos.values, color='teal')
axes[0, 1].set_title('Top 5 G√©neros', fontsize=12, fontweight='bold')
axes[0, 1].invert_yaxis()

# 3. Evoluci√≥n temporal (L√≠neas)
agregados = df_netflix.groupby('year_added').size()
agregados = agregados.dropna()
axes[1, 0].plot(agregados.index, agregados.values, marker='o', color='purple', linewidth=2)
axes[1, 0].set_title('Contenido Agregado por A√±o', fontsize=12, fontweight='bold')
axes[1, 0].set_xlabel('A√±o')
axes[1, 0].grid(True, alpha=0.3)

# 4. Distribuci√≥n de clasificaciones (Barras)
ratings = df_netflix['rating'].value_counts().head(6)
axes[1, 1].bar(ratings.index, ratings.values, color='coral')
axes[1, 1].set_title('Top 6 Clasificaciones', fontsize=12, fontweight='bold')
axes[1, 1].tick_params(axis='x', rotation=45)

plt.suptitle('üìä Dashboard: An√°lisis del Cat√°logo de Netflix', fontsize=16, fontweight='bold', y=1.02)
plt.tight_layout()
plt.show()

---

## üìö Resumen de la Clase 2

### Los 5 Gr√°ficos Esenciales:

| Gr√°fico | Uso Principal | Pregunta que Responde |
|---------|--------------|----------------------|
| **Histograma** | Distribuci√≥n | ¬øC√≥mo se distribuyen los valores? |
| **Barras** | Comparaci√≥n | ¬øCu√°l categor√≠a es mayor/menor? |
| **L√≠neas** | Tendencias | ¬øC√≥mo cambia en el tiempo? |
| **Scatter** | Correlaci√≥n | ¬øHay relaci√≥n entre X e Y? |
| **Boxplot** | Outliers | ¬øHay valores at√≠picos? |

### Proceso de An√°lisis:

1. **Observar** ‚Üí ¬øQu√© muestra el gr√°fico?
2. **Interpretar** ‚Üí ¬øQu√© significa esto?
3. **Contextualizar** ‚Üí ¬øTiene sentido en el negocio?
4. **Recomendar** ‚Üí ¬øQu√© acci√≥n sugiere?

### ‚ö†Ô∏è Recuerda:
> Un gr√°fico sin interpretaci√≥n es solo una imagen bonita. El valor est√° en el **insight**.

---

### üöÄ Pr√≥xima Clase:
**Clase 3: Proyecto Integrador - APIs y An√°lisis Completo**
- Conexi√≥n a APIs externas
- An√°lisis de datos de e-commerce
- Presentaci√≥n de resultados ejecutivos