# Ejercicio Práctico: Medidas de Tendencia Central y Dispersión

**Curso:** CD2001B - Diagnóstico para Líneas de Acción  
**Módulo:** 1 - Estadística para Negocios  
**Tipo:** Ejercicio opcional de práctica  
**Dataset:** ejemplo_satisfaccion_clientes.csv  
**Tiempo estimado:** 45-60 minutos

---

## 🎯 Objetivo

Practicar el cálculo e interpretación de medidas descriptivas usando Python antes de realizar el Workshop 1.

## 📊 Dataset

Usarás el dataset de **satisfacción de beneficiarios** de una ONG ficticia que incluye:
- Calificaciones de satisfacción (1-10)
- Tiempo de espera (minutos)
- Edad de beneficiarios
- Departamento de servicio
- Género

---

## 💡 Instrucciones

1. Completa cada celda de código
2. Interpreta los resultados en texto
3. Compara tus respuestas con el archivo de solución
4. Si tienes dudas, revisa los notebooks de clase

---

## Parte 1: Preparación del Entorno (5 puntos)

### 1.1 Importar Librerías

In [None]:
# Importa las librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Configuración de visualización
sns.set_style('whitegrid')
%matplotlib inline

print("✓ Librerías importadas correctamente")

### 1.2 Cargar Dataset

In [None]:
# Carga el dataset de satisfacción
df = pd.read_csv('../datos/ejemplo_satisfaccion_clientes.csv')

# Muestra las primeras 5 filas
print("📊 Primeras filas del dataset:")
df.head()

In [None]:
# Explora la estructura del dataset
print(f"Dimensiones: {df.shape[0]} filas, {df.shape[1]} columnas\n")
print("Información del dataset:")
df.info()

---

## Parte 2: Medidas de Tendencia Central (30 puntos)

### Pregunta 1: Satisfacción General (10 puntos)

In [None]:
# Calcula media, mediana y moda de la columna 'satisfaccion'

# Media
media_satisfaccion = # TU CÓDIGO AQUÍ

# Mediana
mediana_satisfaccion = # TU CÓDIGO AQUÍ

# Moda
moda_satisfaccion = # TU CÓDIGO AQUÍ (usa .mode()[0])

print(f"📊 Medidas de Tendencia Central - Satisfacción")
print(f"Media:   {media_satisfaccion:.2f}")
print(f"Mediana: {mediana_satisfaccion:.2f}")
print(f"Moda:    {moda_satisfaccion}")

**Interpretación:**

*Escribe aquí tu interpretación:*
- ¿Qué te dice la media sobre la satisfacción promedio?
- ¿Por qué la mediana y la media son diferentes (o similares)?
- ¿Qué significa que la moda sea ese valor?

### Pregunta 2: Tiempo de Espera (10 puntos)

In [None]:
# Calcula media, mediana y moda del tiempo de espera

media_tiempo = # TU CÓDIGO AQUÍ
mediana_tiempo = # TU CÓDIGO AQUÍ
moda_tiempo = # TU CÓDIGO AQUÍ

print(f"📊 Medidas de Tendencia Central - Tiempo de Espera (minutos)")
print(f"Media:   {media_tiempo:.2f}")
print(f"Mediana: {mediana_tiempo:.2f}")
print(f"Moda:    {moda_tiempo}")

**Interpretación:**

*Responde:*
- ¿Cuál medida (media o mediana) es más representativa y por qué?
- ¿Hay evidencia de outliers? ¿Cómo lo sabes?

### Pregunta 3: Edad de Beneficiarios (10 puntos)

In [None]:
# Calcula las medidas de tendencia central para 'edad'

# TU CÓDIGO AQUÍ

print(f"📊 Medidas de Tendencia Central - Edad")
# TU CÓDIGO PARA IMPRIMIR RESULTADOS

**Interpretación:**

*¿Cuál es el perfil etario típico de los beneficiarios?*

---

## Parte 3: Medidas de Dispersión (30 puntos)

### Pregunta 4: Variabilidad de Satisfacción (15 puntos)

In [None]:
# Calcula varianza, desviación estándar y rango de 'satisfaccion'

varianza = # TU CÓDIGO AQUÍ (usa .var())
desviacion = # TU CÓDIGO AQUÍ (usa .std())
rango = # TU CÓDIGO AQUÍ (max - min)

print(f"📊 Medidas de Dispersión - Satisfacción")
print(f"Varianza:           {varianza:.2f}")
print(f"Desviación estándar: {desviacion:.2f}")
print(f"Rango:              {rango}")

**Interpretación:**

*¿Qué tan dispersos están los datos de satisfacción? ¿Es alta o baja la variabilidad?*

### Pregunta 5: Cuartiles y Rango Intercuartílico (15 puntos)

In [None]:
# Calcula Q1, Q2 (mediana), Q3 y el IQR del tiempo de espera

Q1 = # TU CÓDIGO AQUÍ (usa .quantile(0.25))
Q2 = # TU CÓDIGO AQUÍ (usa .quantile(0.50))
Q3 = # TU CÓDIGO AQUÍ (usa .quantile(0.75))
IQR = # TU CÓDIGO AQUÍ (Q3 - Q1)

print(f"📊 Cuartiles - Tiempo de Espera")
print(f"Q1 (25%): {Q1:.2f} minutos")
print(f"Q2 (50%): {Q2:.2f} minutos")
print(f"Q3 (75%): {Q3:.2f} minutos")
print(f"IQR:      {IQR:.2f} minutos")

**Interpretación:**

*¿Qué porcentaje de beneficiarios espera más de Q3 minutos? ¿Qué significa el IQR en este contexto?*

---

## Parte 4: Visualización (20 puntos)

### Pregunta 6: Histograma de Satisfacción (10 puntos)

In [None]:
# Crea un histograma de la variable 'satisfaccion'

plt.figure(figsize=(10, 6))

# TU CÓDIGO AQUÍ (usa plt.hist() o df['satisfaccion'].hist())

plt.xlabel('Satisfacción')
plt.ylabel('Frecuencia')
plt.title('Distribución de Satisfacción de Beneficiarios')
plt.axvline(media_satisfaccion, color='red', linestyle='--', label=f'Media: {media_satisfaccion:.2f}')
plt.axvline(mediana_satisfaccion, color='green', linestyle='--', label=f'Mediana: {mediana_satisfaccion:.2f}')
plt.legend()
plt.show()

**Observación:**

*¿La distribución es simétrica, sesgada a la izquierda o sesgada a la derecha?*

### Pregunta 7: Boxplot de Tiempo de Espera (10 puntos)

In [None]:
# Crea un boxplot del tiempo de espera

plt.figure(figsize=(10, 6))

# TU CÓDIGO AQUÍ (usa sns.boxplot() o plt.boxplot())

plt.ylabel('Tiempo de Espera (minutos)')
plt.title('Boxplot: Tiempo de Espera')
plt.show()

**Observación:**

*¿Observas outliers en el boxplot? ¿Qué te dice esto sobre la distribución del tiempo de espera?*

---

## Parte 5: Análisis por Grupos (15 puntos)

### Pregunta 8: Satisfacción por Departamento

In [None]:
# Calcula la media y desviación estándar de satisfacción agrupada por departamento

resumen_dept = # TU CÓDIGO AQUÍ (usa .groupby('departamento')['satisfaccion'].agg(['mean', 'std']))

print("📊 Satisfacción por Departamento")
print(resumen_dept)

In [None]:
# Crea un boxplot comparativo por departamento

plt.figure(figsize=(12, 6))

# TU CÓDIGO AQUÍ (usa sns.boxplot con x='departamento', y='satisfaccion')

plt.xlabel('Departamento')
plt.ylabel('Satisfacción')
plt.title('Satisfacción por Departamento')
plt.xticks(rotation=45)
plt.show()

**Interpretación:**

*¿Qué departamento tiene mayor satisfacción promedio? ¿Cuál tiene mayor variabilidad?*

---

## 🎯 Resumen Final

**Completa esta tabla con tus resultados:**

| Variable | Media | Mediana | Desv. Est. |
|----------|-------|---------|------------|
| Satisfacción | ___ | ___ | ___ |
| Tiempo de Espera | ___ | ___ | ___ |
| Edad | ___ | ___ | ___ |

---

## ✅ Autoevaluación

- [ ] Calculé todas las medidas de tendencia central
- [ ] Calculé todas las medidas de dispersión
- [ ] Creé las visualizaciones solicitadas
- [ ] Interpreté los resultados en contexto
- [ ] Comparé mis respuestas con el archivo de solución

---

## 📚 Próximos Pasos

1. Revisa el archivo **`ejercicio_medidas_tendencia_SOLUCION.ipynb`**
2. Practica con el **`ejercicio_pruebas_hipotesis.ipynb`**
3. Prepárate para **Workshop 1** con el dataset de alcohol

---

**¡Buen trabajo!** 🎉