# Ejercicio Completo: Análisis de Satisfacción de ONG

**Curso:** CD2001B - Diagnóstico para Líneas de Acción  
**Módulo:** 1 - Estadística para Negocios  
**Tipo:** Ejercicio opcional avanzado  
**Dataset:** ejemplo_satisfaccion_clientes.csv  
**Tiempo estimado:** 90-120 minutos

---

## 🎯 Objetivo

Realizar un **análisis estadístico completo** de la satisfacción de beneficiarios de una ONG, aplicando:
- Análisis descriptivo
- Pruebas de hipótesis
- Visualizaciones
- Interpretación en contexto de negocios

Este ejercicio simula el reto final usando un dataset diferente.

---

## 📊 Contexto

**Organización:** ONG "Apoyo Comunitario"

**Situación:** La ONG ha recopilado datos de satisfacción de 200 beneficiarios durante 6 meses. Como analista de datos, debes:
1. Evaluar el desempeño actual
2. Identificar áreas de mejora
3. Proponer acciones basadas en datos

**Variables disponibles:**
- `id_beneficiario`: Identificador único
- `edad`: Edad del beneficiario
- `genero`: Masculino / Femenino
- `departamento`: Área de servicio (Salud, Educación, Alimentación, etc.)
- `satisfaccion`: Calificación 1-10
- `tiempo_espera`: Minutos de espera
- `visitas_previas`: Número de veces que ha usado el servicio

---

## Parte 1: Carga y Exploración Inicial (10 puntos)

In [None]:
# Importar librerías
import pandas as pd
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
import seaborn as sns

sns.set_style('whitegrid')
%matplotlib inline

print("✓ Librerías cargadas")

In [None]:
# Cargar dataset
df = pd.read_csv('../datos/ejemplo_satisfaccion_clientes.csv')

# Exploración básica
print(f"📊 Dimensiones: {df.shape}")
print(f"\n📋 Primeras filas:")
df.head(10)

In [None]:
# Información del dataset
print("ℹ️ Información:")
df.info()

print("\n❓ Valores faltantes:")
print(df.isnull().sum())

print("\n🔢 Estadísticas descriptivas:")
df.describe()

**Pregunta 1.1 (5 puntos):** ¿Cuántos beneficiarios hay de cada departamento? Crea una tabla de frecuencias.

In [None]:
# TU CÓDIGO AQUÍ
# Usa: df['departamento'].value_counts()


**Pregunta 1.2 (5 puntos):** ¿Cuál es la distribución de género? Crea un gráfico de barras.

In [None]:
# TU CÓDIGO AQUÍ
# Crea un gráfico de barras de la distribución de género


---

## Parte 2: Análisis Descriptivo de Satisfacción (20 puntos)

**Pregunta 2.1 (10 puntos):** Calcula las medidas de tendencia central y dispersión de la satisfacción.

In [None]:
# TU CÓDIGO AQUÍ
# Calcula: media, mediana, moda, desviación estándar, Q1, Q3, IQR

media = 
mediana = 
moda = 
desv_est = 
Q1 = 
Q3 = 
IQR = 

print(f"Media: {media:.2f}")
# Continúa imprimiendo las demás medidas

**Interpretación:** *Escribe aquí qué te dicen estos números sobre la satisfacción general.*

**Pregunta 2.2 (10 puntos):** Crea un dashboard de 4 gráficos:
1. Histograma de satisfacción
2. Boxplot de satisfacción
3. Boxplot de satisfacción por departamento
4. Scatter plot: tiempo de espera vs satisfacción

In [None]:
# TU CÓDIGO AQUÍ
# Crea una figura con 4 subplots (2x2)

fig, axes = plt.subplots(2, 2, figsize=(16, 12))

# 1. Histograma
# TU CÓDIGO

# 2. Boxplot
# TU CÓDIGO

# 3. Boxplot por departamento
# TU CÓDIGO

# 4. Scatter plot
# TU CÓDIGO

plt.tight_layout()
plt.show()

**Observaciones:** *¿Qué patrones observas en las visualizaciones?*

---

## Parte 3: Pruebas de Hipótesis (40 puntos)

### 3.1 Prueba t para Una Muestra (15 puntos)

**Escenario:** La ONG tiene como meta una satisfacción promedio de **8.0 puntos**.

**Pregunta:** ¿La satisfacción real es diferente de 8.0?

In [None]:
# Paso 1: Plantear hipótesis
print("📋 HIPÓTESIS")
# TU CÓDIGO: Escribe H₀ y H₁


In [None]:
# Paso 2: Realizar prueba t
# TU CÓDIGO AQUÍ
# Usa: stats.ttest_1samp()

t_stat, p_value = 

print(f"t-statistic: {t_stat:.4f}")
print(f"p-value: {p_value:.4f}")

In [None]:
# Paso 3: Decisión e interpretación
alpha = 0.05

# TU CÓDIGO: Escribe la decisión basada en p-value


**Interpretación en contexto:** *¿Qué significa este resultado para la ONG? ¿Están cumpliendo su meta?*

### 3.2 Prueba t para Dos Muestras (15 puntos)

**Pregunta:** ¿Existe diferencia en satisfacción entre hombres y mujeres?

In [None]:
# Paso 1: Estadísticas descriptivas por grupo
# TU CÓDIGO
# Usa: df.groupby('genero')['satisfaccion'].agg(['mean', 'std', 'count'])


In [None]:
# Paso 2: Separar grupos
# TU CÓDIGO
grupo_m = 
grupo_f = 

In [None]:
# Paso 3: Prueba t de dos muestras
# TU CÓDIGO
# Usa: stats.ttest_ind()

t_stat, p_value = 

print(f"t-statistic: {t_stat:.4f}")
print(f"p-value: {p_value:.4f}")

**Decisión:** *Rechazar o no rechazar H₀ y por qué.*

### 3.3 Comparación entre Dos Departamentos (10 puntos)

**Pregunta:** ¿Existe diferencia en tiempo de espera entre los departamentos de **Salud** y **Educación**?

In [None]:
# TU CÓDIGO COMPLETO AQUÍ
# 1. Filtrar departamentos
# 2. Realizar prueba t
# 3. Interpretar resultado


---

## Parte 4: Análisis de Correlación (15 puntos)

**Pregunta:** ¿Existe relación entre tiempo de espera y satisfacción?

In [None]:
# Calcular correlación de Pearson
# TU CÓDIGO
# Usa: stats.pearsonr()

r, p_value = 

print(f"Correlación (r): {r:.4f}")
print(f"p-value: {p_value:.4f}")

In [None]:
# Crear scatter plot con línea de tendencia
# TU CÓDIGO
# Usa np.polyfit() para la línea de tendencia


**Interpretación:** *¿Qué tipo de relación existe? ¿Es fuerte, moderada o débil?*

---

## Parte 5: Análisis por Departamento (15 puntos)

**Pregunta 5.1:** Crea una tabla resumen con la media y desviación estándar de satisfacción por departamento.

In [None]:
# TU CÓDIGO
resumen_dept = 
print(resumen_dept)

**Pregunta 5.2:** ¿Qué departamento tiene:
- Mayor satisfacción promedio?
- Menor satisfacción promedio?
- Mayor variabilidad?

In [None]:
# TU CÓDIGO: Identifica estos departamentos

mejor_dept = 
peor_dept = 
mas_variable = 

print(f"Mayor satisfacción: {mejor_dept}")
print(f"Menor satisfacción: {peor_dept}")
print(f"Mayor variabilidad: {mas_variable}")

---

## Parte 6: Reporte Ejecutivo (Bonus +10 puntos)

Redacta un breve reporte (200-300 palabras) que incluya:

1. **Situación Actual:** Resumen de los hallazgos clave
2. **Áreas de Oportunidad:** Problemas identificados
3. **Recomendaciones:** 3-5 acciones concretas basadas en datos

### REPORTE EJECUTIVO

**Para:** Dirección General de ONG "Apoyo Comunitario"  
**De:** [Tu nombre], Analista de Datos  
**Fecha:** [Fecha]  
**Re:** Análisis de Satisfacción de Beneficiarios

---

**1. SITUACIÓN ACTUAL**

*[Escribe aquí tu resumen de hallazgos]*

**2. ÁREAS DE OPORTUNIDAD**

*[Identifica problemas basados en datos]*

**3. RECOMENDACIONES**

1. *[Recomendación 1]*
2. *[Recomendación 2]*
3. *[Recomendación 3]*

**CONCLUSIÓN**

*[Mensaje final]*

---

## 🎯 Resumen de Tareas Completadas

**Marca las tareas que completaste:**

- [ ] Parte 1: Carga y exploración (10 pts)
- [ ] Parte 2: Análisis descriptivo (20 pts)
- [ ] Parte 3: Pruebas de hipótesis (40 pts)
- [ ] Parte 4: Correlación (15 pts)
- [ ] Parte 5: Análisis por departamento (15 pts)
- [ ] Parte 6: Reporte ejecutivo (Bonus +10 pts)

**Total:** ___ / 100 puntos (+ bonus)

---

## 💡 Reflexión Final

**Preguntas para reflexionar:**

1. ¿Qué técnica estadística te pareció más útil para este análisis?
2. ¿Qué desafíos enfrentaste al interpretar los resultados?
3. ¿Cómo aplicarías este flujo de trabajo al dataset de tu reto final?

*[Escribe tus reflexiones aquí]*

---

## 📚 Comparación con Workshop 1

**Similitudes:**
- Ambos usan análisis descriptivo y pruebas t
- Estructura de análisis similar

**Diferencias:**
- Dataset diferente (ONG vs estudiantes)
- Contexto de negocio diferente
- Este ejercicio incluye correlación y análisis por departamento

**Aprendizajes transferibles:**
- El proceso estadístico es el mismo independientemente del dataset
- La interpretación debe adaptarse al contexto específico
- Las visualizaciones ayudan a comunicar hallazgos

---

**¡Excelente trabajo!** 🎉

Este ejercicio te prepara para:
- Workshop 2 (Ji-cuadrada, ANOVA, Regresión)
- Reto final con dataset real de ONG
- Aplicación profesional de estadística en negocios