# Solucionario

Este cuaderno contiene las soluciones a los ejercicios planteados.

---

# 1. Estadística Descriptiva y Distribuciones

La estadística descriptiva nos ayuda a resumir y entender las características principales de un conjunto de datos.

## 1.1 Medidas de Tendencia Central y Dispersión

In [None]:
import numpy as np
import pandas as pd
import scipy.stats as stats
import matplotlib.pyplot as plt
import seaborn as sns

np.random.seed(42)

# Generar datos: Edades de una población (distribución normal)
edades = np.random.normal(loc=35, scale=10, size=1000)
edades = np.round(edades) # Redondear a enteros

print(f"Media: {np.mean(edades):.2f}")
print(f"Mediana: {np.median(edades)}")
print(f"Desviación Estándar: {np.std(edades):.2f}")

# Moda con scipy
moda = stats.mode(edades, keepdims=True)
print(f"Moda: {moda.mode[0]} (Frecuencia: {moda.count[0]})")

## 1.2 Distribuciones de Probabilidad
Modelar fenómenos aleatorios usando distribuciones teóricas.

### Distribución Normal (Gaussiana)
$$ f(x) = \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{1}{2}(\frac{x-\mu}{\sigma})^2} $$

In [None]:
# Generar PDF (Probability Density Function)
x = np.linspace(0, 70, 100)
pdf = stats.norm.pdf(x, loc=35, scale=10)

plt.figure(figsize=(10, 6))
sns.histplot(edades, stat="density", label="Datos empíricos", kde=False)
plt.plot(x, pdf, 'r-', lw=3, label="Distribución Teórica (Normal)")
plt.title("Distribución de Edades")
plt.legend()
plt.show()

### Skewness (Asimetría) y Kurtosis (Curtosis)
Miden la forma de la distribución.

In [None]:
print(f"Skewness: {stats.skew(edades):.4f} (Cerca de 0 es simétrica)")
print(f"Kurtosis: {stats.kurtosis(edades):.4f} (Positiva = colas pesadas, Negativa = plana)")

## 1.3 Ejercicio: Detección de Outliers
Utiliza el rango intercuartílico (IQR) para detectar outliers en el array `datos_ruidosos`.
Un dato es outlier si $x < Q1 - 1.5 \times IQR$ o $x > Q3 + 1.5 \times IQR$.

In [None]:
datos_ruidosos = np.concatenate([np.random.normal(0, 1, 100), [10, -10]]) # 10 y -10 son outliers

# TO-DO: Calcular Q1, Q3 e IQR
# q1 = np.percentile(datos_ruidosos, 25)
# ...

# TO-DO: Filtrar outliers