# Ejercicios Complementarios - Bloque 2: Modelado Avanzado

## Objetivos

Este notebook contiene ejercicios prácticos adicionales para reforzar los conceptos aprendidos en el Bloque 2:

1. **Validación cruzada avanzada**
2. **Ensemble methods**
3. **Análisis de series temporales**
4. **Detección de anomalías**
5. **Validación de modelos en producción**

---

## Ejercicio 1: Validación Cruzada Avanzada

### Objetivos:
- Implementar diferentes tipos de validación cruzada
- Comparar Time Series Split vs K-Fold
- Analizar estabilidad de modelos

### Instrucciones:
1. Implementa validación cruzada con `TimeSeriesSplit`
2. Compara resultados con `KFold` estándar
3. Calcula intervalos de confianza para las métricas
4. Visualiza la estabilidad de los modelos

In [None]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
from sklearn.model_selection import TimeSeriesSplit, KFold, cross_val_score
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error, r2_score
import matplotlib.pyplot as plt
import seaborn as sns

# TODO: Implementar validación cruzada con TimeSeriesSplit
# TODO: Comparar con KFold estándar
# TODO: Calcular intervalos de confianza
# TODO: Crear visualizaciones comparativas

print("Implementa la validación cruzada avanzada aquí...")

## Ejercicio 2: Ensemble Methods

### Objetivos:
- Implementar Voting Regressor
- Crear un Stacking Regressor
- Comparar rendimiento vs modelos individuales

### Instrucciones:
1. Crea un VotingRegressor con 3 modelos diferentes
2. Implementa un StackingRegressor
3. Compara resultados con modelos base
4. Analiza cuándo usar cada método

In [None]:
from sklearn.ensemble import VotingRegressor, StackingRegressor
from sklearn.linear_model import LinearRegression
from sklearn.svm import SVR
from sklearn.tree import DecisionTreeRegressor

# TODO: Crear VotingRegressor
# TODO: Implementar StackingRegressor
# TODO: Comparar rendimiento
# TODO: Analizar ventajas y desventajas

print("Implementa los ensemble methods aquí...")

## Ejercicio 3: Análisis de Series Temporales

### Objetivos:
- Implementar predicción de rendimiento temporal
- Detectar tendencias y estacionalidad
- Usar modelos ARIMA para predicción

### Instrucciones:
1. Crea series temporales de rendimiento de equipos
2. Detecta tendencias usando descomposición
3. Implementa modelo ARIMA
4. Compara con modelos de ML tradicionales

In [None]:
from statsmodels.tsa.arima.model import ARIMA
from statsmodels.tsa.seasonal import seasonal_decompose
from statsmodels.tsa.stattools import adfuller

# TODO: Crear series temporales
# TODO: Descomposición estacional
# TODO: Implementar ARIMA
# TODO: Comparar con modelos ML

print("Implementa el análisis de series temporales aquí...")

## Ejercicio 4: Detección de Anomalías

### Objetivos:
- Implementar detección de partidos anómalos
- Usar Isolation Forest y One-Class SVM
- Analizar impacto en predicciones

### Instrucciones:
1. Implementa Isolation Forest para detectar anomalías
2. Usa One-Class SVM como comparación
3. Visualiza partidos anómalos encontrados
4. Evalúa impacto en modelo predictivo

In [None]:
from sklearn.ensemble import IsolationForest
from sklearn.svm import OneClassSVM
from sklearn.preprocessing import StandardScaler

# TODO: Implementar Isolation Forest
# TODO: Usar One-Class SVM
# TODO: Visualizar anomalías
# TODO: Evaluar impacto en predicciones

print("Implementa la detección de anomalías aquí...")

## Ejercicio 5: Validación de Modelos en Producción

### Objetivos:
- Implementar monitoreo de drift de datos
- Crear alertas de degradación de modelo
- Simular reentrenamiento automático

### Instrucciones:
1. Implementa detección de data drift
2. Crea métricas de monitoreo de modelo
3. Simula degradación de rendimiento
4. Implementa lógica de reentrenamiento

In [None]:
from scipy.stats import ks_2samp
import warnings

# TODO: Implementar detección de data drift
# TODO: Crear métricas de monitoreo
# TODO: Simular degradación
# TODO: Lógica de reentrenamiento

print("Implementa la validación de modelos en producción aquí...")

## 🎯 Actividades Adicionales

### Para Profundizar:

1. **Investigación:** Busca papers sobre ML en deportes y implementa técnicas nuevas
2. **Comparación:** Implementa algoritmos no cubiertos (Neural Networks, LightGBM)
3. **Optimización:** Usa Bayesian Optimization para hiperparámetros
4. **Interpretabilidad:** Implementa LIME además de SHAP
5. **Evaluación:** Crea métricas personalizadas para tu dominio

### Recursos Adicionales:

- [Scikit-learn User Guide](https://scikit-learn.org/stable/user_guide.html)
- [SHAP Documentation](https://shap.readthedocs.io/)
- [MLflow for Model Management](https://mlflow.org/)
- [Optuna for Hyperparameter Optimization](https://optuna.org/)

---

**¡Completa estos ejercicios para reforzar tu comprensión del modelado avanzado!** 💪