<a href="https://colab.research.google.com/github/financieras/math_for_ai/blob/main/estadistica/temario_estadistica.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🧭 **Programa de Estadística para Data Science y Machine Learning**

---

## **BLOQUE 1. Fundamentos y Estadística Descriptiva**

**Objetivo:** Comprender los tipos de datos, su descripción y visualización inicial.

1. **Tema 1.** Conceptos básicos: población, muestra, variables, tipos y escalas de medición.
2. **Tema 2.** Medidas de tendencia central: media, mediana, moda.
3. **Tema 3.** Medidas de dispersión: rango, varianza, desviación estándar, coeficiente de variación.
4. **Tema 4.** Medidas de posición y forma: percentiles, cuartiles, asimetría y curtosis.
5. **Tema 5.** Estadística bivariante: covarianza, correlación (Pearson, Spearman).
6. **Tema 6.** Visualización y análisis exploratorio de datos (EDA): histogramas, boxplots, scatter plots, outliers.

---

## **BLOQUE 2. Probabilidad y Distribuciones**

**Objetivo:** Entender la incertidumbre y las distribuciones que modelan fenómenos aleatorios.

1. **Tema 1.** Conceptos de probabilidad: espacio muestral, eventos, independencia, probabilidad condicional.
2. **Tema 2.** Teorema de Bayes e interpretación práctica.
3. **Tema 3.** Variables aleatorias: discretas y continuas, funciones de probabilidad y densidad.
4. **Tema 4.** Distribuciones discretas: Bernoulli, Binomial, Poisson.
5. **Tema 5.** Distribuciones continuas: Uniforme, Normal, Exponencial, t-Student, Chi-cuadrado, F.
6. **Tema 6.** Esperanza, varianza, covarianza y Teorema del Límite Central.

---

## **BLOQUE 3. Inferencia Estadística**

**Objetivo:** Extraer conclusiones sobre poblaciones a partir de muestras.

1. **Tema 1.** Muestreo y sesgos: métodos de muestreo y error muestral.
2. **Tema 2.** Distribuciones muestrales y estimadores (insesgados, eficientes, consistentes).
3. **Tema 3.** Intervalos de confianza para medias y proporciones.
4. **Tema 4.** Pruebas de hipótesis: hipótesis nula/alternativa, p-valor, errores tipo I y II.
5. **Tema 5.** Tests paramétricos: t-test, ANOVA.
6. **Tema 6.** Tests no paramétricos: chi-cuadrado, Mann-Whitney, Kruskal-Wallis.

---

## **BLOQUE 4. Modelos Estadísticos y Regresión**

**Objetivo:** Modelar relaciones entre variables y sentar las bases de los algoritmos de ML.

1. **Tema 1.** Correlación vs causalidad.
2. **Tema 2.** Regresión lineal simple: estimación por mínimos cuadrados, interpretación, supuestos.
3. **Tema 3.** Regresión múltiple: multicolinealidad, selección de variables, diagnóstico de residuos.
4. **Tema 4.** Regresión logística: clasificación binaria, odds ratio, métricas básicas (precisión, recall, F1).
5. **Tema 5.** Regularización: Ridge, Lasso y Elastic Net.
6. **Tema 6.** Modelos lineales generalizados (GLM): visión general.

---

## **BLOQUE 5. Métodos de Validación y Evaluación de Modelos**

**Objetivo:** Aplicar principios estadísticos para evaluar y validar modelos predictivos.

1. **Tema 1.** Partición de datos: train/test/validation, muestreo estratificado.
2. **Tema 2.** Validación cruzada (K-fold, Leave-One-Out).
3. **Tema 3.** Bootstrapping y Jackknife: remuestreo y estimación de incertidumbre.
4. **Tema 4.** Métricas de evaluación: MSE, RMSE, MAE, R², ROC, AUC, Precision-Recall.
5. **Tema 5.** Sesgo, varianza, overfitting y underfitting.

---

## **BLOQUE 6. Análisis Multivariante y Series Temporales**

**Objetivo:** Analizar datos complejos y dependientes del tiempo.

1. **Tema 1.** Análisis de componentes principales (PCA) y reducción de dimensionalidad.
2. **Tema 2.** Clustering: K-means, clustering jerárquico, evaluación de clústeres.
3. **Tema 3.** Análisis factorial y discriminante.
4. **Tema 4.** Series temporales: componentes, estacionariedad, autocorrelación.
5. **Tema 5.** Modelos ARIMA y su interpretación.

---

## **BLOQUE 7. Enfoque Bayesiano y Aplicaciones en ML**

**Objetivo:** Comprender la inferencia bayesiana y su papel en Machine Learning.

1. **Tema 1.** Paradigma bayesiano vs frecuentista.
2. **Tema 2.** Distribuciones a priori, verosimilitud y posterior.
3. **Tema 3.** Inferencia bayesiana y ejemplos simples.
4. **Tema 4.** Clasificador Naive Bayes y aplicaciones prácticas.
5. **Tema 5.** Introducción a MCMC y herramientas como PyMC.


# 🧭 **Programa de Estadística para Data Science y Machine Learning**

---

## **BLOQUE 1. Fundamentos y Estadística Descriptiva**

**Objetivo:** Comprender los tipos de datos, su descripción y visualización inicial.

---

### **Tema 1. Conceptos básicos: población, muestra, variables, tipos y escalas de medición**

* **Lección 1.1.** ¿Qué es la estadística? Ramas descriptiva e inferencial.
* **Lección 1.2.** Conceptos fundamentales: población, muestra, parámetro y estadístico.
* **Lección 1.3.** Tipos de estudios: observacional vs experimental.
* **Lección 1.4.** Tipos de variables: cualitativas, cuantitativas discretas y continuas.
* **Lección 1.5.** Escalas de medición: nominal, ordinal, de intervalo y de razón.
* **Lección 1.6.** Organización y presentación de datos: tablas de frecuencias y porcentajes.
* **Lección 1.7.** Introducción al análisis de datos con Python (pandas y numpy).

---

### **Tema 2. Medidas de tendencia central: media, mediana, moda**

* **Lección 2.1.** Concepto y utilidad de las medidas de tendencia central.
* **Lección 2.2.** Cálculo de la media aritmética, ponderada y geométrica.
* **Lección 2.3.** Cálculo e interpretación de la mediana.
* **Lección 2.4.** Moda: definición, tipos y limitaciones.
* **Lección 2.5.** Comparación entre media, mediana y moda (efecto de valores atípicos).
* **Lección 2.6.** Implementación en Python: funciones `mean()`, `median()`, `mode()`.

---

### **Tema 3. Medidas de dispersión: rango, varianza, desviación estándar, coeficiente de variación**

* **Lección 3.1.** Concepto de dispersión y su importancia.
* **Lección 3.2.** Cálculo e interpretación del rango y rango intercuartílico (IQR).
* **Lección 3.3.** Varianza y desviación estándar: significado y fórmulas.
* **Lección 3.4.** Coeficiente de variación y su interpretación relativa.
* **Lección 3.5.** Relación entre dispersión y estabilidad de datos.
* **Lección 3.6.** Cálculo con Python: `var()`, `std()`, `quantile()`.

---

### **Tema 4. Medidas de posición y forma: percentiles, cuartiles, asimetría y curtosis**

* **Lección 4.1.** Concepto de posición relativa en un conjunto de datos.
* **Lección 4.2.** Percentiles y cuartiles: interpretación y cálculo.
* **Lección 4.3.** Diagramas de caja y bigotes (boxplots).
* **Lección 4.4.** Asimetría (skewness): tipos e interpretación.
* **Lección 4.5.** Curtosis: leptocúrtica, mesocúrtica y platicúrtica.
* **Lección 4.6.** Cálculo e interpretación práctica con Python.

---

### **Tema 5. Estadística bivariante: covarianza, correlación (Pearson, Spearman)**

* **Lección 5.1.** Concepto de relación entre dos variables.
* **Lección 5.2.** Covarianza: fórmula e interpretación.
* **Lección 5.3.** Coeficiente de correlación de Pearson.
* **Lección 5.4.** Correlación de Spearman (rangos).
* **Lección 5.5.** Diferencias entre correlación y causalidad.
* **Lección 5.6.** Matriz de correlaciones y mapa de calor en Python (Seaborn/Matplotlib).

---

### **Tema 6. Visualización y análisis exploratorio de datos (EDA): histogramas, boxplots, scatter plots, outliers**

* **Lección 6.1.** Importancia del EDA en Data Science.
* **Lección 6.2.** Histogramas y densidades: forma y dispersión de la distribución.
* **Lección 6.3.** Diagramas de caja, violín y barras.
* **Lección 6.4.** Gráficos de dispersión (scatter plots) y relación entre variables.
* **Lección 6.5.** Detección de outliers: métodos z-score e IQR.
* **Lección 6.6.** Herramientas de visualización en Python: Matplotlib, Seaborn, Plotly.
* **Lección 6.7.** Proyecto práctico: análisis exploratorio de un dataset real (ej. Iris o Titanic).

---

## **BLOQUE 2. Probabilidad y Distribuciones**

**Objetivo:** Entender la incertidumbre y las distribuciones que modelan fenómenos aleatorios.

---

### **Tema 1. Conceptos de probabilidad: espacio muestral, eventos, independencia, probabilidad condicional**

* **Lección 1.1.** Concepto de experimento aleatorio y espacio muestral.
* **Lección 1.2.** Eventos y operaciones entre eventos (unión, intersección, complemento).
* **Lección 1.3.** Definiciones clásica, frecuentista y axiomática de probabilidad.
* **Lección 1.4.** Propiedades básicas de la probabilidad.
* **Lección 1.5.** Independencia y dependencia de eventos.
* **Lección 1.6.** Probabilidad condicional y regla de la multiplicación.
* **Lección 1.7.** Ejercicios prácticos con Python y simulaciones (lanzamiento de dados y monedas).

---

### **Tema 2. Teorema de Bayes e interpretación práctica**

* **Lección 2.1.** Idea fundamental del razonamiento bayesiano.
* **Lección 2.2.** Derivación y enunciado del Teorema de Bayes.
* **Lección 2.3.** Probabilidad total y árboles de probabilidad.
* **Lección 2.4.** Aplicaciones prácticas: diagnóstico médico, detección de spam.
* **Lección 2.5.** Simulación del Teorema de Bayes en Python.

---

### **Tema 3. Variables aleatorias: discretas y continuas, funciones de probabilidad y densidad**

* **Lección 3.1.** Concepto de variable aleatoria y su función de probabilidad.
* **Lección 3.2.** Función de distribución acumulada (FDA).
* **Lección 3.3.** Diferencias entre variables discretas y continuas.
* **Lección 3.4.** Cálculo de esperanza, varianza y desviación típica.
* **Lección 3.5.** Representación gráfica de distribuciones discretas y continuas.
* **Lección 3.6.** Implementación en Python: `numpy.random` y `scipy.stats`.

---

### **Tema 4. Distribuciones discretas: Bernoulli, Binomial, Poisson**

* **Lección 4.1.** Distribución de Bernoulli: definición y propiedades.
* **Lección 4.2.** Distribución Binomial: probabilidad de éxitos y función de masa.
* **Lección 4.3.** Distribución Poisson: conteo de eventos raros.
* **Lección 4.4.** Relación entre Binomial y Poisson.
* **Lección 4.5.** Aplicaciones prácticas: defectos en producción, llegadas en colas.
* **Lección 4.6.** Simulación y visualización en Python.

---

### **Tema 5. Distribuciones continuas: Uniforme, Normal, Exponencial, t-Student, Chi-cuadrado, F**

* **Lección 5.1.** Distribución Uniforme: definición y ejemplos.
* **Lección 5.2.** Distribución Normal: propiedades y regla del 68–95–99,7%.
* **Lección 5.3.** Tipificación y uso de la distribución normal estándar.
* **Lección 5.4.** Distribución Exponencial: tiempo entre eventos y memoria sin efecto.
* **Lección 5.5.** Distribuciones t-Student, Chi-cuadrado y F: usos en inferencia.
* **Lección 5.6.** Aplicaciones prácticas en Python y comparación de distribuciones.

---

### **Tema 6. Esperanza, varianza, covarianza y Teorema del Límite Central**

* **Lección 6.1.** Esperanza matemática y propiedades lineales.
* **Lección 6.2.** Varianza y covarianza: interpretación y fórmulas.
* **Lección 6.3.** Propiedades de la varianza de combinaciones lineales.
* **Lección 6.4.** Ley de los grandes números.
* **Lección 6.5.** Teorema del Límite Central: enunciado e importancia en estadística.
* **Lección 6.6.** Demostración empírica del Teorema del Límite Central con Python (simulaciones).

---

## **BLOQUE 3. Inferencia Estadística**

**Objetivo:** Extraer conclusiones sobre poblaciones a partir de muestras.

---

### **Tema 1. Muestreo y sesgos: métodos de muestreo y error muestral**

* **Lección 1.1.** Concepto de muestreo y necesidad de inferencia.
* **Lección 1.2.** Población, marco muestral y muestra representativa.
* **Lección 1.3.** Tipos de muestreo: aleatorio simple, sistemático, estratificado, por conglomerados.
* **Lección 1.4.** Tamaño muestral y error muestral.
* **Lección 1.5.** Sesgos de selección y no respuesta.
* **Lección 1.6.** Simulación del proceso de muestreo con Python.

---

### **Tema 2. Distribuciones muestrales y estimadores (insesgados, eficientes, consistentes)**

* **Lección 2.1.** Concepto de distribución muestral.
* **Lección 2.2.** Distribución muestral de la media y de la proporción.
* **Lección 2.3.** Propiedades de los estimadores: insesgadez, eficiencia, consistencia.
* **Lección 2.4.** Errores estándar y su interpretación.
* **Lección 2.5.** Ejemplos prácticos de distribuciones muestrales con Python.

---

### **Tema 3. Intervalos de confianza para medias y proporciones**

* **Lección 3.1.** Concepto de intervalo de confianza y nivel de confianza.
* **Lección 3.2.** Intervalo de confianza para una media (σ conocida y desconocida).
* **Lección 3.3.** Intervalo de confianza para una proporción.
* **Lección 3.4.** Intervalos de confianza para diferencia de medias y proporciones.
* **Lección 3.5.** Interpretación práctica y errores comunes.
* **Lección 3.6.** Cálculo en Python con `scipy.stats` y comparación visual.

---

### **Tema 4. Pruebas de hipótesis: hipótesis nula/alternativa, p-valor, errores tipo I y II**

* **Lección 4.1.** Fundamentos de la prueba de hipótesis: H₀ y H₁.
* **Lección 4.2.** Tipos de errores (I y II) y potencia de una prueba.
* **Lección 4.3.** Estadístico de prueba y regiones de rechazo.
* **Lección 4.4.** Valor p e interpretación correcta.
* **Lección 4.5.** Procedimiento paso a paso para realizar un test de hipótesis.
* **Lección 4.6.** Ejercicios prácticos en Python: prueba de medias y proporciones.

---

### **Tema 5. Tests paramétricos: t-test, ANOVA**

* **Lección 5.1.** Supuestos de los tests paramétricos.
* **Lección 5.2.** Prueba t para una muestra y para dos muestras independientes.
* **Lección 5.3.** Prueba t pareada (muestras relacionadas).
* **Lección 5.4.** ANOVA de un factor: hipótesis, estadístico F e interpretación.
* **Lección 5.5.** Comparaciones múltiples (Tukey HSD).
* **Lección 5.6.** Implementación práctica con `scipy.stats` y `statsmodels`.

---

### **Tema 6. Tests no paramétricos: chi-cuadrado, Mann-Whitney, Kruskal-Wallis**

* **Lección 6.1.** Cuándo usar tests no paramétricos.
* **Lección 6.2.** Test chi-cuadrado de independencia y de bondad de ajuste.
* **Lección 6.3.** Prueba de Mann-Whitney U (dos muestras independientes).
* **Lección 6.4.** Prueba de Kruskal-Wallis (más de dos muestras).
* **Lección 6.5.** Comparación entre métodos paramétricos y no paramétricos.
* **Lección 6.6.** Aplicaciones en Python con `scipy.stats`.

---

## **BLOQUE 4. Modelos Estadísticos y Regresión**

**Objetivo:** Modelar relaciones entre variables y realizar predicciones mediante técnicas de regresión.

---

### **Tema 1. Concepto de modelo estadístico y ajuste de modelos**

* **Lección 1.1.** Qué es un modelo estadístico y su papel en el análisis de datos.
* **Lección 1.2.** Tipos de modelos: deterministas vs. probabilísticos.
* **Lección 1.3.** Etapas del modelado estadístico.
* **Lección 1.4.** Medidas de ajuste: error cuadrático medio, R² y R² ajustado.
* **Lección 1.5.** Overfitting y underfitting: diagnóstico y prevención.
* **Lección 1.6.** Evaluación de modelos con datos de entrenamiento y prueba.

---

### **Tema 2. Regresión lineal simple**

* **Lección 2.1.** Concepto y ecuación del modelo lineal simple.
* **Lección 2.2.** Estimación de parámetros por mínimos cuadrados.
* **Lección 2.3.** Interpretación de coeficientes y significado del intercepto.
* **Lección 2.4.** Supuestos del modelo lineal.
* **Lección 2.5.** Diagnóstico de residuos: homocedasticidad, normalidad, independencia.
* **Lección 2.6.** Implementación en Python con `scikit-learn` y `statsmodels`.

---

### **Tema 3. Regresión lineal múltiple**

* **Lección 3.1.** Extensión del modelo a múltiples variables explicativas.
* **Lección 3.2.** Multicolinealidad y su detección (VIF).
* **Lección 3.3.** Selección de variables: métodos hacia adelante, hacia atrás y stepwise.
* **Lección 3.4.** Evaluación del modelo múltiple: R² ajustado y AIC/BIC.
* **Lección 3.5.** Interacción entre variables y términos polinómicos.
* **Lección 3.6.** Ejemplo práctico completo en Python.

---

### **Tema 4. Regresión logística y modelos para variables categóricas**

* **Lección 4.1.** Concepto y función sigmoide.
* **Lección 4.2.** Odds, log-odds y probabilidad.
* **Lección 4.3.** Estimación de parámetros por máxima verosimilitud.
* **Lección 4.4.** Evaluación del modelo: matriz de confusión, precisión, recall, F1-score.
* **Lección 4.5.** Curva ROC y AUC.
* **Lección 4.6.** Implementación práctica con `scikit-learn`.

---

### **Tema 5. Diagnóstico y validación de modelos**

* **Lección 5.1.** Supuestos y problemas comunes: multicolinealidad, outliers, leverage.
* **Lección 5.2.** Métodos de validación cruzada (k-fold, leave-one-out).
* **Lección 5.3.** Regularización: Ridge, Lasso y Elastic Net.
* **Lección 5.4.** Comparación de modelos mediante métricas de error.
* **Lección 5.5.** Interpretación de resultados y comunicación de modelos.
* **Lección 5.6.** Ejercicios prácticos integrados con `scikit-learn`.

---

## **BLOQUE 5. Análisis Multivariante**

**Objetivo:** Analizar relaciones simultáneas entre múltiples variables y reducir la dimensionalidad de los datos.

---

### **Tema 1. Introducción al análisis multivariante**

* **Lección 1.1.** Qué es el análisis multivariante y su importancia en Data Science.
* **Lección 1.2.** Tipos de variables y estructuras de datos multivariantes.
* **Lección 1.3.** Matriz de datos y matriz de covarianzas/correlaciones.
* **Lección 1.4.** Escalado y normalización de variables.
* **Lección 1.5.** Visualización multivariante: pairplots, mapas de calor y gráficos 3D.
* **Lección 1.6.** Ejemplo introductorio en Python con `pandas` y `seaborn`.

---

### **Tema 2. Análisis de Componentes Principales (PCA)**

* **Lección 2.1.** Motivación y fundamentos matemáticos del PCA.
* **Lección 2.2.** Autovalores y autovectores: interpretación geométrica.
* **Lección 2.3.** Varianza explicada y selección del número de componentes.
* **Lección 2.4.** Proyección de los datos en los componentes principales.
* **Lección 2.5.** Visualización de resultados: biplot y scree plot.
* **Lección 2.6.** Implementación práctica con `scikit-learn` y `matplotlib`.

---

### **Tema 3. Análisis de Factores (FA)**

* **Lección 3.1.** Diferencias entre PCA y Análisis Factorial.
* **Lección 3.2.** Modelo factorial común y comunalidades.
* **Lección 3.3.** Métodos de extracción: componentes principales, máxima verosimilitud.
* **Lección 3.4.** Rotación de factores: Varimax, Promax.
* **Lección 3.5.** Interpretación de factores y cargas factoriales.
* **Lección 3.6.** Ejemplo práctico con `factor_analyzer` en Python.

---

### **Tema 4. Análisis de Conglomerados (Clustering)**

* **Lección 4.1.** Concepto de agrupamiento y medidas de similitud/distancia.
* **Lección 4.2.** Métodos jerárquicos: dendrogramas y linkage.
* **Lección 4.3.** Métodos no jerárquicos: K-means y K-medoids.
* **Lección 4.4.** Determinación del número óptimo de clusters (Elbow, Silhouette).
* **Lección 4.5.** Visualización y análisis de clusters.
* **Lección 4.6.** Aplicación práctica con `scikit-learn`.

---

### **Tema 5. Análisis Discriminante y Reducción de Dimensionalidad Supervisada**

* **Lección 5.1.** Concepto de análisis discriminante lineal (LDA).
* **Lección 5.2.** Funciones discriminantes y separación de grupos.
* **Lección 5.3.** Comparación LDA vs PCA.
* **Lección 5.4.** Análisis discriminante cuadrático (QDA).
* **Lección 5.5.** Aplicación de LDA y QDA a conjuntos de datos reales.
* **Lección 5.6.** Implementación con `scikit-learn` y comparación de rendimiento.

---

### **Tema 6. Técnicas avanzadas y aplicaciones en Machine Learning**

* **Lección 6.1.** Reducción de dimensionalidad no lineal: t-SNE, UMAP.
* **Lección 6.2.** Clustering jerárquico avanzado y DBSCAN.
* **Lección 6.3.** Detección de outliers multivariantes.
* **Lección 6.4.** Combinación de PCA y clustering.
* **Lección 6.5.** Visualización de datos de alta dimensión.
* **Lección 6.6.** Casos prácticos en Python con datasets del mundo real.

---

## **BLOQUE 6. Series Temporales y Análisis Predictivo**

**Objetivo:** Analizar datos que varían en el tiempo, identificar patrones y construir modelos predictivos basados en series temporales.

---

### **Tema 1. Fundamentos de series temporales**

* **Lección 1.1.** Qué es una serie temporal y su importancia en Data Science.
* **Lección 1.2.** Componentes de una serie: tendencia, estacionalidad, ciclo y ruido.
* **Lección 1.3.** Tipos de series: aditivas y multiplicativas.
* **Lección 1.4.** Visualización y descomposición de series en Python (`statsmodels`).
* **Lección 1.5.** Transformaciones y limpieza de datos temporales.
* **Lección 1.6.** Resampling y manejo de fechas con `pandas`.

---

### **Tema 2. Análisis exploratorio de series temporales**

* **Lección 2.1.** Autocorrelación y función de autocorrelación parcial (ACF y PACF).
* **Lección 2.2.** Identificación de patrones estacionales.
* **Lección 2.3.** Estacionariedad y pruebas de raíz unitaria (ADF, KPSS).
* **Lección 2.4.** Diferenciación y transformación logarítmica.
* **Lección 2.5.** Correlogramas y diagnóstico visual.
* **Lección 2.6.** Ejemplo práctico de análisis exploratorio con Python.

---

### **Tema 3. Modelos clásicos: AR, MA, ARMA, ARIMA, SARIMA**

* **Lección 3.1.** Introducción a los procesos autoregresivos y de medias móviles.
* **Lección 3.2.** Modelos ARMA y su formulación matemática.
* **Lección 3.3.** Modelos ARIMA: integración y diferenciación.
* **Lección 3.4.** Modelos SARIMA: estacionalidad y parámetros (p,d,q)(P,D,Q,s).
* **Lección 3.5.** Selección de modelos mediante AIC y BIC.
* **Lección 3.6.** Implementación práctica con `statsmodels` y predicción futura.

---

### **Tema 4. Modelos avanzados: Prophet, VAR y GARCH**

* **Lección 4.1.** Introducción al modelo Prophet (Facebook).
* **Lección 4.2.** Modelado multivariante con VAR y VARMAX.
* **Lección 4.3.** Modelos GARCH para volatilidad financiera.
* **Lección 4.4.** Comparación entre modelos ARIMA, Prophet y VAR.
* **Lección 4.5.** Evaluación de precisión: MAPE, RMSE, MAE.
* **Lección 4.6.** Casos prácticos de predicción económica y de demanda.

---

### **Tema 5. Forecasting y validación de modelos temporales**

* **Lección 5.1.** Separación de datos en entrenamiento y validación temporal.
* **Lección 5.2.** Validación cruzada para series (TimeSeriesSplit).
* **Lección 5.3.** Backtesting y rolling forecast origin.
* **Lección 5.4.** Interpretación y comunicación de predicciones.
* **Lección 5.5.** Integración de predicciones en dashboards o pipelines ML.
* **Lección 5.6.** Proyecto práctico de forecasting con Python.

---

### **Tema 6. Introducción al Deep Learning para series temporales**

* **Lección 6.1.** Limitaciones de los modelos clásicos.
* **Lección 6.2.** Redes neuronales recurrentes (RNN) y su arquitectura.
* **Lección 6.3.** LSTM y GRU para predicción de series.
* **Lección 6.4.** Preparación de datos secuenciales con `TensorFlow/Keras`.
* **Lección 6.5.** Evaluación y comparación con modelos tradicionales.
* **Lección 6.6.** Ejemplo práctico de predicción con LSTM.

---

## **BLOQUE 7. Técnicas de Muestreo Avanzadas y Bootstrapping**

**Objetivo:** Profundizar en técnicas modernas de muestreo, estimación por remuestreo y sus aplicaciones en la inferencia estadística y el aprendizaje automático.

---

### **Tema 1. Repaso y fundamentos del muestreo**

* **Lección 1.1.** Conceptos clave: población, muestra, error muestral y sesgo.
* **Lección 1.2.** Ventajas y limitaciones del muestreo clásico.
* **Lección 1.3.** Revisión de métodos de muestreo aleatorio y estratificado.
* **Lección 1.4.** Problemas prácticos de representatividad en grandes datos.
* **Lección 1.5.** Introducción al remuestreo y su motivación.
* **Lección 1.6.** Ejemplos de muestreo con `numpy` y `pandas`.

---

### **Tema 2. Técnicas de remuestreo: Jackknife, Bootstrap y Permutaciones**

* **Lección 2.1.** Idea general del remuestreo: generar nuevas muestras a partir de los datos observados.
* **Lección 2.2.** Método Jackknife: estimación del sesgo y la varianza.
* **Lección 2.3.** Método Bootstrap: concepto, fundamentos teóricos y ventajas.
* **Lección 2.4.** Bootstrapping paramétrico y no paramétrico.
* **Lección 2.5.** Pruebas de permutación y su aplicación en contrastes de hipótesis.
* **Lección 2.6.** Implementación de remuestreo con `scipy` y `sklearn.utils.resample`.

---

### **Tema 3. Aplicaciones del Bootstrap en inferencia estadística**

* **Lección 3.1.** Estimación de intervalos de confianza por Bootstrapping.
* **Lección 3.2.** Estimación del error estándar y sesgo de un estimador.
* **Lección 3.3.** Comparación entre métodos bootstrap y aproximaciones normales.
* **Lección 3.4.** Visualización de distribuciones bootstrap.
* **Lección 3.5.** Ejemplo práctico: estimar la media y la mediana con Bootstrap.
* **Lección 3.6.** Casos de uso en Data Science (muestreo en datasets grandes).

---

### **Tema 4. Validación estadística mediante remuestreo**

* **Lección 4.1.** Validación cruzada y su relación con el Bootstrap.
* **Lección 4.2.** Bootstrap .632 y su uso en modelos predictivos.
* **Lección 4.3.** Bagging: relación entre Bootstrap y modelos de ensamblado.
* **Lección 4.4.** Comparación de modelos mediante remuestreo.
* **Lección 4.5.** Métricas de estabilidad de modelos y estimadores.
* **Lección 4.6.** Implementación práctica en `scikit-learn`.

---

### **Tema 5. Técnicas avanzadas de muestreo en Big Data**

* **Lección 5.1.** Submuestreo aleatorio y estratificado en datasets grandes.
* **Lección 5.2.** Muestreo ponderado y muestreo por importancia.
* **Lección 5.3.** Muestreo secuencial y adaptativo.
* **Lección 5.4.** Reservoir sampling y algoritmos eficientes para flujos de datos.
* **Lección 5.5.** Uso de muestreo en pipelines de Machine Learning.
* **Lección 5.6.** Ejemplo práctico con datos masivos simulados en Python.

---

### **Tema 6. Aplicaciones integradas y casos prácticos**

* **Lección 6.1.** Bootstrapping aplicado a regresión lineal y logística.
* **Lección 6.2.** Estimación de intervalos de predicción por remuestreo.
* **Lección 6.3.** Validación de modelos ensemble con bagging y random forest.
* **Lección 6.4.** Bootstrap en estimaciones bayesianas aproximadas.
* **Lección 6.5.** Comparación empírica: muestreo tradicional vs Bootstrap.
* **Lección 6.6.** Proyecto final: construcción de un estimador bootstrap personalizado en Python.

---




