# 10. Respuesta a preguntas Iniciales

## Variables numéricas

Las variables más relevantes para determinar el precio de las casas del dataset de bicicletas son:

| Variable         | Tipo                     | Qué representa                           | Relevancia en la predicción             | Interpretación práctica                                                              |
| ---------------- | ------------------------ | ---------------------------------------- | --------------------------------------- | ------------------------------------------------------------------------------------ |
| **temp**         | Continua                 | Temperatura normalizada                  | **Muy alta**                            | La demanda aumenta en temperaturas cálidas; es uno de los predictores más fuertes.   |
| **hum**          | Continua                 | Humedad relativa                         | **Alta (negativa)**                     | Alta humedad reduce la demanda; anticipa lluvia e incomodidad.                       |
| **windspeed**    | Continua                 | Velocidad del viento normalizada         | **Baja a moderada**                     | Cambios leves no afectan mucho; vientos fuertes reducen un poco el uso.              |
| **yr**           | Binaria (0=2011, 1=2012) | Tendencia anual                          | **Alta**                                | 2012 tiene mucha mayor demanda que 2011 → crecimiento del sistema.                   |
| **hr_sin**       | Continua (cíclica)       | Codificación senoidal de la hora         | **Muy alta**                            | Captura patrones horarios: picos 8 AM y 5–6 PM.                                      |
| **hr_cos**       | Continua (cíclica)       | Complemento coseno de la hora            | **Muy alta**                            | Completa el ciclo horario; mejora predicción de horas tempranas/tardías.             |
| **weekday_sin**  | Continua (cíclica)       | Ciclo semanal                            | **Moderada**                            | Mayor demanda jueves–sábado; menor los lunes.                                        |
| **day_cos**      | Continua (cíclica)       | Representación alterna del ciclo semanal | **Moderada**                            | Ayuda a capturar patrones suaves entre días consecutivos.                            |
| **mnth_sin**     | Continua (cíclica)       | Estacionalidad mensual                   | **Alta**                                | Mayor uso en verano; menor en invierno.                                              |
| **holiday**      | Binaria                  | 1 si es festivo                          | **Alta**                     | La demanda cambia en festivos; suele ser menor que en fines de semana.               |
| **rush_hour**    | Binaria                  | 1 si hora pico (7–9 AM, 4–6 PM)          | **Muy alta (especialmente Registered)** | Captura el efecto laboral; permite diferenciar commuting vs recreativo.              |
| **season_2**     | Binaria                  | Primavera                                | **Alta**                            | Uso mayor que en invierno, pero menor que verano.                                    |
| **season_3**     | Binaria                  | Verano                                   | **Alta**                                | Estación con mayor demanda del año.                                                  |
| **season_4**     | Binaria                  | Otoño                                    | **Alta**                            | Demanda buena pero menos que verano.                                                 |
| **weathersit_2** | Binaria                  | Clima “nublado/mist”                     | **Moderada**                            | Reduce un poco el uso, pero no tanto como lluvia.                                    |
| **weathersit_3** | Binaria                  | Lluvia ligera / nieve ligera             | **Muy alta (negativa)**                 | Causa una caída fuerte en el uso; es de los predictores más importantes en negativo. |


---





---

En conclusión, aprendimos lo siguiente sobre Métodos lineales:

## 10.1 Regularización


| Característica | **OLS (Mínimos Cuadrados Ordinarios)** | **Ridge (Regresión de cresta)** | **Lasso (Regresión L1)** |
|----------------|------------------------------------------|----------------------------------|---------------------------|
| **Ecuación de optimización** | Minimiza:  ![OLS](https://latex.codecogs.com/svg.image?\min_{\beta}\sum_i(y_i-\hat{y_i})^2) | Minimiza:  ![Ridge](https://latex.codecogs.com/svg.image?\min_{\beta}\sum_i(y_i-\hat{y_i})^2+\lambda\sum_j\beta_j^2) | Minimiza:  ![Lasso](https://latex.codecogs.com/svg.image?\min_{\beta}\sum_i(y_i-\hat{y_i})^2+\lambda\sum_j\|\beta_j\|) |
| **Tipo de penalización** | Sin penalización | Penalización L2 (cuadrática) | Penalización L1 (absoluta) |
| **Objetivo principal** | Ajuste puro a los datos | Reducir la varianza del modelo | Selección de variables y regularización |
| **Efecto de la penalización** | Ninguno | Reduce la magnitud de los coeficientes pero no los elimina | Puede llevar algunos coeficientes exactamente a 0 |
| **Interpretación de coeficientes** | Todos los predictores contribuyen al modelo | Todos contribuyen pero con menor peso | Algunos predictores se eliminan (coef. = 0) |
| **Control de sobreajuste** | Limitado | Bueno (reduce varianza) | Bueno, además realiza selección automática |
| **Dependencia entre predictores** | Sensible a la multicolinealidad | Maneja bien la multicolinealidad | Tiende a seleccionar uno de los predictores correlacionados |
| **Hiperparámetro λ (alpha)** | No aplica | Controla el grado de penalización L2 | Controla el grado de penalización L1 |
| **Valor típico de λ** | — | λ ∈ [10⁻³, 10³], ajustado por validación cruzada | λ ∈ [10⁻³, 10³], ajustado por validación cruzada |
| **Comportamiento con outliers** | Muy sensible | Algo más robusto | Algo más robusto |
| **Uso común** | Modelos explicativos | Modelos predictivos estables | Modelos con selección de características |
| **Ejemplo de uso en `sklearn`** | `LinearRegression()` | `Ridge(alpha=λ)` | `Lasso(alpha=λ)` |

---

## 10.2 Metodos Robustos

| Método                         | Qué estima                                                        | Problemas que corrige                                           | Ventajas                                                                 | Desventajas                                                                                   | Cuándo usarlo                                                                                   |
|--------------------------------|-------------------------------------------------------------------|------------------------------------------------------------------|---------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------|------------------------------------------------------------------------------------------------|
| **OLS clásico**                | Coeficientes y errores estándar bajo supuestos clásicos           | Ninguno (no corrige heterocedasticidad ni autocorrelación)      | Simple, interpretable, eficiente si se cumplen los supuestos             | Sensible a autocorrelación, outliers y heterocedasticidad; errores estándar no confiables     | Como modelo base; datos independientes y homocedásticos                                        |
| **Bootstrap temporal (blocks)**| Distribución empírica de coeficientes y errores                  | Autocorrelación, no normalidad, dependencia temporal             | No requiere supuestos fuertes; robusto; ideal para series temporales     | Computacionalmente costoso; depende del tamaño del bloque                                    | Series temporales; cuando se necesitan intervalos de confianza realistas                        |
| **HAC (Newey-West)**           | Errores estándar robustos a autocorrelación y heterocedasticidad | Autocorrelación de bajo orden; heterocedasticidad               | Fácil de usar; mejora inferencia; mantiene coeficientes OLS              | No corrige sesgo de coeficientes; depende del lag; conservador                                 | Series temporales con autocorrelación moderada; inferencia robusta                              |
| **Huber (M-Estimators)**       | Coeficientes robustos a outliers                                 | Outliers; colas pesadas                                         | Reduce efecto de valores extremos; estable; menos sensible que OLS       | No corrige autocorrelación; puede sesgar si hay fuerte estructura temporal                     | Datos con outliers; clima extremo; demanda atípica por eventos                                 |


## 10.3 Metodos de validación de supuestos

| **Supuesto** | **Método de validación** | **Procedimiento / Estadístico** | **Interpretación esperada (modelo adecuado)** | **Código típico (Python / statsmodels)** |
|---------------|---------------------------|----------------------------------|-----------------------------------------------|------------------------------------------|
| **Linealidad** | Gráfico de residuos vs. valores ajustados | Dispersión aleatoria de los residuos alrededor de 0 | No debe observarse patrón sistemático; los residuos deben distribuirse aleatoriamente | `sns.residplot(x=fitted, y=residuals)` |
| **Homoscedasticidad (varianza constante)** | **Test de Breusch–Pagan** o **White** | \( H_0: \text{varianza constante} \) | p-value > 0.05 → no hay evidencia de heterocedasticidad | `het_breuschpagan(resid, X)` |
| | **Gráfico de residuos vs. ajustados** | Residuos con dispersión uniforme | No debe observarse cono o patrón de expansión | `plt.scatter(fitted, resid)` |
| **Normalidad de errores** | **QQ-Plot (Quantile-Quantile)** | Comparación visual con la distribución normal teórica | Puntos cercanos a la línea diagonal → residuos normales | `sm.qqplot(residuals, line='45')` |
| | **Shapiro-Wilk / Jarque–Bera test** | \( H_0: \text{residuos normales} \) | p-value > 0.05 → normalidad no rechazada | `sm.stats.jarque_bera(resid)` |
| **Independencia de errores (no autocorrelación)** | **Durbin–Watson test** | \( 0 < DW < 4 \), ideal ≈ 2 | Valores cercanos a 2 → sin autocorrelación | `sm.stats.stattools.durbin_watson(resid)` |
| **Multicolinealidad** | **VIF (Variance Inflation Factor)** | \( VIF_j = \frac{1}{1 - R_j^2} \) | VIF < 5 → aceptable, VIF > 10 → colinealidad alta | `variance_inflation_factor(X.values, i)` |

