# 6.4.2 QuantileRegressor

In [1]:
%load_ext autoreload
%autoreload 2

In [2]:
import numpy as np
from sklearn.linear_model import QuantileRegressor


import warnings
warnings.filterwarnings("ignore")

Este regresor estima la mediana u otros cuartiles de $y$ condicionales sobre $X$, mientras que los mínimos cuadrados ordinarios (OLS) estima la media condicional. <br>
Este modelo lineal da la predicción $\hat{y}(w, X) = Xw $ para el q-ésimo cuartial, con $q \ \epsilon \ (0,1)$. <br>
Los coeficientes son obtenidos con la siguiente función objetivo:

$$ min_w \frac{1}{n_{samples}} \sum_{i}^{} PB_q (y_i − X_i w) + \alpha ∗ ||w||_1 $$ 

$PB$ se define como:

$$  
PB_q(t) = q_{max}(t,0) + (1−q)_{max}(−t,0) =
\begin{cases}
    t & \text{si} t > 0 \\
    0 & \text{si} t = 0 \\
    (q-1)t & \text{si} t < 0
\end{cases}
$$

Es un regresor robusto a outliers. <br>
Se usa para pronosticar los intervalos en vez de la media (predicción puntual), ya que en muchos casos, los intervalos son calculados suponiendo que el error sigue una distribución normal con media cero y varianza constante. <br>
Permite pronosticar intervalos para errores con varianza no constante o que no siguen una distribución normal.

In [3]:
n_samples, n_features = 10, 2
rng = np.random.RandomState(0)

y = rng.randn(n_samples)
X = rng.randn(n_samples, n_features)

In [4]:
estimator = QuantileRegressor(
    # -------------------------------------------------------------------------
    # The quantile that the model tries to predict. It must be strictly between
    # 0 and 1. If 0.5 (default), the model predicts the 50% quantile, i.e. the
    # median.
    quantile=0.5,
    # -------------------------------------------------------------------------
    # Regularization constant that multiplies the L1 penalty term.
    alpha=1.0,
    # -------------------------------------------------------------------------
    # Whether or not to fit the intercept.
    fit_intercept=True,
    # -------------------------------------------------------------------------
    # Method used by scipy.optimize.linprog to solve the linear programming
    # formulation.
    # * 'highs-ds'
    # * 'highs-ipm'
    # * 'highs'
    # * 'interior-point'
    # * 'revised simplex'
    solver='interior-point',
    # -------------------------------------------------------------------------
    # Additional parameters passed to scipy.optimize.linprog as options. If
    # None and if solver='interior-point', then {"lstsq": True} is passed to
    # scipy.optimize.linprog for the sake of stability.
    solver_options=None,
)
estimator.fit(X, y)

In [5]:
estimator.coef_

array([ 4.45409994e-14, -1.83417568e-13])

In [6]:
estimator.intercept_

0.7194722439589483

In [7]:
print('ok_')

ok_
