## Introducción al Machine Learning 
### Regresión Lineal Simple

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

In [None]:
import pickle

In [None]:
with open('../data/stock_data.pkl', 'rb') as handle:
    stock_data = pickle.load(handle)

with open('../data/benchmark_data.pkl', 'rb') as handle:
    benchmarks = pickle.load(handle)

### Estimar la $\beta$ del modelo CAPM

El modelo CAPM dice en equilibrio el retorno esperado de un activo de riesgo es 

$E(R_i) = R_f + \beta_i(R_m - R_f)$

Donde la $\beta_i$ corresponde a una prima ajustada al riesgo de mercado de dicho activo.
Esta $\beta_i$ podemos estimarla como una tarea de regresión lineal simple a partir de los
rendimientos de un índice de mercado y del activo en cuestión. Por simplicidad, dado la circunstancia de tipos de interés asumiremos $R_f=0.0$

___


### Ejemplo 

Seires OHLC de Telefonica y el IBEX

In [None]:
tef_data = stock_data['TEF'].loc['2019-01-02':]
ibex_data = benchmarks['ibex'].loc['2019-01-02':]

In [None]:
tef_ret = np.log(tef_data.close).diff()
ibex_ret = np.log(ibex_data.close).diff()

In [None]:
print(tef_ret.shape)
print(ibex_ret.shape)

#### Regresión Lineal con sklearn


In [None]:
from sklearn.linear_model import LinearRegression

In [None]:
X = ibex_ret.dropna().values.reshape(-1,1) 
Y = tef_ret.dropna().values.reshape(-1,1)

In [None]:
lmodel = LinearRegression()
lmodel.fit(X, Y)

La Beta corresponde al coeficiente de la regresión

In [None]:
beta = lmodel.coef_[0][0]
beta

Nube de puntos y linea de regresión correspondiente

In [None]:
ptos_x = np.array([np.min(X)*1.2, np.max(X)*1.2])
ptos_y = beta*ptos_x

In [None]:
ptos_y

In [None]:
plt.scatter(X,Y)
plt.plot(ptos_x, ptos_y, 'r')

La función score devuelve el R^2

In [None]:
r_sqr = lmodel.score(X,Y)
r_sqr

R^2 ajustado

In [None]:
adj_r_sqr = 1 - (1-lmodel.score(X, Y))*(Y.shape[0]-1)/(Y.shape[0]-X.shape[1]-1)
adj_r_sqr

Gráfica de los residuos

In [None]:
Y_hat = beta * X
res = Y - Y_hat
plt.scatter(X, res)
plt.grid()