#**Ejemplo básico con solución matricial**

In [None]:
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy as np

In [2]:
mydata = {'x1':[1,-2,5,0,-4,2,3],
          'x2':[4,2,-3,5,7,-1,-5],
          'x3':[2,4,1,3,-2,-3,-4],
          'y':[5,-10,15,-1,-5,12,20]}

In [None]:
df = pd.DataFrame(mydata)
df.head(7)

In [None]:
df.corr(method='pearson')

###**Definimos la matriz de los datos de entrada X (variables independientes) y la de la variable de salida Y (variable dependiente):**

In [5]:
x = df[['x1','x2','x3']]
y = df[['y']]

In [None]:
x.head()

In [None]:
y.head()

###**Agregamos la columna de 1s:**

In [None]:
Xones = sm.add_constant(x)
Xones.head()

In [None]:
np.asarray(Xones)

## Usando librería:

In [None]:
model = sm.OLS(y, Xones).fit()
print(model.summary())

###**Usamos el Coeficiente de Correlación de Pearson para evaluar el desempeño del modelo:**

In [None]:
predictions = model.predict(Xones) 
np.corrcoef(predictions, y.T)

In [None]:
print(predictions)
print(y)

#**Matricialmente**

In [None]:
Xplus = np.linalg.pinv(Xones)  # matriz inversa de Moore-Penrose

###**O bien, la obtenemos mediante productos matriciales, la matriz de Moore-Penrose:**

$(X^T * X)^{-1} * X^T$

In [None]:
mp = np.matmul(np.linalg.inv(np.matmul(np.array(Xones.T), np.array(Xones))), Xones.T)
mp

###**Coeficientes de regresión:**


$\hat{\beta} = (X^T * X)^{-1} * X^T * Y$

In [None]:
beta = np.matmul(np.array(mp), np.array(y))
beta

###**Es decir, la ecuación de regresión es:**

$\hat{y} = 2.9405 + 3.0837x_1 + 0.18803x_2 - 1.6945x_3$

#**Predicciones:**

In [None]:
print(np.matmul(np.array(Xones), np.array(beta)))
print(predictions)


###**Suma de Cuadrados**

In [None]:
SSE = np.sum(np.power(predictions - y.values.reshape(7,), 2), axis=0)
SSE

In [None]:
Syy =  np.sum(np.power(y.values - np.mean(y.values), 2))
Syy

In [None]:
R2 = 1 - SSE/Syy
R2

In [None]:
N = x.shape[0]
k = x.shape[1]

R2_ajustada = 1 - (N-1)*(1-R2) / (N-k-1)
R2_ajustada