# Regresión lineal de la Diabetes

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from sklearn import datasets
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.model_selection import train_test_split

In [None]:
!python --version

### Importamos el dataset de la librería datasets de sklearn

In [None]:
diabetes = datasets.load_diabetes()

In [None]:
type(diabetes)

In [None]:
type(diabetes.data)

In [None]:
diabetes.data.shape

### Establecemos las variables independientes *x* y dependientes *y*

In [None]:
X = diabetes.data[:,np.newaxis, 2]

In [None]:
y = diabetes.target

### Dividir el data set en conjunto de entrenamiento y conjunto de testing

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2, random_state = 0)

### Crear el modelo de Regresión Lineal Simple con el conjunto de datos de entrenamiento

In [None]:
modelo = LinearRegression()
modelo.fit(X_train, y_train)

In [None]:
modelo.coef_

In [None]:
modelo.intercept_

### El modelo de regresión lineal creado es:

$$\tilde{y} = 981.65543614\cdot x + 152.28824927379625 $$

### Graficar los datos de entrenamiento junto a la recta creada en el modelo de regresión lineal

In [None]:
plt.scatter(X_train, y_train, color = 'black')
plt.plot(X_train, modelo.predict(X_train), color='blue', linewidth=3)
plt.show()

### Cálculo del error cuadrático medio (MSE) de los *y_train* respecto a los *y* del modelo de predicción

$$MSE = \frac{\sum_{i=1}^n(y_i - \tilde{y_i})^2}{n}$$

In [None]:
mean_squared_error(y_train, modelo.predict(X_train))

### Cálculo del coeficiente de determinación (r^2) de los *y_train* respecto a los *y* del modelo de predicción

In [None]:
r2_score(y_train, modelo.predict(X_train))

## Testing

In [None]:
y_pred = modelo.predict(X_test)

### Cálculo del error cuadrático medio (MSE) de los *y_test* respecto a los *y* del modelo de predicción

In [None]:
mean_squared_error(y_test, y_pred)

### Cálculo del coeficiente de determinación (r^2) de los *y_test* respecto a los *y* del modelo de predicción

In [None]:
r2_score(y_test, y_pred)

In [None]:
plt.scatter(X_train, y_train, color = 'black')
plt.scatter(X_test, y_test, color = "red")
plt.plot(X_train, modelo.predict(X_train), color='blue', linewidth=3)
plt.show()