# C210 - Exemplo de Regressão

### Conjuntos de dados disponíveis no SKL:
https://scikit-learn.org/stable/modules/classes.html#module-sklearn.datasets

In [None]:
# importacao e carregamento do dataset
from sklearn import datasets
diabetes_X, diabetes_y = datasets.load_diabetes(return_X_y=True)

In [None]:
# usar somente a primeira caracteristica
import numpy as np
diabetes_X = diabetes_X[:, np.newaxis, 2]

In [None]:
# separacao dos dados em subconjuntos de treinamento e teste
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(diabetes_X, diabetes_y, test_size=0.25)

### Modelos de aprendizado supervisionado (ex.: classificação e regressão) disponíveis no SKL:
https://scikit-learn.org/stable/supervised_learning.html

In [None]:
# importacao, criacao e treinamento do regressor
from sklearn import linear_model
regr = linear_model.LinearRegression()
regr = regr.fit(X_train, y_train)

In [None]:
# coeficientes obtidos pelo algoritmo
print('Coefficients: \n', regr.coef_)

In [None]:
# apresentacao de dados desconhecidos
y_pred = regr.predict(X_test)

In [None]:
# visualizacao dos resultados
import matplotlib.pyplot as plt
plt.rcParams['figure.dpi'] = 200
plt.scatter(X_test, y_test,  color='black')
plt.plot(X_test, y_pred, color='blue', linewidth=3)

### Métricas de regressão disponíveis no SKL:
https://scikit-learn.org/stable/modules/model_evaluation.html#regression-metrics

In [None]:
# metricas para avaliacao do modelo
from sklearn.metrics import mean_squared_error, r2_score
print('Mean squared error: %.2f' % mean_squared_error(y_test, y_pred))
print('Coefficient of determination: %.2f' % r2_score(y_test, y_pred))

##### Referências:
https://scikit-learn.org/stable/auto_examples/linear_model/plot_ols.html#sphx-glr-auto-examples-linear-model-plot-ols-py