<a href="https://colab.research.google.com/github/andrehochuli/teaching/blob/main/%5BESPEC%5D%20Fundamentos%20Aprendizagem%20M%C3%A1quina/T%C3%B3pico%2006%20-%20Regress%C3%A3o/Topico_06_Regress%C3%A3o.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Regressão

A regressão é uma técnica de aprendizado de máquina que busca prever valores contínuos com base em dados históricos. Ela é frequentemente utilizada em problemas de previsão, como preços de ações, vendas de produtos, ou até mesmo a temperatura. A regressão pode ser realizada usando vários algoritmos, incluindo o K-Nearest Neighbors (KNN), Support Vector Machines (SVM), Árvores de Decisão e Multi-Layer Perceptron (MLP).

Durante este tutorial, iremos utilizar o MSE como uma das métricas de avaliação de nossos modelos de regressão

#Dataset California House Pricing

Previsão de Valores de Casas


In [None]:
import pandas as pd
pd.set_option('display.width', 200)
pd.set_option('display.max_columns', None)  # mostra todas as colunas

import numpy as np
np.set_printoptions(linewidth=200)

from sklearn.datasets import fetch_california_housing
# Carrega o conjunto de dados
california = fetch_california_housing()

print(california.DESCR)



In [None]:
print(california.data.shape)
# Cria um DataFrame do Pandas com os dados e os nomes das colunas
df = pd.DataFrame(california.data, columns=california.feature_names)

# Adiciona a coluna de valores alvo ao DataFrame
df['Target'] = california.target*100000

In [None]:
df

#Modelos de Regressão

In [None]:
from sklearn.preprocessing import StandardScaler

scaler = StandardScaler()
data = scaler.fit_transform(california.data)

print(california.data[0])
print(data[0])

##KNN

In [None]:
from sklearn.model_selection import train_test_split

print(data.shape)
california.target*=100000
X_train, X_test, y_train, y_test = train_test_split(data, california.target, test_size=0.3,
                                                    random_state=0)

print(X_train.shape,X_test.shape)

In [None]:
from sklearn.neighbors import KNeighborsRegressor


#instanciando meu modelo
knn = KNeighborsRegressor(n_neighbors=3)

#treino
knn.fit(X_train,y_train)


In [None]:
#test
resp = knn.predict(X_test)
print(resp)

In [None]:
for i in range(0,20):
  print(X_test[i],y_test[i],resp[i])


#Erro Quadrático Médio (MSE)

In [None]:
from sklearn.metrics import mean_squared_error
import numpy as np

mse = mean_squared_error(y_test, resp)
print(mse)
print(np.sqrt(mse)) #rmse


##Comparativo entre os classificadores

In [None]:
from sklearn.svm import SVR
from sklearn.tree import DecisionTreeRegressor
from sklearn.neural_network import MLPRegressor
knn = KNeighborsRegressor(n_neighbors=7)
dt = DecisionTreeRegressor(criterion='poisson')
mlp = MLPRegressor(hidden_layer_sizes=(5,), activation='logistic')
svr = SVR()

for clf_names, clf in zip(['KNN','DT','MLP','SVR'],[knn,dt,mlp,svr]):
  clf.fit(X_train,y_train)
  y_pred = clf.predict(X_test)
  mse = mean_squared_error(y_test, y_pred)
  print(clf_names, np.sqrt(mse))