# **Testando os Modelos de Regressão - Machine Learning 11**

### Bibliotecas

In [1]:
# Libs
import numpy as np
import pandas as pd

### Base de Dados

In [2]:
# Função de carregamento de dados
def carregarDados(arquivo):
    ds = pd.read_csv(arquivo, sep=';')
    # Amostra
    X = ds.iloc[:,:-1].values
    # Variável independente 
    y = ds.iloc[:,-1].values
    return X, y, ds

### Gráfico

In [3]:
# Função de Plotar gráfico
def plotarGraph(X_Points, y_Points, X_Line, y_Line):
    import matplotlib.pyplot as plt
    plt.scatter(X_Points, y_Points, color='red')
    plt.plot(X_Line, y_Line, color='blue')
    plt.title("Comparando pontos reais com a reta produzida pela regressão de floresta randômica.")
    plt.xlabel("Experiéncia em anos")
    plt.ylabel("Salário")
    plt.show()

### Regressão Linear

In [4]:
# Função do Algorítimo de Regressão
def regressaoLinear(X, y):
    from sklearn.linear_model import LinearRegression
    regressor = LinearRegression()
    regressor.fit(X, y)

    return regressor

### Regressão Polinomial 

In [5]:
# Função de regressão linear
def regressaoLinearPolinomial(X, y, d):
    from sklearn.preprocessing import PolynomialFeatures
    polynomial_Features = PolynomialFeatures(degree = d)
    X_Polynomial = polynomial_Features.fit_transform(X)
    
    from sklearn.linear_model import LinearRegression
    polLinear_Regression = LinearRegression()
    polLinear_Regression.fit(X_Polynomial, y)

    return X_Polynomial, polLinear_Regression

### Regressão de Árvore de Decisão

In [6]:
#  Função de Regressão de Árvore de Decisão
def regressaoArvoreDecisao(X, y):
    from sklearn.tree import DecisionTreeRegressor

    regressorTree = DecisionTreeRegressor(random_state=42)
    regressorTree.fit(X, y)

    return regressorTree

### Regressão Floresta Aleatória

In [7]:
#  Função de Regressão de Floresta Randômica
def regressaoArvoreRandomica(X, y, n_Avores):
    from sklearn.ensemble import RandomForestRegressor

    regressoFloresta = RandomForestRegressor(n_estimators=n_Avores)
    regressoFloresta.fit(X, y)

    return regressoFloresta

### Rodando Todas as Funções

In [8]:
# Função que roda todas as funções
def rodarRegressao(dados):
    from sklearn.metrics import r2_score
    X, y, csv = carregarDados(dados)

    regressor = regressaoLinear(X, y)
    XPoly, polyLinearRegressor = regressaoLinearPolinomial(X, y, 4)
    regressorTree = regressaoArvoreDecisao(X, y)
    regressoFloresta = regressaoArvoreRandomica(X, y, 30)


    print(f'Regressão Linear: {r2_score(y, regressor.predict(X))}')
    print(f'Regressão Linear Polinomial: {r2_score(y, polyLinearRegressor.predict(XPoly))}')
    print(f'Regressão Árvore Decisão: {r2_score(y, regressorTree.predict(X))}')
    print(f'Regressão Árvore Randomica: {r2_score(y, regressoFloresta.predict(X))}')

### Resultados Finais 

In [9]:
# Rodando as Funções
rodarRegressao('../data/salary.csv')

Regressão Linear: 0.9569566641435086
Regressão Linear Polinomial: 0.9636560599375091
Regressão Árvore Decisão: 0.9976748641432848
Regressão Árvore Randomica: 0.9917873337796747
