# Imports

In [60]:
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
import pandas as pd
import numpy as np
import math
import time

# Regressão Linear Múltipla (SciKit):

In [61]:
def skl(x, y):
    #Create model
    lr_model = LinearRegression()
    
    #Train model
    lr_model.fit(x, y)
    
    print(lr_model.intercept_[0])
    #Estimated coefficients by feature0
    for c in lr_model.coef_[0]:
        print(c)

In [62]:
def run_skl(dataset):
    
    #Read dataset
    data = pd.read_csv(dataset)
    
    #Load data
    x = pd.DataFrame(data[['d1', 'd2', 'd3', 'd4', 'd5']]).values
    y = pd.DataFrame(data[['cra']]).values
    
    #Coefficients
    skl(x, y)

Execução do modelo e exibição dos coeficiêntes pós-treino:

In [63]:
run_skl('sample_treino.csv')

1.7377115137944346
0.10304143246259938
0.04643670085073448
0.1640983441916584
0.3811784266558143
0.020278157624843585


# Regressão Linear Múltipla (MMQ):

In [64]:
def mmq(x, y):
    
    x = np.insert(x, 0, 1, axis=1)
    x_t = np.transpose(x)
    xt_x = np.dot(x_t, x)
    inverse_xt_x = np.linalg.inv(xt_x)
    xt_y = np.dot(x_t, y)
    
    for c in np.dot(inverse_xt_x, xt_y):
        print(c[0])

In [65]:
def run_rlm(dataset):
    
    #Read dataset
    data = pd.read_csv(dataset)
    
    #Load data
    x = pd.DataFrame(data[['d1', 'd2', 'd3', 'd4', 'd5']]).values
    y = pd.DataFrame(data[['cra']]).values
    
    #Coefficients
    mmq(x, y)

Execução do modelo e exibição dos coeficiêntes pós-treino:

In [66]:
run_rlm('sample_treino.csv')

1.737711513795034
0.10304143246257702
0.04643670085070717
0.16409834419164326
0.381178426655822
0.020278157624844084


# Regressão Linear Múltipla (Gradient )

In [67]:
def compute_mse_vectorized(w,X,Y):
    res = Y - np.dot(X,w)
    totalError = np.dot(res.T,res)
    return totalError / float(len(Y))

In [68]:
def step_gradient_vectorized(w_current,X,Y,learningRate):
    res = Y - np.dot(X, w_current)
    grad = np.multiply(-2/len(X), np.dot(X.T, res))
    new_w = np.zeros((len(grad),1))
    for i in range(len(grad)):
        new_w[i,0] = w_current[i] - (grad[i] * learningRate)
    return [new_w,grad]

In [69]:
def gradient_descent_runner_vectorized(starting_w, X,Y, learning_rate, epsilon):
    w = starting_w
    grad = np.array([np.inf,np.inf, np.inf,np.inf,np.inf,np.inf])
    i = 0
    while (np.linalg.norm(grad)>=epsilon):
        w,grad = step_gradient_vectorized(w, X, Y, learning_rate)
        i+= 1
    return w

In [70]:
def run_rlmm(dataset, learning_rate, epsilon):
    points = np.genfromtxt(dataset, delimiter=",", skip_header=1)
    points = np.c_[np.ones(len(points)),points]
    X = points[:,:6]
    Y = points[:,6][:,np.newaxis]
    init_w = np.zeros((6,1))
    learning_rate = learning_rate
    epsilon = epsilon
    w = gradient_descent_runner_vectorized(init_w, X,Y, learning_rate, epsilon)
    for c in w:
        print(c[0])

In [71]:
run_rlmm('sample_treino.csv', 0.001, 0.1)

0.05540834611679614
0.14437956504218688
0.16036210570877774
0.17744115771034352
0.3946597366556146
0.05140574150577698


In [72]:
run_rlmm('sample_treino.csv', 0.001, 0.01)

1.0213914155883619
0.11587685689400858
0.07921795385284058
0.16246624065890286
0.41755245720676426
0.02909314040028249


In [73]:
run_rlmm('sample_treino.csv', 0.001, 0.001)

1.666078888090045
0.10432498594149059
0.04971485433588941
0.16393513243511848
0.384815860984883
0.021159663481408245


In [74]:
run_rlmm('sample_treino.csv', 0.001, 0.0001)

1.7305482893779969
0.10316978712682381
0.04676451445319279
0.16408202310293654
0.3815421681512983
0.020366307740979743


Neste exercício foram implementadas três formas para calcular os coeficiêntes para o modelo de regressão linear múltipla. O primeiro são os resultados obtidos pela api do SciKit Learn, o segundo a forma fechada (MMP) e o terceiro uma versão baseada no gradiente considerando taxa de aprendizagem e crtério de convergência.

Como podemos obervar, os resultados do SciKit Learn e da fórmula fechada são bastante próximos, no entanto, os resultados obtidos pela versão considerando o gradiente apresentou valores bastante distintos para os coeficiêntes encontrados considerando a taxa de aprendizagem = 0.001 e convergência = 0.1. Porém, a medida com que fomos diminuindo a convergência, os valores foram se aproximando dos encontreados na duas primeiras soluções.