# Regressão Mútipla com NumPy (Vetorizada)

Universidade Federal de Campina Grande<br/>
Programa de Pós-Graduação em Ciência da Computação<br/>
Disciplina: Aprendizagem de Máquina<br/>
Aluno: Ruan Victor Bertoldo Reis de Amorim

In [2]:
from sklearn import linear_model
import numpy as np
import math
import time

### Calculando Residual Sum of Squares:
$RSS(\mathbf{w})=(y-{\mathbf{H}\mathbf{w}})^T(y-{\mathbf{H}\mathbf{w}})$

In [3]:
def compute_rss_vectorized(w, X, Y):
    res = Y - np.dot(X,w)
    totalError = np.dot(res.T,res)
    return totalError

### Calculando Gradiente do RSS:
$\nabla RSS(\mathbf{w})=-2{\mathbf{H}^T}(y-{\mathbf{H}\mathbf{w}})$<br>

### Gradiente Descentente - atualizando vetor de coeficientes:
$\mathbf{w}^{(t + 1)} = \mathbf{w}^t - \alpha \nabla RSS(\mathbf{w}^{(t)})$

In [4]:
def step_gradient_vectorized(w_current, X, Y, learningRate):
    res =  Y - np.dot(X, w_current)
    gradient = np.dot(-2*(X.T), res)
    new_w = w_current - learningRate * gradient
    return [new_w, gradient]

### Iterações do algoritmo

In [5]:
def gradient_descent_runner_vectorized(starting_w, X, Y, learning_rate, epsilon):
    w = starting_w
    gradient = np.array([np.inf,np.inf, np.inf, np.inf, np.inf, np.inf])
#    i = 0
    while (np.linalg.norm(gradient)>=epsilon):
        w, gradient = step_gradient_vectorized(w, X, Y, learning_rate)
#        if i % 1000 == 0:
#            print("MSE na iteração {0} é de {1}".format(i, compute_mse_vectorized(w, X, Y)))
#        i+= 1
    return w

### Ponto inicial - Leitura dos Dados, Configurações e Resultados

In [9]:
points = np.genfromtxt("sample_treino.csv", delimiter=",")
points = np.c_[np.ones(len(points)),points]
X = points[:,[0, 1, 2, 3, 4, 5]]
Y = points[:,6][:,np.newaxis]
init_w = np.zeros((6,1))

learning_rate = 0.00002
epsilon = 0.05

print("Iniciando gradiente descendente com w0 = {0}, w1 = {1}, w2 = {2}, w3 = {3}, w4 = {4}, w5 = {5}, error = {6}"
      .format(init_w[0], init_w[1], init_w[2], init_w[3], init_w[4], init_w[5], compute_rss_vectorized(init_w, X,Y)))
print("Executando...")

tic = time.time()
w = gradient_descent_runner_vectorized(init_w, X, Y, learning_rate, epsilon)
toc = time.time()
print("\nGradiente descendente convergiu com w0 = {0}, w1 = {1}, w2 = {2}, w3 = {3}, w4 = {4}, w5 = {5}, error = {6}".
      format(w[0], w[1], w[2], w[3], w[4], w[5], compute_rss_vectorized(w,X,Y)))
print("\nTempo de Execução: " + str(1000*(toc-tic)) + " ms")


Iniciando gradiente descendente com w0 = [ 0.], w1 = [ 0.], w2 = [ 0.], w3 = [ 0.], w4 = [ 0.], w5 = [ 0.], error = [[ 4794.2359393]]
Executando...

Gradiente descendente convergiu com w0 = [ 1.69701235], w1 = [ 0.1037707], w2 = [ 0.04829923], w3 = [ 0.16400561], w4 = [ 0.38324509], w5 = [ 0.020779], error = [[ 36.1987279]]

Tempo de Execução: 2288.2463932037354 ms


### Coeficientes da Regressão Linear do Scikit Learn

In [10]:
ols = linear_model.LinearRegression()
model = ols.fit(X, Y)
print (model.coef_)

[[ 0.          0.10304143  0.0464367   0.16409834  0.38117843  0.02027816]]


##### O algoritmo funcionou corretamente! Podemos ver que os valores dos coeficientes encontrados são muito próximos ao do Scikit Learn, com exceção do coeficiente w0.