# Regressão Múltipla - Vetorizada

Brunna de Sousa Pereira Amorim

In [29]:
from sklearn import linear_model
import numpy as np
import math
import time

## Versão Vetorizada

### RSS
Temos que o RSS(w) é dado por:

$RSS(w)=(y-Hw)^T(y-Hw)$

In [17]:
def compute_rss(w,X,Y):
    res = Y - np.dot(X,w)
    return (res.transpose().dot(res))

### Gradiente do RSS

Para calcularmos o gradiente do RSS, utilizaremos a seguinte equação:

$∇RSS(w)=−2H^T(y−Hw)$

E, enquanto o gradiente não converge, atualizaremos o vetor de coeficientes usando a seguinte equação:

$w^{(t+1)}=w^{(t)}−\alpha∇RSS(w^{(t)})$

In [18]:
def step_gradient(w_current,X,Y,learningRate):
    res = Y - np.dot(X,w_current)
    gradientRSS = np.dot(-2*(X.T), res)
    new_w = w_current - learningRate * gradientRSS 
    return [new_w,gradientRSS]

In [19]:
def gradient_descent_runner(starting_w, X,Y, learning_rate, epsilon):
    w = starting_w
    grad = np.array([np.inf,np.inf, np.inf, np.inf, np.inf, np.inf])
    while (np.linalg.norm(grad)>=epsilon):
        w,grad = step_gradient(w, X, Y, learning_rate)
    return w

### Execução do algoritmo

In [20]:
data = np.genfromtxt("sample_treino.csv", delimiter=",")
data = np.c_[np.ones(len(data)),data]
X = data[:,[0,1,2,3,4,5]]
Y = data[:,6][:,np.newaxis]

init_w = np.zeros((6,1))
learning_rate = 0.00001
epsilon = 0.000001

print("Começando o gradiente descendente. RSS={0}".format(compute_rss(init_w, X,Y)))
tic = time.time()
w = gradient_descent_runner(init_w, X,Y, learning_rate, epsilon)
toc = time.time()
print("Gradiente descendente convergiu com os coeficientes {0}".format(w))
print("RSS={0}").format(compute_rss(w,X,Y))
print("Versão vetorizada rodou em: " + str(1000*(toc-tic)) + " ms")


Começando o gradiente descendente. RSS=[[ 4794.2359393]]
Gradiente descendente convergiu com os coeficientes [[ 1.7377107 ]
 [ 0.10304145]
 [ 0.04643674]
 [ 0.16409834]
 [ 0.38117847]
 [ 0.02027817]]
RSS=[[ 36.19770785]]
Versão vetorizada rodou em: 21970.0000286 ms


### Coeficientes usando o scikit

In [31]:
regressao = linear_model.LinearRegression()
regressao.fit(X, Y)
print("Coeficientes usando o scikit: {0}".format(regressao.coef_))

Coeficientes usando o scikit: [[ 0.          0.10304143  0.0464367   0.16409834  0.38117843  0.02027816]]
