# Regressão Múltipla do Zero

Importar Bibliotecas Numpy e LinearRegression, para comparação com a versão implementada do zero

In [1]:
from sklearn.linear_model import LinearRegression
import numpy as np

Função para calcular a norma dos vetores (L2):

$||\mathbf{w}||_2 = \sqrt{w^T*w}$

In [2]:
def compute_norma(gradient):
    return np.sqrt(np.dot(gradient.T,gradient))

Função para calcular o MSE (Mean Squared Error):

$MSE(\hat{w})=\frac{1}{N}(y-\hat{\mathbf{w}}^T\mathbf{x})^T(y-\hat{\mathbf{w}}^T\mathbf{x})$

In [3]:
def compute_mse_vectorized(w,X,Y):
    res = Y - np.dot(X,w)
    totalError = np.dot(res.T,res)
    return totalError / float(len(Y))

Função para fazer uma atualização dos parâmetros no Gradiente Descendente:

$w_M = w_M + 2\alpha\sum_{i=1}^N x_i(y_i - (w_0+w_1x_i))$

In [4]:
def step_gradient_vectorized(w_current,X,Y,learningRate):
    m = np.size(w_current,0)
    res = Y - np.dot(X,w_current)
    gradient = np.zeros((m,1))
    w = np.zeros((m,1))
    gradient = np.sum(np.multiply(res,X),axis=0)[:,np.newaxis]
    w = w_current + (2 * learningRate * gradient)
    return [w,gradient]

Função para iterar sobre o gradiente descendente até convergência.

In [21]:
def gradient_descent_runner_vectorized(w, X,Y, learning_rate, epsilon):
	i = 0
	norma = float('inf')
	while (norma>=epsilon):
		[w,gradient] = step_gradient_vectorized(w, X, Y, learning_rate)
		norma = compute_norma(gradient)
		if i % 10000 == 0:
			print("MSE na iteração {0} é de {1}".format(i,compute_mse_vectorized(w, X, Y)))
			print("epsilon na iteração {0} é de {1}".format(i,norma))
		i+= 1
	print("MSE na iteração final {0} é de {1}".format(i,compute_mse_vectorized(w, X, Y)))    
	print("epsilon na iteração final {0} é de {1}".format(i,norma))
	return w

Leitura e separação dos dados

In [22]:
points = np.genfromtxt("sample_treino.csv", delimiter=",", skip_header=1);
points = np.c_[np.ones(len(points)),points];
X = points[:,0:5];
Y = points[:,6][:,np.newaxis];

Inicialização dos coeficientes, taxa de aprendizagem e limiar de parada

In [23]:
init_w = np.zeros((5,1));
learning_rate = 0.00004;
epsilon = 0.0001

Chamada do algoritmo de Regressão Múltipla do Zero e retorno dos coeficientes

In [24]:
w_do_zero = gradient_descent_runner_vectorized(init_w, X,Y, learning_rate, epsilon)
print("Os coeficientes obtidos na Regressão Múltipla do Zero são: \n {0}".format(w_do_zero))

MSE na iteração 0 é de [[ 30.83908673]]
epsilon na iteração 0 é de [[ 10195.06808199]]
MSE na iteração 10000 é de [[ 0.42003011]]
epsilon na iteração 10000 é de [[ 0.67116604]]
MSE na iteração 20000 é de [[ 0.4148794]]
epsilon na iteração 20000 é de [[ 0.40462411]]
MSE na iteração 30000 é de [[ 0.41300738]]
epsilon na iteração 30000 é de [[ 0.24393467]]
MSE na iteração 40000 é de [[ 0.41232699]]
epsilon na iteração 40000 é de [[ 0.14706025]]
MSE na iteração 50000 é de [[ 0.41207971]]
epsilon na iteração 50000 é de [[ 0.08865783]]
MSE na iteração 60000 é de [[ 0.41198983]]
epsilon na iteração 60000 é de [[ 0.05344891]]
MSE na iteração 70000 é de [[ 0.41195717]]
epsilon na iteração 70000 é de [[ 0.03222261]]
MSE na iteração 80000 é de [[ 0.41194529]]
epsilon na iteração 80000 é de [[ 0.01942596]]
MSE na iteração 90000 é de [[ 0.41194098]]
epsilon na iteração 90000 é de [[ 0.01171128]]
MSE na iteração 100000 é de [[ 0.41193941]]
epsilon na iteração 100000 é de [[ 0.00706035]]
MSE na itera

Chamada do algoritmo de Regressão Múltipla do SKLEARN e retorno dos coeficientes

In [25]:
clf = LinearRegression()
clf.fit(X,Y)
w_sklearn = clf.coef_.T
w_sklearn[0,0] = clf.intercept_
print("Os coeficientes obtidos na Regressão Múltipla do sklearn são: \n {0}".format(w_sklearn))

Os coeficientes obtidos na Regressão Múltipla do sklearn são: 
 [[ 1.79001712]
 [ 0.10676596]
 [ 0.04638034]
 [ 0.16818839]
 [ 0.3835391 ]]


Função para calcular o MSE (Mean Squared Error) entre os coeficientes de ambos os métodos:

$MSE=\frac{1}{N}(wdozero - wsklearn)^T*(wdozero - wsklearn)$

In [26]:
def compute_mse_coefs(w_dozero, w_sklearn):
    res = w_dozero - w_sklearn
    totalError = np.dot(res.T,res)
    return totalError / float(len(w_dozero))
print("A diferença entre o os vetores que representam os coeficientes de ambas as abordagens é: \n {0}".format(compute_mse_coefs(w_do_zero,w_sklearn)))

A diferença entre o os vetores que representam os coeficientes de ambas as abordagens é: 
 [[  4.99756719e-09]]


A diferença entre os vetores de coeficientes é desprezível. Dessa forma, o código do zero é equivalente ao da biblioteca SKLEARN