In [None]:
import numpy as np
import math
import time
import matplotlib.pyplot as plt
from sklearn import linear_model
import scipy.stats as st

## Mean Squared Error
$MSE(\hat{w})=\frac{1}{N}(y-\hat{\mathbf{w}}^T\mathbf{x})^T(y-\hat{\mathbf{w}}^T\mathbf{x})$

In [12]:
def compute_mse_vectorized(w,X,Y):
    '''This function returns de MSE for a given dataset and coefficients'''
    res = Y - np.dot(X,w)
    totalError = np.dot(res.T,res)
    return totalError / float(len(Y))

## Regressão Logística Vetorizada

In [1]:
def step_gradient_vectorized(w_current, X, Y, alpha):
    '''This function calculates the step gradient using alpha value as stepsize.'''
    w = w_current
    # valores previstos com o vetor de coeficientes atual
    Y_pred = np.dot(X, w)
    res = np.subtract(Y, Y_pred)  # resíduos entre Y observados e Y previstos
    gradient_rss = -2 * np.dot(X.T, res)  # vetor de derivadas parciais
    new_w = np.add(w, alpha * (gradient_rss))
    return [new_w, gradient_rss]

In [15]:
def gradient_ascent_runner_vectorized(starting_w, X, Y, learning_rate, epsilon):
    '''This function returns the coefficients' vector'''
    w = starting_w
    grad = np.array([0, 0, 0, 0])
    i = 0
    while(np.linalg.norm(grad) <= epsilon):
        w, grad = step_gradient_vectorized(w, X, Y, learning_rate)
        if i % 100 == 0:
            print("MSE na iteração {0} é de {1}".format(i, compute_mse_vectorized(w, X, Y)))
            print("grad norm: {0}".format(np.linalg.norm(grad)))
        i += 1
    return w

In [6]:
points = np.genfromtxt("../data/iris.csv", delimiter=",", dtype="str")
points = points[1:]

In [7]:
def predict(Y):
    '''It sets the classes's values to 0 or 1 integers'''
    levels = np.unique(Y)
    resp = np.where(Y == levels[0],0,1)
    return resp

In [9]:
X = points[:,[0,1,2,3]].astype("float")
Y = predict(points[:,[4]])

In [10]:
num_coeficients = X.shape[1]
init_w = np.zeros((num_coeficients,1))

learning_rate = 0.0000001
epsilon = 50000

In [16]:
start_grad_asc_runner_time = time.time()
w = gradient_ascent_runner_vectorized(init_w, X, Y, learning_rate, epsilon)
end_grad_asc_runner_time = time.time()
print('time: {0}'.format(end_grad_asc_runner_time - start_grad_asc_runner_time))

MSE na iteração 0 é de [[ 0.67313843]]
grad norm: 1724.3994896774934
MSE na iteração 100 é de [[ 0.91459236]]
grad norm: 2069.263633011327
MSE na iteração 200 é de [[ 1.26239198]]
grad norm: 2483.798415595421
MSE na iteração 300 é de [[ 1.76361148]]
grad norm: 2981.969000550983
MSE na iteração 400 é de [[ 2.48616545]]
grad norm: 3580.5566690455657
MSE na iteração 500 é de [[ 3.52803532]]
grad norm: 4299.724175500783
MSE na iteração 600 é de [[ 5.03058044]]
grad norm: 5163.694942609583
MSE na iteração 700 é de [[ 7.1977422]]
grad norm: 6201.568987356782
MSE na iteração 800 é de [[ 10.32375012]]
grad norm: 7448.303068342837
MSE na iteração 900 é de [[ 14.8330939]]
grad norm: 8945.88807197932
MSE na iteração 1000 é de [[ 21.3381918]]
grad norm: 10744.763295823219
MSE na iteração 1100 é de [[ 30.72258964]]
grad norm: 12905.515264555153
MSE na iteração 1200 é de [[ 44.26099355]]
grad norm: 15500.918296219184
MSE na iteração 1300 é de [[ 63.79244307]]
grad norm: 18618.38554584991
MSE na iter

In [17]:
# The coefficients
print('Coefficients: \n', w)

Coefficients: 
 [[-1.97584185]
 [-0.98612406]
 [-1.37748492]
 [-0.45383154]]


## Regressão Logística com sklearn

In [28]:
start_sklearn_reg = time.time()
# Create linear regression object
regr = linear_model.LogisticRegression()
# Train the model using the training sets
regr.fit(X, Y)
end_sklearn_reg = time.time()
print('time: {0}'.format(end_sklearn_reg - start_sklearn_reg))
# The coefficients
print('Coefficients: \n', regr.coef_.T)

time: 0.0014178752899169922
Coefficients: 
 [[-0.41359992]
 [-1.4579924 ]
 [ 2.25863103]
 [ 1.02753661]]


  y = column_or_1d(y, warn=True)


In [None]:
###Comparando os Coeficientes

Comparando os coeficientes aprendidos em ambas as abordagens, é possível perceber que os vetores 
são formados por valores baixos, não apresentando problema de altos coeficientes. Entretanto, 
os coeficientes w2 e w3 do sklearn apresentam valores positivos, enquanto que o da solução implementada
possui valores negativos. 