In [4]:
# %matplotlib inline
# from IPython.display import HTML
import numpy as np
import pandas as pd
#import matplotlib.pyplot as plt

In [5]:
def compute_cost(thetas, x, y):
    """
    Calcula o erro quadratico medio
    
    Args:
        theta_0 (float): intercepto da reta 
        theta_1 (float): inclinacao da reta
        data (np.array): matriz com o conjunto de dados, x na coluna 0 e y na coluna 1
    
    Retorna:
        float: o erro quadratico medio
    """
    total_cost = 0
    sum_ = np.sum(np.square((thetas[0] + np.sum(np.dot(thetas[1:].T, x.T))) - y))
        
    total_cost = sum_/y.shape[0]

    return total_cost


def get_min_max(x):
    minimo = x.min()
    maximo = x.max()
    amplitude = maximo - minimo
    x = (x - minimo) / amplitude
    return x


def get_derivada(x, y, thetas, derivada_theta):
    derivada_funcao_erro = thetas[0] + np.dot(thetas[1:].T , x.T) - y
    return (2/x.shape[0]) * np.sum(derivada_funcao_erro * derivada_theta)


def step_gradient(thetas_current, x, y, alpha):
    """Calcula um passo em direção ao EQM mínimo
    
    Args:
        theta_0_current (float): valor atual de theta_0
        theta_1_current (float): valor atual de theta_1
        data (np.array): vetor com dados de treinamento (x,y)
        alpha (float): taxa de aprendizado / tamanho do passo 
    
    Retorna:
        tupla: (theta_0, theta_1) os novos valores de theta_0, theta_1
    """
    thetas_updated = []
    for indice in range(thetas_current.shape[0]):
        if indice:
            derivada_theta = 1
        else:
            derivada_theta = x[:, indice]
        derivada = get_derivada(x, y, thetas_current, derivada_theta)
        theta_updated = thetas_current[indice] - (alpha * derivada)
        thetas_updated.append(theta_updated)        
    return np.array(thetas_updated).reshape(len(thetas_updated), 1)

def gradient_descent(x, y, starting_thetas=None, learning_rate=0.0001, num_iterations=10):
    """executa a descida do gradiente
    
    Args:
        data (np.array): dados de treinamento, x na coluna 0 e y na coluna 1
        starting_theta_0 (float): valor inicial de theta0 
        starting_theta_1 (float): valor inicial de theta1
        learning_rate (float): hyperparâmetro para ajustar o tamanho do passo durante a descida do gradiente
        num_iterations (int): hyperparâmetro que decide o número de iterações que cada descida de gradiente irá executar
    
    Retorna:
        list : os primeiros dois parâmetros são o Theta0 e Theta1, que armazena o melhor ajuste da curva. O terceiro e quarto parâmetro, são vetores com o histórico dos valores para Theta0 e Theta1.
    """

    # valores iniciais
    if starting_thetas:
        thetas = np.array(starting_thetas).reshape(x.shape[1]+1, 1)
    else:
        thetas = np.zeros(x.shape[1]+1).reshape(x.shape[1]+1, 1)
    
    # variável para armazenar o custo ao final de cada step_gradient
    cost_graph = []
    
    # vetores para armazenar os valores de Theta0 e Theta1 apos cada iteração de step_gradient (pred = Theta1*x + Theta0)
    thetas_progress = []
    
    # Para cada iteração, obtem novos (Theta0,Theta1) e calcula o custo (EQM)
    num_iterations = num_iterations
    for i in range(num_iterations):
        cost = compute_cost(thetas, x, y)
        cost_graph.append(cost)
        thetas = step_gradient(thetas, x, y, alpha=learning_rate)
        #print(thetas)
        thetas_progress.append(thetas)
        
    return thetas, cost_graph, np.array(thetas_progress).T

In [9]:
atributos_1 = ["GrLivArea", "SalePrice"]
atributos_2 = ["GrLivArea", "OverallQual", "SalePrice"]
atributos_3 = ["GrLivArea", "OverallQual", "OverallCond", "GarageArea", "YearBuilt", "SalePrice"]

In [13]:
data = pd.read_csv("data/house_prices_train.csv")[atributos_1]
x = data.iloc[:,:-1].astype("float").values
y = data.iloc[:,-1].astype("float").values

for i in range(data.shape[1]-1):
    x[:,i] = get_min_max(x[:,i])
y = get_min_max(y)

thetas, cost_graph, thetas_progres = gradient_descent(x, y, learning_rate=0.000001, num_iterations=100)

# #Imprimir parâmetros otimizados
for index, theta in enumerate(thetas):
    print (f'Theta_{index} otimizado: ', theta[0])

# #Imprimir erro com os parâmetros otimizados
print ('Custo minimizado: ', compute_cost(thetas, x, y))

Theta_0 otimizado:  1.0573310728603653e-05
Theta_1 otimizado:  4.055387013484685e-05
Custo minimizado:  0.04810675512793792


In [11]:
data = pd.read_csv("data/house_prices_train.csv")[atributos_2]
x = data.iloc[:,:-1].astype("float").values
y = data.iloc[:,-1].astype("float").values

for i in range(data.shape[1]-1):
    x[:,i] = get_min_max(x[:,i])
y = get_min_max(y)

thetas, cost_graph, thetas_progres = gradient_descent(x, y, learning_rate=0.000001, num_iterations=100)

# #Imprimir parâmetros otimizados
for index, theta in enumerate(thetas):
    print (f'Theta_{index} otimizado: ', theta[0])

# #Imprimir erro com os parâmetros otimizados
print ('Custo minimizado: ', compute_cost(thetas, x, y))

Theta_0 otimizado:  1.0572768241334009e-05
Theta_1 otimizado:  4.055159548398755e-05
Theta_2 otimizado:  4.055159548398755e-05
Custo minimizado:  0.036512622436602866


In [10]:
data = pd.read_csv("data/house_prices_train.csv")[atributos_3]
x = data.iloc[:,:-1].astype("float").values
y = data.iloc[:,-1].astype("float").values

for i in range(data.shape[1]-1):
    x[:,i] = get_min_max(x[:,i])
y = get_min_max(y)

thetas, cost_graph, thetas_progres = gradient_descent(x, y, learning_rate=0.000001, num_iterations=100)

# #Imprimir parâmetros otimizados
for index, theta in enumerate(thetas):
    print (f'Theta_{index} otimizado: ', theta[0])

# #Imprimir erro com os parâmetros otimizados
print ('Custo minimizado: ', compute_cost(thetas, x, y))

Theta_0 otimizado:  1.0571275579870783e-05
Theta_1 otimizado:  4.054507342796464e-05
Theta_2 otimizado:  4.054507342796464e-05
Theta_3 otimizado:  4.054507342796464e-05
Theta_4 otimizado:  4.054507342796464e-05
Theta_5 otimizado:  4.054507342796464e-05
Custo minimizado:  0.015747054774088456


In [8]:
plt.figure(figsize=(10, 6))
plt.plot(cost_graph)
plt.xlabel('No. de interações')
plt.ylabel('Custo')
plt.title('Custo por iteração')
plt.show()