# Regressão Linear Simples

### Descrição:
Nesse notebook iremos desenvolver e executar um simples algoritmo de Regressão Linear. Utilizaremos um modelo linear simples, como já explicado, e um dataset de dados artificialmente gerados (para facilitar a visualização do funcionamento do algoritmo.

A Regressão Linear é um algoritmo de Machine Learning (dos mais simples) que se propõe a predizer valores em um espaço contínuo. O produto de tal algoritmo é justamente um conjunto de parâmetros que definem um Modelo que determinamos. A aplicação de valores diretamente neste modelo, utilizando os parâmetros que foram "aprendidos" no treinamento, constituem uma predição de dados realizadas a partir desse treinamento.

<b> Obs.: </b> todas as matrizes/vetores utilizados na fundamentação teórica são consideradas como Vetores-Colunas. A implementação pode diferir um pouco dessa convenção.


## Bibliotecas e Configurações

In [1]:
# -*- coding: utf-8 -*-
%matplotlib qt5

# Libraries
import numpy as np 
import matplotlib.pyplot as plt

## Modelo Linear

Na célula abaixo, iremos programar a função responsável por calcular e retornar uma aplicação do nosso modelo linear:

$$ h(\theta) = \theta_{0}+\theta_{1}X_{1} $$

Perceba que, por simplificação e otimização, podemos representar essa operação matricialmente da forma:

$$ h(\theta) = \begin{bmatrix} \theta_{0} \\ \theta_{1} \end{bmatrix}^{T} \times \begin{bmatrix} 1 \\ X_{1} \end{bmatrix} = \begin{bmatrix} \theta_{0} & \theta_{1} \end{bmatrix} \times \begin{bmatrix} 1 \\ X_{1} \end{bmatrix}  = \theta^{T}X $$

In [2]:
# Definição da Função para o Modelo Linear
def h_theta(x, theta):
    ''' Apply the Linear Model for features X and parameters theta '''
    return np.dot(np.transpose(theta), x)

# Teste da Função: h([5;2]) = 5+2X
testX = np.array([[1,1,1],
                  [3,4,9]])

testTheta = np.array([[5],
                      [2]])

print("Prediction:", h_theta(testX, testTheta))

Prediction: [[11 13 23]]


## Função de Custo

Na célula abaixo, definimos uma função que calcula e retorna o custo total das nossas predições, isto é, o cálculo do erro total do treinamento. A função que utilizaremos pode ser arbitrária (apenas nos permite ter uma melhor visualização do treinamento, mas não influencia o mesmo).

Nesse algoritmo, utilizaremos a Soma dos Resíduos Quadráticos (um dos seus muitos nomes):

$$ J(\theta) = \frac{1}{m} \sum (h(\theta) - y)^{2} $$

In [3]:
# Definição da Função de Erro
def errorFunction(errors):
    ''' Calculate the Least Square Error '''
    return (1 / np.size(errors)) * np.sum(errors ** 2) 

# Teste da Função
errors = np.array([5., 4., 4., 3., 2.])
print("Custo Total:", errorFunction(errors))

Custo Total: 14.0


## Programa Principal (Regressão Linear)

No programa principal, iremos programar a Regressão Linear propriamente dita.
Dividimos o código em três partes:

### Part 1: Data Pre-Processing

Nesse trecho, iremos nos preocupar em carregar e organizar o dataset que utilizaremos no treinamento. É nesse momento, também, que iremos declarar e separar as variáveis que definem o Conjunto de Atributos, o Conjunto de Saída e os Parâmetros do Modelo, além dos Hiperparâmetros de Treinamento. Iremos seguir a convenção de considerar todos os exemplares como vetores-colunas. No entanto, o numpy não nos permite facilmente modificar essa informação para o Conjunto de Saída, e o mesmo continuará como vetor-linha (sem muito prejuízo). Iremos criar, também um vetor para armazenar o Histórico de Erros do treinamento (por motivos de visualização).

Iremos utilizar o dataset <i>data1.txt</i> localizado na pasta <i>datasets/</i>. Teremos as seguintes matrizes:

$$
    X = \begin{bmatrix} 1 & 1 & \cdots & 1 \\  X_{1}^{(1)} & X_{1}^{(2)} & \cdots & X_{1}^{(m)}  \end{bmatrix};\   \theta = \begin{bmatrix} \theta_{0} \\ \theta_{1}\end{bmatrix};\  Y = \begin{bmatrix} Y^{(1)} & Y^{(2)} & \cdots & Y^{(m)} \end{bmatrix}
$$

### Part 2: Linear Regression Training

Para cada época até a convergência (ou até atingir o limite máximo definido pelo Hiperparâmetro) iremos realizar o Treinamento da Regressão Linear. Os passos serão os seguintes:

1. Calculamos o vetor de predição "Y_pred", como resultado da predição do Modelo para os parâmetros daquela época;
2. Utilizando "Y_pred", calculamos os erros de acordo com o a matriz real "Y";
3. Concatenamos o Custo Total do erro calculado no Histórico de Erros;
4. Realizamos, para cada parâmetro, o Gradiente Descendente para estimar os novos valores dos parâmetros;
5. Imprimimos os resultados do treino a cada 500 épocas;
6. Verificamos uma possível convergência do treino, e paremos o mesmo caso seja verificado;

### Part 3: Data Plotting and Training Results

Ao fim do treinamento, iremos plotar duas figuras para avaliar o resultado final do nosso algoritmo. A <b>Figura 1</b> irá apenas exibir os atributos do Dataset. A <b>Figura 2</b> irá exibir a função estimada pelo nosso Modelo Linear, além do Histórico de Erros dado as épocas até convergência.

In [4]:
# Main Function
if __name__=='__main__':
    
    ###############################
    # Part 1: Data Pre-Processing #
    ###############################
    # Loads the data
    data = np.loadtxt("datasets/cricketData.txt")
    
    n_examples = np.size(data,0)
    n_features = np.size(data,1)
    
    # Define the model parameters
    x = np.array([np.ones(n_examples), data[:, 0]])
    y = data[:, 1]
    theta = np.zeros([np.size(x, 0), 1])
    
    # Defines the hyperparameters and training measurements
    alfa = 0.005
    max_epochs = 500000
    
    error_hist = np.zeros([max_epochs])
    epsilon = 0.01
    
    ######################################
    # Part 2: Linear Regression Training #
    ######################################
    for epochs in range(max_epochs):
        # Calculate the error vector from the current Model
        y_pred = h_theta(x, theta)
        error = y_pred - y

        # Append new Least Square Error to History
        error_hist[epochs] = errorFunction(error)

        # Perform Gradient Descent
        for j in range(n_features):
            theta[j] = theta[j] - (alfa/n_examples) * np.sum(error * x[j,:])

        # Prints training status at each 100 epochs
        if(epochs % 500 == 0):
            print("###### Epoch", epochs, "######")
            print("Error:", error_hist[epochs])
            print("Thetas:\n", theta)
            print("")
        
        # Evaluate convergence and stops training if so
        if(abs(error_hist[epochs] - error_hist[epochs-50]) <= epsilon):
            print("Gradient Converged!!!\nStopping at epoch", epochs)
            print("###### Epoch", epochs, "######")
            print("Error:", error_hist[epochs])
            print("Thetas:\n", theta)
            print("")
            break
            
    #############################################
    # Part 3: Data Plotting and Training Result #
    #############################################
    # First Figure: Dataset plotting
    plt.figure(1)
    
    plt.title("Influence of Temperature on Cricket Chirp Rate")
    plt.xlabel("Rate of Cricket Chirping")
    plt.ylabel("Temperature (ºF)")
    
    plt.grid()
    plt.plot(x[1,:], y, 'rx')
    
    plt.show()
    
    # Second Figure: Training results
    plt.figure(2)
    
    plt.subplot(1,2,1)
    plt.title("Linear Regression Function Prediction\n(Black=ModelPrediction)")
    plt.xlabel("Rate of Cricket Chirping")
    plt.ylabel("Temperature (ºF)")
    
    plt.grid()
    plt.plot(x[1,:], y, 'rx', x[1,:], h_theta(x, theta)[0,:], 'k-')
    
    plt.subplot(1,2,2)
    plt.title("Error History")
    plt.xlabel("Epochs")
    plt.ylabel("Least Square Error")
    
    plt.grid()
    plt.plot(error_hist[:epochs], "g-")
    
    plt.show()
    
#__

###### Epoch 0 ######
Error: 6341.89466667
Thetas:
 [[ 0.39673333]
 [ 6.61924   ]]

###### Epoch 500 ######
Error: 18.9429261624
Thetas:
 [[ 0.83402521]
 [ 4.72611325]]

###### Epoch 1000 ######
Error: 18.7129721891
Thetas:
 [[ 1.36917352]
 [ 4.6941285 ]]

###### Epoch 1500 ######
Error: 18.4940619613
Thetas:
 [[ 1.89131324]
 [ 4.66292124]]

###### Epoch 2000 ######
Error: 18.2856650932
Thetas:
 [[ 2.40076058]
 [ 4.63247259]]

###### Epoch 2500 ######
Error: 18.0872766714
Thetas:
 [[ 2.89782407]
 [ 4.60276409]]

###### Epoch 3000 ######
Error: 17.8984160312
Thetas:
 [[ 3.38280474]
 [ 4.57377776]]

###### Epoch 3500 ######
Error: 17.7186255924
Thetas:
 [[ 3.85599631]
 [ 4.54549604]]

###### Epoch 4000 ######
Error: 17.5474697504
Thetas:
 [[ 4.31768535]
 [ 4.5179018 ]]

###### Epoch 4500 ######
Error: 17.384533821
Thetas:
 [[ 4.76815147]
 [ 4.49097834]]

###### Epoch 5000 ######
Error: 17.2294230356
Thetas:
 [[ 5.20766748]
 [ 4.46470934]]

###### Epoch 5500 ######
Error: 17.0817615845
Th