## Regressão Linear

![](../images/linear-regression-gradient_descent_example.gif)

In [1]:
import numpy as np

A função abaixo implementa a formula de calculo da distância (erro) entre a linha plotada e o data point.

![Erro Regressão Linear](../images/linear-regression-error1.png)

X e Y são data points (Pontos no gráfico)

M é o declive/angulo da linha

N é o tamanho do dataset

B é a interseção de Y (pesquisar mais a respeito)

In [2]:
def compute_error_for_line_given_points(b, m, points):
    totalError = 0
    # Itera de 0 ao tamanho (numero de linhas) de points
    for i in range(0, len(points)):
        x = points[i, 0] # Obtem o valor da 1ª coluna na linha i
        y = points[i, 1] # Obtem o valor da 2ª coluna na linha i
        totalError += (y - (m * x + b)) ** 2
    return totalError / float(len(points))

A função abaixo itera (loop) a quantidade de vezes que a orientamos (num_iterations) para otimizar os valores de B e M. 

In [3]:
def gradient_descent_runner(points, starting_b, starting_m, learning_rate, num_iterations):
    b = starting_b
    m = starting_m
    
    # Gradient descent
    for i in range(num_iterations):
        #array_points = np.array(points)
        b, m = step_gradient(b, m, points, learning_rate)
    return [b, m]

No gráfico 3D abaixo pode-se ver a relação entre M, B e o Erro (distancia entre a linha e os data points). Gradient Descent é o método para encontrar o ponto (combinação de M e B) onde o erro é o menor possível.

![Gradient Descent Error](../images/linear-regression-gradient-descent-error-surface.png)

In [4]:
def step_gradient(b_current, m_current, points, learningRate):
    # Inicialização das variaveis.
    b_gradient = 0
    m_gradient = 0
    N = float(len(points))
    
    # Loop para calcular o gradiente para cada data point
    for i in range(0, len(points)):
        # Obtem os pontos do gráfico.
        # Estes pontos são o tempo de estudo e média da nota que
        # foram carregados do arquivo CSV.
        x = points[i, 0]
        y = points[i, 1]
        
        # Aplicação das equações de gradient.
        b_gradient += -(2/N) * (y - ((m_current * x) + b_current))
        m_gradient += -(2/N) * x * (y - ((m_current * x) + b_current))
    
    # Aplica a taxa de aprendizado (learning_rate)
    new_b = b_current - (learningRate * b_gradient)
    new_m = m_current - (learningRate * m_gradient)
    return [new_b, new_m]

Estas equações mostram a "direção" que B e M devem seguir para encontrar o menor erro.

![Gradient](../images/linear-regression-gradient1.png)

X e Y são data points (Pontos no gráfico)

M é o declive/angulo da linha

N é o tamanho do dataset

B é a interseção de Y (pesquisar mais a respeito)

A função abaixo representa a implementação de cada equação, sendo a primeira pra M e a segunda para B.

A função *run* carrega os dados do arquivo CSV, estabelece os hyper-parameters, calcula e mostra o erro inicial e calcula o gradiente para M e B em busca do menor erro possível.

O menor erro, neste caso, representa a menor soma de distancias entre os data point e a linha desenhada.

In [5]:
def run():
    points = np.genfromtxt("data.csv", delimiter=",")
    
    learning_rate = 0.0001
    initial_b = 0 # initial y-intercept guess
    initial_m = 0 # initial slope guess
    num_iterations = 1000
    
    print("Starting gradient descent at b = {0}, m = {1}, error = {2}".format(
        initial_b, initial_m, 
        compute_error_for_line_given_points(initial_b, initial_m, points))
    )
    
    print("Running...")
    
    [b, m] = gradient_descent_runner(points, initial_b, initial_m, learning_rate, num_iterations)
    
    print("After {0} iterations b = {1}, m = {2}, error = {3}".format(
        num_iterations, b, m, 
        compute_error_for_line_given_points(b, m, points))
    )

In [None]:
run()