# Linear Regression

##### Siraj's Live Session

<img src="https://raw.githubusercontent.com/mattnedrich/GradientDescentExample/master/gradient_descent_example.gif">

<img src="https://spin.atomicobject.com/wp-content/uploads/linear_regression_error1.png">

###### A formula acima representa o cálculo da distancia(erro) entre a linha e os datapoints:
* x e y : São os pontos do grafico(relacionados aos dados "data points").  
* m : Representa a inclinação da reta(slope), assim como em uma função normal.   
* N : Representa o tamanho do dataset.  
* b : Onde "corta o eixo y.




In [23]:
from numpy import *

In [24]:
def compute_error_for_line_given_points(b, m, points):
    totalError = 0
    #Realiza a somatória de 0 até N para a formula acima
    for i in range(0, len(points)):
        x = points[i, 0] #Valor da primeira coluna na linha i
        y = points[i, 1] #Valor da segunda coluna na linha i
        totalError += (y - (m * x + b)) ** 2
    return totalError / float(len(points))

A função abaixo realiza a somatória pelo numero de interações orientado (num_iteration) de modo a otimizar os valores de B e M.

In [29]:
def gradient_descent_runner(points, starting_b, starting_m, learning_rate, num_iterations):
    b = starting_b
    m = starting_m
    
    #Gradient descent
    for i in range(num_iterations):
        #array_points = np.array(points)
        b, m = step_gradient(b, m, points, learning_rate)
    return [b, m]

As equações mostram a "direção" (positiva ou negativa) que B e M devem seguir para encontrar o menor erro(loss).  
São equações de derivadas parciais.

<img src="https://spin.atomicobject.com/wp-content/uploads/gradient_descent_error_surface.png">

<img src="https://spin.atomicobject.com/wp-content/uploads/linear_regression_gradient1.png">

* x e y : são os datapoints  
* m : inclinação(slope) da reta  
* N : tamanho do dataset  
* b : y-intercept(local onde a reta intercepta o eixo y)  

Implementação das equacões para B e M:

In [30]:

def step_gradient(b_current, m_current, points, learningRate):
    # Inicialização das variaveis.
    b_gradient = 0
    m_gradient = 0
    N = float(len(points))
    
    # Loop para calcular o gradiente para cada data point
    for i in range(0, len(points)):
        # Obtem os pontos do gráfico.
        # foram carregados do arquivo CSV.
        x = points[i, 0]
        y = points[i, 1]
        
        # Aplicação das equações de gradient.
        b_gradient += -(2/N) * (y - ((m_current * x) + b_current))
        m_gradient += -(2/N) * x * (y - ((m_current * x) + b_current))
    
    # Aplica a taxa de aprendizado (learning_rate)
    new_b = b_current - (learningRate * b_gradient)
    new_m = m_current - (learningRate * m_gradient)
    return [new_b, new_m]

A função _run_ carrega os dados do arquivo CSV, estabelece os parametros, calcula e mostra o erro inicial e calcula o gradiente para B e M pelo menor erro possível.  
  
O menor erro, neste caso(linear-regression), representa a menor soma de distancias entre os datapoints e a linha plotada.

In [31]:
def run():
    points = genfromtxt("data.csv", delimiter=",")
    
    learning_rate = 0.0001
    initial_b = 0 # initial y-intercept guess
    initial_m = 0 # initial slope guess
    num_iterations = 1000
    
    print("Starting gradient descent at b = {0}, m = {1}, error = {2}".format(
        initial_b, initial_m, 
        compute_error_for_line_given_points(initial_b, initial_m, points))
    )
    
    print("Running...")
    
    [b, m] = gradient_descent_runner(points, initial_b, initial_m, learning_rate, num_iterations)
    
    print("After {0} iterations b = {1}, m = {2}, error = {3}".format(
        num_iterations, b, m, 
        compute_error_for_line_given_points(b, m, points))
    )

In [32]:
run()

Starting gradient descent at b = 0, m = 0, error = 5565.10783448
Running...
After 1000 iterations b = 0.0889365199374, m = 1.47774408519, error = 112.614810116
