**Pressione SHIFT+ENTER para executar a célula**

# Alegrete

Este notebook fornece algumas visualizações para o trabalho de regressão linear. Para conseguir usar, implemente as funções no seu `alegrete.py` e tenha as bibliotecas `numpy` e `matplotlib` instaladas.

O notebook usa um conjunto de dados sintetico. Adapte-o para carregar e usar os dados do `alegrete.csv`.

### Imports das bibliotecas de plot e da solucao implementada

In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.animation as animation

from IPython.display import HTML

import alegrete

%matplotlib inline

### Visualizacao dos dados

In [None]:
dataset = np.loadtxt("./alegrete.csv", delimiter=",", dtype=np.float64)

# Gráfico dos dados
plt.figure(figsize=(6, 2))
plt.scatter(dataset[:, 0], dataset[:, 1])
plt.xlabel("Área")
plt.ylabel("Preço")
plt.title("Preço de fazendas em Alegrete")
plt.show()

### Execucao da regressao linear e calculo do EQM por epoca/iteracao

Considere o parâmetro b o coeficiente linear (theta_0, visto em aula) e w o coeficiente angular (theta_1, visto em aula).

In [None]:
b_history, w_history = alegrete.fit(
    dataset, b=-3, w=1.0, alpha=1e-5, num_iterations=1000
)

# valores finais de theta0 e theta1
final_b, final_w = b_history[-1], w_history[-1]

mse_list = [alegrete.compute_mse(b, w, dataset) for b, w in zip(b_history, w_history)]
print(f"EQM final: {mse_list[-1]}")


plt.plot(mse_list)
plt.xlabel("Epoca/iteracao")
plt.ylabel("EQM")
plt.show()

### Plot da curva final

In [None]:
# De acordo com a Equação Normal, estes são os pesos ideiais que devemos encontrar

input_vector = dataset[:, 0]
input_matrix = np.c_[np.ones_like(input_vector), input_vector]

observed_vector = dataset[:, 1]

np.linalg.inv(input_matrix.T.dot(input_matrix)).dot(input_matrix.T).dot(observed_vector)

In [None]:
# Imprimir parâmetros otimizados
print(f"Curva encontrada: {final_w}*x + {final_b}")

# plota os dados
plt.figure(figsize=(4, 2))
plt.scatter(dataset[:, 0], dataset[:, 1])

# plota a curva de ajuste
pred = final_w * dataset[:, 0] + final_b
plt.plot(dataset[:, 0], pred, c="r")
plt.show()

### Progresso da descida do gradiente com o número de iterações

Execute a celula e use os controles abaixo do grafico para visualizar o progresso do seu ajuste

Pode aparecer um grafico "extra" abaixo da animacao, apenas ignore.

In [None]:
fig = plt.figure(figsize=(4, 2))
ax = fig.add_subplot(111)

# conjunto de dados
ax.scatter(dataset[:, 0], dataset[:, 1])

# linha com os valores iniciais dos parametros
pred = w_history[0] * dataset[:, 0] + b_history[0]
(line,) = ax.plot(dataset[:, 0], pred, "-", c="r")


# funcao que atualiza a linha a cada passo
def animate(i):
    pred = w_history[i] * dataset[:, 0] + b_history[i]
    line.set_ydata(pred)
    return (line,)


# mude interval para trocar a velocidade da animacao
ani = animation.FuncAnimation(
    fig, animate, frames=len(b_history), interval=20, save_count=50
)
HTML(ani.to_jshtml())