## Regressão Linear

O <a href="http://jupyter.org">Jupyter</a> é ótimo para se documentar o trabalho realizado, permitindo que se coloque textos e gráficos juntos ao código executável.

Nesse exemplo, vamos realizar <b>predições</b> do <u>lucro anual</u> de um food truck com base no tamanho da <u>população</u> da cidade.

Vamos começar importando os dados. Aqui, nós utilizamos a biblioteca <a href="http://www.numpy.org">NumPy</a> para se trabalhar com vetores e matrizes no estilo R / Matlab:

In [None]:
import numpy as np

data = np.genfromtxt('food_trucks.csv', delimiter=',')
#print('Data %s:\n%s' % (data.shape, data))

populacao = data[:,0].reshape(-1, 1)
lucro = data[:,1]
#print('População %s:\n%s\n' % (populacao.shape, populacao))
#print('Lucro %s:\n%s' % (lucro.shape, lucro))

A seguir, vamos visualizar os dados.

Para se plotar gráficos, nós utilizamos uma outra ferramenta essencial para Machine Learning, a biblioteca <a href="http://matplotlib.org">matplotlib</a>:

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

plt.scatter(populacao, lucro)
plt.title('Food trucks')
plt.xlabel('População (10k)')
plt.ylabel('Lucro anual (R$ 10k)')
plt.show()

A seguir, vamos treinar o nosso modelo preditivo.

A biblioteca <a href="http://scikit-learn.org">scikit-learn</a> (<u>sklearn</u> para os íntimos) contém vários algoritmos de Machine Learning. Aqui nós utilizamos o de regressão linear.

Em geral, cada algoritmo é representado por uma classe, contendo o método `fit()` para se treinar o modelo preditivo.

In [None]:
from sklearn import linear_model

regr = linear_model.LinearRegression()
regr.fit(populacao, lucro)

plt.scatter(populacao, lucro)
plt.plot(populacao, regr.predict(populacao))
plt.show()

Aós treinar o modelo preditivo, basta invocar o método `predict()` para se realizar predições:

In [None]:
teste = 17
predicao = regr.predict(teste)

print('O lucro anual previsto para um food truck em uma cidade com %d habitantes é de R$%d.' 
      % (teste * 10000, predicao * 10000))