## Sobre o desafio

De acordo com o que foi ensinado no módulo, iremos trabalhar com previsões de vendas de uma loja. O dicionário disponibilizado não é difícil de entender, porém deveremos contar com as implementações que vimos no módulo para:

- Tratar os dados
- Formatar (se necessário)
- Treinar o modelo
- Prever a venda de dezembro
- Montar um histograma dos dados
- Montar um plot de scatter

Caso tenha alguma dúvida, revise o módulo com calma e reveja suas anotações! Você irá conseguir!

In [1]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, r2_score

In [2]:
dados_vendas = {
    'mes': ['Janeiro', 'Fevereiro', 'Março', 'Abril', 'Maio', 'Junho', 'Julho', 'Agosto', 'Setembro', 'Outubro', 'Novembro', 'Dezembro'],
    'vendas': [2000, 2200, 2300, 2500, 2600, 2700, 2800, 2900, 3000, 3100, 3200, 3300]
}

In [3]:
df = pd.DataFrame.from_dict(dados_vendas)

In [4]:
df.head(3)

Unnamed: 0,mes,vendas
0,Janeiro,2000
1,Fevereiro,2200
2,Março,2300


In [5]:
df['mes_numero'] = range (1, 13) 

In [6]:
df = df.drop('mes', axis=1)

In [7]:
X = df[['mes_numero']]
y = df['vendas']

In [8]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [9]:
model = LinearRegression().fit(X_train, y_train)

In [10]:
y_pred = model.predict(X_test)

In [11]:
# a
model.coef_

array([109.3575419])

In [12]:
# b
model.intercept_

np.float64(2019.5530726256984)

In [13]:
model.score(X_train, y_train)

0.9910527234636872

In [14]:
model.score(X_test, y_test)

0.9804933170681456

In [15]:
r2_score(y_test, y_pred)

0.9804933170681456

In [16]:
mean_absolute_error(y_true=y_test, y_pred=y_pred)

np.float64(54.84171322160122)