In [1]:
import datacleaner as dtclean
import dataexplore as dtexp
from view import data_visualization as dtview
import pandas as pd
import numpy as np
from fbprophet import Prophet
import forecast_metrics as fm
import seaborn as sns
import plotly.graph_objs as go
import plotly.tools
import matplotlib.pyplot as plt
# Offline mode
import plotly.offline as py
from plotly.offline import init_notebook_mode, iplot
import warnings

warnings.filterwarnings('ignore')
# "high resolution"
%config InlineBackend.figure_format = 'retina'
init_notebook_mode(connected=True)

# Visualizando o dataframe

In [2]:
df_274_sale = dtclean.get_Dataframes(274,'s')
df_274_sale.reset_index(inplace=True)

sns.set(style="darkgrid")
sns.set_context("notebook", font_scale=1.5, rc={"lines.linewidth": 2.5})

# Dataframe diário

In [3]:
print('Data início: {}, Data final: {}'.format(df_274_sale.ds.min(),df_274_sale.ds.max()))
df_274_sale.info()

Data início: 2020-03-01 00:00:00, Data final: 2020-05-31 00:00:00
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 92 entries, 0 to 91
Data columns (total 2 columns):
 #   Column  Non-Null Count  Dtype         
---  ------  --------------  -----         
 0   ds      92 non-null     datetime64[ns]
 1   y       92 non-null     int64         
dtypes: datetime64[ns](1), int64(1)
memory usage: 1.6 KB


In [4]:
iplot(dtview.plot_scatter(df_274_sale,title='Produtos vendidos'))

In [None]:
df_274_sale.describe()


In [None]:
model = Prophet(interval_width=0.95)
model.fit(df_274_sale)
forecast = model.predict(df_274_sale)
model.plot(forecast)

In [None]:
print("Valor real: {};\nValor previsto: {};\nPrevisão inferior: {};\nPrevisão superior: {}"
      .format(
    df_274_sale.y.sum(),
    forecast.yhat.sum(),
    forecast.yhat_lower.sum(),
    forecast.yhat_upper.sum()))

# Análise dos Dados

In [None]:
iplot(dtview.plot_scatter(df_274_sale,title='Vendas/dia (março-maio de 2020)'))

In [None]:
df_new = dtexp.date_features(df_274_sale)
iplot(dtview.plot_df_features_as_table(df_new))

In [None]:
fig, ax = plt.subplots(figsize=(14,5))
dtview.plot_df_features(df_new,fig, ax).show()
#plt.show()

In [None]:
fig,(ax1,ax2)= plt.subplots(nrows=2)
fig.set_size_inches(20,30)

mesAgregado = pd.DataFrame(df_new.groupby("semana")["y"].sum()).reset_index().sort_values('y')
sns.barplot(data=mesAgregado,x="semana",y="y",ax=ax1)
ax1.set(xlabel='Vendas', ylabel='Total Produtos vendidos')
ax1.set_title("Total Vendas Mês",fontsize=15)

semanaAgregada = pd.DataFrame(df_new.groupby("num")["y"].sum()).reset_index().sort_values('num')
sns.barplot(data=semanaAgregada,x="num",y="y",ax=ax2)
ax2.set(xlabel='diasemana', ylabel='Total Vendas')
ax2.set_title("Total Vendas Por Dia da Semana",fontsize=15)

In [None]:
semanaAgregada.sort_values('y')

In [None]:
df_274_sale_treino_diario, df_274_sale_teste_diario = dtexp.configura_dataframe_treino_teste(df_274_sale)
print('-'*60)
print('Shape dataframe de treino --> {}'.format(df_274_sale_treino_diario.shape))
print('Shape dataframe de teste --> {}'.format(df_274_sale_teste_diario.shape))
print('-'*60)

In [None]:
# Visualizando o montante de dados para os datasets de treino e de teste

In [None]:
iplot(dtview.compare_dataframes_with_scatter(df_274_sale_treino_diario,
                                   df_274_sale_teste_diario,
                                   title='Montante de dados de vendas de Treinamento e Teste',
                                    mode='lines',
                                   name1='Treinamento',
                                   name2='Teste'))

In [None]:
prophet = Prophet()
prophet.fit(df_274_sale_treino_diario)
future_vendas = prophet.make_future_dataframe(periods=7, freq='D')
# Removendo valores fora do range de atendimento da loja (22:30 - 05:59)
future_vendas['ds'] = pd.to_datetime(future_vendas['ds'])
future_vendas = future_vendas.set_index(pd.DatetimeIndex(future_vendas['ds']))
future_vendas = future_vendas.between_time('08:00','21:00')

forecast_vendas = prophet.predict(future_vendas)

iplot(dtview.plot_forecast_as_table(forecast_vendas))

In [None]:
# componentes

fig = prophet.plot_components(forecast_vendas, figsize=(12,8))

In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
fig = prophet.plot(forecast_vendas,ax=ax)
plt.show()

In [None]:
df_274_sale_teste_diario_forecast = prophet.predict(df_274_sale_teste_diario)
iplot(dtview.plot_forecast_as_table(df_274_sale_teste_diario_forecast))

In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
ax.scatter(df_274_sale_teste_diario.ds,df_274_sale_teste_diario['y'], color='r')
fig = prophet.plot(df_274_sale_teste_diario_forecast,ax=ax)
plt.show()


In [None]:
# Comparação entre as vendas previstas e realizadas


In [None]:
iplot(dtview.compare_dataframes_with_scatter(df_274_sale_teste_diario,
                                   df_274_sale_teste_diario_forecast,
                                   title='Previsão de vendas vs Vendas originais realizadas',
                                    mode='lines',
                                   name1='Teste',
                                   name2='Previsto',
                                  is_forecast=True))

In [None]:
# Plot the forecast with the actuals
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
ax.scatter(df_274_sale_teste_diario.ds, df_274_sale_teste_diario['y'], color='r')
fig = prophet.plot(df_274_sale_teste_diario_forecast, ax=ax)
ax.set_xbound(lower='2020-03-01', upper='2020-03-08')
ax.set_ylim(0, 1000)
plot = plt.suptitle('Primeira semana de Março - Previsão vs Original')

In [None]:
mape_sem_feriados = dtexp.mean_absolute_percentage_error(df_274_sale_teste_diario['y'],df_274_sale_teste_diario_forecast['yhat'])
print("MAPE -------------> ",round(mape_sem_feriados,4))
print("MAPE para validar ------> {}".format(fm.mape(np.array(df_274_sale_teste_diario['y']), np.array(df_274_sale_teste_diario_forecast['yhat']))))

In [None]:
print("Valor real: {};\nValor previsto: {};\nPrevisão inferior: {};\nPrevisão superior: {}"
      .format(
    df_274_sale_teste_diario.y.sum(),
    df_274_sale_teste_diario_forecast.yhat.sum(),
    df_274_sale_teste_diario_forecast.yhat_lower.sum(),
    df_274_sale_teste_diario_forecast.yhat_upper.sum()))

In [None]:
iplot(dtview.compare_dataframes_with_bar(
    df_274_sale_teste_diario,
    df_274_sale_teste_diario_forecast,
    nametrace1='Valor Real',
    nametrace2='Valor Previsto',
    idx_end=28))

In [None]:
# Criando novo modelo com os feriados

In [None]:
# definindo o cap (carrying capacity)
#df_274_sale_treino_diario['cap'] = 1362*2
#df_274_sale_treino_diario['floor'] = 1
#df_274_sale_treino_diario.reset_index(drop=True)
prophet_feriados = Prophet(holidays=dtclean.get_Holiday())
prophet_feriados.add_country_holidays('BR')
prophet_feriados.fit(df_274_sale_treino_diario)
# Criando as datas futuras previstas pelo prophet
# A frequência especificada em dias (os dados estão em dias)
future_feriados = prophet_feriados.make_future_dataframe(freq='D', periods=8)
# Prevendo os valores
forecast_feriados = prophet_feriados.predict(future_feriados)
# Removendo valores fora do range de atendimento da loja (22:30 - 05:59)
future_feriados['ds'] = pd.to_datetime(future_feriados['ds'])
future_feriados = future_feriados.set_index(pd.DatetimeIndex(future_feriados['ds']))
future_feriados = future_feriados.between_time('08:00','21:00')
# Previsão optimizada dos valores
forecast_feriados = prophet_feriados.predict(future_feriados)
iplot(dtview.plot_forecast_as_table(forecast_feriados))

In [None]:
plt,fig_forecast_feriado = dtview.plot_forecast(forecast_feriados,prophet_feriados,f,ax)
plt.show()

In [None]:
# Visualizando os componentes do modelo

In [None]:
fig_forecast_feriado = prophet_feriados.plot_components(forecast_feriados, figsize=(12,8))

## Visualizar tabela de previsão de teste

In [None]:
forecast_teste_feriados = prophet_feriados.predict(df_274_sale_teste_diario)
iplot(dtview.plot_forecast_as_table(forecast_teste_feriados))

## Visualizar dataframe de teste previsto e original com feriados

In [None]:
iplot(dtview.compare_dataframes_with_scatter(
    df_274_sale_teste_diario,
    forecast_teste_feriados,
    title='Dados Previsto vs Original última semana de maio/2020',
    mode='lines',
    name1='Original',
    name2='Previsão com feriados',
    is_forecast=True))

In [None]:
mape_com_feriados = dtexp.mean_absolute_percentage_error(df_274_sale_teste_diario.y,forecast_teste_feriados.yhat)
print("MAPE",round(mape_com_feriados,4))

In [None]:
print("Valor real: {};\nValor previsto: {};\nPrevisão inferior: {};\nPrevisão superior: {}"
      .format(
    df_274_sale_teste_diario.y.sum(),
    forecast_teste_feriados.yhat.sum(),
    forecast_teste_feriados.yhat_lower.sum(),
    forecast_teste_feriados.yhat_upper.sum()))

In [None]:
'''Utilizar apenas quando prever melhor conjunto de parâmetros. Acessar o arquivo model_parameters_274_vendas.csv'''
# dtexp.tuning_model(df_274_sale_treino_diario,df_274_sale,periodo=226,frequencia='D',loja='274',tipo='vendas')

In [None]:
parameters_df = pd.read_csv('model_parameters_274_vendas.csv',sep='\t')
parameters_df = parameters_df.sort_values(by=['MAPE'])
parameters_df = parameters_df.reset_index(drop=True)
parameters_df.drop(['Unnamed: 0'],axis=1,inplace=True)
trace_df_parameters=go.Table(header=dict(values=list(parameters_df[['MAPE','Parameters']])),
                            cells=dict(values=[parameters_df.MAPE,
                                               parameters_df.Parameters]))
data=[trace_df_parameters]
fig_df_parameters=go.Figure(data=data)
iplot(fig_df_parameters)


In [None]:
## Treinando o modelo com os melhores parâmetros identificados

+ changepoint_prior_scale= 15
+ holidays_prior_scale = 15
+ n_changepoints = 200
+ seasonality_mode = 'multiplicative'
+ seasonality_prior_scale = 25

In [None]:
# Configurando e treinando o modelo com feriados e parâmetros otimizados
final_prophet = Prophet(holidays=dtclean.get_Holiday(),
                      changepoint_prior_scale= 15,
                      holidays_prior_scale = 15,
                      n_changepoints = 200,
                      seasonality_mode = 'multiplicative',
                      seasonality_prior_scale = 25,
                      weekly_seasonality=True,
                      daily_seasonality = True,
                      yearly_seasonality = True,
                      interval_width=0.95)
final_prophet.add_country_holidays(country_name='BR')
final_prophet.fit(df_274_sale_treino_diario)

In [None]:
future_final = final_prophet.make_future_dataframe(periods=12, freq='D')
forecast_final = final_prophet.predict(future_final)
iplot(dtview.plot_forecast_as_table(forecast_final))

In [None]:
# Plot the components of the model
fig = final_prophet.plot_components(forecast_final, figsize=(12,10))

In [None]:
from fbprophet.plot import plot_weekly,plot_yearly, plot_seasonality,plot_seasonality_plotly

fig_y = plot_yearly(final_prophet)


In [None]:
fig_w = plot_weekly(final_prophet)

In [None]:
from fbprophet.diagnostics import performance_metrics, cross_validation
df_cv = cross_validation(final_prophet, initial='20 days', period = '10 days', horizon='12 days')
df_p = performance_metrics(df_cv)
df_p.head()

In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
fig = final_prophet.plot(forecast_final,ax=ax)
plt.show()

In [None]:
df_teste_final= final_prophet.predict(df_274_sale_teste_diario)
iplot(dtview.plot_forecast_as_table(df_teste_final))

In [None]:
iplot(dtview.compare_dataframes_with_scatter(df_274_sale_teste_diario,
                                   df_teste_final,
                                   title='Previsão de vendas vs Vendas originais realizadas',
                                    mode='lines',
                                   name1='Teste',
                                   name2='Previsto',
                                  is_forecast=True))

# Comparando os dataframes de teste e previsto em escala diária

In [None]:
iplot(dtview.compare_dataframes_with_bar(
    df_274_sale_teste_diario,
    df_teste_final,
    nametrace1='Teste',
    nametrace2='Previsto'))

In [None]:
mape_final = dtexp.mean_absolute_percentage_error(df_274_sale_teste_diario['y'],df_teste_final['yhat'])
print("MAPE -------------> ",round(mape_final,4))
print("MAPE (validação) ---> {}".format(fm.mape(np.array(df_274_sale_teste_diario['y']), np.array(df_teste_final['yhat']))))

In [None]:
print("Valor real: {};\nValor previsto: {};\nPrevisão inferior: {};\nPrevisão superior: {}"
      .format(
    df_274_sale_teste_diario.y.sum(),
    df_teste_final.yhat.sum(),
    df_teste_final.yhat_lower.sum(),
    df_teste_final.yhat_upper.sum()))

# Identificando os outliers

In [None]:
outliers = dtexp.detect_outlier(df_274_sale['y'])
sorted(outliers)
lim_inf, lim_sup = dtexp.calculate_iqr_score(outliers)
print('Outlier inferior {}, outlier superior {}'.format(lim_inf,lim_sup))

In [None]:
df_sem_outliers = df_274_sale[df_274_sale['y'] < 670]
df_sem_outliers.info

###### Outlier são pontos de dados se desviam de forma acentuada dos outros pontos de dados em uma mesma amostra, é chamado de outlier. Qualquer outra observação esperada é rotulada como um inlier"Outliers são os valores em uma série, que se afastam de forma imprevista, dos valores esperados. Isso pode ocorrer em função de características particulares que afetam a variável analisada, erro na transcrição/registo dos valores da variável, etc. A visualização gráfica desses valores em boxplot auxilia a compreender o quanto eles estão distante do valor esperado. A caixa de cor sólida, representa os valores esperados, isto é, o maior conjunto de valores que se repete na série, enquanto os pontos fora da caixa representam os outliers.
`Conforme esclarece Montgomery, os outliers são pontos de dados incomuns que devem ser devidamente identificados para análise futura`

In [None]:
dtview.check_outliers_univariate(df_274_sale)

In [None]:
df_274_sem_outliers_treino, df_274_sem_outliers_teste = dtexp.configura_dataframe_treino_teste(df_sem_outliers)
print('-'*60)
print('Shape dataframe de treino --> {}'.format(df_274_sem_outliers_treino.shape))
print('Shape dataframe de teste --> {}'.format(df_274_sem_outliers_teste.shape))
print('-'*60)


In [None]:
iplot(dtview.compare_dataframes_with_scatter(df_274_sem_outliers_treino,
                                   df_274_sem_outliers_teste,
                                   title='Montante de dados de vendas de Treinamento e Teste (sem outliers)',
                                    mode='lines',
                                   name1='Treinamento',
                                   name2='Teste'))

In [None]:
prophet_no_outliers = Prophet()
prophet_no_outliers.fit(df_274_sem_outliers_treino)
future_no_outliers = prophet_no_outliers.make_future_dataframe(periods=7, freq='D')
# Removendo valores fora do range de atendimento da loja (22:30 - 05:59)
future_no_outliers['ds'] = pd.to_datetime(future_no_outliers['ds'])
future_no_outliers = future_no_outliers.set_index(pd.DatetimeIndex(future_no_outliers['ds']))
future_no_outliers = future_no_outliers.between_time('08:00','21:00')

forecast_no_outliers = prophet_no_outliers.predict(future_no_outliers)

iplot(dtview.plot_forecast_as_table(forecast_no_outliers))

In [None]:
# componentes

fig = prophet_no_outliers.plot_components(forecast_no_outliers, figsize=(12,8))


In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
fig = prophet_no_outliers.plot(forecast_no_outliers,ax=ax)
plt.show()

In [None]:
df_274_no_outliers_teste_forecast = prophet_no_outliers.predict(df_274_sem_outliers_teste)
iplot(dtview.plot_forecast_as_table(df_274_no_outliers_teste_forecast))

In [None]:
iplot(dtview.compare_dataframes_with_scatter(df_274_sem_outliers_teste,
                                   df_274_no_outliers_teste_forecast,
                                   title='Previsão de vendas vs Vendas originais realizadas',
                                    mode='lines',
                                   name1='Teste',
                                   name2='Previsto',
                                  is_forecast=True))

In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
ax.scatter(df_274_sem_outliers_teste.ds,df_274_sem_outliers_teste['y'], color='r')
fig = prophet_no_outliers.plot(df_274_no_outliers_teste_forecast,ax=ax)
plt.show()

In [None]:
# Plot the forecast with the actuals
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
ax.scatter(df_274_sem_outliers_teste.ds, df_274_sem_outliers_teste['y'], color='r')
fig = prophet_no_outliers.plot(df_274_no_outliers_teste_forecast, ax=ax)
ax.set_xbound(lower='2020-03-01', upper='2020-03-08')
ax.set_ylim(0, 1000)
plot = plt.suptitle('Primeira semana de Março - Previsão vs Original')

In [None]:
mape_sem_feriados = dtexp.mean_absolute_percentage_error(df_274_sem_outliers_teste['y'],df_274_no_outliers_teste_forecast['yhat'])
print("MAPE -------------> ",round(mape_sem_feriados,4))
print("MAPE (validação) ---> {}".format(
    fm.mape(np.array(df_274_sem_outliers_teste['y']),
            np.array(df_274_no_outliers_teste_forecast['yhat']))))

In [None]:
iplot(dtview.compare_dataframes_with_bar(
        df_274_sem_outliers_teste,
        df_274_no_outliers_teste_forecast,
        nametrace1='Valor Real (sem outliers)',
        nametrace2='Valor Previsto (sem outliers)',
        idx_end=28))

In [None]:
prophet_feriados_s_outliers = Prophet(holidays=dtclean.get_Holiday())

prophet_feriados_s_outliers.add_country_holidays('BR')
prophet_feriados_s_outliers.fit(df_274_sem_outliers_treino)
# Criando as datas futuras previstas pelo prophet
# A frequência especificada em dias (os dados estão em dias)
future_feriados_s_outliers = prophet_feriados_s_outliers.make_future_dataframe(freq='D', periods=8)
# Prevendo os valores
forecast_feriados_s_outliers = prophet_feriados_s_outliers.predict(future_feriados_s_outliers)
# Removendo valores fora do range de atendimento da loja (22:30 - 05:59)
future_feriados_s_outliers['ds'] = pd.to_datetime(future_feriados_s_outliers['ds'])
future_feriados_s_outliers = future_feriados_s_outliers.set_index(pd.DatetimeIndex(future_feriados_s_outliers['ds']))
future_feriados_s_outliers = future_feriados_s_outliers.between_time('08:00','21:00')
# Previsão optimizada dos valores
future_feriados_s_outliers = prophet_feriados_s_outliers.predict(future_feriados_s_outliers)

In [None]:
plt,fig_forecast_feriado_s_outliers = dtview.plot_forecast(future_feriados_s_outliers,prophet_feriados_s_outliers,f,ax)
plt.show()

# Visualizando os componentes do modelo

In [None]:
fig_forecast_feriado_s_outliers = prophet_feriados_s_outliers.plot_components(forecast_feriados_s_outliers,figsize=(12,8))

In [None]:
forecast_teste_feriados_s_outliers = prophet_feriados_s_outliers.predict(df_274_sem_outliers_teste)
iplot(dtview.plot_forecast_as_table(forecast_teste_feriados_s_outliers))

# Visualizar dataframe de teste previsto e original com feriados

In [None]:
iplot(dtview.compare_dataframes_with_scatter(
    df_274_sem_outliers_teste,
    forecast_teste_feriados_s_outliers,
    title='Dados Previsto vs Original última semana de maio/2020',
    mode='lines',
    name1='Original',
    name2='Previsão com feriados',
    is_forecast=True))

In [None]:
iplot(dtview.compare_dataframes_with_bar(
        df_274_sem_outliers_teste,
        forecast_teste_feriados_s_outliers,
        nametrace1='Original',
        nametrace2='Previsão com feriados',
        idx_end=28))

In [None]:
mape_com_feriados = dtexp.mean_absolute_percentage_error(df_274_sem_outliers_teste.y,forecast_teste_feriados_s_outliers.yhat)
print("MAPE -------------> ",round(mape_com_feriados,4))
print("MAPE (validação) ---> {}".format(
    fm.mape(np.array(df_274_sem_outliers_teste['y']),
    np.array(forecast_teste_feriados_s_outliers['yhat']))))

In [None]:
# Somente utilizar para gerar novo conjunto otimizado de parâmetros atualmente esse conjunto está registado no arquivo:
# 'model_parameters_274_vendas_s_outliers.csv'
# dtexp.tuning_model(df_274_sem_outliers_treino,df_sem_outliers,periodo=219,frequencia='D',loja='274',tipo='vendas_s_outliers')

In [None]:
parameters_df_s_outliers = pd.read_csv('model_parameters_274_vendas_s_outliers.csv',sep='\t')
parameters_df_s_outliers = parameters_df_s_outliers.sort_values(by=['MAPE'])
parameters_df_s_outliers = parameters_df_s_outliers.reset_index(drop=True)
parameters_df_s_outliers.drop(['Unnamed: 0'],axis=1,inplace=True)
trace_df_parameters_s_outliers=go.Table(header=dict(values=list(parameters_df_s_outliers[['MAPE','Parameters']])),
                            cells=dict(values=[parameters_df_s_outliers.MAPE,
                                               parameters_df_s_outliers.Parameters]))
data=[trace_df_parameters_s_outliers]
fig_df_parameters_s_outliers=go.Figure(data=data)
iplot(fig_df_parameters_s_outliers)

In [None]:
# Configurando e treinando o modelo com feriados e parâmetros otimizados
final_prophet_s_outliers = Prophet(holidays=dtclean.get_Holiday(),
                      changepoint_prior_scale= 15,
                      holidays_prior_scale = 15,
                      n_changepoints = 200,
                      seasonality_mode = 'multiplicative',
                      seasonality_prior_scale = 25,
                      weekly_seasonality=True,
                      daily_seasonality = True,
                      yearly_seasonality = True,
                      interval_width=0.95)
final_prophet_s_outliers.add_country_holidays(country_name='BR')
final_prophet_s_outliers.fit(df_274_sem_outliers_treino)

In [None]:
future_final_s_outliers = final_prophet_s_outliers.make_future_dataframe(periods=122, freq='D')
forecast_final_s_outliers = final_prophet_s_outliers.predict(future_final_s_outliers)
iplot(dtview.plot_forecast_as_table(forecast_final_s_outliers))

In [None]:
iplot(dtview.plot_forecast_as_table(forecast_final_s_outliers))

In [None]:
# Plot the components of the model
fig = final_prophet_s_outliers.plot_components(forecast_final_s_outliers)

In [None]:
# Plot the forecast
f, ax = plt.subplots(1)
f.set_figheight(5)
f.set_figwidth(15)
fig = final_prophet_s_outliers.plot(forecast_final_s_outliers,ax=ax)
plt.show()

In [None]:
# Visualizando a tabela prevista

df_teste_final_s_outliers= final_prophet_s_outliers.predict(df_274_sem_outliers_teste)
iplot(dtview.plot_forecast_as_table(df_teste_final_s_outliers))

In [None]:
# Comparando os dataframes em gráfico scatter

iplot(dtview.compare_dataframes_with_scatter(df_274_sem_outliers_teste,
                                   df_teste_final_s_outliers,
                                   title='Previsão de vendas vs Vendas originais realizadas',
                                    mode='lines',
                                   name1='Teste',
                                   name2='Previsto',
                                  is_forecast=True))

In [None]:
# Comparando os dataframes em gráfico de barras

iplot(dtview.compare_dataframes_with_bar(
    df_274_sem_outliers_teste,
    df_teste_final_s_outliers,
    nametrace1='Teste',
    nametrace2='Previsto'))

In [None]:
# Calculando o mape

mape_final = dtexp.mean_absolute_percentage_error(df_274_sem_outliers_teste['y'],df_teste_final_s_outliers['yhat'])
print("MAPE -------------> ",round(mape_final,4))
print("MAPE (validação) ---> {}".format(
    fm.mape(np.array(df_274_sem_outliers_teste['y']),
    np.array(df_teste_final_s_outliers['yhat']))))

In [None]:
print("Valor real: {};\nValor previsto: {};\nPrevisão inferior: {};\nPrevisão superior: {}"
      .format(
    df_274_sem_outliers_teste.y.sum(),
    df_teste_final_s_outliers.yhat.sum(),
    df_teste_final_s_outliers.yhat_lower.sum(),
    df_teste_final_s_outliers.yhat_upper.sum()))
