In [1]:
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import numpy as np
from utils import calculate_metrics

  from .autonotebook import tqdm as notebook_tqdm


# Todas as Lojas

## Favorita

In [2]:
# Leitura dos arquivos CSV
arima_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Tudo\ARIMA.csv')
cnn_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Tudo\CNN.csv')
lsmt_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Tudo\LSMT.csv')
prophet_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Tudo\prophet.csv')

# Leitura dos arquivos CSV
arima_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Tudo\ARIMA.csv')
cnn_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Tudo\CNN.csv')
lsmt_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Tudo\LSMT.csv')
prophet_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Tudo\prophet.csv')


In [3]:
fig = go.Figure()

# Adiciona a linha para arima_df_favorita
fig.add_trace(go.Scatter(x=arima_df_favorita['Data'], y=arima_df_favorita['Real'], mode='lines+markers', name='Real', line=dict(color='black')))

fig.add_trace(go.Scatter(x=arima_df_favorita['Data'], y=arima_df_favorita['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4')))

# Adiciona a linha para lsmt_df_favorita
fig.add_trace(go.Scatter(x=lsmt_df_favorita['Data'], y=lsmt_df_favorita['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e')))

# Adiciona a linha para prophet_df_favorita
fig.add_trace(go.Scatter(x=prophet_df_favorita['Data'], y=prophet_df_favorita['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c')))


fig.add_trace(go.Scatter(x=cnn_df_favorita['Data'], y=cnn_df_favorita['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd')))

# Configurações do layout
fig.update_layout(
    title='Comparação de Previsões - Favorita',
    xaxis_title='Data',
    yaxis_title='Valores',
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    xaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    ),
    yaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    )
)

fig.show()

In [4]:
from sklearn.metrics import mean_squared_error, mean_absolute_percentage_error

# Função para calcular RMSE e MAPE
def calculate_rmse_mape(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe
metrics = {
    'Model': ['ARIMA', 'CNN', 'LSMT', 'Prophet'],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Tudo',
    'Base': 'Favorita'
}

for df in [arima_df_favorita, cnn_df_favorita, lsmt_df_favorita, prophet_df_favorita]:
    rmse, mape = calculate_rmse_mape(df)
    metrics['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
    metrics['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados
metrics_df = pd.DataFrame(metrics)
display(metrics_df)

Unnamed: 0,Model,RMSE(#),MAPE(%),Tipo,Base
0,ARIMA,501644,7.168455,Tudo,Favorita
1,CNN,850827,11.854927,Tudo,Favorita
2,LSMT,497659,6.191691,Tudo,Favorita
3,Prophet,826610,12.213204,Tudo,Favorita


In [5]:
# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo
arima_df_favorita_tempo['Base'] = 'Favorita'
arima_df_favorita_tempo['Tipo'] = 'Tudo'
arima_df_favorita_tempo['Modelo'] = 'ARIMA'

cnn_df_favorita_tempo['Base'] = 'Favorita'
cnn_df_favorita_tempo['Tipo'] = 'Tudo'
cnn_df_favorita_tempo['Modelo'] = 'CNN'

lsmt_df_favorita_tempo['Base'] = 'Favorita'
lsmt_df_favorita_tempo['Tipo'] = 'Tudo'
lsmt_df_favorita_tempo['Modelo'] = 'LSMT'

prophet_df_favorita_tempo['Base'] = 'Favorita'
prophet_df_favorita_tempo['Tipo'] = 'Tudo'
prophet_df_favorita_tempo['Modelo'] = 'Prophet'

# Concatena todos os dataframes de tempo
tempo_df = pd.concat([arima_df_favorita_tempo, cnn_df_favorita_tempo, lsmt_df_favorita_tempo, prophet_df_favorita_tempo], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df['Treino(%)'] = ((tempo_df['Treino'] / tempo_df['Treino'].sum()) * 100).round(2)
tempo_df['Previsao(%)'] = ((tempo_df['Previsao'] / tempo_df['Previsao'].sum()) * 100).round(2)

display(tempo_df)

Unnamed: 0,Treino,Previsao,Base,Tipo,Modelo,Treino(%),Previsao(%)
0,59.325666,0.017308,Favorita,Tudo,ARIMA,60.34,1.92
1,5.244068,0.206086,Favorita,Tudo,CNN,5.33,22.9
2,33.357168,0.552318,Favorita,Tudo,LSMT,33.93,61.36
3,0.387834,0.124396,Favorita,Tudo,Prophet,0.39,13.82


In [6]:
# Renomeia a coluna 'Model' em metrics_df para 'Modelo' para fazer o join
metrics_df.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df e metrics_df
merged_df = pd.merge(tempo_df, metrics_df, on=['Modelo', 'Base', 'Tipo'])
# Ordena as colunas de forma adequada
merged_df = merged_df[['Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]
# Exibe o dataframe resultante
display(merged_df)

Unnamed: 0,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,ARIMA,Favorita,Tudo,59.325666,0.017308,60.34,1.92,501644,7.168455
1,CNN,Favorita,Tudo,5.244068,0.206086,5.33,22.9,850827,11.854927
2,LSMT,Favorita,Tudo,33.357168,0.552318,33.93,61.36,497659,6.191691
3,Prophet,Favorita,Tudo,0.387834,0.124396,0.39,13.82,826610,12.213204


## M5

In [7]:
# Leitura dos arquivos CSV para M5
arima_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Tudo\ARIMA.csv')
cnn_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Tudo\CNN.csv')
lsmt_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Tudo\LSMT.csv')
prophet_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Tudo\prophet.csv')

# Leitura dos arquivos CSV de tempo para M5
arima_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Tudo\ARIMA.csv')
cnn_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Tudo\CNN.csv')
lsmt_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Tudo\LSMT.csv')
prophet_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Tudo\prophet.csv')

# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo
arima_df_m5_tempo['Base'] = 'M5'
arima_df_m5_tempo['Tipo'] = 'Tudo'
arima_df_m5_tempo['Modelo'] = 'ARIMA'

cnn_df_m5_tempo['Base'] = 'M5'
cnn_df_m5_tempo['Tipo'] = 'Tudo'
cnn_df_m5_tempo['Modelo'] = 'CNN'

lsmt_df_m5_tempo['Base'] = 'M5'
lsmt_df_m5_tempo['Tipo'] = 'Tudo'
lsmt_df_m5_tempo['Modelo'] = 'LSMT'

prophet_df_m5_tempo['Base'] = 'M5'
prophet_df_m5_tempo['Tipo'] = 'Tudo'
prophet_df_m5_tempo['Modelo'] = 'Prophet'


# Concatena todos os dataframes de tempo
tempo_df_m5 = pd.concat([arima_df_m5_tempo, cnn_df_m5_tempo, lsmt_df_m5_tempo, prophet_df_m5_tempo], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_m5['Treino(%)'] = ((tempo_df_m5['Treino'] / tempo_df_m5['Treino'].sum()) * 100).round(2)
tempo_df_m5['Previsao(%)'] = ((tempo_df_m5['Previsao'] / tempo_df_m5['Previsao'].sum()) * 100).round(2)

display(tempo_df_m5)

Unnamed: 0,Treino,Previsao,Base,Tipo,Modelo,Treino(%),Previsao(%)
0,664.702387,0.024014,M5,Tudo,ARIMA,97.46,2.99
1,5.966893,0.13919,M5,Tudo,CNN,0.87,17.35
2,11.051379,0.538049,M5,Tudo,LSMT,1.62,67.07
3,0.288815,0.100931,M5,Tudo,Prophet,0.04,12.58


In [8]:
# Função para calcular RMSE e MAPE
def calculate_rmse_mape(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

In [9]:
# Calcula RMSE e MAPE para cada dataframe
metrics_m5 = {
    'Model': ['ARIMA', 'CNN', 'LSMT', 'Prophet'],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Tudo',
    'Base': 'M5'
}

for df in [arima_df_m5, cnn_df_m5, lsmt_df_m5, prophet_df_m5]:
    rmse, mape = calculate_rmse_mape(df)
    metrics_m5['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
    metrics_m5['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados
metrics_df_m5 = pd.DataFrame(metrics_m5)
display(metrics_df_m5)

Unnamed: 0,Model,RMSE(#),MAPE(%),Tipo,Base
0,ARIMA,16910,5.395437,Tudo,M5
1,CNN,22826,6.637214,Tudo,M5
2,LSMT,12593,3.517592,Tudo,M5
3,Prophet,27434,7.961216,Tudo,M5


In [10]:
# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo
metrics_df_m5.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_m5 e metrics_df_m5
merged_df_m5 = pd.merge(tempo_df_m5, metrics_df_m5, on=['Modelo', 'Base', 'Tipo'])
# Ordena as colunas de forma adequada
merged_df_m5 = merged_df_m5[['Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]
# Exibe o dataframe resultante
display(merged_df_m5)

Unnamed: 0,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,ARIMA,M5,Tudo,664.702387,0.024014,97.46,2.99,16910,5.395437
1,CNN,M5,Tudo,5.966893,0.13919,0.87,17.35,22826,6.637214
2,LSMT,M5,Tudo,11.051379,0.538049,1.62,67.07,12593,3.517592
3,Prophet,M5,Tudo,0.288815,0.100931,0.04,12.58,27434,7.961216


In [11]:
# Plotagem dos dados
fig_m5 = go.Figure()

# Adiciona a linha para arima_df_m5
fig_m5.add_trace(go.Scatter(x=arima_df_m5['Data'], y=arima_df_m5['Real'], mode='lines+markers', name='Real', line=dict(color='black')))
fig_m5.add_trace(go.Scatter(x=arima_df_m5['Data'], y=arima_df_m5['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4')))

# Adiciona a linha para lsmt_df_m5
fig_m5.add_trace(go.Scatter(x=lsmt_df_m5['Data'], y=lsmt_df_m5['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e')))

# Adiciona a linha para prophet_df_m5
fig_m5.add_trace(go.Scatter(x=prophet_df_m5['Data'], y=prophet_df_m5['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c')))

# Adiciona a linha para rl_df_m5

fig_m5.add_trace(go.Scatter(x=cnn_df_m5['Data'], y=cnn_df_m5['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd')))

# Configurações do layout
fig_m5.update_layout(
    title='Comparação de Previsões - M5',
    xaxis_title='Data',
    yaxis_title='Valores',
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    xaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    ),
    yaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    )
)

fig_m5.show()

## Olist

In [12]:
# Leitura dos arquivos CSV para Olist
arima_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Tudo\ARIMA.csv')
cnn_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Tudo\CNN.csv')
lsmt_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Tudo\LSMT.csv')
prophet_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Tudo\prophet.csv')

# Leitura dos arquivos CSV de tempo para Olist
arima_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Tudo\ARIMA.csv')
cnn_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Tudo\CNN.csv')
lsmt_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Tudo\LSMT.csv')
prophet_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Tudo\prophet.csv')

# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo
arima_df_olist_tempo['Base'] = 'Olist'
arima_df_olist_tempo['Tipo'] = 'Tudo'
arima_df_olist_tempo['Modelo'] = 'ARIMA'

cnn_df_olist_tempo['Base'] = 'Olist'
cnn_df_olist_tempo['Tipo'] = 'Tudo'
cnn_df_olist_tempo['Modelo'] = 'CNN'

lsmt_df_olist_tempo['Base'] = 'Olist'
lsmt_df_olist_tempo['Tipo'] = 'Tudo'
lsmt_df_olist_tempo['Modelo'] = 'LSMT'

prophet_df_olist_tempo['Base'] = 'Olist'
prophet_df_olist_tempo['Tipo'] = 'Tudo'
prophet_df_olist_tempo['Modelo'] = 'Prophet'


# Concatena todos os dataframes de tempo
tempo_df_olist = pd.concat([arima_df_olist_tempo, cnn_df_olist_tempo, lsmt_df_olist_tempo, prophet_df_olist_tempo], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_olist['Treino(%)'] = ((tempo_df_olist['Treino'] / tempo_df_olist['Treino'].sum()) * 100).round(2)
tempo_df_olist['Previsao(%)'] = ((tempo_df_olist['Previsao'] / tempo_df_olist['Previsao'].sum()) * 100).round(2)

display(tempo_df_olist)

Unnamed: 0,Treino,Previsao,Base,Tipo,Modelo,Treino(%),Previsao(%)
0,32.125384,0.008285,Olist,Tudo,ARIMA,69.26,1.13
1,2.542305,0.116971,Olist,Tudo,CNN,5.48,15.9
2,11.275092,0.565615,Olist,Tudo,LSMT,24.31,76.87
3,0.438933,0.044937,Olist,Tudo,Prophet,0.95,6.11


In [13]:
# Calcula RMSE e MAPE para cada dataframe
metrics_olist = {
    'Model': ['ARIMA', 'CNN', 'LSMT', 'Prophet'],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Tudo',
    'Base': 'Olist'
}

for df in [arima_df_olist, cnn_df_olist, lsmt_df_olist, prophet_df_olist]:
    rmse, mape = calculate_rmse_mape(df)
    metrics_olist['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
    metrics_olist['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados
metrics_df_olist = pd.DataFrame(metrics_olist)

# Renomeia a coluna 'Model' em metrics_df_olist para 'Modelo' para fazer o join
metrics_df_olist.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_olist e metrics_df_olist
merged_df_olist = pd.merge(tempo_df_olist, metrics_df_olist, on=['Modelo', 'Base', 'Tipo'])
# Ordena as colunas de forma adequada
merged_df_olist = merged_df_olist[['Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

# Exibe o dataframe resultante
display(merged_df_olist)

Unnamed: 0,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,ARIMA,Olist,Tudo,32.125384,0.008285,69.26,1.13,488,25.166999
1,CNN,Olist,Tudo,2.542305,0.116971,5.48,15.9,414,20.843459
2,LSMT,Olist,Tudo,11.275092,0.565615,24.31,76.87,475,23.903737
3,Prophet,Olist,Tudo,0.438933,0.044937,0.95,6.11,615,33.3596


In [14]:
fig_olist = go.Figure()

# Adiciona a linha para arima_df_olist
fig_olist.add_trace(go.Scatter(x=arima_df_olist['Data'], y=arima_df_olist['Real'], mode='lines+markers', name='Real', line=dict(color='black')))
fig_olist.add_trace(go.Scatter(x=arima_df_olist['Data'], y=arima_df_olist['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4')))

# Adiciona a linha para lsmt_df_olist
fig_olist.add_trace(go.Scatter(x=lsmt_df_olist['Data'], y=lsmt_df_olist['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e')))

# Adiciona a linha para prophet_df_olist
fig_olist.add_trace(go.Scatter(x=prophet_df_olist['Data'], y=prophet_df_olist['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c')))

fig_olist.add_trace(go.Scatter(x=cnn_df_olist['Data'], y=cnn_df_olist['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd')))

# Configurações do layout
fig_olist.update_layout(
    title='Comparação de Previsões - Olist',
    xaxis_title='Data',
    yaxis_title='Valores',
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    xaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    ),
    yaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    )
)

fig_olist.show()

## Todas as bases

In [15]:
# Concatena as bases de resultados
final_results_df = pd.concat([merged_df, merged_df_m5, merged_df_olist], ignore_index=True)

# Exibe o dataframe resultante
display(final_results_df)

Unnamed: 0,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,ARIMA,Favorita,Tudo,59.325666,0.017308,60.34,1.92,501644,7.168455
1,CNN,Favorita,Tudo,5.244068,0.206086,5.33,22.9,850827,11.854927
2,LSMT,Favorita,Tudo,33.357168,0.552318,33.93,61.36,497659,6.191691
3,Prophet,Favorita,Tudo,0.387834,0.124396,0.39,13.82,826610,12.213204
4,ARIMA,M5,Tudo,664.702387,0.024014,97.46,2.99,16910,5.395437
5,CNN,M5,Tudo,5.966893,0.13919,0.87,17.35,22826,6.637214
6,LSMT,M5,Tudo,11.051379,0.538049,1.62,67.07,12593,3.517592
7,Prophet,M5,Tudo,0.288815,0.100931,0.04,12.58,27434,7.961216
8,ARIMA,Olist,Tudo,32.125384,0.008285,69.26,1.13,488,25.166999
9,CNN,Olist,Tudo,2.542305,0.116971,5.48,15.9,414,20.843459


# Por Lojas

## Favorita

In [16]:
# Leitura dos arquivos CSV
arima_df_favorita_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Loja\ARIMA.csv')
cnn_df_favorita_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Loja\CNN.csv')
lsmt_df_favorita_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Loja\LSMT.csv')
prophet_df_favorita_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Loja\prophet.csv')

# Leitura dos arquivos CSV de tempo
arima_df_favorita_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Loja\ARIMA.csv')
cnn_df_favorita_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Loja\CNN.csv')
lsmt_df_favorita_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Loja\LSMT.csv')
prophet_df_favorita_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Loja\prophet.csv')

In [17]:
# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo por loja
arima_df_favorita_tempo_loja['Base'] = 'Favorita'
arima_df_favorita_tempo_loja['Tipo'] = 'Loja'
arima_df_favorita_tempo_loja['Modelo'] = 'ARIMA'

cnn_df_favorita_tempo_loja['Base'] = 'Favorita'
cnn_df_favorita_tempo_loja['Tipo'] = 'Loja'
cnn_df_favorita_tempo_loja['Modelo'] = 'CNN'

lsmt_df_favorita_tempo_loja['Base'] = 'Favorita'
lsmt_df_favorita_tempo_loja['Tipo'] = 'Loja'
lsmt_df_favorita_tempo_loja['Modelo'] = 'LSMT'

prophet_df_favorita_tempo_loja['Base'] = 'Favorita'
prophet_df_favorita_tempo_loja['Tipo'] = 'Loja'
prophet_df_favorita_tempo_loja['Modelo'] = 'Prophet'


# Concatena todos os dataframes de tempo por loja
tempo_df_loja = pd.concat([arima_df_favorita_tempo_loja, cnn_df_favorita_tempo_loja, lsmt_df_favorita_tempo_loja, prophet_df_favorita_tempo_loja], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_loja['Treino(%)'] = ((tempo_df_loja['Treino'] / tempo_df_loja['Treino'].sum()) * 100).round(2)
tempo_df_loja['Previsao(%)'] = ((tempo_df_loja['Previsao'] / tempo_df_loja['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por loja
def calculate_rmse_mape_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por loja
metrics_loja = {
    'Loja': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Loja',
    'Base': 'Favorita'
}

for df, model in zip([arima_df_favorita_loja, cnn_df_favorita_loja, lsmt_df_favorita_loja, prophet_df_favorita_loja], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        df_loja = df[df['Loja'] == loja]
        rmse, mape = calculate_rmse_mape_loja(df_loja)
        metrics_loja['Loja'].append(loja)
        metrics_loja['Model'].append(model)
        metrics_loja['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
        metrics_loja['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por loja
metrics_df_loja = pd.DataFrame(metrics_loja)

# Renomeia a coluna 'Model' em metrics_df_loja para 'Modelo' para fazer o join
metrics_df_loja.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_loja e metrics_df_loja
merged_df_loja = pd.merge(tempo_df_loja, metrics_df_loja, on=['Modelo', 'Base', 'Tipo', 'Loja'])
# Ordena as colunas de forma adequada
merged_df_loja = merged_df_loja[['Loja', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_loja.sort_values(by=['Loja','Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_loja)

Unnamed: 0,Loja,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,3,ARIMA,Favorita,Loja,60.104832,0.01403,2.99,0.18,29876,9.849908
10,3,CNN,Favorita,Loja,6.413599,0.132664,0.32,1.74,29931,8.576498
20,3,LSMT,Favorita,Loja,13.413112,0.489503,0.67,6.42,20419,5.833989
33,3,Prophet,Favorita,Loja,0.250051,0.068587,0.01,0.9,50436,16.435207
1,8,ARIMA,Favorita,Loja,48.862118,0.014308,2.43,0.19,14248,6.986637
11,8,CNN,Favorita,Loja,4.897604,0.143627,0.24,1.89,21135,10.574813
21,8,LSMT,Favorita,Loja,7.843975,0.485268,0.39,6.37,14790,6.572742
38,8,Prophet,Favorita,Loja,0.183863,0.081934,0.01,1.08,27230,14.413078
2,44,ARIMA,Favorita,Loja,92.907892,0.015111,4.62,0.2,31177,8.055423
12,44,CNN,Favorita,Loja,4.733027,0.167219,0.24,2.19,34970,7.985514


In [18]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_favorita_loja['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=5, cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja}" for loja in lojas[:10]])

# Adicionar as linhas para cada loja
for i, loja in enumerate(lojas[:10]):
    df_arima = arima_df_favorita_loja[arima_df_favorita_loja['Loja'] == loja]
    df_cnn = cnn_df_favorita_loja[cnn_df_favorita_loja['Loja'] == loja]
    df_lsmt = lsmt_df_favorita_loja[lsmt_df_favorita_loja['Loja'] == loja]
    df_prophet = prophet_df_favorita_loja[prophet_df_favorita_loja['Loja'] == loja]

    row = (i // 2) + 1
    col = (i % 2) + 1

    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_prophet['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0)), row=row, col=col)

    fig.update_xaxes(title_text='Data', row=row, col=col)
    fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=1500,
    title_text="Comparação de Previsões por Loja - Favorita",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

fig.show()


## M5

In [19]:
# Leitura dos arquivos CSV para M5
arima_df_m5_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Loja\ARIMA.csv')
cnn_df_m5_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Loja\CNN.csv')
lsmt_df_m5_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Loja\LSMT.csv')
prophet_df_m5_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Loja\prophet.csv')

# Leitura dos arquivos CSV de tempo para M5
arima_df_m5_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Loja\ARIMA.csv')
cnn_df_m5_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Loja\CNN.csv')
lsmt_df_m5_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Loja\LSMT.csv')
prophet_df_m5_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Loja\prophet.csv')

In [20]:
# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo por loja
arima_df_m5_tempo_loja['Base'] = 'M5'
arima_df_m5_tempo_loja['Tipo'] = 'Loja'
arima_df_m5_tempo_loja['Modelo'] = 'ARIMA'

cnn_df_m5_tempo_loja['Base'] = 'M5'
cnn_df_m5_tempo_loja['Tipo'] = 'Loja'
cnn_df_m5_tempo_loja['Modelo'] = 'CNN'

lsmt_df_m5_tempo_loja['Base'] = 'M5'
lsmt_df_m5_tempo_loja['Tipo'] = 'Loja'
lsmt_df_m5_tempo_loja['Modelo'] = 'LSMT'

prophet_df_m5_tempo_loja['Base'] = 'M5'
prophet_df_m5_tempo_loja['Tipo'] = 'Loja'
prophet_df_m5_tempo_loja['Modelo'] = 'Prophet'

# Concatena todos os dataframes de tempo por loja
tempo_df_m5_loja = pd.concat([arima_df_m5_tempo_loja, cnn_df_m5_tempo_loja, lsmt_df_m5_tempo_loja, prophet_df_m5_tempo_loja], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_m5_loja['Treino(%)'] = ((tempo_df_m5_loja['Treino'] / tempo_df_m5_loja['Treino'].sum()) * 100).round(2)
tempo_df_m5_loja['Previsao(%)'] = ((tempo_df_m5_loja['Previsao'] / tempo_df_m5_loja['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por loja
def calculate_rmse_mape_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por loja
metrics_m5_loja = {
    'Loja': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Loja',
    'Base': 'M5'
}

for df, model in zip([arima_df_m5_loja, cnn_df_m5_loja, lsmt_df_m5_loja, prophet_df_m5_loja], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        df_loja = df[df['Loja'] == loja]
        rmse, mape = calculate_rmse_mape_loja(df_loja)
        metrics_m5_loja['Loja'].append(loja)
        metrics_m5_loja['Model'].append(model)
        metrics_m5_loja['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
        metrics_m5_loja['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por loja
metrics_df_m5_loja = pd.DataFrame(metrics_m5_loja)

# Renomeia a coluna 'Model' em metrics_df_m5_loja para 'Modelo' para fazer o join
metrics_df_m5_loja.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_m5_loja e metrics_df_m5_loja
merged_df_m5_loja = pd.merge(tempo_df_m5_loja, metrics_df_m5_loja, on=['Modelo', 'Base', 'Tipo', 'Loja'])
# Ordena as colunas de forma adequada
merged_df_m5_loja = merged_df_m5_loja[['Loja', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_m5_loja.sort_values(by=['Loja','Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_m5_loja)

Unnamed: 0,Loja,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,CA_1,ARIMA,M5,Loja,538.684078,0.020655,6.54,0.26,2813,7.428361
10,CA_1,CNN,M5,Loja,5.211563,0.119365,0.06,1.48,2622,6.808329
20,CA_1,LSMT,M5,Loja,10.227205,0.510533,0.12,6.31,1624,4.208027
30,CA_1,Prophet,M5,Loja,0.17819,0.060421,0.0,0.75,1746,4.366955
1,CA_2,ARIMA,M5,Loja,1772.772636,0.072999,21.53,0.9,8840,25.164539
11,CA_2,CNN,M5,Loja,5.108984,0.150384,0.06,1.86,4318,12.729961
21,CA_2,LSMT,M5,Loja,8.650939,0.524632,0.11,6.48,2132,6.184952
31,CA_2,Prophet,M5,Loja,0.222654,0.079369,0.0,0.98,12684,36.208213
2,CA_3,ARIMA,M5,Loja,850.863738,0.010519,10.33,0.13,4756,9.787034
12,CA_3,CNN,M5,Loja,5.318629,0.132938,0.06,1.64,3596,6.697964


In [21]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_m5_loja['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=5, cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja}" for loja in lojas[:10]])

# Adicionar as linhas para cada loja
for i, loja in enumerate(lojas[:10]):
    df_arima = arima_df_m5_loja[arima_df_m5_loja['Loja'] == loja]
    df_cnn = cnn_df_m5_loja[cnn_df_m5_loja['Loja'] == loja]
    df_lsmt = lsmt_df_m5_loja[lsmt_df_m5_loja['Loja'] == loja]
    df_prophet = prophet_df_m5_loja[prophet_df_m5_loja['Loja'] == loja]

    row = (i // 2) + 1
    col = (i % 2) + 1

    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0)), row=row, col=col)

    fig.update_xaxes(title_text='Data', row=row, col=col)
    fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=1500,
    title_text="Comparação de Previsões por Loja - M5",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

fig.show()


## Olist

In [22]:
# Leitura dos arquivos CSV para Olist
arima_df_olist_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Loja\ARIMA.csv')
cnn_df_olist_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Loja\CNN.csv')
lsmt_df_olist_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Loja\LSMT.csv')
prophet_df_olist_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Loja\prophet.csv')

# Leitura dos arquivos CSV de tempo para Olist
arima_df_olist_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Loja\ARIMA.csv')
cnn_df_olist_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Loja\CNN.csv')
lsmt_df_olist_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Loja\LSMT.csv')
prophet_df_olist_tempo_loja = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Loja\prophet.csv')

In [23]:
# Adiciona as colunas 'Base', 'Tipo' e 'Modelo' a cada dataframe de tempo por loja
arima_df_olist_tempo_loja['Base'] = 'Olist'
arima_df_olist_tempo_loja['Tipo'] = 'Loja'
arima_df_olist_tempo_loja['Modelo'] = 'ARIMA'

cnn_df_olist_tempo_loja['Base'] = 'Olist'
cnn_df_olist_tempo_loja['Tipo'] = 'Loja'
cnn_df_olist_tempo_loja['Modelo'] = 'CNN'

lsmt_df_olist_tempo_loja['Base'] = 'Olist'
lsmt_df_olist_tempo_loja['Tipo'] = 'Loja'
lsmt_df_olist_tempo_loja['Modelo'] = 'LSMT'

prophet_df_olist_tempo_loja['Base'] = 'Olist'
prophet_df_olist_tempo_loja['Tipo'] = 'Loja'
prophet_df_olist_tempo_loja['Modelo'] = 'Prophet'


# Concatena todos os dataframes de tempo por loja
tempo_df_olist_loja = pd.concat([arima_df_olist_tempo_loja, cnn_df_olist_tempo_loja, lsmt_df_olist_tempo_loja, prophet_df_olist_tempo_loja], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_olist_loja['Treino(%)'] = ((tempo_df_olist_loja['Treino'] / tempo_df_olist_loja['Treino'].sum()) * 100).round(2)
tempo_df_olist_loja['Previsao(%)'] = ((tempo_df_olist_loja['Previsao'] / tempo_df_olist_loja['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por loja
def calculate_rmse_mape_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por loja
metrics_olist_loja = {
    'Loja': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Loja',
    'Base': 'Olist'
}

for df, model in zip([arima_df_olist_loja, cnn_df_olist_loja, lsmt_df_olist_loja, prophet_df_olist_loja], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        df_loja = df[df['Loja'] == loja]
        rmse, mape = calculate_rmse_mape_loja(df_loja)
        metrics_olist_loja['Loja'].append(loja)
        metrics_olist_loja['Model'].append(model)
        metrics_olist_loja['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
        metrics_olist_loja['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por loja
metrics_df_olist_loja = pd.DataFrame(metrics_olist_loja)

# Renomeia a coluna 'Model' em metrics_df_olist_loja para 'Modelo' para fazer o join
metrics_df_olist_loja.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_olist_loja e metrics_df_olist_loja
merged_df_olist_loja = pd.merge(tempo_df_olist_loja, metrics_df_olist_loja, on=['Modelo', 'Base', 'Tipo', 'Loja'])
# Ordena as colunas de forma adequada
merged_df_olist_loja = merged_df_olist_loja[['Loja', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_olist_loja.sort_values(by=['Loja','Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_olist_loja)

Unnamed: 0,Loja,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,Loja_1,ARIMA,Olist,Loja,26.370638,0.012243,6.85,0.16,19,84.42954
10,Loja_1,CNN,Olist,Loja,2.743404,0.117334,0.71,1.55,18,41.1872
20,Loja_1,LSMT,Olist,Loja,12.182565,0.575329,3.16,7.62,18,56.3781
30,Loja_1,Prophet,Olist,Loja,0.687403,0.041712,0.18,0.55,23,91.35096
9,Loja_10,ARIMA,Olist,Loja,21.008826,0.009099,5.46,0.12,25,489.1504
19,Loja_10,CNN,Olist,Loja,2.944746,0.126142,0.77,1.67,7,126.1015
29,Loja_10,LSMT,Olist,Loja,12.200912,0.559765,3.17,7.42,5,86.38934
39,Loja_10,Prophet,Olist,Loja,0.396731,0.050551,0.1,0.67,45,800.2965
1,Loja_2,ARIMA,Olist,Loja,20.679891,0.010005,5.37,0.13,32,178.8489
11,Loja_2,CNN,Olist,Loja,2.658906,0.133364,0.69,1.77,14,83.15874


In [24]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_olist_loja['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=5, cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja}" for loja in lojas[:10]])

# Adicionar as linhas para cada loja
for i, loja in enumerate(lojas[:10]):
    df_arima = arima_df_olist_loja[arima_df_olist_loja['Loja'] == loja]
    df_cnn = cnn_df_olist_loja[cnn_df_olist_loja['Loja'] == loja]
    df_lsmt = lsmt_df_olist_loja[lsmt_df_olist_loja['Loja'] == loja]
    df_prophet = prophet_df_olist_loja[prophet_df_olist_loja['Loja'] == loja]

    row = (i // 2) + 1
    col = (i % 2) + 1

    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_prophet['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0)), row=row, col=col)
    fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0)), row=row, col=col)

    fig.update_xaxes(title_text='Data', row=row, col=col)
    fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=1500,
    title_text="Comparação de Previsões por Loja - Olist",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

fig.show()

## Todas as lojas

In [25]:
# Concatena as bases de resultados por loja
final_results_loja_df = pd.concat([merged_df_loja, merged_df_m5_loja, merged_df_olist_loja], ignore_index=True)

# Exibe o dataframe resultante
display(final_results_loja_df)

Unnamed: 0,Loja,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,3,ARIMA,Favorita,Loja,60.104832,0.014030,2.99,0.18,29876,9.849908e+00
1,3,CNN,Favorita,Loja,6.413599,0.132664,0.32,1.74,29931,8.576498e+00
2,3,LSMT,Favorita,Loja,13.413112,0.489503,0.67,6.42,20419,5.833989e+00
3,3,Prophet,Favorita,Loja,0.250051,0.068587,0.01,0.90,50436,1.643521e+01
4,8,ARIMA,Favorita,Loja,48.862118,0.014308,2.43,0.19,14248,6.986637e+00
...,...,...,...,...,...,...,...,...,...,...
115,Loja_8,Prophet,Olist,Loja,0.362993,0.039608,0.09,0.52,29,1.762764e+18
116,Loja_9,ARIMA,Olist,Loja,34.237147,0.007649,8.89,0.10,23,1.725232e+02
117,Loja_9,CNN,Olist,Loja,2.641461,0.117076,0.69,1.55,12,5.352410e+01
118,Loja_9,LSMT,Olist,Loja,12.131645,0.563797,3.15,7.47,25,1.554407e+02


# Por item

## Favorita

In [26]:
# Leitura dos arquivos CSV
arima_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Item\ARIMA.csv')
cnn_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Item\CNN.csv')
lsmt_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Item\LSMT.csv')
prophet_df_favorita = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Favorita\Item\prophet.csv')

# Leitura dos arquivos CSV
arima_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Item\ARIMA.csv')
cnn_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Item\CNN.csv')
lsmt_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Item\LSMT.csv')
prophet_df_favorita_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Favorita\Item\prophet.csv')


In [27]:
# Adiciona as colunas 'Base', 'Tipo', 'Modelo' e 'Item' a cada dataframe de tempo por item e loja
arima_df_favorita_tempo['Base'] = 'Favorita'
arima_df_favorita_tempo['Tipo'] = 'Item'
arima_df_favorita_tempo['Modelo'] = 'ARIMA'

cnn_df_favorita_tempo['Base'] = 'Favorita'
cnn_df_favorita_tempo['Tipo'] = 'Item'
cnn_df_favorita_tempo['Modelo'] = 'CNN'

lsmt_df_favorita_tempo['Base'] = 'Favorita'
lsmt_df_favorita_tempo['Tipo'] = 'Item'
lsmt_df_favorita_tempo['Modelo'] = 'LSMT'

prophet_df_favorita_tempo['Base'] = 'Favorita'
prophet_df_favorita_tempo['Tipo'] = 'Item'
prophet_df_favorita_tempo['Modelo'] = 'Prophet'



# Concatena todos os dataframes de tempo por item e loja
tempo_df_item_loja = pd.concat([arima_df_favorita_tempo, cnn_df_favorita_tempo, lsmt_df_favorita_tempo, prophet_df_favorita_tempo,], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_item_loja['Treino(%)'] = ((tempo_df_item_loja['Treino'] / tempo_df_item_loja['Treino'].sum()) * 100).round(2)
tempo_df_item_loja['Previsao(%)'] = ((tempo_df_item_loja['Previsao'] / tempo_df_item_loja['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por item e loja
def calculate_rmse_mape_item_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por item e loja
metrics_item_loja = {
    'Loja': [],
    'Item': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Item',
    'Base': 'Favorita'
}

for df, model in zip([arima_df_favorita, cnn_df_favorita, lsmt_df_favorita, prophet_df_favorita], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        for item in df[df['Loja'] == loja]['Item'].unique():
            df_item_loja = df[(df['Loja'] == loja) & (df['Item'] == item)]
            rmse, mape = calculate_rmse_mape_item_loja(df_item_loja)
            metrics_item_loja['Loja'].append(loja)
            metrics_item_loja['Item'].append(item)
            metrics_item_loja['Model'].append(model)
            metrics_item_loja['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
            metrics_item_loja['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por item e loja
metrics_df_item_loja = pd.DataFrame(metrics_item_loja)

# Renomeia a coluna 'Model' em metrics_df_item_loja para 'Modelo' para fazer o join
metrics_df_item_loja.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_item_loja e metrics_df_item_loja
merged_df_item_loja = pd.merge(tempo_df_item_loja, metrics_df_item_loja, on=['Modelo', 'Base', 'Tipo', 'Loja', 'Item'])
# Ordena as colunas de forma adequada
merged_df_item_loja = merged_df_item_loja[['Loja', 'Item', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_item_loja.sort_values(by=['Loja', 'Item', 'Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_item_loja)

Unnamed: 0,Loja,Item,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,3,1047679,ARIMA,Favorita,Item,142.633928,0.065648,5.18,0.45,624,19.764904
20,3,1047679,CNN,Favorita,Item,4.863841,0.136849,0.18,0.94,618,19.617814
40,3,1047679,LSMT,Favorita,Item,5.308206,0.501984,0.19,3.44,423,12.865300
66,3,1047679,Prophet,Favorita,Item,0.167222,0.064224,0.01,0.44,821,26.970079
1,3,1503844,ARIMA,Favorita,Item,5.788506,0.005859,0.21,0.04,336,7.300324
...,...,...,...,...,...,...,...,...,...,...,...
75,51,257847,Prophet,Favorita,Item,0.188746,0.073381,0.01,0.50,294,23.064915
18,51,1503844,ARIMA,Favorita,Item,28.661329,0.008511,1.04,0.06,488,18.557319
38,51,1503844,CNN,Favorita,Item,4.079782,0.156573,0.15,1.07,272,8.786778
58,51,1503844,LSMT,Favorita,Item,12.005109,0.519078,0.44,3.56,405,15.532181


In [28]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_favorita['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=len(lojas), cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja} - Item {item}" for loja in lojas for item in arima_df_favorita[arima_df_favorita['Loja'] == loja]['Item'].unique()])

# Adicionar as linhas para cada loja e item
for i, loja in enumerate(lojas):
    itens = arima_df_favorita[arima_df_favorita['Loja'] == loja]['Item'].unique()
    for j, item in enumerate(itens):
        df_arima = arima_df_favorita[(arima_df_favorita['Loja'] == loja) & (arima_df_favorita['Item'] == item)]
        df_cnn = cnn_df_favorita[(cnn_df_favorita['Loja'] == loja) & (cnn_df_favorita['Item'] == item)]
        df_lsmt = lsmt_df_favorita[(lsmt_df_favorita['Loja'] == loja) & (lsmt_df_favorita['Item'] == item)]
        df_prophet = prophet_df_favorita[(prophet_df_favorita['Loja'] == loja) & (prophet_df_favorita['Item'] == item)]

        row = i + 1
        col = (j % 2) + 1

        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_prophet['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0 and j == 0)), row=row, col=col)

        fig.update_xaxes(title_text='Data', row=row, col=col)
        fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=2000,
    title_text="Comparação de Previsões por Loja e Item - Favorita",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=12,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

# Diminui o tamanho das fontes dos eixos
fig.update_xaxes(tickfont=dict(size=10))
fig.update_yaxes(tickfont=dict(size=10))

fig.show()


## M5

In [29]:
# Leitura dos arquivos CSV para M5
arima_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Item\ARIMA.csv')
cnn_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Item\CNN.csv')
lsmt_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Item\LSMT.csv')
prophet_df_m5 = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\M5\Item\prophet.csv')

# Leitura dos arquivos CSV de tempo para M5
arima_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Item\ARIMA.csv')
cnn_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Item\CNN.csv')
lsmt_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Item\LSMT.csv')
prophet_df_m5_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\M5\Item\prophet.csv')


In [30]:
# Adiciona as colunas 'Base', 'Tipo', 'Modelo' e 'Item' a cada dataframe de tempo por item e loja
arima_df_m5_tempo['Base'] = 'M5'
arima_df_m5_tempo['Tipo'] = 'Item'
arima_df_m5_tempo['Modelo'] = 'ARIMA'

cnn_df_m5_tempo['Base'] = 'M5'
cnn_df_m5_tempo['Tipo'] = 'Item'
cnn_df_m5_tempo['Modelo'] = 'CNN'

lsmt_df_m5_tempo['Base'] = 'M5'
lsmt_df_m5_tempo['Tipo'] = 'Item'
lsmt_df_m5_tempo['Modelo'] = 'LSMT'

prophet_df_m5_tempo['Base'] = 'M5'
prophet_df_m5_tempo['Tipo'] = 'Item'
prophet_df_m5_tempo['Modelo'] = 'Prophet'


# Concatena todos os dataframes de tempo por item e loja
tempo_df_item_loja_m5 = pd.concat([arima_df_m5_tempo, cnn_df_m5_tempo, lsmt_df_m5_tempo, prophet_df_m5_tempo], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_item_loja_m5['Treino(%)'] = ((tempo_df_item_loja_m5['Treino'] / tempo_df_item_loja_m5['Treino'].sum()) * 100).round(2)
tempo_df_item_loja_m5['Previsao(%)'] = ((tempo_df_item_loja_m5['Previsao'] / tempo_df_item_loja_m5['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por item e loja
def calculate_rmse_mape_item_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por item e loja
metrics_item_loja_m5 = {
    'Loja': [],
    'Item': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Item',
    'Base': 'M5'
}

for df, model in zip([arima_df_m5, cnn_df_m5, lsmt_df_m5, prophet_df_m5], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        for item in df[df['Loja'] == loja]['Item'].unique():
            df_item_loja = df[(df['Loja'] == loja) & (df['Item'] == item)]
            rmse, mape = calculate_rmse_mape_item_loja(df_item_loja)
            metrics_item_loja_m5['Loja'].append(loja)
            metrics_item_loja_m5['Item'].append(item)
            metrics_item_loja_m5['Model'].append(model)
            metrics_item_loja_m5['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
            metrics_item_loja_m5['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por item e loja
metrics_df_item_loja_m5 = pd.DataFrame(metrics_item_loja_m5)

# Renomeia a coluna 'Model' em metrics_df_item_loja_m5 para 'Modelo' para fazer o join
metrics_df_item_loja_m5.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_item_loja_m5 e metrics_df_item_loja_m5
merged_df_item_loja_m5 = pd.merge(tempo_df_item_loja_m5, metrics_df_item_loja_m5, on=['Modelo', 'Base', 'Tipo', 'Loja', 'Item'])
# Ordena as colunas de forma adequada
merged_df_item_loja_m5 = merged_df_item_loja_m5[['Loja', 'Item', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_item_loja_m5.sort_values(by=['Loja', 'Item', 'Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_item_loja_m5)

Unnamed: 0,Loja,Item,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,CA_1,FOODS_3_090,ARIMA,M5,Item,16.059195,0.006001,0.27,0.04,399,5.642561e+19
20,CA_1,FOODS_3_090,CNN,M5,Item,5.284324,0.117800,0.09,0.70,212,3.213837e+19
40,CA_1,FOODS_3_090,LSMT,M5,Item,12.608272,0.535508,0.21,3.20,162,1.761615e+19
60,CA_1,FOODS_3_090,Prophet,M5,Item,0.203334,0.064626,0.00,0.39,214,3.042686e+19
1,CA_1,FOODS_3_586,ARIMA,M5,Item,628.162231,0.063548,10.60,0.38,50,1.473044e+01
...,...,...,...,...,...,...,...,...,...,...,...
78,WI_3,FOODS_3_090,Prophet,M5,Item,0.189872,0.060767,0.00,0.36,306,2.145115e+19
19,WI_3,FOODS_3_226,ARIMA,M5,Item,203.941258,0.008017,3.44,0.05,44,1.141279e+01
39,WI_3,FOODS_3_226,CNN,M5,Item,4.637714,0.160367,0.08,0.96,51,1.230573e+01
59,WI_3,FOODS_3_226,LSMT,M5,Item,13.660626,0.567002,0.23,3.39,50,1.271000e+01


In [31]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_m5['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=len(lojas), cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja} - Item {item}" for loja in lojas for item in arima_df_m5[arima_df_m5['Loja'] == loja]['Item'].unique()])

# Adicionar as linhas para cada loja e item
for i, loja in enumerate(lojas):
    itens = arima_df_m5[arima_df_m5['Loja'] == loja]['Item'].unique()
    for j, item in enumerate(itens):
        df_arima = arima_df_m5[(arima_df_m5['Loja'] == loja) & (arima_df_m5['Item'] == item)]
        df_cnn = cnn_df_m5[(cnn_df_m5['Loja'] == loja) & (cnn_df_m5['Item'] == item)]
        df_lsmt = lsmt_df_m5[(lsmt_df_m5['Loja'] == loja) & (lsmt_df_m5['Item'] == item)]
        df_prophet = prophet_df_m5[(prophet_df_m5['Loja'] == loja) & (prophet_df_m5['Item'] == item)]

        row = i + 1
        col = (j % 2) + 1

        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_prophet['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0 and j == 0)), row=row, col=col)

        fig.update_xaxes(title_text='Data', row=row, col=col)
        fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=2000,
    title_text="Comparação de Previsões por Loja e Item - M5",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=12,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

# Diminui o tamanho das fontes dos eixos
fig.update_xaxes(tickfont=dict(size=10))
fig.update_yaxes(tickfont=dict(size=10))

fig.show()

## Olist

In [32]:
# Leitura dos arquivos CSV para Olist
arima_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Item\ARIMA.csv')
cnn_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Item\CNN.csv')
lsmt_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Item\LSMT.csv')
prophet_df_olist = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Previsao\Olist\Item\prophet.csv')

# Leitura dos arquivos CSV de tempo para Olist
arima_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Item\ARIMA.csv')
cnn_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Item\CNN.csv')
lsmt_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Item\LSMT.csv')
prophet_df_olist_tempo = pd.read_csv(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Tempo\Olist\Item\prophet.csv')

In [33]:
# Adiciona as colunas 'Base', 'Tipo', 'Modelo' e 'Item' a cada dataframe de tempo por item e loja
arima_df_olist_tempo['Base'] = 'Olist'
arima_df_olist_tempo['Tipo'] = 'Item'
arima_df_olist_tempo['Modelo'] = 'ARIMA'

cnn_df_olist_tempo['Base'] = 'Olist'
cnn_df_olist_tempo['Tipo'] = 'Item'
cnn_df_olist_tempo['Modelo'] = 'CNN'

lsmt_df_olist_tempo['Base'] = 'Olist'
lsmt_df_olist_tempo['Tipo'] = 'Item'
lsmt_df_olist_tempo['Modelo'] = 'LSMT'

prophet_df_olist_tempo['Base'] = 'Olist'
prophet_df_olist_tempo['Tipo'] = 'Item'
prophet_df_olist_tempo['Modelo'] = 'Prophet'

# Concatena todos os dataframes de tempo por item e loja
tempo_df_item_loja_olist = pd.concat([arima_df_olist_tempo, cnn_df_olist_tempo, lsmt_df_olist_tempo, prophet_df_olist_tempo], ignore_index=True)

# Calcula a porcentagem de tempo de treino e previsão com duas casas decimais
tempo_df_item_loja_olist['Treino(%)'] = ((tempo_df_item_loja_olist['Treino'] / tempo_df_item_loja_olist['Treino'].sum()) * 100).round(2)
tempo_df_item_loja_olist['Previsao(%)'] = ((tempo_df_item_loja_olist['Previsao'] / tempo_df_item_loja_olist['Previsao'].sum()) * 100).round(2)

# Função para calcular RMSE e MAPE por item e loja
def calculate_rmse_mape_item_loja(df, real_col='Real', predicted_col='Previsto'):
    rmse = np.sqrt(mean_squared_error(df[real_col], df[predicted_col]))
    mape = mean_absolute_percentage_error(df[real_col], df[predicted_col]) * 100  # Converte MAPE para porcentagem
    return rmse, mape

# Calcula RMSE e MAPE para cada dataframe por item e loja
metrics_item_loja_olist = {
    'Loja': [],
    'Item': [],
    'Model': [],
    'RMSE(#)': [],
    'MAPE(%)': [],
    'Tipo': 'Item',
    'Base': 'Olist'
}

for df, model in zip([arima_df_olist, cnn_df_olist, lsmt_df_olist, prophet_df_olist], ['ARIMA', 'CNN', 'LSMT', 'Prophet']):
    for loja in df['Loja'].unique():
        for item in df[df['Loja'] == loja]['Item'].unique():
            df_item_loja = df[(df['Loja'] == loja) & (df['Item'] == item)]
            rmse, mape = calculate_rmse_mape_item_loja(df_item_loja)
            metrics_item_loja_olist['Loja'].append(loja)
            metrics_item_loja_olist['Item'].append(item)
            metrics_item_loja_olist['Model'].append(model)
            metrics_item_loja_olist['RMSE(#)'].append(int(rmse))  # Converte RMSE para inteiro
            metrics_item_loja_olist['MAPE(%)'].append(mape)

# Cria um dataframe com os resultados por item e loja
metrics_df_item_loja_olist = pd.DataFrame(metrics_item_loja_olist)

# Renomeia a coluna 'Model' em metrics_df_item_loja_olist para 'Modelo' para fazer o join
metrics_df_item_loja_olist.rename(columns={'Model': 'Modelo'}, inplace=True)

# Faz o join entre tempo_df_item_loja_olist e metrics_df_item_loja_olist
merged_df_item_loja_olist = pd.merge(tempo_df_item_loja_olist, metrics_df_item_loja_olist, on=['Modelo', 'Base', 'Tipo', 'Loja', 'Item'])
# Ordena as colunas de forma adequada
merged_df_item_loja_olist = merged_df_item_loja_olist[['Loja', 'Item', 'Modelo', 'Base', 'Tipo', 'Treino', 'Previsao', 'Treino(%)', 'Previsao(%)', 'RMSE(#)', 'MAPE(%)']]

merged_df_item_loja_olist.sort_values(by=['Loja', 'Item', 'Modelo'], inplace=True)
# Exibe o dataframe resultante
display(merged_df_item_loja_olist)

Unnamed: 0,Loja,Item,Modelo,Base,Tipo,Treino,Previsao,Treino(%),Previsao(%),RMSE(#),MAPE(%)
0,Loja_1,Item_1,ARIMA,Olist,Item,34.098256,0.007006,3.02,0.05,4,6.162689e+17
20,Loja_1,Item_1,CNN,Olist,Item,2.711693,0.130087,0.24,0.86,4,2.069664e+17
40,Loja_1,Item_1,LSMT,Olist,Item,12.763350,0.901449,1.13,5.96,57,1.052885e+18
60,Loja_1,Item_1,Prophet,Olist,Item,0.566593,0.045304,0.05,0.30,9,1.225422e+18
1,Loja_1,Item_2,ARIMA,Olist,Item,21.529835,0.007996,1.91,0.05,2,8.498728e+16
...,...,...,...,...,...,...,...,...,...,...,...
76,Loja_9,Item_17,Prophet,Olist,Item,0.462499,0.044311,0.04,0.29,2,5.128044e+16
17,Loja_9,Item_18,ARIMA,Olist,Item,12.211263,0.004023,1.08,0.03,1,1.526961e+17
37,Loja_9,Item_18,CNN,Olist,Item,2.642495,0.117207,0.23,0.77,1,3.579275e+17
57,Loja_9,Item_18,LSMT,Olist,Item,10.350329,0.535233,0.92,3.54,6,1.042926e+18


In [34]:
from plotly.subplots import make_subplots

# Obter a lista de lojas únicas
lojas = arima_df_olist['Loja'].unique()

# Criar a figura com subplots
fig = make_subplots(rows=len(lojas), cols=2, shared_xaxes=False, subplot_titles=[f"Loja {loja} - Item {item}" for loja in lojas for item in arima_df_olist[arima_df_olist['Loja'] == loja]['Item'].unique()])

# Adicionar as linhas para cada loja e item
for i, loja in enumerate(lojas):
    itens = arima_df_olist[arima_df_olist['Loja'] == loja]['Item'].unique()
    for j, item in enumerate(itens):
        df_arima = arima_df_olist[(arima_df_olist['Loja'] == loja) & (arima_df_olist['Item'] == item)]
        df_cnn = cnn_df_olist[(cnn_df_olist['Loja'] == loja) & (cnn_df_olist['Item'] == item)]
        df_lsmt = lsmt_df_olist[(lsmt_df_olist['Loja'] == loja) & (lsmt_df_olist['Item'] == item)]
        df_prophet = prophet_df_olist[(prophet_df_olist['Loja'] == loja) & (prophet_df_olist['Item'] == item)]

        row = i + 1
        col = (j % 2) + 1

        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Real'], mode='lines+markers', name='Real', line=dict(color='black'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_arima['Data'], y=df_arima['Previsto'], mode='lines', name='ARIMA', line=dict(color='#1f77b4'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_lsmt['Data'], y=df_lsmt['Previsto'], mode='lines', name='LSMT', line=dict(color='#ff7f0e'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_prophet['Data'], y=df_prophet['Previsto'], mode='lines', name='Prophet', line=dict(color='#2ca02c'), showlegend=(i == 0 and j == 0)), row=row, col=col)
        fig.add_trace(go.Scatter(x=df_cnn['Data'], y=df_cnn['Previsto'], mode='lines', name='CNN', line=dict(color='#9467bd'), showlegend=(i == 0 and j == 0)), row=row, col=col)

        fig.update_xaxes(title_text='Data', row=row, col=col)
        fig.update_yaxes(title_text='Vendas', row=row, col=col)

# Configurações do layout
fig.update_layout(
    height=2000,
    title_text="Comparação de Previsões por Loja e Item - Olist",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=12,
        color="black"
    ),
    legend=dict(
        title="Modelos",
        orientation="h",
        yanchor="bottom",
        y=1.02,
        xanchor="right",
        x=1
    ),
    legend_tracegroupgap=0
)

# Atualiza a visibilidade das linhas para que a legenda interaja com todos os gráficos
for trace in fig['data']:
    trace['legendgroup'] = trace['name']
    trace['showlegend'] = False

# Mostra apenas uma linha do grupo na legenda
fig['data'][0]['showlegend'] = True
fig['data'][1]['showlegend'] = True
fig['data'][2]['showlegend'] = True
fig['data'][3]['showlegend'] = True
fig['data'][4]['showlegend'] = True

# Diminui o tamanho das fontes dos eixos
fig.update_xaxes(tickfont=dict(size=10))
fig.update_yaxes(tickfont=dict(size=10))

fig.show()

## Todas as bases

In [35]:
df_item_loja = pd.concat([merged_df_item_loja, merged_df_item_loja_m5, merged_df_item_loja_olist], ignore_index=True)
df_item_loja.drop(columns=['Treino(%)','Previsao(%)'], inplace=True)
display(df_item_loja)

Unnamed: 0,Loja,Item,Modelo,Base,Tipo,Treino,Previsao,RMSE(#),MAPE(%)
0,3,1047679,ARIMA,Favorita,Item,142.633928,0.065648,624,1.976490e+01
1,3,1047679,CNN,Favorita,Item,4.863841,0.136849,618,1.961781e+01
2,3,1047679,LSMT,Favorita,Item,5.308206,0.501984,423,1.286530e+01
3,3,1047679,Prophet,Favorita,Item,0.167222,0.064224,821,2.697008e+01
4,3,1503844,ARIMA,Favorita,Item,5.788506,0.005859,336,7.300324e+00
...,...,...,...,...,...,...,...,...,...
235,Loja_9,Item_17,Prophet,Olist,Item,0.462499,0.044311,2,5.128044e+16
236,Loja_9,Item_18,ARIMA,Olist,Item,12.211263,0.004023,1,1.526961e+17
237,Loja_9,Item_18,CNN,Olist,Item,2.642495,0.117207,1,3.579275e+17
238,Loja_9,Item_18,LSMT,Olist,Item,10.350329,0.535233,6,1.042926e+18


# Todas as granularidades e bases

In [36]:
final_results_df['Loja'] = 'Todas'
final_results_df['Item'] = 'Todos'
final_results_df.drop(columns=['Treino(%)','Previsao(%)'], inplace=True)
final_results_loja_df['Item'] = 'Todos'
final_results_loja_df.drop(columns=['Treino(%)','Previsao(%)'], inplace=True)
resultados_completo = pd.concat([final_results_df, final_results_loja_df, df_item_loja], ignore_index=True)

In [37]:
resultados_completo.to_excel(r'C:\Users\BRAINER.CAMPOS\Desktop\TCC\Resultados\Resultados_Finais.xlsx', index=False)

ModuleNotFoundError: No module named 'openpyxl'

# Análise de Tempo

In [39]:
resultados_completo

Unnamed: 0,Modelo,Base,Tipo,Treino,Previsao,RMSE(#),MAPE(%),Loja,Item
0,ARIMA,Favorita,Tudo,93.273346,0.019063,501644,7.168455e+00,Todas,Todos
1,CNN,Favorita,Tudo,3.817574,0.141353,779006,1.057108e+01,Todas,Todos
2,LSMT,Favorita,Tudo,61.747025,0.688389,499710,6.832131e+00,Todas,Todos
3,Prophet,Favorita,Tudo,0.387224,0.108174,826610,1.221320e+01,Todas,Todos
4,ARIMA,M5,Tudo,882.018378,0.033104,16910,5.395437e+00,Todas,Todos
...,...,...,...,...,...,...,...,...,...
347,LSMT,Olist,Item,9.030175,0.569568,10,1.401821e+18,Loja_9,Item_17
348,Prophet,Olist,Item,0.365391,0.038744,2,5.128044e+16,Loja_9,Item_17
349,ARIMA,Olist,Item,21.423446,0.001927,1,1.526961e+17,Loja_9,Item_18
350,LSMT,Olist,Item,10.400242,0.529838,6,9.222700e+17,Loja_9,Item_18


In [40]:
import plotly.graph_objects as go
import pandas as pd

# Calcula as porcentagens para os valores de Treino
treemap_treino = pd.DataFrame(resultados_completo.groupby('Modelo')['Treino'].sum())
treemap_treino['Treino_Percentual'] = (
    treemap_treino['Treino'] / treemap_treino['Treino'].sum() * 100
)

# Define as cores para cada modelo
colors = {
    'ARIMA': '#1f77b4',
    'CNN': '#ff7f0e',
    'LSMT': '#2ca02c',
    'Prophet': '#d62728'}

# Adiciona uma pequena proporção fixa para valores muito pequenos
min_value = 0.5  # Porcentagem mínima para exibição
treemap_treino['Treino_Percentual_Adjusted'] = treemap_treino['Treino_Percentual'].apply(
    lambda x: max(x, min_value)
)

# Cria o treemap para Treino
fig_treino = go.Figure()

fig_treino.add_trace(go.Treemap(
    labels=treemap_treino.index,
    parents=[""] * len(treemap_treino),
    values=treemap_treino['Treino_Percentual_Adjusted'],  # Usa os valores ajustados para tamanho
    text=treemap_treino['Treino_Percentual'].map(lambda x: f"{x:.2f}%"),  # Exibe os valores reais como texto
    textinfo="label+text",  # Exibe rótulo e o texto formatado
    marker=dict(colors=[colors[model] for model in treemap_treino.index]),
    name="Treemap"
))

# Adiciona traços para a legenda personalizada
for model, color in colors.items():
    fig_treino.add_trace(go.Scatter(
        x=[None], y=[None],  # Fake data para criar a legenda
        mode='markers',
        marker=dict(size=10, color=color),
        name=model
    ))

# Configurações do layout para Treino
fig_treino.update_layout(
    title="Treemap de Treino por Modelo",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title=dict(text="Modelos"),
        orientation="h",
        yanchor="bottom",
        y=1,
        xanchor="right",
        x=1
    ),
    xaxis=dict(visible=False),  # Oculta o eixo X
    yaxis=dict(visible=False),  # Oculta o eixo Y
    height=500,  # Aumenta a altura do gráfico
    width=1200   # Aumenta a largura do gráfico
)

# Mostra o gráfico
fig_treino.show()

In [41]:
import plotly.graph_objects as go
import pandas as pd

# Calcula as porcentagens para os valores de Previsao
treemap_previsao = pd.DataFrame(resultados_completo.groupby('Modelo')['Previsao'].sum())
treemap_previsao['Previsao_Percentual'] = (
    treemap_previsao['Previsao'] / treemap_previsao['Previsao'].sum() * 100
)

# Define as cores para cada modelo
colors = {
    'ARIMA': '#1f77b4',
    'CNN': '#ff7f0e',
    'LSMT': '#2ca02c',
    'Prophet': '#d62728'
}

# Adiciona uma pequena proporção fixa para valores muito pequenos
min_value = 0.5  # Porcentagem mínima para exibição
treemap_previsao['Previsao_Percentual_Adjusted'] = treemap_previsao['Previsao_Percentual'].apply(
    lambda x: max(x, min_value)
)

# Cria o treemap para Previsao
fig_previsao = go.Figure()

fig_previsao.add_trace(go.Treemap(
    labels=treemap_previsao.index,
    parents=[""] * len(treemap_previsao),
    values=treemap_previsao['Previsao_Percentual_Adjusted'],  # Usa os valores ajustados para tamanho
    text=treemap_previsao['Previsao_Percentual'].map(lambda x: f"{x:.2f}%"),  # Exibe os valores reais como texto
    textinfo="label+text",  # Exibe rótulo e o texto formatado
    marker=dict(colors=[colors[model] for model in treemap_previsao.index]),
    name="Treemap"
))

# Adiciona traços para a legenda personalizada
for model, color in colors.items():
    fig_previsao.add_trace(go.Scatter(
        x=[None], y=[None],  # Fake data para criar a legenda
        mode='markers',
        marker=dict(size=10, color=color),
        name=model
    ))

# Configurações do layout para Previsao
fig_previsao.update_layout(
    title="Treemap de Previsão por Modelo",
    template='plotly_white',
    font=dict(
        family="Arial, sans-serif",
        size=14,
        color="black"
    ),
    legend=dict(
        title=dict(text="Modelos"),
        orientation="h",
        yanchor="bottom",
        y=1,
        xanchor="right",
        x=1
    ),
    xaxis=dict(visible=False),  # Oculta o eixo X
    yaxis=dict(visible=False),  # Oculta o eixo Y
    height=500,  # Aumenta a altura do gráfico
    width=1200   # Aumenta a largura do gráfico
)

# Mostra o gráfico
fig_previsao.show()