In [4]:
import pandas as pd

In [5]:
# 1. Carregar os dados
df = pd.read_parquet('../data/processed/dados_completos_commodities.parquet')

# 2. Tratamento de Buracos (Missing Values)
# Ffill propaga o preço de ontem se hoje for feriado
df_tratado = df.ffill()
df_tratado = df_tratado.dropna()

# 3. Definição das constantes
FATOR_ARABICA = 132.276  # 1 Saca = 132.276 Libras
FATOR_ROBUSTA = 0.06     # 1 Saca = 0.06 Toneladas

# 4. Criação das colunas de Preço Real (BRL)
# Arábica
df_tratado['Arabica_BRL'] = (df_tratado['Arabica'] / 100) * FATOR_ARABICA * df_tratado['Dolar']
# Robusta
df_tratado['Robusta_BRL'] = df_tratado['Robusta'] * FATOR_ROBUSTA * df_tratado['Dolar']

# 5. Refinamento (Arredondamento)
df_tratado['Arabica_BRL'] = df_tratado['Arabica_BRL'].round(2)
df_tratado['Robusta_BRL'] = df_tratado['Robusta_BRL'].round(2)

# --- A CORREÇÃO DE ARQUITETURA ---
# Tiramos a Data do "Index" e transformamos em uma coluna normal.
# Isso evita o erro 'KeyError: Date' nos gráficos.
df_tratado = df_tratado.reset_index()

# 6. Salvando o arquivo definitivo
df_tratado.to_parquet('../data/processed/dados_completos_commodities.parquet')

# --- VALIDAÇÃO ---
print("✅ Transformação concluída!")
print("--- Amostra dos Dados Finais ---")
display(df_tratado.tail()) 
# Verifique: Agora você deve ver números (0, 1, 2...) na esquerda e 'Date' como coluna.

✅ Transformação concluída!
--- Amostra dos Dados Finais ---


Unnamed: 0,level_0,index,Date,Dolar,Arabica,Robusta,Arabica_BRL,Robusta_BRL
1295,1295,1295,2026-01-12,5.3703,356.049988,3845.0,2529.24,1238.93
1296,1296,1296,2026-01-13,5.3737,360.25,3882.0,2560.7,1251.64
1297,1297,1297,2026-01-14,5.3713,356.0,3879.0,2529.36,1250.12
1298,1298,1298,2026-01-15,5.3961,358.100006,3923.0,2556.03,1270.13
1299,1299,1299,2026-01-16,5.3694,355.100006,4013.0,2522.07,1292.84
