In [None]:
import os
import json
import pandas as pd


# Caminho absoluto do arquivo JSON
caminho_json = "C:/Users/win 10/Documents/GitHub/neotass_etl/data/registros_oportunidades.json"
caminho_parquet = "C:/Users/win 10/Documents/GitHub/neotass_etl/data/sellout.parquet"

# Verificar se o arquivo existe antes de tentar abrir
if os.path.exists(caminho_json):
    with open(caminho_json, "r", encoding="utf-8") as file:
        oportunidades = json.load(file)

    # Convertendo para DataFrame
    df_oportunidades = pd.DataFrame(oportunidades)

    # Exibir as primeiras linhas do DataFrame
    print(df_oportunidades.head())
else:
    print(f"Erro: Arquivo não encontrado no caminho {caminho_json}")

# Agora vamos carregar os dados do sellout (vendas)
if os.path.exists(caminho_parquet):
    df_sellout = pd.read_parquet(caminho_parquet)

    # Exibir as primeiras linhas do DataFrame
    print(df_sellout.head())
else:
    print(f"Erro: Arquivo não encontrado no caminho {caminho_parquet}")

# ---- Transformação dos Dados ----

# Renomeando colunas do df_oportunidades para o modelo dimensional
df_oportunidades.rename(columns={
    "id": "id_oportunidade",
    "partner_id": "id_parceiro",
    "product_id": "id_produto",
    "created_at": "data_registro",
    "quantity": "quantidade",
    "total_value": "valor_total",
    "status": "status"
}, inplace=True)

# Convertendo a coluna de data para o formato datetime
df_oportunidades["data_registro"] = pd.to_datetime(df_oportunidades["data_registro"])

# Exibir para conferir se está certo
print(df_oportunidades.head())

# Renomeando colunas do df_sellout para o modelo dimensional
df_sellout.rename(columns={
    "id": "id_sellout",
    "partner_id": "id_parceiro",
    "product_id": "id_produto",
    "invoice_date": "data_fatura",
    "invoice_number": "nf",
    "quantity": "quantidade",
    "total_value": "valor_total"
}, inplace=True)

# Convertendo a coluna de data para datetime
df_sellout["data_fatura"] = pd.to_datetime(df_sellout["data_fatura"])

# Exibir para conferir se está certo
print(df_sellout.head())

# ---- Carregamento dos Dados ----

# Criando diretório "output" caso não exista
output_dir = "C:/Users/win 10/Documents/GitHub/neotass_etl/output"
os.makedirs(output_dir, exist_ok=True)

# Salvando os dados transformados no formato Excel
df_oportunidades.to_excel(os.path.join(output_dir, "fato_registro_oportunidade.xlsx"), index=False)
df_sellout.to_excel(os.path.join(output_dir, "fato_sellout.xlsx"), index=False)

print("ETL concluído com sucesso! Os arquivos foram salvos na pasta 'output'.")
