In [1]:
import pandas as pd
import zipfile
import os

In [2]:
# CNPJ da Petrobras
CNPJ_PETROBRAS = "33.000.167/0001-01"

# Caminho para o arquivo ZIP
PATH_ZIP = "../data/raw/balancos_cvm/dfp_cia_aberta_2024.zip"

# Nome dos arquivos CSV dentro do ZIP
# (usamos _con para 'consolidado' e não _ind para 'individual')
FILE_DRE = "dfp_cia_aberta_DRE_con_2024.csv"
FILE_BPA = "dfp_cia_aberta_BPA_con_2024.csv"
FILE_BPP = "dfp_cia_aberta_BPP_con_2024.csv"

print(f"Constantes definidas. CNPJ alvo: {CNPJ_PETROBRAS}")

Constantes definidas. CNPJ alvo: 33.000.167/0001-01


In [3]:
# Abrir o arquivo ZIP
try:
    zf = zipfile.ZipFile(PATH_ZIP)
    
    # Ler o DRE (Demonstração do Resultado)
    dre_df = pd.read_csv(
        zf.open(FILE_DRE), 
        sep=';', 
        encoding='latin1'
    )
    
    print("DRE (consolidado) carregado com sucesso (com tipos numéricos corretos).")
    print(f"Total de linhas no DRE: {len(dre_df)}")

except FileNotFoundError:
    print(f"ERRO: Arquivo ZIP não encontrado.")
    print(f"Verifique se o caminho está correto: {PATH_ZIP}")
except Exception as e:
    print(f"ERRO ao ler o arquivo: {e}")

DRE (consolidado) carregado com sucesso (com tipos numéricos corretos).
Total de linhas no DRE: 31972


In [4]:
petro_dre_df = dre_df[
    (dre_df['CNPJ_CIA'] == CNPJ_PETROBRAS) & 
    (dre_df['ORDEM_EXERC'] == 'ÚLTIMO')
].copy()

# Exibir as colunas e as primeiras linhas dos dados da Petrobras
print(f"Colunas do DRE: {petro_dre_df.columns.to_list()}")
print("\n--- DRE Filtrado da Petrobras (Último Exercício) ---")
display(petro_dre_df.head())

Colunas do DRE: ['CNPJ_CIA', 'DT_REFER', 'VERSAO', 'DENOM_CIA', 'CD_CVM', 'GRUPO_DFP', 'MOEDA', 'ESCALA_MOEDA', 'ORDEM_EXERC', 'DT_INI_EXERC', 'DT_FIM_EXERC', 'CD_CONTA', 'DS_CONTA', 'VL_CONTA', 'ST_CONTA_FIXA']

--- DRE Filtrado da Petrobras (Último Exercício) ---


Unnamed: 0,CNPJ_CIA,DT_REFER,VERSAO,DENOM_CIA,CD_CVM,GRUPO_DFP,MOEDA,ESCALA_MOEDA,ORDEM_EXERC,DT_INI_EXERC,DT_FIM_EXERC,CD_CONTA,DS_CONTA,VL_CONTA,ST_CONTA_FIXA
18935,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Demonstração do Resultado,REAL,MIL,ÚLTIMO,2024-01-01,2024-12-31,3.01,Receita de Venda de Bens e/ou Serviços,490829000.0,S
18937,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Demonstração do Resultado,REAL,MIL,ÚLTIMO,2024-01-01,2024-12-31,3.02,Custo dos Bens e/ou Serviços Vendidos,-244367000.0,S
18939,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Demonstração do Resultado,REAL,MIL,ÚLTIMO,2024-01-01,2024-12-31,3.03,Resultado Bruto,246462000.0,S
18941,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Demonstração do Resultado,REAL,MIL,ÚLTIMO,2024-01-01,2024-12-31,3.04,Despesas/Receitas Operacionais,-109261000.0,S
18943,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Demonstração do Resultado,REAL,MIL,ÚLTIMO,2024-01-01,2024-12-31,3.04.01,Despesas com Vendas,-26134000.0,S


In [5]:
# Ler o BPA (Balanço Patrimonial Ativo)
bpa_df = pd.read_csv(
    zf.open(FILE_BPA), 
    sep=';', 
    encoding='latin1',
)

# Ler o BPP (Balanço Patrimonial Passivo)
bpp_df = pd.read_csv(
    zf.open(FILE_BPP), 
    sep=';', 
    encoding='latin1',
)

print("BPA (Ativo) e BPP (Passivo) carregados com sucesso.")

BPA (Ativo) e BPP (Passivo) carregados com sucesso.


In [6]:
# Filtrar Ativo
petro_bpa_df = bpa_df[
    (bpa_df['CNPJ_CIA'] == CNPJ_PETROBRAS) & 
    (bpa_df['ORDEM_EXERC'] == 'ÚLTIMO')
].copy()

# Filtrar Passivo
petro_bpp_df = bpp_df[
    (bpp_df['CNPJ_CIA'] == CNPJ_PETROBRAS) & 
    (bpp_df['ORDEM_EXERC'] == 'ÚLTIMO')
].copy()

print("--- BPA Filtrado da Petrobras (Ativo) ---")
display(petro_bpa_df.head())
print("\n--- BPP Filtrado da Petrobras (Passivo) ---")
display(petro_bpp_df.head())

--- BPA Filtrado da Petrobras (Ativo) ---


Unnamed: 0,CNPJ_CIA,DT_REFER,VERSAO,DENOM_CIA,CD_CVM,GRUPO_DFP,MOEDA,ESCALA_MOEDA,ORDEM_EXERC,DT_FIM_EXERC,CD_CONTA,DS_CONTA,VL_CONTA,ST_CONTA_FIXA
36863,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Ativo,REAL,MIL,ÚLTIMO,2024-12-31,1,Ativo Total,1124797000.0,S
36865,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Ativo,REAL,MIL,ÚLTIMO,2024-12-31,1.01,Ativo Circulante,135212000.0,S
36867,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Ativo,REAL,MIL,ÚLTIMO,2024-12-31,1.01.01,Caixa e Equivalentes de Caixa,20254000.0,S
36869,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Ativo,REAL,MIL,ÚLTIMO,2024-12-31,1.01.02,Aplicações Financeiras,26397000.0,S
36871,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Ativo,REAL,MIL,ÚLTIMO,2024-12-31,1.01.02.01,Aplicações Financeiras Avaliadas a Valor Justo...,0.0,S



--- BPP Filtrado da Petrobras (Passivo) ---


Unnamed: 0,CNPJ_CIA,DT_REFER,VERSAO,DENOM_CIA,CD_CVM,GRUPO_DFP,MOEDA,ESCALA_MOEDA,ORDEM_EXERC,DT_FIM_EXERC,CD_CONTA,DS_CONTA,VL_CONTA,ST_CONTA_FIXA
63063,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Passivo,REAL,MIL,ÚLTIMO,2024-12-31,2,Passivo Total,1124797000.0,S
63065,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Passivo,REAL,MIL,ÚLTIMO,2024-12-31,2.01,Passivo Circulante,194808000.0,S
63067,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Passivo,REAL,MIL,ÚLTIMO,2024-12-31,2.01.01,Obrigações Sociais e Trabalhistas,9336000.0,S
63069,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Passivo,REAL,MIL,ÚLTIMO,2024-12-31,2.01.01.01,Obrigações Sociais,0.0,S
63071,33.000.167/0001-01,2024-12-31,1,PETROLEO BRASILEIRO S.A. PETROBRAS,9512,DF Consolidado - Balanço Patrimonial Passivo,REAL,MIL,ÚLTIMO,2024-12-31,2.01.01.02,Obrigações Trabalhistas,0.0,S


In [7]:
def pegar_valor_conta(df_filtrado, cd_conta):
    """
    Busca o valor (VL_CONTA) de um código de conta (CD_CONTA) 
    específico em um DataFrame já filtrado.
    """
    try:
        # Localiza a linha onde a coluna 'CD_CONTA' é igual ao código
        # e pega o valor da coluna 'VL_CONTA'
        valor = df_filtrado.loc[df_filtrado['CD_CONTA'] == cd_conta, 'VL_CONTA'].iloc[0]
        return valor
    except IndexError:
        # Se .iloc[0] falhar, significa que não encontrou a conta
        print(f"AVISO: Conta {cd_conta} não encontrada. Retornando 0.")
        return 0
    except Exception as e:
        print(f"Erro ao buscar conta {cd_conta}: {e}")
        return 0

print("Função 'pegar_valor_conta' definida.")

Função 'pegar_valor_conta' definida.


In [8]:
# --- Mapeamento das Contas Principais (Plano de Contas da CVM) ---
CD_ATIVO_TOTAL = '1'
CD_ATIVO_CIRCULANTE = '1.01'
CD_PASSIVO_CIRCULANTE = '2.01'
CD_PASSIVO_NAO_CIRCULANTE = '2.02'
CD_PATRIMONIO_LIQUIDO = '2.03'
CD_LUCRO_LIQUIDO = '3.11' 

# --- Extraindo os valores para a Petrobras (Ano 2024) ---
print("Extraindo valores para os cálculos (Ano 2024)...")

# Vamos checar a escala no BPA. Assumimos que é a mesma para DRE e BPP.
# .iloc[0] pega o valor da primeira linha (já que filtramos só para a Petrobras)
try:
    escala_moeda_texto = petro_bpa_df['ESCALA_MOEDA'].iloc[0]
    
    fator_escala = 1.0 # Padrão (caso a coluna não seja 'MIL' ou 'MILHAO')
    
    if escala_moeda_texto == 'MIL':
        fator_escala = 1000.0
    elif escala_moeda_texto == 'MILHAO':
        fator_escala = 1000000.0
        
    print(f"ESCALA DA MOEDA DETECTADA: {escala_moeda_texto}. Fator de multiplicação: {fator_escala:,.0f}")

except IndexError:
    print("AVISO: Não foi possível detectar a escala da moeda. Usando fator 1.0")
    fator_escala = 1.0


# --- Extraindo os valores e APLICANDO O FATOR ---
# Ativo
ativo_circulante = pegar_valor_conta(petro_bpa_df, CD_ATIVO_CIRCULANTE) * fator_escala
ativo_total = pegar_valor_conta(petro_bpa_df, CD_ATIVO_TOTAL) * fator_escala

# Passivo
passivo_circulante = pegar_valor_conta(petro_bpp_df, CD_PASSIVO_CIRCULANTE) * fator_escala
passivo_nao_circulante = pegar_valor_conta(petro_bpp_df, CD_PASSIVO_NAO_CIRCULANTE) * fator_escala
patrimonio_liquido = pegar_valor_conta(petro_bpp_df, CD_PATRIMONIO_LIQUIDO) * fator_escala

# DRE
lucro_liquido = pegar_valor_conta(petro_dre_df, CD_LUCRO_LIQUIDO) * fator_escala

print("\n--- Valores Extraídos (Petrobras 2024) - CORRIGIDOS PELA ESCALA ---")
print(f"Ativo Circulante:   R$ {ativo_circulante:,.2f}")
print(f"Ativo Total:        R$ {ativo_total:,.2f}")
print(f"Passivo Circulante: R$ {passivo_circulante:,.2f}")
print(f"Passivo Não Circulante: R$ {passivo_nao_circulante:,.2f}")
print(f"Patrimônio Líquido: R$ {patrimonio_liquido:,.2f}")
print(f"Lucro Líquido:      R$ {lucro_liquido:,.2f}")

Extraindo valores para os cálculos (Ano 2024)...
ESCALA DA MOEDA DETECTADA: MIL. Fator de multiplicação: 1,000

--- Valores Extraídos (Petrobras 2024) - CORRIGIDOS PELA ESCALA ---
Ativo Circulante:   R$ 135,212,000,000.00
Ativo Total:        R$ 1,124,797,000,000.00
Passivo Circulante: R$ 194,808,000,000.00
Passivo Não Circulante: R$ 562,475,000,000.00
Patrimônio Líquido: R$ 367,514,000,000.00
Lucro Líquido:      R$ 37,009,000,000.00


In [9]:
print(f"\n--- Indicadores Manuais (Petrobras 2024) ---")

# --- 1. Indicadores de Liquidez ---
if passivo_circulante > 0:
    liq_corrente = ativo_circulante / passivo_circulante
    # O ':.2f' formata para 2 casas decimais (ex: 1.25)
    print(f"Liquidez Corrente (Ativo Circ. / Passivo Circ.): {liq_corrente:.2f}")
else:
    print("Liquidez Corrente: Não foi possível calcular (Passivo Circulante é 0).")

# --- 2. Indicadores de Endividamento ---
# Usamos o 'passivo_nao_circulante' que acabamos de extrair
divida_total = passivo_circulante + passivo_nao_circulante

if ativo_total > 0:
    endividamento_geral = divida_total / ativo_total
    # O ':.2%' formata como porcentagem (ex: 55.40%)
    print(f"Endividamento Geral (Dívida Total / Ativo Total): {endividamento_geral:.2%}")
else:
    print("Endividamento Geral: Não foi possível calcular (Ativo Total é 0).")

if patrimonio_liquido > 0:
    divida_pl = divida_total / patrimonio_liquido
    print(f"Dívida Total / Patrimônio Líquido: {divida_pl:.2f}")
else:
    print("Dívida/PL: Não foi possível calcular (Patrimônio Líquido é 0).")

# --- 3. Indicador de Rentabilidade (ROE) ---
if patrimonio_liquido > 0:
    roe = lucro_liquido / patrimonio_liquido
    print(f"ROE (Lucro Líq. / PL): {roe:.2%}")
else:
    print("ROE: Não foi possível calcular (Patrimônio Líquido é 0).")

# Fechar o arquivo ZIP ao final
# 'zf' foi a variável que criamos na Célula 3 para abrir o ZIP
zf.close()
print("\nAnálise exploratória (Dia 3) concluída. Arquivo ZIP fechado.")


--- Indicadores Manuais (Petrobras 2024) ---
Liquidez Corrente (Ativo Circ. / Passivo Circ.): 0.69
Endividamento Geral (Dívida Total / Ativo Total): 67.33%
Dívida Total / Patrimônio Líquido: 2.06
ROE (Lucro Líq. / PL): 10.07%

Análise exploratória (Dia 3) concluída. Arquivo ZIP fechado.


In [2]:
import pandas as pd
# Este é o caminho para o ficheiro que o gestor_cadastro.py acabou de baixar
caminho_cadastro = "../data/raw/cadastro_cvm/cad_cia_aberta.csv"

try:
    # Vamos ler apenas as primeiras 5 linhas (nrows=5)
    # Só precisamos disto para ver os nomes das colunas
    df_cad = pd.read_csv(
        caminho_cadastro,
        sep=';',
        encoding='latin1',
        nrows=5 
    )
    
    print("Colunas encontradas no ficheiro 'cad_cia_aberta.csv':")
    # Isto vai imprimir a lista de todos os nomes de colunas
    print(df_cad.columns.to_list())
    
except Exception as e:
    print(f"Erro ao ler o ficheiro: {e}")

Colunas encontradas no ficheiro 'cad_cia_aberta.csv':
['CNPJ_CIA', 'DENOM_SOCIAL', 'DENOM_COMERC', 'DT_REG', 'DT_CONST', 'DT_CANCEL', 'MOTIVO_CANCEL', 'SIT', 'DT_INI_SIT', 'CD_CVM', 'SETOR_ATIV', 'TP_MERC', 'CATEG_REG', 'DT_INI_CATEG', 'SIT_EMISSOR', 'DT_INI_SIT_EMISSOR', 'CONTROLE_ACIONARIO', 'TP_ENDER', 'LOGRADOURO', 'COMPL', 'BAIRRO', 'MUN', 'UF', 'PAIS', 'CEP', 'DDD_TEL', 'TEL', 'DDD_FAX', 'FAX', 'EMAIL', 'TP_RESP', 'RESP', 'DT_INI_RESP', 'LOGRADOURO_RESP', 'COMPL_RESP', 'BAIRRO_RESP', 'MUN_RESP', 'UF_RESP', 'PAIS_RESP', 'CEP_RESP', 'DDD_TEL_RESP', 'TEL_RESP', 'DDD_FAX_RESP', 'FAX_RESP', 'EMAIL_RESP', 'CNPJ_AUDITOR', 'AUDITOR']
