### Demonstrativos financeiros

Uma companhia de capital aberto deve apurar as seguintes demonstrações em atendimento às exigências da Comissão de Valores Mobiliários (CVM), B3 e seus acionistas:

*Demonstrações Financeiras Padronizadas* (DFP) – Este documento é composto por todos os demonstrativos financeiros referentes ao exercício social encerrado, e deve ser encaminhado ao final de cada trimestre de cada ano à CVM e à B3. https://dados.cvm.gov.br/dataset/cia_aberta-doc-dfp 
Deve ser entregue pelo emissor nacional em até 3 (três) meses contados do encerramento do exercício social ou na mesma data de envio das demonstrações financeiras, o que ocorrer primeiro.

*Informações e Resultados Trimestrais* (ITR) – São elaborados e enviados por todas as companhias listadas em Bolsa de Valores para a CVM e B3 todo trimestre. A ITR tem por finalidade permitir que o investidor acompanhe o desempenho da empresa no trimestre. https://dados.cvm.gov.br/dataset/cia_aberta-doc-itr
Deve ser entregue pelo emissor no prazo de 45 (quarenta e cinco) dias contados da data de encerramento
de cada trimestre.

Relatórios contábeis elaborados periodicamente pelas empresas. 
- Balanço Patrimonial Ativo (BPA)
- Balanço Patrimonial Passivo (BPP)
- Demonstração de Fluxo de Caixa - Método Direto (DFC-MD)
- Demonstração de Fluxo de Caixa - Método Indireto (DFC-MI)
- Demonstração das Mutações do Patrimônio Líquido (DMPL)
- Demonstração de Resultado Abrangente (DRA)
- Demonstração de Resultado (DRE)
- Demonstração de Valor Adicionado (DVA)

Os arquivos contêm duas versões: consolidadas (con) e indivuduais (ind):

'itr_cia_aberta_DRE_ind_2023.csv' - apenas a própria empresa, desconsiderando suas subsidiadas

'itr_cia_aberta_DRE_con_2023.csv' - contemplam todas as empresas do grupo que a empresa possui participação, e.g. no caso de uma holding 

Os demonstrativos consolidados são os mais usados pelo mercado. 

In [None]:
ano_inicio  = 2014
ano_fim     = 2024 # Evite colocar ano onde não há dados ainda

In [None]:
import os
import pandas as pd
import urllib.request
from zipfile import ZipFile
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')


In [None]:
# get_cvm_file(  2024 , 2024)# , path='/home/yair/teste' )

In [None]:
def get_cvm_file(start_year=2010, end_year=2025, report='dfp', path=None, dl=False) -> str:
    '''
    Baixa arquivos zipados com demonstrativos financeiros do site da CVM
    
    Args:
        start_year (int): ano inicial
        end_year (int): ano final
        report (str): tipo de relatório - 'DFP' (anual) ou 'ITR' (trimestral)
        path (str): diretório para salvar os arquivos (padrão: './data/cvm_zipped')
        dl (bool): se True, força download (sobrescreve arquivos existentes);
                   se False, baixa apenas se o arquivo não existir localmente
    
    Returns:
        str: caminho do diretório contendo os arquivos zipados
    '''

    import os
    import pandas as pd
    import urllib.request

    # Define diretório de destino
    if path is None:
        path_data = os.path.join(os.getcwd(), 'data')
        os.makedirs(path_data, exist_ok=True)
        path_zipped = os.path.join(path_data, 'cvm_zipped')
        os.makedirs(path_zipped, exist_ok=True)
    else:
        os.makedirs(path, exist_ok=True)
        path_zipped = path
    
    url_cvm = f'https://dados.cvm.gov.br/dados/CIA_ABERTA/DOC/{report.upper()}/DADOS/'
    
    if dl:  # Força download incondicional
        for ano in range(start_year, end_year + 1):
            zipped_filename = f'{report}_cia_aberta_{ano}.zip'
            url = url_cvm + zipped_filename
            path_local_file = os.path.join(path_zipped, zipped_filename)
            
            try:
                print(f"Baixando {zipped_filename}...")
                urllib.request.urlretrieve(url, path_local_file)
                print(f"✓ Download concluído")
            except Exception as e:
                print(f"✗ Erro ao baixar {zipped_filename}: {e}")
    
    else:  # Baixa apenas se não existir localmente
        for ano in range(start_year, end_year + 1):
            zipped_filename = f'{report}_cia_aberta_{ano}.zip'
            url = url_cvm + zipped_filename
            path_local_file = os.path.join(path_zipped, zipped_filename)
            
            try:
                if not os.path.exists(path_local_file):
                    print(f"Baixando {zipped_filename}...")
                    urllib.request.urlretrieve(url, path_local_file)
                    print(f"✓ Download concluído")
                else:
                    print(f"✓ {zipped_filename} já existe localmente")
            except Exception as e:
                print(f"✗ Erro ao processar ano {ano}: {e}")
    
    return path_zipped

In [None]:
# extract_report( 2024 , 2024 , 'DRE_con' ).head(2)#, zip_dir='/home/yair/' ).head(3)

In [None]:
def extract_report(start_year, end_year, report='DRE_con', annual=True, zip_dir=None, rmzip = False) -> pd.DataFrame:
    '''
    Extrai dados específicos dos arquivos ZIP da CVM em um DataFrame
    
    Args:
        start_year (int): ano inicial
        end_year (int): ano final
        report (str): relatório a extrair. Opções disponíveis:
            BPA_con, BPA_ind, BPP_con, BPP_ind, DFC_MD_con, DFC_MD_ind,
            DFC_MI_con, DFC_MI_ind, DMPL_con, DMPL_ind, DRA_con, DRA_ind,
            DRE_con, DRE_ind, DVA_con, DVA_ind
        annual (bool): se True, usa DFP (anual); se False, usa ITR (trimestral)
        zip_dir (str): diretório contendo/para baixar os arquivos ZIP. 
                       Se None, usa './data/cvm_zipped'
                       Se especificado mas não existe, cria e baixa os arquivos nele
    
    Returns:
        pd.DataFrame: dados consolidados de todos os anos
    
    Raises:
        FileNotFoundError: se arquivos ZIP não forem encontrados após tentativa de download
    '''
    import pandas as pd
    from zipfile import ZipFile
    import os
    
    # Define tipo de relatório
    repP = 'dfp' if annual else 'itr'
    
    # Define diretório dos arquivos ZIP
    if zip_dir is not None:
        path_zipped = zip_dir
        # Se o diretório especificado não existe, cria e baixa os arquivos
        if not os.path.exists(path_zipped):
            print(f"Diretório {path_zipped} não encontrado. Criando e baixando arquivos...")
            path_zipped = get_cvm_file(start_year=start_year, end_year=end_year, 
                                      report=repP, path=zip_dir, dl=False)
            rmzip = True
    else:
        # Tenta usar diretório padrão
        path_zipped = os.path.join(os.getcwd(), 'data', 'cvm_zipped')
        if not os.path.exists(path_zipped):
            print(f"Diretório {path_zipped} não encontrado. Baixando arquivos...")
            path_zipped = get_cvm_file(start_year=start_year, end_year=end_year, 
                                      report=repP, dl=False)
    
    demonstrativo = pd.DataFrame()
    arquivos_processados = 0
    
    for ano in range(start_year, end_year + 1):
        zipped_file = f'{repP}_cia_aberta_{ano}.zip'
        full_path_file = os.path.join(path_zipped, zipped_file)
        
        # Verifica se o arquivo ZIP existe
        if not os.path.exists(full_path_file):
            print(f"⚠ Arquivo {zipped_file} não encontrado em {path_zipped}")
            try:
                # Tenta baixar apenas este arquivo específico
                get_cvm_file(start_year=ano, end_year=ano, 
                           report=repP, path=path_zipped, dl=True)
            except Exception as e:
                print(f"✗ Erro ao baixar {zipped_file}: {e}")
                continue
        
        try:
            # Abre o arquivo ZIP
            with ZipFile(full_path_file, 'r') as zip_ref:
                arquivos_no_zip = zip_ref.namelist()
                
                # Procura o CSV correspondente ao relatório
                arquivo_csv = None
                for arquivo in arquivos_no_zip:
                    if report.lower() in arquivo.lower() and arquivo.endswith('.csv'):
                        arquivo_csv = arquivo
                        break
                
                if arquivo_csv:
                    # Lê CSV diretamente do ZIP
                    with zip_ref.open(arquivo_csv) as csv_file:
                        df_ano = pd.read_csv(
                            csv_file, 
                            sep=';', 
                            decimal=',', 
                            encoding='latin1',
                            dtype={"ORDEM_EXERC": "category"}
                        )
                        demonstrativo = pd.concat([demonstrativo, df_ano], ignore_index=True)
                        arquivos_processados += 1
                        print(f"✓ Processado: {zipped_file} ({len(df_ano)} registros)")
                else:
                    print(f"⚠ CSV '{report}' não encontrado em {zipped_file}")
        
        except Exception as e:
            print(f"✗ Erro ao processar {zipped_file}: {e}")
            continue
    
    print(f"\n✓ Total de arquivos processados: {arquivos_processados}")    
    # if rmzip and os.path.exists(path_zipped):
    #     import shutil 
    #     shutil.rmtree(path_zipped)
    #     print(f"Diretório {path_zipped} removido!")
        
    
    return demonstrativo

In [None]:
def show_table(data, conta=[]):
  
    ''' Mostra uma tabela organizada 

    Args:
        data (DataFrame): DataFrame do demonstrativo
        conta (list): Lista dos códigos das contas que se deseja filtrar

    Returns:
        DataFrame
'''

    # filtra as contas e as colunas de interesse
    data = data[data.CD_CONTA.isin(conta)][['DT_REFER','CD_CONTA','DS_CONTA','VL_CONTA']].drop_duplicates()
    data['DT_REFER'] = pd.to_datetime(data['DT_REFER'])
    data['Ano'] = data['DT_REFER'].dt.year.astype(str)
    data.reset_index(inplace = True, drop = True)

    data_pivot = data.pivot(index = ['CD_CONTA','DS_CONTA'], columns = 'Ano', values = 'VL_CONTA')

    year_cols = list(map(str,list(range(ano_inicio,ano_fim+1))))
    pct_changes = round(data_pivot[year_cols].pct_change(axis=1).iloc[:,1:] * 100, ndigits = 2)
    pct_changes.columns = [f'{start}-{end} Δ%' for start, end in zip(year_cols[:-1], year_cols[1:])]

    colunas_intercaladas = [col for pair in zip(data_pivot.columns, pct_changes.columns) for col in pair]
    colunas_intercaladas.append(data_pivot.columns[-1])

    return pd.concat([data_pivot, pct_changes], axis=1)[colunas_intercaladas]
#   return data_pivot


# DRE

In [None]:

## preparação dos dados

dre = extract_report( start_year = ano_inicio, end_year = ano_fim , report = 'DRE_con').copy()
# print(dre.info(memory_usage='deep')) # memory usage: 277.4 MB
## floats
dre['VL_CONTA'] = dre['VL_CONTA'].astype(float)
print(f"{dre['VL_CONTA'].isna().sum()} erros de conversão de numeros")
## strings
dre[['DENOM_CIA','CNPJ_CIA','CD_CONTA']] = dre[['DENOM_CIA','CNPJ_CIA','CD_CONTA']].astype('string')
## categories -- é um tipo especial do Pandas para dados categóricos (valores repetidos de um conjunto limitado). 1. Economia de memória (principal vantagem) 2. Performance em operações 3. Ordem definida customizavel
dre[['ESCALA_MOEDA','DS_CONTA','GRUPO_DFP','MOEDA','ST_CONTA_FIXA']] = dre[['ESCALA_MOEDA','DS_CONTA','GRUPO_DFP','MOEDA','ST_CONTA_FIXA']].astype('category')

dre['DT_REFER'] = pd.to_datetime(dre['DT_REFER'])
dre['DT_INI_EXERC'] = pd.to_datetime(dre['DT_INI_EXERC'])
dre['DT_FIM_EXERC'] = pd.to_datetime(dre['DT_FIM_EXERC'])
# print(dre.info(memory_usage='deep'))  # memory usage: 85.9 MB

# Normalização de Escala 
print('Escalas da moeda: ',dre.ESCALA_MOEDA.unique().tolist(),end=' --- ')
if len(dre.ESCALA_MOEDA.unique().tolist()) > 2: print('REVERIFICAR ESCALAS DE MOEDA!!!') 
else: print('Escalas OK')
dre['VL_CONTA'] = dre.apply(lambda row: row['VL_CONTA'] * 1000 if row['ESCALA_MOEDA'] == 'MIL' else row['VL_CONTA'], axis=1)
dre.head(1)

In [None]:
print('DÊ PALAVRA-CHAVE PARA O NOME DE UMA EMPRESA: ',end='')
empresa = input('nome da empresa; palavra-chave: ')
print(empresa)

busca = empresa.upper().strip()
while True: 
    resultado = dre[dre['DENOM_CIA'].str.contains(busca)][['DENOM_CIA', 'CD_CVM']]
    if resultado.empty:
        print(f"Nenhum resultado encontrado para '{busca}'. Tente novamente com outra palavra-chave.")
        busca = input("Digite uma palavra-chave para buscar na coluna 'DENOM_CIA': ").strip().upper()
    else:
        print(resultado.drop_duplicates())
        break  # Sai do loop

In [None]:
if len(resultado.drop_duplicates()[['CD_CVM']].values) == 1:  # se só encontrou uma empresa
    cod_cvm = resultado.drop_duplicates().iloc[0]['CD_CVM']
else:  
    print('DIGITE O CODIGO DESEJADO') 
    cod_cvm= int(input(f"Digite o código CVM dentre {list(resultado['CD_CVM'].drop_duplicates().values)}: "))

empresa = dre[dre['CD_CVM']==cod_cvm]['DENOM_CIA'].drop_duplicates().values[0]
empresa

# Filtros

Filtros deixar só informações necessárias:
 - ORDEM_EXERC linhas  com 'PENÚLTIMO' e 'ÚTIMO'. Usar o segundo, o outro é do ano anterior.
 - DT_FIM_EXERC no caso do ITR é  última data  do trimestre referente ao dado. Nos arquivos DFP há apenas o  mês 12.
 - DT_INI_EXERC. Quando mão aparece no demonstrativo, o valor mostrado representa a posição no final do semestre. Quando esse campo aparece, o valor corresponde ao total do período entre a data inicial (DT_INI_EXERC) e a data final (DT_FIM_EXERC). Pode aparecer em mais de uma linha, indicando períodos diferentes:

| Empresa | Conta   | DT_INI_EXERC | DT_FIM_EXERC | Valor |
| ------- | ------- | ------------ | ------------ | ----- |
| A       | Receita | 01/01/2023   | 30/06/2023   | 500   |
| A       | Receita | 01/04/2023   | 30/06/2023   | 300   |


ST_CONTA_FIXA refere-se ao Status da Conta Fixa, para entender a estrutura do plano de contas que a empresa utilizou para reportar seus resultados.

S (Sim): Indica que aquela é uma conta fixa (padronizada). São as linhas que a CVM define como obrigatórias ou padrão para todas as empresas de um determinado setor.

N (Não): Indica que aquela é uma conta não fixa (detalhada). São linhas adicionadas pela própria empresa para detalhar melhor suas operações. Por exemplo, dentro de "Outras Despesas Operacionais", uma empresa pode criar uma linha específica (Não Fixa) para descrever um custo peculiar ao seu negócio.ST_CONTA_FIXA refere-se ao Status da Conta Fixa.

Muitas vezes, o valor de uma conta fixa ("S") é o somatório de várias contas detalhadas ("N") logo abaixo dela. Ao manipular esses dados a regra de ouro é: Se quer um resumo padronizado, filtre por ST_CONTA_FIXA == 'S'. Se quer o detalhamento máximo e as notas explicativas digitais, analise as linhas com 'N', mas tome cuidado para não somá-las ao total da conta pai.

In [None]:
remover_cols = ['GRUPO_DFP','MOEDA','ORDEM_EXERC','DENOM_CIA','CD_CVM','ESCALA_MOEDA'] 
tabela = dre[(dre['CD_CVM']==cod_cvm) & (dre['ORDEM_EXERC']=='ÚLTIMO')].copy().drop(remover_cols, axis=1)
tabela['ano'] = tabela['DT_REFER'].dt.year
tabela.head(2)

Contas

In [None]:
from IPython.display import display, HTML

padrao = r"^\d+\.\d{2}$"
padrao2 = r"^\d+\.\d{2}\.\d{2}$"
padrao3 = r"^\d+\.\d{2}\.\d{2}\.\d{2}$"

# conta = tabela[['CD_CONTA', 'DS_CONTA' , 'VL_CONTA']]
conta = tabela[#(tabela['VL_CONTA']!=0) & 
    (tabela['CD_CONTA'].str.match(padrao))][['CD_CONTA', 'DS_CONTA' , 'VL_CONTA','ano']]
conta2 = tabela[#(tabela['VL_CONTA']!=0) & 
    (tabela['CD_CONTA'].str.match(padrao2))][['CD_CONTA', 'DS_CONTA' , 'VL_CONTA','ano']]
conta3 = tabela[#(tabela['VL_CONTA']!=0) & 
    (tabela['CD_CONTA'].str.match(padrao3))][['CD_CONTA', 'DS_CONTA' , 'VL_CONTA','ano']]


In [None]:
display(HTML(conta[['CD_CONTA', 'DS_CONTA']].drop_duplicates().to_html(index=False)))
display(HTML(conta2[['CD_CONTA', 'DS_CONTA']].drop_duplicates().to_html(index=False)))
display(HTML(conta3[['CD_CONTA', 'DS_CONTA']].drop_duplicates().to_html(index=False)))


## Receita Líquida, Custos e Lucro líquido

In [None]:
contas_rlcll = {
    "3.01": "Receita Líquida",
    "3.02": "Custos",
    "3.11": "Lucro Líquido"
}
rlcll = tabela[tabela["CD_CONTA"].isin(contas_rlcll.keys()) & (tabela["ST_CONTA_FIXA"] == 'S')].copy()
rlcll["Conta"] = rlcll["CD_CONTA"].map(contas_rlcll)

rl_pivot = (
    rlcll
    .pivot_table(
        index="ano",
        columns="Conta",
        values="VL_CONTA",
        aggfunc="sum"
    )
    .sort_index()
)
rl_pivot = rl_pivot / 1e9 ## valores em bilhões

rl_pivot.head(2)

In [None]:

anos = rl_pivot.index

plt.figure(figsize=(14, 5))

plt.bar(anos, rl_pivot["Receita Líquida"], label="Receita Líquida")
plt.bar(anos, rl_pivot["Custos"], label="Custos")

plt.plot(
    anos,
    rl_pivot["Lucro Líquido"],
    marker="o",
    color="black",
    linewidth=2,
    label="Lucro Líquido"
)

plt.xlabel("Ano")
plt.ylabel("R$ (bilhões)")
plt.legend()
plt.title(f"DRE – Receita Líquida, Custos e Lucro Líquido - {empresa}")

plt.tight_layout()
plt.show()


# Lucro por ação - LPA

taxonomia da CVM
```
3.99        Lucro por Ação
├── 3.99.01 Lucro Básico por Ação
│   ├── 3.99.01.01 ON
│   └── 3.99.01.02 PN
└── 3.99.02 Lucro Diluído por Ação
    ├── 3.99.02.01 ON
    └── 3.99.02.02 PN

```
| Para análise                        | Conta                               |
| ----------------------------------- | ----------------------------------- |
| EPS básico (fundamentalista padrão) | **3.99.01** ou **3.99.01.01 / .02** |
| EPS diluído (análise conservadora)  | 3.99.02                             |


3.99.01 é o valor médio ponderado do LPA básico, considerando todas as classes de ações juntas.
A CVM permite que empresas divulguem apenas 3.99.01 (sem separar classes), ou 3.99.01.01 e 3.99.01.02 separadamente. o Lucro Diluído por Ação (3.99.02) considera a possível diluição futura por: Opções de ações; Debêntures conversíveis; Stock options; Warrants. É mais conservador, mas nem sempre relevante no Brasil, porque muitas empresas têm pouca diluição potencial.

In [None]:
contas_lpa = {
    "3.99.01.01": "LPA - ON",
    "3.99.01.02": "LPA - PN"
}

# contas_lpa2 = {
#     "3.99.02.01": "LPA - ON",
#     "3.99.02.02": "LPA - PN"
# }

lpa  = tabela[tabela["CD_CONTA"].isin(contas_lpa.keys()) 
            #   &  tabela["CD_CONTA"].isin(contas_lpa2.keys()) 
             ].copy()
lpa["Conta"] = lpa["CD_CONTA"].map(contas_lpa)

lpa_pivot = lpa.pivot_table(
    index='ano', 
    columns='Conta', 
    values='VL_CONTA', 
    aggfunc='mean'  # Usamos mean para evitar duplicatas caso existam
).sort_index()        
lpa

In [None]:
if not lpa_pivot.empty:
    plt.figure(figsize=(12, 6))
    
    # Plotar uma linha para cada tipo de ação encontrada (ON, PN, PNA, etc)
    for coluna in lpa_pivot.columns:
        plt.plot(lpa_pivot.index, lpa_pivot[coluna], marker='o', label=coluna, linewidth=2)

    plt.title(f"Lucro por Ação (LPA Básico) - {empresa}", fontsize=14, fontweight='bold')
    plt.xlabel("Ano")
    plt.ylabel("Valor (R$ por Ação)")
    plt.grid(True, linestyle='--', alpha=0.7)
    plt.legend(title="Tipo de Ação")
    
    # Adicionar linha de referência no zero
    plt.axhline(0, color='black', linewidth=1, linestyle='-')
    
    plt.tight_layout()
    plt.savefig('lpa_por_acao.png') # Salva a imagem para visualização
    plt.show()
else:
    print("Dados de LPA não encontrados para as contas 3.99.01.01 ou 3.99.01.02 desta empresa.")

# Margens

In [None]:
contas_margens = {
    "3.01": "Receita Líquida",
    "3.03": "Lucro Bruto",
    "3.05": "EBIT",
    "3.11": "Lucro Líquido"
}

margens = tabela[tabela["CD_CONTA"].isin(contas_margens.keys()) & (tabela["ST_CONTA_FIXA"] == 'S')].copy()
margens["Conta"] = margens["CD_CONTA"].map(contas_margens)
margens.head(2)


### EBITDA

### DVA

In [None]:
dva = extract_report(start_year=ano_inicio, end_year=ano_fim, report='DVA_con').copy()
dva['VL_CONTA'] = dva['VL_CONTA'].astype(float)
dva['ano'] = pd.to_datetime(dva['DT_REFER']).dt.year

In [None]:
# dva.DS_CONTA.unique().tolist()

In [None]:
# Filtrar a DA para a empresa selecionada (cod_cvm)
dva_empresa = dva[(dva['CD_CVM'] == cod_cvm) 
                & (dva['ORDEM_EXERC'] == 'ÚLTIMO')
                & (dva['DS_CONTA'].str.contains('Deprecia', case=False, na=False) )
                & (dva['ST_CONTA_FIXA'] == 'S') 
                & (dva['ORDEM_EXERC'] == 'ÚLTIMO')].copy()
# Selecione a conta mais genérica (geralmente a com o menor código)
contas_encontradas = dva_empresa.sort_values('CD_CONTA')

if not contas_encontradas.empty:
    codigo_deprec_dinamico = contas_encontradas.iloc[0]['CD_CONTA']
    nome_conta_deprec = contas_encontradas.iloc[0]['DS_CONTA']
    print(f"Conta identificada: {codigo_deprec_dinamico} - {nome_conta_deprec}")
else:
    print("Conta de depreciação não encontrada para esta empresa.")

df_da = dva_empresa[dva_empresa['CD_CONTA'] == codigo_deprec_dinamico].copy()
df_da["Conta"] = "DA"

In [None]:
contas_ebitda = {
    "3.01": "Receita Líquida",
    "3.05": "EBIT"
}

df_dre = margens[margens["CD_CONTA"].isin(contas_ebitda.keys())].copy()

# Consolidar os dados em um único DataFrame - unimos as linhas de D&A com as de Receita e EBIT
df_consolidado = pd.concat([
    df_dre[['ano', 'Conta', 'VL_CONTA']],
    df_da[['ano', 'Conta', 'VL_CONTA']]
])

# Pivotar para ter as contas como colunas
ebitda_pivot = df_consolidado.pivot_table(index="ano", columns="Conta", values="VL_CONTA", aggfunc="sum")



In [None]:

# Pivotar os dados por ano
margens_pivot = margens.pivot_table(
    index="ano",
    columns="Conta",
    values="VL_CONTA",
    aggfunc="sum"
).sort_index()
# Calcular EBITDA e Margem
# O EBITDA é o EBIT + Depreciação/Amortização
margens_pivot["EBITDA"] = ebitda_pivot["EBIT"] + ebitda_pivot["DA"]

# Cálculo das Margens em porcentagem (%)
margens_pivot["Margem Bruta (%)"] = (margens_pivot["Lucro Bruto"] / margens_pivot["Receita Líquida"]) * 100
margens_pivot["Margem EBIT (%)"] = (margens_pivot["EBIT"] / margens_pivot["Receita Líquida"]) * 100
margens_pivot["Margem Líquida (%)"] = (margens_pivot["Lucro Líquido"] / margens_pivot["Receita Líquida"]) * 100
margens_pivot["Margem EBITDA (%)"] = (margens_pivot["EBITDA"] / margens_pivot["Receita Líquida"]) * 100


margens_pivot

In [None]:

plt.figure(figsize=(12, 6))
plt.plot(margens_pivot.index, margens_pivot["Margem Bruta (%)"], marker='o', label="Margem Bruta", linewidth=2.5)
plt.plot(margens_pivot.index, margens_pivot["Margem EBIT (%)"], marker='s', label="Margem EBIT", linewidth=2.5)
plt.plot(margens_pivot.index, margens_pivot["Margem Líquida (%)"], marker='^', label="Margem Líquida", linewidth=2.5)
plt.plot(margens_pivot.index, margens_pivot["Margem EBITDA (%)"], marker='d', label="Margem EBITDA", linewidth=2.5)

plt.title(f"Histórico de Margens de Eficiência - {empresa}", fontsize=14, fontweight='bold')
plt.xlabel("Ano")
plt.ylabel("Margem (%)")
plt.grid(True, linestyle='--', alpha=0.6)
plt.legend()
plt.axhline(0, color='black', linewidth=1) # Linha de referência no zero

# Formatação do eixo Y para mostrar o símbolo de %
plt.gca().yaxis.set_major_formatter(plt.FormatStrFormatter('%.1f%%'))

plt.tight_layout()
plt.show()

In [None]:


# 6. Exibir Resultado
display(ebitda_pivot[["Receita Líquida", "EBIT", "DA", "EBITDA", "Margem EBITDA (%)"]].round(2))

# Plotar a evolução
plt.figure(figsize=(12, 5))
plt.plot(ebitda_pivot.index, ebitda_pivot["Margem EBITDA (%)"], marker='o', color='green', label='Margem EBITDA')
plt.title(f"Evolução da Margem EBITDA - {empresa}")
plt.ylabel("Porcentagem (%)")
plt.xlabel("Ano")
plt.grid(True, alpha=0.3)
plt.legend()
plt.show()

In [None]:
# Definir mapeamento de contas (considerando variações de códigos CVM para Bancos e Não-Bancos)
# As contas de distribuição de capital próprio na DVA costumam ser 7.08.04 ou 7.09.04
contas_payout = {
    "7.08.04.01": "JCP",
    "7.08.04.02": "Dividendos",
    "7.09.04.01": "JCP",
    "7.09.04.02": "Dividendos"
}

payout = dva[
    (dva['CD_CVM'] == cod_cvm) & 
    (dva['CD_CONTA'].isin(contas_payout.keys())) & 
    (dva['ORDEM_EXERC'] == 'ÚLTIMO')].copy()

payout['Provento'] = payout['CD_CONTA'].map(contas_payout)

# Pivotar para ter anos no índice e Proventos como colunas
payout_pivot = payout.pivot_table(
    index="ano", 
    columns="Provento", 
    values="VL_CONTA", 
    aggfunc="sum"
).fillna(0)

# Garantir que ambas as colunas existam para evitar erro no gráfico
for col in ["Dividendos", "JCP"]:
    if col not in payout_pivot.columns:
        payout_pivot[col] = 0

# 4. Gerar o Gráfico de Barras Empilhadas
plt.figure(figsize=(12, 6))

# Barras de JCP (Base) - Azul
plt.bar(payout_pivot.index, payout_pivot["JCP"], color='#0077b6', label='Juros sobre Capital Próprio (JCP)')

# Barras de Dividendos (Topo) - Verde
plt.bar(payout_pivot.index, payout_pivot["Dividendos"], bottom=payout_pivot["JCP"], color='#2a9d8f', label='Dividendos')

plt.title(f"Distribuição de Proventos Anuais - {empresa}", fontsize=14, fontweight='bold')
plt.ylabel("Valor (em Milhares de Reais)")
plt.xlabel("Ano")
plt.xticks(payout_pivot.index)
plt.legend()
plt.grid(axis='y', linestyle='--', alpha=0.7)

plt.tight_layout()
plt.show()

DRE

In [None]:
filtro = ['3.01', #Receita de Venda de Bens e/ou Serviços
          '3.02', #Custo dos Bens e/ou Serviços Vendidos
          '3.03', #Resultado Bruto
          '3.04', #Despesas/Receitas Operacionais
          '3.05', #Resultado Antes do Resultado Financeiro e dos Tributos
          '3.06', #Resultado Financeiro
          '3.07', #Resultado Antes dos Tributos sobre o Lucro
          '3.08', #Imposto de Renda e Contribuição Social sobre o Lucro
          '3.09', # Resultado Líquido das Operações Continuadas
          '3.11'  #Lucro/Prejuízo Consolidado do Período
          ]

In [None]:
nova_tabela = show_table(tabela,filtro)
display(HTML(nova_tabela.reset_index().drop('CD_CONTA', axis = 1).to_html(index=False)))

In [None]:
from great_tables import GT, md, html, style, loc

anos = [str(ano) for ano in range(ano_inicio, ano_fim + 1)]
outros = list(nova_tabela.columns.difference(anos))

gt = (
    GT(nova_tabela.reset_index().drop('CD_CONTA', axis = 1),
        rowname_col='DS_CONTA')
    .tab_header(title=md(f'**Demonstrações do Resultado de Exercício (DRE)** <br> **{empresa}**'))
    .tab_source_note(source_note=md("**Fonte: CVM**"))
    .fmt_currency(
        columns= anos,
        currency='BRL',
        locale='br'
    )
    .fmt_percent(
        columns= outros,
        scale_values=False,
        dec_mark=',',
        sep_mark='.'
    )
    .opt_all_caps(locations='column_labels')
    # .opt_align(align='center')  # Centralizar todas as colunas, se necessário
)

gt  # Apenas referenciando o objeto, caso ele seja automaticamente renderizável no ambiente
