In [1]:
import pandas as pd
import numpy as np

## DRE

In [2]:
df_DRE = pd.read_csv('historic_data/historico_DRE.csv',sep=';',encoding='latin-1')

In [3]:
df_DRE.columns = [k.strip() for k in df_DRE.columns]
df_DRE.columns

Index(['safra', 'custo de bens e ou serviços vendidos',
       'deduções da receita bruta', 'despesas', 'despesas com vendas',
       'despesas da intermediação financeira', 'despesas de pessoal',
       'despesas financeiras', 'despesas gerais e administrativas',
       'despesas tributárias', 'financeiras', 'ir diferido',
       'lucro prejuízo do período', 'outras despesas administrativas',
       'outras despesas operacionais', 'outras despesas receitas operacionais',
       'outras receitas operacionais', 'part. de acionistas não controladores',
       'participações contribuições estatutárias',
       'perdas pela não recuperabilidade de ativos',
       'provisão para ir e contribuição social',
       'receita bruta de vendas e ou serviços',
       'receita líquida de vendas e ou serviços', 'receitas',
       'receitas da intermediação financeira',
       'receitas de prestação de serviços', 'receitas financeiras',
       'resultado antes tributação participações', 'resultado bru

In [4]:
# (3) = (1)-(2)
# (5) = (3)-(4)
# (8) = (5)-[(6)-(7.1)+(7.2)]
# (10) = (8)-(9)
# (12) = (10)-[(11.2)-(11.1)]
# (15) = (12)-(13.1)+(13.2)-(14)

# Para financeiras, receitas e despesas da intermediação financeira são receita bruta e deduções sobre ela
# "outras despesas receitas operacionais" - somar direto com valor original (pode mesclar positivo ou negativo)

dict_cols = {'1 - Receita bruta':['receita bruta de vendas e ou serviços','receitas da intermediação financeira'],
             '2 - Deduções sobre receita bruta':['deduções da receita bruta'],
             '3 - Receita líquida':['receita líquida de vendas e ou serviços'],
             '4 - Custo de mercadorias e serviços vendidos (CMV)':['custo de bens e ou serviços vendidos',
                                                                   'despesas da intermediação financeira'],
             '5 - Resultado bruto':['resultado bruto','resultado bruto intermediação financeira'],
             '6 - Despesas com vendas':['despesas com vendas'],
             '7.1 - Receitas operacionais':['outras receitas operacionais','receitas',
                                            'outras despesas receitas operacionais',
                                            'receitas de prestação de serviços'],
             '7.2 - Despesas gerais, administrativas e de pessoal':['despesas gerais e administrativas',
                                                                    'perdas pela não recuperabilidade de ativos',
                                                                    'despesas', 'despesas de pessoal',
                                                                    'despesas tributárias','outras despesas operacionais',
                                                                    'outras despesas administrativas'],
             '8 - EBITDA':[],
             '9 - Depreciações e amortizações':[],
             '10 - EBIT':[],
             '11.1 - Receitas financeiras':['receitas financeiras'],
             '11.2 - Despesas financeiras':['despesas financeiras'],
             '12 - EBT':['resultado antes tributação participações'],
             '13.1 - IR e taxas':['provisão para ir e contribuição social'],
             '13.2 - Restituição de IR e taxas':['ir diferido'],
             '14 - Participação de acionistas':['part. de acionistas não controladores',
                                                'participações contribuições estatutárias',
                                                'reversão dos juros sobre capital próprio'],
             '15 - Resultado do período':['lucro prejuízo do período']
            }
vars_consolidacao_originais_base = ['resultado bruto','resultado da equivalência patrimonial','financeiras',
                                    'resultado não operacional','resultado antes tributação participações',
                                    'lucro prejuízo do período','resultado bruto intermediação financeira',
                                    'resultado operacional']

In [5]:
cols_consideradas = []
for col in list(dict_cols.values()):
    cols_consideradas = cols_consideradas + col
cols_n_consideradas = ((set(df_DRE.columns) - set(['safra','ticker'])) - set(cols_consideradas)) - set(vars_consolidacao_originais_base)

In [6]:
df_DRE[df_DRE['ticker']=='SQIA3']['provisão para ir e contribuição social']

18003    -558.000
18004    -216.000
18005   -2216.000
18006   -1246.000
18007    -281.000
18008    -206.000
18009    -650.000
18010    -264.000
18011    -101.000
18012     -51.000
18013   -1200.000
18014    -275.000
18015    -923.000
18016    -862.000
18017     929.312
18018    -186.478
18019     362.494
18020    -591.810
18021    -525.328
18022   -1544.515
18023     649.372
18024    -387.851
18025      23.723
18026    -292.158
18027    -255.940
18028     -35.378
18029   -1446.546
18030    -313.468
18031    -399.016
18032    -219.645
Name: provisão para ir e contribuição social, dtype: float64

In [7]:
def concatena_cols_df(df,cols):
    df = df.copy()
    df['dummy_col'] = 0
    for col in cols:
        df['dummy_col'] = df['dummy_col'] + df[col].fillna(0)
    return df['dummy_col']

df_DRE_simp = df_DRE[['safra','ticker']].copy()
for lin in dict_cols.keys():
    if '3 - ' in lin:
        df_DRE_simp[lin] = concatena_cols_df(df_DRE,dict_cols[lin])
        df_DRE_simp[lin] = [l1 - l2 if l3==0 else l3 for (l1,l2,l3) in zip(df_DRE_simp['1 - Receita bruta'],\
                                                                           df_DRE_simp['2 - Deduções sobre receita bruta'],\
                                                                           df_DRE_simp['3 - Receita líquida'])]
    elif '5 - ' in lin and 'bruto' in lin:
        df_DRE_simp[lin] = df_DRE_simp['3 - Receita líquida'] + \
        df_DRE_simp['4 - Custo de mercadorias e serviços vendidos (CMV)']
    elif '8 - ' in lin:
        df_DRE_simp[lin] = df_DRE_simp['5 - Resultado bruto'] + df_DRE_simp['6 - Despesas com vendas'] \
        + df_DRE_simp['7.1 - Receitas operacionais'] + df_DRE_simp['7.2 - Despesas gerais, administrativas e de pessoal']
    elif '9 - ' in lin:
        df_DRE_simp[lin] = 0
    elif '10 - ' in lin:
        df_DRE_simp[lin] = df_DRE_simp['8 - EBITDA'] + df_DRE_simp['9 - Depreciações e amortizações']
    elif '12 - ' in lin:
        df_DRE_simp[lin] = df_DRE_simp['10 - EBIT'] + df_DRE_simp['11.2 - Despesas financeiras'] \
        + df_DRE_simp['11.1 - Receitas financeiras']
    elif '15 - ' in lin:
        df_DRE_simp[lin] = df_DRE_simp['12 - EBT'] + df_DRE_simp['13.1 - IR e taxas'] + \
        df_DRE_simp['13.2 - Restituição de IR e taxas'] + df_DRE_simp['14 - Participação de acionistas']
    else:
        df_DRE_simp[lin] = concatena_cols_df(df_DRE,dict_cols[lin])

In [8]:
df_DRE_simp[df_DRE_simp['ticker']=='ABEV3']

Unnamed: 0,safra,ticker,1 - Receita bruta,2 - Deduções sobre receita bruta,3 - Receita líquida,4 - Custo de mercadorias e serviços vendidos (CMV),5 - Resultado bruto,6 - Despesas com vendas,7.1 - Receitas operacionais,"7.2 - Despesas gerais, administrativas e de pessoal",8 - EBITDA,9 - Depreciações e amortizações,10 - EBIT,11.1 - Receitas financeiras,11.2 - Despesas financeiras,12 - EBT,13.1 - IR e taxas,13.2 - Restituição de IR e taxas,14 - Participação de acionistas,15 - Resultado do período
97,30/06/2019,ABEV3,0.0,0.0,12145130.0,-4961300.992,7183832.0,-3085117.952,273441.984,-823977.0,3548178.584,0,3548178.584,249903.008,-817340.032,2980741.56,-807523.968,443414.016,-95168.0,2521463.608
98,31/03/2019,ABEV3,0.0,0.0,12640130.0,-5107701.248,7532425.0,-3028003.072,285051.008,-733739.984,4055732.656,0,4055732.656,287692.992,-959761.024,3383664.624,-979185.024,346724.0,-87218.0,2663985.6
99,31/12/2018,ABEV3,0.0,0.0,16017830.0,-6050933.76,9966896.0,-3309092.864,357825.024,-806363.904,6209264.384,0,6209264.384,19940.992,-1638935.808,4590269.568,33055.104,-1160932.992,-103125.984,3359265.696
100,30/09/2018,ABEV3,0.0,0.0,11063740.0,-4370713.088,6693030.0,-2892641.024,299072.0,-730708.024,3368753.352,0,3368753.352,245288.992,-856369.024,2757673.32,-475184.992,612889.984,-60947.0,2834431.312
101,30/06/2018,ABEV3,0.0,0.0,11509540.0,-4387232.768,7122312.0,-3168975.104,463337.984,-766443.008,3650232.064,0,3650232.064,98044.0,-1147111.936,2601164.128,-663297.024,483739.008,-107009.0,2314597.112
102,31/03/2018,ABEV3,0.0,0.0,11640220.0,-4460747.776,7179471.0,-3095288.064,307433.984,-630448.976,3761167.792,0,3761167.792,375540.992,-919833.984,3216874.8,-728052.992,108190.0,-81667.0,2515344.808
103,31/12/2017,ABEV3,0.0,0.0,15027220.0,-4988325.888,10038890.0,-3168599.04,476209.024,-1072207.984,6274292.496,0,6274292.496,341733.984,-1589280.768,5026745.712,-358014.464,-1364499.072,-179888.0,3124344.176
104,30/09/2017,ABEV3,0.0,0.0,11362300.0,-4482122.24,6880181.0,-2971041.024,289769.984,-585140.008,3613769.688,0,3613769.688,186131.008,-861062.976,2938837.72,-3715267.072,917454.016,-136267.008,4757.656
105,30/06/2017,ABEV3,0.0,0.0,10267950.0,-4048188.928,6219764.0,-2850624.0,258148.0,-588443.0,3038845.224,0,3038845.224,122870.0,-821692.032,2340023.192,-577296.0,356836.992,-111685.0,2007879.184
106,31/03/2017,ABEV3,0.0,0.0,11241800.0,-4523141.12,6718664.0,-2925230.08,314820.0,-608347.008,3499906.592,0,3499906.592,123663.0,-996257.984,2627311.608,-681758.976,343246.016,-90696.0,2198102.648


## BP

In [63]:
df_BP = pd.read_csv('historic_data/historico_balanco_patrimonial.csv',sep=';',encoding='latin-1')
df_BP.columns = [k.strip() for k in df_BP.columns]
df_BP.columns

Index(['safra', 'ativo - aplicações financeiras',
       'ativo - aplicações financeiras avaliadas a valor justo',
       'ativo - aplicações financeiras avaliadas ao custo amortizado',
       'ativo - aplicações interfinanceiras de liquidez',
       'ativo - aplicações interfinanceiras de liquidez 1',
       'ativo - ativo circulante', 'ativo - ativo permanente',
       'ativo - ativo realizável a longo prazo', 'ativo - ativo total',
       'ativo - ativos biológicos', 'ativo - ativos biológicos 1',
       'ativo - caixa e equivalentes de caixa', 'ativo - contas a receber',
       'ativo - contas a receber 1', 'ativo - despesas antecipadas',
       'ativo - despesas antecipadas 1', 'ativo - diferido',
       'ativo - disponibilidades', 'ativo - estoques', 'ativo - estoques 1',
       'ativo - imobilizado', 'ativo - intangível', 'ativo - investimentos',
       'ativo - operações de arrendamento mercantil',
       'ativo - operações de arrendamento mercantil 1',
       'ativo - operaçõe

In [85]:
# Adotar a seguinte estratégia: Pegar "Ativo Total", fazer a conta certa para "Ativo Circulante" e descontar para obter "Ativo não circulante" (várias planilhas estão com problemas de dados)

dict_cols_BP = {'Ativo Circulante':{'Caixa Equivalentes e Disponibilidades':
                                    ['ativo - caixa e equivalentes de caixa',
                                     'ativo - aplicações financeiras',
                                     'ativo - aplicações interfinanceiras de liquidez',
                                     'ativo - disponibilidades'],
                                    'Estoques':['ativo - estoques'],
                                    'Títulos e Valores Mobiliários':['ativo - títulos e valores mobiliários'],
                                    'Contas a receber arrendamentos e biologicos':['ativo - contas a receber',
                                                                                   'ativo - operações de arrendamento mercantil',
                                                                                   'ativo - ativos biológicos',
                                                                                   'ativo - relações interdependências',
                                                                                   'ativo - relações interfinanceiras'
                                                                                  ],
                                    'Operacoes de credito':['ativo - operações de crédito',
                                                            'ativo - outros créditos'],
                                    'Despesas antecipadas':['ativo - despesas antecipadas'],
                                    'Taxas e tributos a recuperar':['ativo - tributos a recuperar'],
                                    'Outros ativos circulantes':['ativo - outros ativos circulantes',
                                                                 'ativo - outros valores e bens'],
                                   },
                'Ativo Nao Circulante':{'ativo nao circulante summary':['ativo total','ativo - ativo total','Ativo Circulante']},
                'Ativo Nao Circulante granulares':{'Aplicacoes financeiras amortizadas':['ativo - aplicações financeiras avaliadas ao custo amortizado',
                                                                              'ativo - contas a receber 1',
                                                                              'ativo - aplicações financeiras avaliadas a valor justo',
                                                                              'ativo - aplicações interfinanceiras de liquidez 1'],
                                        'Estoques a comercializar e arrendamentos':['ativo - estoques 1',
                                                                                    'ativo - operações de arrendamento mercantil 1'],
                                        'Despesas antecipadas':['ativo - despesas antecipadas 1'],
                                        'Tributos diferidos':['ativo - tributos diferidos'],
                                        'Investimentos e operacoes de credito':['ativo - investimentos',
                                                                                'ativo - operações de crédito 1'],
                                        'Títulos e valores mobiliários':['ativo - títulos e valores mobiliários 1'],
                                        'Outros ativos nao circulantes':['ativo - outros ativos não circulantes',
                                                                         'ativo - ativo permanente',
                                                                         'ativo - ativo realizável a longo prazo',
                                                                         'ativo - ativos biológicos 1',
                                                                         'ativo - outros créditos 1',
                                                                         'ativo - outros valores e bens 1',
                                                                         'ativo - relações interdependências 1',
                                                                         'ativo - relações interfinanceiras 1'],
                                        'Imobilizado':['ativo - imobilizado'],
                                        'Intangível':['ativo - intangível']
                },
                'Passivo Circulante':{'Emprestimos e financiamentos':['passivo - empréstimos e financiamentos'],
                                      'Recebíveis de fornecedores':['passivo - fornecedores'],
                                      'Obrig. sociais e trabalhistas':['passivo - obrigações sociais e trabalhistas'],
                                      'Lucros nao distribuídos':['passivo - dividendos e jcp a pagar'],
                                      'Obrig. fiscais': ['passivo - obrigações fiscais'],
                                      'Outros passivos circulantes':['passivo - outros']
                },
                'Passivo Nao Circulante':{'Emprestimos e financiamentos':['passivo - empréstimos e financiamentos 1'],
                                          'Provisoes para contingencias':['passivo - provisões'],
                                          'Outros passivos nao circulantes':['passivo - outros 1']   
                },
                'Patrimonio Liquido':{'Capital social':['pl - capital social realizado'],
                                      'Reserva de capital':['pl - reservas'],
                                      'Reserva de lucros':['pl - lucros ou prejuízos acumulados']
                }
    
}

vars_desconsiderar_bp = ['ativo - ativo circulante','ativo - diferido']

In [86]:
cols_usadas = []
for it in list(dict_cols_BP.values()):
    for subit in list(it.values()):
        cols_usadas = cols_usadas + list(subit)
cols_n_consideradas = ((set(df_BP.columns) - set(['safra','ticker'])) - set(cols_usadas)) - set(vars_desconsiderar_bp)
cols_n_consideradas

{'passivo - adiantamento para futuro aumento capital',
 'passivo - captações no mercado aberto',
 'passivo - captações no mercado aberto 1',
 'passivo - depósitos',
 'passivo - depósitos 1',
 'passivo - lucros e receitas a apropriar',
 'passivo - obrigações por empréstimos',
 'passivo - obrigações por empréstimos 1',
 'passivo - obrigações por repasse do exterior',
 'passivo - obrigações por repasse do exterior 1',
 'passivo - obrigações por repasse do país',
 'passivo - obrigações por repasse do país 1',
 'passivo - outras obrigações',
 'passivo - outras obrigações 1',
 'passivo - participação dos acionistas não controladores',
 'passivo - passivo circulante',
 'passivo - passivo exigível a longo prazo',
 'passivo - passivo não circulante',
 'passivo - passivos sobre ativos não-correntes a venda e descontinuados',
 'passivo - passivos sobre ativos não-correntes a venda e descontinuados 1',
 'passivo - provisões 1',
 'passivo - recursos de aceites e emissão de títulos',
 'passivo - rec

In [84]:
np.unique(df_BP[(df_BP['ativo total']>0) & (df_BP['safra']=='30/06/2019')]['ticker'])

array([], dtype=object)