In [29]:
import pandas as pd
import numpy as np

class CalculadoraIndicadoresFinanceiros:
    def __init__(self, db_config, id_empresa):
        self.db_config = db_config
        self.id_empresa = id_empresa
        self.df = None
        self.dataframes_metricas = {}
        self.dataframes_ajustados = {}
        self.metricas = {
            'receita_liquida': {
                'tipo_relatorio': "Demonstração do Resultado",
                'descricao': "Receita de Venda de Bens e/ou Serviços"
            },
            'ebit': {
                'tipo_relatorio': "Demonstração do Resultado",
                'descricao': "Resultado Antes do Resultado Financeiro e dos Tributos"
            },
            'resultado_liquido': {
                'tipo_relatorio': "Demonstração do Resultado",
                'descricao': "Resultado Líquido das Operações Continuadas"
            },
            'participacao_nao_controladora': {
                'tipo_relatorio': "Demonstração do Resultado",
                'descricao': "Atribuído a Sócios Não Controladores"
            },
            'lucro_liquido': {
                'tipo_relatorio': "Demonstração do Resultado",
                'descricao': "Atribuído a Sócios da Empresa Controladora"
            },
            'deprec': {
                'tipo_relatorio': "Demonstração do Fluxo de Caixa",
                'descricoes': [
                    "Depreciação, Amortização e Exaustão",
                    "Depreciação e amortização",
                    "Depreciação, depleção e amortização"
                ]
            }
        }
        self.metricas_ajustadas = {
            'ativo_total': {
                'tipo_relatorio': "Balanço Patrimonial Ativo",
                'descricao': "Ativo Total"
            },
            'passivo_circulante': {
                'tipo_relatorio': "Balanço Patrimonial Passivo",
                'descricao': "Passivo Circulante"
            },
            'total_emprestimos_e_financiamentos': {
                'tipo_relatorio': "Balanço Patrimonial Passivo",
                'descricao': "Empréstimos e Financiamentos"
            },
            'caixa_e_equivalentes': {
                'tipo_relatorio': "Balanço Patrimonial Ativo",
                'descricao': "Caixa e Equivalentes de Caixa"
            },
            'aplicacoes_financeiras': {
                'tipo_relatorio': "Balanço Patrimonial Ativo",
                'descricoes': ["Aplicações Financeiras","Aplicações Financeiras2", "Aplicações Financeiras1"]
            },
            'patrimonio_liquido': {
                'tipo_relatorio': "Balanço Patrimonial Passivo",
                'descricao': "Patrimônio Líquido Consolidado"
            },
            'participacao_nao_controladora_acionistas': {
                'tipo_relatorio': "Balanço Patrimonial Passivo",
                'descricao': "Participação dos Acionistas Não Controladores"
            },
            'total_emprestimos_e_financiamentos_lp': {
                'tipo_relatorio': "Balanço Patrimonial Passivo",
                'descricao': "Empréstimos e Financiamentos3"
            },
        }

    def carregar_dados(self):
        df_dados = pd.read_sql_table('dados_relatorio', self.db_config)
        df_relatorio = pd.read_sql_table('relatorio', self.db_config)

        if 'id_empresa' not in df_dados.columns:
            if 'id_empresa' in df_relatorio.columns:
                self.df = pd.merge(df_dados, df_relatorio, on='id_relatorio')
                self.df = self.df[self.df['id_empresa'] == self.id_empresa]
            else:
                raise KeyError("A coluna 'id_empresa' não foi encontrada em 'dados_relatorio' nem em 'relatorio'.")
        else:
            df_dados = df_dados[df_dados['id_empresa'] == self.id_empresa]
            self.df = pd.merge(df_dados, df_relatorio, on='id_relatorio')

        self.df['data_inicio'] = pd.to_datetime(self.df['data_inicio'])
        self.df['data_fim'] = pd.to_datetime(self.df['data_fim'])

    def adicionar_metrica(self, nome_metrica, tipo_relatorio, descricao, ajustada=False):
        if ajustada:
            self.metricas_ajustadas[nome_metrica] = {
                'tipo_relatorio': tipo_relatorio,
                'descricao': descricao
            }
        else:
            self.metricas[nome_metrica] = {
                'tipo_relatorio': tipo_relatorio,
                'descricao': descricao
            }

    def filtrar_metricas(self):
        if self.df is None:
            raise ValueError("Dados não carregados. Execute carregar_dados() primeiro.")
        
        for nome_metrica, config in self.metricas.items():
            if nome_metrica == 'deprec':
                # Tratamento especial para deprec com múltiplas descrições
                df_metrica = pd.DataFrame()
                for descricao in config['descricoes']:
                    filtro = self._filtrar_metrica(
                        self.df, config['tipo_relatorio'], descricao, nome_metrica
                    )
                    if not filtro.empty:
                        # Usar a primeira descrição encontrada com dados
                        df_metrica = filtro
                        break
                self.dataframes_metricas[nome_metrica] = df_metrica
            else:
                self.dataframes_metricas[nome_metrica] = self._filtrar_metrica(
                    self.df, config['tipo_relatorio'], config['descricao'], nome_metrica
                )
        
        for nome_metrica, config in self.metricas_ajustadas.items():
            if nome_metrica == 'aplicacoes_financeiras':
                # Tratamento especial para aplicacoes_financeiras com múltiplas descrições
                df_ajustado = pd.DataFrame()
                for descricao in config['descricoes']:
                    filtro = self._filtrar_metrica(
                        self.df, config['tipo_relatorio'], descricao, nome_metrica
                    )
                    if not filtro.empty:
                        # Usar a primeira descrição encontrada com dados
                        df_ajustado = filtro
                        break
                self.dataframes_ajustados[nome_metrica] = df_ajustado[
                    df_ajustado['data_inicio'].isna()
                ][['id_empresa', 'data_fim', nome_metrica]]
            else:
                self.dataframes_ajustados[nome_metrica] = self._filtrar_metrica(
                    self.df, config['tipo_relatorio'], config['descricao'], nome_metrica
                )

    def _filtrar_metrica(self, dados, tipo_relatorio, descricao, nome_coluna_valor):
        filtro = dados[
            (dados["tipo_relatorio"] == tipo_relatorio) &
            (dados["descricao"] == descricao)
        ]
        return filtro.rename(columns={"valor": nome_coluna_valor})

    def calcular_valor_12m(self, df, data_fim_target, valor_col):
        data_fim_target = pd.to_datetime(data_fim_target)
        ano = data_fim_target.year
        mes = data_fim_target.month
        dia = data_fim_target.day
        ano_anterior = ano - 1

        try:
            data_fim_ano_anterior = pd.to_datetime(f'{ano_anterior}-{mes:02d}-{dia:02d}')
        except ValueError:
            ultimo_dia = pd.Timestamp(ano_anterior, mes, 1) + pd.offsets.MonthEnd(0)
            data_fim_ano_anterior = ultimo_dia

        data_inicio_ano_anterior = pd.to_datetime(f'{ano_anterior}-01-01')
        data_fim_ano_anterior_completo = pd.to_datetime(f'{ano_anterior}-12-31')
        if 'data_inicio' not in df.columns:
            return None
        linha_ano_anterior = df[
            (df['data_inicio'] == data_inicio_ano_anterior) & 
            (df['data_fim'] == data_fim_ano_anterior_completo)
        ]
        if linha_ano_anterior.empty:
            data_inicio_ano_anterior = pd.to_datetime(f'{ano_anterior}-04-01')
            data_fim_ano_anterior_completo = pd.to_datetime(f'{ano}-03-31')
            if 'data_inicio' not in df.columns:
                return None
            linha_ano_anterior = df[
                (df['data_inicio'] == data_inicio_ano_anterior) & 
                (df['data_fim'] == data_fim_ano_anterior_completo)
                ]
            if linha_ano_anterior.empty:
                return None
        
        valor_acumulado_ano_anterior = linha_ano_anterior[valor_col].values[0]

        linha_ate_data_fim_ano_anterior = df[
            (df['data_inicio'] == data_inicio_ano_anterior) & 
            (df['data_fim'] == data_fim_ano_anterior)
        ]
        if linha_ate_data_fim_ano_anterior.empty:
            # Adicionar mais um ano ao data_fim_ano_anterior
            data_fim_ano_anterior = pd.to_datetime(f'{ano_anterior+1}-{mes:02d}-{dia:02d}')
            linha_ate_data_fim_ano_anterior = df[
                (df['data_inicio'] == data_inicio_ano_anterior) & 
                (df['data_fim'] == data_fim_ano_anterior)
            ]
            if linha_ate_data_fim_ano_anterior.empty:
                return None
        
        valor_acumulado_ate_data_fim_ano_anterior = linha_ate_data_fim_ano_anterior[valor_col].values[0]

        valor_ultimos_meses_ano_anterior = valor_acumulado_ano_anterior - valor_acumulado_ate_data_fim_ano_anterior

        data_inicio_ano = pd.to_datetime(f'{ano}-01-01')
        linha_ate_data_fim_target = df[
            (df['data_inicio'] == data_inicio_ano) & 
            (df['data_fim'] == data_fim_target)
        ]
        if linha_ate_data_fim_target.empty:
            data_inicio_ano = pd.to_datetime(f'{ano-1}-04-01')
            if mes > 4:
                data_inicio_ano = pd.to_datetime(f'{ano}-04-01')
            linha_ate_data_fim_target = df[
                (df['data_inicio'] == data_inicio_ano) & 
                (df['data_fim'] == data_fim_target)
            ]
            if linha_ate_data_fim_target.empty:
                return None

        valor_acumulado_ate_data_fim_target = linha_ate_data_fim_target[valor_col].values[0]

        return valor_ultimos_meses_ano_anterior + valor_acumulado_ate_data_fim_target

    def calcular_indicadores_12m(self):
        if not self.dataframes_metricas:
            raise ValueError("Métricas não filtradas. Execute filtrar_metricas() primeiro.")
        
        datas_fim = self.dataframes_metricas['receita_liquida']['data_fim'].unique()
        resultado_12m = {nome: [] for nome in self.metricas.keys()}
        resultado_12m['data_fim'] = []

        for data_fim in datas_fim:
            valores = {}
            for nome_metrica, df_metrica in self.dataframes_metricas.items():
                valor_12m = self.calcular_valor_12m(df_metrica, data_fim, nome_metrica)
                valores[nome_metrica] = valor_12m if valor_12m is not None else np.nan
            
            resultado_12m['data_fim'].append(data_fim)
            for nome_metrica in self.metricas.keys():
                resultado_12m[nome_metrica].append(valores[nome_metrica])

        df_resultado = pd.DataFrame(resultado_12m)
        df_resultado['id_empresa'] = self.id_empresa
        df_resultado['data_fim'] = pd.to_datetime(df_resultado['data_fim'])

        for nome_metrica, df_ajustado in self.dataframes_ajustados.items():
            df_resultado = df_resultado.merge(
                df_ajustado[['id_empresa', 'data_fim', nome_metrica]],
                on=['id_empresa', 'data_fim'],
                how='left'
            )

        df_resultado = df_resultado.sort_values('data_fim')
        return df_resultado

    def executar(self):
        self.carregar_dados()
        self.filtrar_metricas()
        return self.calcular_indicadores_12m()

    def calculo_indicadores(self, df_resultados):
        df_resultados.fillna(0, inplace=True)
        indicadores_primarios = {
            'capital_investido': (
                df_resultados['ativo_total'] - 
                df_resultados['passivo_circulante'] + 
                df_resultados['total_emprestimos_e_financiamentos'] - 
                df_resultados['caixa_e_equivalentes'] - 
                df_resultados['aplicacoes_financeiras']
            ),
            'ebitda': df_resultados['ebit'] + df_resultados['deprec'],
            'divida_bruta': (
                df_resultados['total_emprestimos_e_financiamentos'] + 
                df_resultados['total_emprestimos_e_financiamentos_lp']
            ),
            'patrimonio_liquido': (
                df_resultados['patrimonio_liquido'] - 
                df_resultados['participacao_nao_controladora_acionistas']
            ),
        }

        for nome, serie in indicadores_primarios.items():
            df_resultados[nome] = serie

        indicadores_secundarios = {
            'roic': (df_resultados['ebit'] * 0.66) / df_resultados['capital_investido'],
            'roe': (
                (df_resultados['lucro_liquido'] + df_resultados['participacao_nao_controladora']) / 
                (df_resultados['patrimonio_liquido'] + df_resultados['participacao_nao_controladora_acionistas'])
            ),
            'roa': (
                (df_resultados['lucro_liquido'] + df_resultados['participacao_nao_controladora']) / 
                df_resultados['ativo_total']
            ),
            'divida_liquida': (
                df_resultados['divida_bruta'] - 
                df_resultados['caixa_e_equivalentes'] - 
                df_resultados['aplicacoes_financeiras']
            ),
            'margem_ebit': df_resultados['ebit'] / df_resultados['receita_liquida'],
            'margem_liquida': (df_resultados['lucro_liquido'] + df_resultados['participacao_nao_controladora']) / df_resultados['receita_liquida'],
    
        }
        
        for nome, serie in indicadores_secundarios.items():
            df_resultados[nome] = serie

        df_resultados['divida_liquida_ebitda'] = df_resultados['divida_liquida'] / df_resultados['ebitda']
        
        # Formatar todos os valores para 2 casas decimais
        for coluna in df_resultados.columns:
            if coluna not in ['id_empresa', 'data_fim']:
                df_resultados[coluna] = df_resultados[coluna].round(4)
        
        return df_resultados

In [30]:
if __name__ == "__main__":
    db_config = 'postgresql+psycopg2://admin:admin_password@localhost:5432/meu_banco'
    calculadora = CalculadoraIndicadoresFinanceiros(db_config, 16659)

    # Executar o cálculo completo
    df_resultado = calculadora.executar()
    # Caso as todas as colunas, exceto data_fim e id_empresa, sejam nulas, a linha é removida
    df_resultado = df_resultado.dropna(subset=df_resultado.columns.difference(['data_fim', 'id_empresa']), how='all')
    df_resultado = calculadora.calculo_indicadores(df_resultado)
    df_resultado.drop_duplicates(subset=['data_fim'], keep='last', inplace=True)

In [31]:
df_resultado

Unnamed: 0,receita_liquida,ebit,resultado_liquido,participacao_nao_controladora,lucro_liquido,deprec,data_fim,id_empresa,ativo_total,passivo_circulante,...,capital_investido,ebitda,divida_bruta,roic,roe,roa,divida_liquida,margem_ebit,margem_liquida,divida_liquida_ebitda
13642,0.0,0.0,0.0,0.0,0.0,0.0,2021-03-31,16659,36686646.0,21347087.0,...,5581195.0,0.0,0.0,0.0,0.0,0.0,-9758364.0,,,-inf
13643,0.0,0.0,0.0,0.0,0.0,0.0,2021-06-30,16659,37959687.0,21668456.0,...,6971841.0,0.0,0.0,0.0,0.0,0.0,-9319390.0,,,-inf
13644,0.0,0.0,0.0,0.0,0.0,0.0,2021-09-30,16659,39334432.0,23407279.0,...,7461332.0,0.0,0.0,0.0,0.0,0.0,-8465821.0,,,-inf
13391,0.0,0.0,0.0,0.0,0.0,0.0,2021-12-31,16659,42872898.0,24959484.0,...,9035539.0,0.0,0.0,0.0,0.0,0.0,-8877875.0,,,-inf
13128,22260359.0,1030242.0,1423380.0,12.0,1423368.0,0.0,2022-03-31,16659,42466912.0,25592122.0,...,7664057.0,1030242.0,0.0,0.0887,0.1531,0.0335,-9210733.0,0.0463,0.0639,-8.9404
13129,23611112.0,538993.0,931659.0,18.0,931641.0,0.0,2022-06-30,16659,45932610.0,26641756.0,...,9882632.0,538993.0,0.0,0.036,0.099,0.0203,-9408222.0,0.0228,0.0395,-17.4552
13295,24941583.0,461805.0,1105566.0,3576.0,1101990.0,0.0,2022-09-30,16659,48947151.0,20263291.0,...,18625154.0,461805.0,0.0,0.0164,0.1105,0.0226,-10058706.0,0.0185,0.0443,-21.7813
3540,26414873.0,838404.0,1157414.0,17443.0,1139971.0,0.0,2022-12-31,16659,39914390.0,20263291.0,...,9592393.0,838404.0,0.0,0.0577,0.1088,0.029,-10058706.0,0.0317,0.0438,-11.9974
0,28189734.0,1175179.0,1339102.0,30703.0,1308399.0,0.0,2023-03-31,16659,40579108.0,20396708.0,...,9603059.0,1175179.0,0.0,0.0808,0.123,0.033,-10579341.0,0.0417,0.0475,-9.0023
1,29816000.0,1657235.0,1867513.0,47856.0,1819657.0,0.0,2023-06-30,16659,41440008.0,21167726.0,...,9081681.0,1657235.0,0.0,0.1204,0.163,0.0451,-11190601.0,0.0556,0.0626,-6.7526


In [7]:
x[x['descricao'] == 'Empréstimos e Financiamentos']

Unnamed: 0,id_dado,id_relatorio,descricao,valor,id_empresa,data_inicio,data_fim,tipo_relatorio,ultima_atualizacao
