#### **1. Objetivo Principal**

O objetivo central do caderno é desenvolver um sistema automatizado para avaliar a saúde financeira de empresas, atribuindo uma **pontuação de 0 a 10**. A metodologia foi projetada para utilizar apenas dados financeiros internos da empresa, sem a necessidade de recorrer a ratings de crédito externos.

#### **2. Metodologia Proposta (Passo a Passo)**

O processo é dividido em uma sequência clara de etapas:

* **Passo 1: Identificação de Indicadores-Chave:** O caderno começa por categorizar as entradas de dados financeiros essenciais em cinco grupos principais: Rentabilidade, Liquidez, Alavancagem, Fluxo de Caixa e Eficiência/Risco.
* **Passo 2: Engenharia de Atributos:** Com os dados brutos, o próximo passo é calcular um conjunto de índices financeiros padrão. As fórmulas para cada um (ex: Índice de Liquidez Corrente, Dívida/Patrimônio Líquido, ROE) são fornecidas.
* **Passo 3: Sistema de Pontuação (Scoring):** Cada índice calculado é mapeado para uma escala de 0 a 10 com base em limiares predefinidos e justificados pela literatura financeira.
* **Passo 4: Ponderação e Score Final:** As pontuações individuais dos índices são agregadas em uma única "Pontuação de Saúde" final por meio de uma média ponderada.
* **Passo 5: Treinamento de Modelo de Machine Learning:** A "Pontuação de Saúde" calculada é usada como o rótulo (variável-alvo `y`) para treinar um modelo de regressão.

#### **3. Fundamentação Acadêmica e Justificativa**

Uma parte crucial do caderno é a sua preocupação com a credibilidade acadêmica. Ele justifica a escolha dos índices, limiares e pesos com base em:
* **Fontes Clássicas:** Trabalhos fundamentais sobre previsão de falências, como os de **Altman (Z-Score)** e **Ohlson**.
* **Literatura Financeira Padrão:** Livros didáticos e obras de referência (Van Horne, Damodaran) que estabelecem as faixas consideradas saudáveis para cada índice.
* **Estudos Empíricos:** Pesquisas específicas do mercado turco e de mercados emergentes para calibrar os limiares de forma mais precisa ao contexto.
* **Referências Regulatórias:** Menção a frameworks como **Basileia II** para justificar a importância dos pesos atribuídos.

---

### **Detalhamento dos Indicadores, Pontuação e Ponderação**

A seguir estão os detalhes técnicos da metodologia de pontuação, incluindo os indicadores, suas fórmulas, as escalas de avaliação e as fontes que os justificam.

#### **1. Liquidez**
Mede a capacidade da empresa de cumprir suas obrigações de curto prazo.
* **Fontes de Referência para Limiares:** Van Horne & Wachowicz (2008); Celik (2019).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **Índice de Liquidez Corrente** | `Ativo Circulante / Passivo Circulante` | < 0.8 → **0** \| 1.0–1.5 → **5** \| ≥ 2.0 → **10** |
| **Índice de Liquidez Seca** | `(Ativo Circulante - Estoques) / Passivo Circulante` | < 0.5 → **0** \| 1.0 → **5** \| ≥ 1.5 → **10** |

#### **2. Alavancagem**
Avalia a estabilidade financeira e a solvência da empresa.
* **Fontes de Referência para Limiares:** Arslan & Karan (2009); Altman (1968).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **Dívida/Patrimônio Líquido** | `(Passivo Total - Patrimônio Líquido) / Patrimônio Líquido` | > 3 → **0** \| 1–2 → **5** \| < 0.5 → **10** |

#### **3. Rentabilidade**
Mede a capacidade da empresa de gerar lucros.
* **Fontes de Referência para Limiares:** Uyar & Kuzey (2014); Beaver (1966).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **Retorno sobre Patrimônio Líquido (ROE)** | `Lucro Líquido do Período / Patrimônio Líquido` | < 0% → **0** \| 0–10% → **4** \| 10–20% → **7** \| > 20% → **10** |
| **Margem de Lucro Líquido** | `Lucro Líquido do Período / Receita de Vendas` | < 0% → **0** \| 0–5% → **3** \| 5–15% → **7** \| > 15% → **10** |
| **Margem Operacional** | `Lucro Operacional / Receita de Vendas` | < 0% → **0** \| 5–10% → **5** \| > 15% → **10** |

#### **4. Cobertura**
Indica a capacidade de cobrir despesas financeiras.
* **Fontes de Referência para Limiares:** Van Horne (2008); Altman (2017).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **Cobertura de Juros** | `Lucro Operacional / Despesas Financeiras` | < 1 → **0** \| 1–3 → **5** \| > 5 → **10** |

#### **5. Fluxo de Caixa**
Avalia a capacidade real de geração de caixa.
* **Fontes de Referência para Limiares:** Ohlson (1980); Erdogan & Bozkurt (2020).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **FCO / Dívida** | `Fluxo de Caixa Operacional / Dívidas Financeiras` | < 0.1 → **0** \| 0.2–0.5 → **5** \| > 0.5 → **10** |
| **Fluxo de Caixa Livre / Vendas** | `Fluxo de Caixa Livre / Receita de Vendas` | < 0% → **0** \| 0–5% → **5** \| > 10% → **10** |

#### **6. Risco, Solvência e Sustentabilidade**
Mede a sensibilidade a fatores macroeconômicos e a força dos lucros acumulados.
* **Fontes de Referência para Limiares:** Relatórios de Estabilidade Financeira do CBRT; Altman (1968).

| Indicador | Fórmula | Escala de Pontuação (0-10) |
| :--- | :--- | :--- |
| **Posição Cambial Líquida** | Valor direto do balanço | Exposição negativa grande → **0** \| Neutra → **5** \| Positiva → **10** |
| **Lucros Retidos / Ativo Total**| `Lucros Retidos ou Prejuízos Acumulados / Ativo Total` | < 0 → **0** \| 0–0.2 → **5** \| > 0.3 → **10** |

---

### **Ponderação Final do Score de Saúde Financeira**

As pontuações de cada categoria são combinadas em um único score final (0-10) usando a seguinte média ponderada:

| Dimensão | Peso | Descrição |
| :--- | :--- | :--- |
| **Rentabilidade** | 25% | Capacidade de geração de lucro. |
| **Liquidez** | 20% | Capacidade de cumprir obrigações de curto prazo. |
| **Alavancagem** | 20% | Estabilidade financeira e solvência. |
| **Fluxo de Caixa** | 20% | Capacidade real de geração de caixa. |
| **Risco / Exposição Cambial** | 10% | Sensibilidade à moeda e ao macroambiente. |
| **Sustentabilidade** | 5% | Força dos lucros retidos. |

# Exemplo — pontuação passo a passo de 4 empresas fictícias (mostra a lógica + pontuação final de 0 a 10)

## 1) As regras de mapeamento (os limites exatos usados neste exemplo)

* **Índice de Liquidez Corrente (ILC)**: `<0.8 → 0`, `0.8–1.0 → 2`, `1.0–1.5 → 5`, `1.5–2.0 → 7`, `≥2.0 → 10`
* **Índice de Liquidez Seca (ILS)**: `<0.5 → 0`, `0.5–1.0 → 4`, `1.0–1.5 → 5`, `≥1.5 → 10`
* **Dívida/Patrimônio Líquido (D/PL)**: `>3 → 0`, `2–3 → 3`, `1–2 → 5`, `0.5–1 → 7`, `<0.5 → 10`
* **ROE**: `<0% → 0`, `0–10% → 4`, `10–20% → 7`, `>20% → 10`
* **Margem de Lucro Líquido**: `<0% → 0`, `0–5% → 3`, `5–15% → 7`, `>15% → 10`
* **Margem Operacional**: `<0% → 0`, `5–10% → 5`, `10–15% → 7`, `>15% → 10`
* **Cobertura de Juros** (Lucro Operacional / Despesas Financeiras): `<1 → 0`, `1–3 → 5`, `3–5 → 7`, `>5 → 10`
* **FCO / Dívida**: `<0.1 → 0`, `0.1–0.2 → 2`, `0.2–0.5 → 5`, `>0.5 → 10`
* **FCL / Vendas**: `<0% → 0`, `0–5% → 5`, `5–10% → 7`, `>10% → 10`
* **Posição Cambial Líquida**: `negativa grande → 0`, `neutra → 5`, `positiva → 10`
* **Lucros Retidos / Ativo Total**: `<0 → 0`, `0–0.2 → 5`, `0.2–0.3 → 7`, `>0.3 → 10`

Pesos usados para combinar as sub-pontuações:

* **Liquidez** = 20% (média das sub-pontuações de ILC e ILS)
* **Alavancagem** = 20% (D/PL)
* **Rentabilidade** = 25% (média de ROE, Margem de Lucro Líquido, Margem Operacional)
* **Fluxo de Caixa** = 20% (média de FCO/Dívida, FCL/Vendas)
* **Cobertura** = 10% (Cobertura de Juros)
* **Risco / Sustentabilidade** = 5% (média da Posição Cambial Líquida e do índice de Lucros Retidos)

---

## 2) Dados brutos para 4 empresas fictícias

| Empresa | Vendas | Ativo Circulante | Passivo Circulante | Estoques | Passivo Total | Patrimônio Líquido | Lucro Operacional | Despesas Financeiras | Lucro Líquido | FCO Líquido | Dívidas Financeiras | Fluxo de Caixa Livre | Lucros Retidos | Ativo Total | Posição Cambial Líquida |
| :--- | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | ---: | :--- |
| **A (saudável)** | 500 | 300 | 100 | 50 | 150 | 350 | 90 | 5 | 77 | 120 | 50 | 60 | 150 | 500 | **+10** |
| **B (mediana)** | 300 | 150 | 120 | 40 | 200 | 150 | 30 | 10 | 20 | 40 | 100 | 10 | 40 | 350 | **0** |
| **C (em dificuldade)** | 250 | 60 | 120 | 10 | 200 | 20 | -20 | 20 | -30 | -10 | 150 | -15 | -50 | 220 | **-50** |
| **D (mista)** | 400 | 500 | 300 | 0 | 350 | 150 | 32 | 8 | 18 | 40 | 160 | 15 | 60 | 520 | **+5** |

---

## 3) Índices calculados (dígito a dígito), depois a sub-pontuação por índice

### Cálculos da Empresa A

* Índice de Liquidez Corrente = 300 ÷ 100 = **3.00** → sub-pontuação ILC = **10** (≥2.0)
* Índice de Liquidez Seca = (300 − 50) ÷ 100 = 250 ÷ 100 = **2.50** → sub-pontuação ILS = **10**
* Dívida/PL = 150 ÷ 350 = 0.428571… → **0.4286** → sub-pontuação D/PL = **10** (<0.5)
* ROE = 77 ÷ 350 = 0.22 → **22.0%** → sub-pontuação ROE = **10** (>20%)
* Margem de Lucro Líquido = 77 ÷ 500 = 0.154 → **15.4%** → sub-pontuação = **10** (>15%)
* Margem Operacional = 90 ÷ 500 = 0.18 → **18.0%** → sub-pontuação = **10**
* Cobertura de Juros = 90 ÷ 5 = **18.0** → sub-pontuação = **10**
* FCO / Dívida = 120 ÷ 50 = **2.4** → sub-pontuação = **10**
* FCL / Vendas = 60 ÷ 500 = 0.12 → **12.0%** → sub-pontuação = **10**
* Posição Cambial Líquida positiva → sub-pontuação = **10**
* Lucros Retidos / Ativo Total = 150 ÷ 500 = 0.30 → **0.30** → sub-pontuação = **10** (≥0.3)

### Cálculos da Empresa B

* Índice de Liquidez Corrente = 150 ÷ 120 = **1.25** → sub-pontuação ILC = **5**
* Índice de Liquidez Seca = (150 − 40) ÷ 120 = 110 ÷ 120 = **0.9167** → sub-pontuação ILS = **4**
* Dívida/PL = 200 ÷ 150 = **1.3333** → sub-pontuação D/PL = **5**
* ROE = 20 ÷ 150 = **0.1333** → **13.33%** → sub-pontuação ROE = **7**
* Margem de Lucro Líquido = 20 ÷ 300 = **0.0667** → **6.67%** → sub-pontuação = **7**
* Margem Operacional = 30 ÷ 300 = **0.10** → **10.0%** → sub-pontuação = **5** (conforme mapeamento)
* Cobertura de Juros = 30 ÷ 10 = **3.0** → sub-pontuação = **5**
* FCO / Dívida = 40 ÷ 100 = **0.40** → sub-pontuação = **5**
* FCL / Vendas = 10 ÷ 300 = **0.0333** → **3.33%** → sub-pontuação = **5**
* Posição Cambial Líquida neutra → sub-pontuação = **5**
* Lucros Retidos / Ativo Total = 40 ÷ 350 = **0.1143** → sub-pontuação = **5**

### Cálculos da Empresa C

* Índice de Liquidez Corrente = 60 ÷ 120 = **0.50** → sub-pontuação ILC = **0**
* Índice de Liquidez Seca = (60 − 10) ÷ 120 = 50 ÷ 120 = **0.4167** → sub-pontuação ILS = **0**
* Dívida/PL = 200 ÷ 20 = **10.0** → sub-pontuação = **0**
* ROE = -30 ÷ 20 = **-1.5** → negativo → sub-pontuação = **0**
* Margem de Lucro Líquido = -30 ÷ 250 = **-0.12** → negativo → **0**
* Margem Operacional = -20 ÷ 250 = **-0.08** → negativo → **0**
* Cobertura de Juros = -20 ÷ 20 = **-1.0** → negativo → **0**
* FCO / Dívida = -10 ÷ 150 = **-0.0667** → **0**
* FCL / Vendas = -15 ÷ 250 = **-0.06** → **0**
* Posição Cambial Líquida negativa grande → **0**
* Lucros Retidos / Ativo Total = -50 ÷ 220 = **-0.2273** → **0**

### Cálculos da Empresa D

* Índice de Liquidez Corrente = 500 ÷ 300 = **1.6667** → sub-pontuação ILC = **7** (definimos 1.5–2.0 → 7)
* Índice de Liquidez Seca = (500 − 0) ÷ 300 = 500 ÷ 300 = **1.6667** → sub-pontuação ILS = **10** (≥1.5)
* Dívida/PL = 350 ÷ 150 = **2.3333** → sub-pontuação D/PL = **3** (2–3 → 3)
* ROE = 18 ÷ 150 = **0.12** → **12.0%** → sub-pontuação ROE = **7**
* Margem de Lucro Líquido = 18 ÷ 400 = **0.045** → **4.5%** → sub-pontuação = **3**
* Margem Operacional = 32 ÷ 400 = **0.08** → **8.0%** → sub-pontuação = **5**
* Cobertura de Juros = 32 ÷ 8 = **4.0** → sub-pontuação = **7**
* FCO / Dívida = 40 ÷ 160 = **0.25** → sub-pontuação = **5**
* FCL / Vendas = 15 ÷ 400 = **0.0375** → **3.75%** → sub-pontuação = **5**
* Posição Cambial Líquida positiva pequena → sub-pontuação = **10**
* Lucros Retidos / Ativo Total = 60 ÷ 520 = **0.1154** → sub-pontuação = **5**

---

## 4) Médias das sub-pontuações por dimensão (calculamos a média das sub-pontuações dos componentes dentro de cada dimensão)

### Liquidez (média de ILC e ILS)

* A: (10 + 10) ÷ 2 = **10.0**
* B: (5 + 4) ÷ 2 = **4.5**
* C: (0 + 0) ÷ 2 = **0.0**
* D: (7 + 10) ÷ 2 = **8.5**

### Alavancagem (sub-pontuação D/PL)

* A: **10**
* B: **5**
* C: **0**
* D: **3**

### Rentabilidade (média de ROE, Margem de Lucro Líquido, Margem Operacional)

* A: (10 + 10 + 10) ÷ 3 = **10.0**
* B: (7 + 7 + 5) ÷ 3 = **6.3333333...** → **6.33**
* C: (0 + 0 + 0) ÷ 3 = **0**
* D: (7 + 3 + 5) ÷ 3 = **5.0**

### Fluxo de Caixa (média de FCO/Dívida e FCL/Vendas)

* A: (10 + 10) ÷ 2 = **10.0**
* B: (5 + 5) ÷ 2 = **5.0**
* C: (0 + 0) ÷ 2 = **0**
* D: (5 + 5) ÷ 2 = **5.0**

### Cobertura (Cobertura de Juros)

* A: **10**
* B: **5**
* C: **0**
* D: **7**

### Risco/Sustentabilidade (média de Posição Cambial e Lucros Retidos/Ativo Total)

* A: (10 + 10) ÷ 2 = **10.0**
* B: (5 + 5) ÷ 2 = **5.0**
* C: (0 + 0) ÷ 2 = **0**
* D: (10 + 5) ÷ 2 = **7.5**

---

## 5) Combinação ponderada (pontuação final de saúde 0–10)

Ponderação: Liquidez 20%, Alavancagem 20%, Rentabilidade 25%, Fluxo de Caixa 20%, Cobertura 10%, Risco 5%.

Calcular contribuição = sub-pontuação × peso.

### Empresa A

* Liquidez: 10.0 × 0.20 = **2.00**
* Alavancagem: 10.0 × 0.20 = **2.00**
* Rentabilidade: 10.0 × 0.25 = **2.50**
* Fluxo de Caixa: 10.0 × 0.20 = **2.00**
* Cobertura: 10.0 × 0.10 = **1.00**
* Risco: 10.0 × 0.05 = **0.50**
* **Pontuação final = 2.00 + 2.00 + 2.50 + 2.00 + 1.00 + 0.50 = 10.00**

**Pontuação final de saúde da Empresa A = 10.0** (excelente)

---

### Empresa B

* Liquidez: 4.5 × 0.20 = **0.90**
* Alavancagem: 5.0 × 0.20 = **1.00**
* Rentabilidade: 6.3333333 × 0.25 = **1.58333333** → arredondar para **1.58**
* Fluxo de Caixa: 5.0 × 0.20 = **1.00**
* Cobertura: 5.0 × 0.10 = **0.50**
* Risco: 5.0 × 0.05 = **0.25**
* **Pontuação final = 0.90 + 1.00 + 1.5833 + 1.00 + 0.50 + 0.25 = 5.2333**

**Pontuação final de saúde da Empresa B ≈ 5.23** (moderada)

---

### Empresa C

* Liquidez: 0 × 0.20 = **0.00**
* Alavancagem: 0 × 0.20 = **0.00**
* Rentabilidade: 0 × 0.25 = **0.00**
* Fluxo de Caixa: 0 × 0.20 = **0.00**
* Cobertura: 0 × 0.10 = **0.00**
* Risco: 0 × 0.05 = **0.00**
* **Pontuação final = 0.00**

**Pontuação final de saúde da Empresa C = 0.0** (em dificuldade)

---

### Empresa D

* Liquidez: 8.5 × 0.20 = **1.70**
* Alavancagem: 3.0 × 0.20 = **0.60**
* Rentabilidade: 5.0 × 0.25 = **1.25**
* Fluxo de Caixa: 5.0 × 0.20 = **1.00**
* Cobertura: 7.0 × 0.10 = **0.70**
* Risco: 7.5 × 0.05 = **0.375**
* **Pontuação final = 1.70 + 0.60 + 1.25 + 1.00 + 0.70 + 0.375 = 5.625**

**Pontuação final de saúde da Empresa D ≈ 5.63** (ligeiramente acima da média / mista)

---

## 6) Tabela de resumo final (compacta)

| Empresa | Pontuação final (0–10) | Interpretação |
| :--- | :--- | :--- |
| **A** | **10.00** | Excelente — liquidez, rentabilidade e fluxo de caixa fortes |
| **B** | **5.23** | Moderada — mediana em todas as métricas |
| **C** | **0.00** | Em dificuldade — rentabilidade e fluxo de caixa negativos |
| **D** | **5.63** | Mista — boa liquidez, mas alta alavancagem e rentabilidade modesta |

---

## 7) Notas e como você pode reproduzir isso automaticamente

* Todas as fórmulas de índices são retiradas das colunas do conjunto de dados que você já possui (usei `Vendas`, `Ativo Circulante`, `Passivo Circulante`, etc.).
* O **mapeamento de sub-pontuação** de 0 a 10 usa os mesmos limites que discutimos anteriormente. Na prática, você pode:

    * implementar o mapeamento como uma função simples (ou `numpy.select` / `pandas.cut` vetorizado)
    * calcular as médias dos componentes por dimensão, depois multiplicar pelos pesos e somar.
* Você pode calibrar qualquer um dos limiares (ex: classificar `ILC 1.5–2.0` como 8 em vez de 7) com base nas medianas do setor ou no seu conjunto de validação.

---

Documentação do Dataset: Engenharia de Features para Modelo de Default

1. Objetivo

Este documento descreve o processo de preparação e engenharia de features (variáveis) realizado sobre os dados financeiros brutos. O objetivo foi transformar os dados contábeis em métricas padronizadas e pontuadas que sirvam como base para um modelo preditivo de default (inadimplência) de crédito.

O processo foi dividido em duas etapas principais:

Cálculo de Ratios (df_with_ratios): Criação de 17 rácios financeiros tradicionais.

Pontuação de Features (df_scored): Aplicação de um sistema de pontuação (scoring) baseado em literatura acadêmica para criar 13 features de pontuação e um score total.

2. Etapa 1: Cálculo de Ratios Financeiros (df_with_ratios)

A partir dos 65 campos originais do dataset, foram criados 17 novos rácios (indicadores). Este processo resultou no dataframe df_with_ratios (total de 82 colunas).

Estes rácios traduzem os números brutos em métricas comparáveis de saúde financeira, agrupadas nas seguintes categorias:

Liquidez (Capacidade de pagamento a curto prazo)

Alavancagem (Nível de endividamento)

Rentabilidade (Capacidade de gerar lucro)

Eficiência (Uso de ativos)

Cobertura (Capacidade de pagar juros)

Crescimento (Evolução ano a ano)

Solvência e Risco (Estabilidade de longo prazo)

3. Etapa 2: Pontuação de Features (df_scored)

Para normalizar os rácios e capturar relações não-lineares, aplicamos um sistema de pontuação (de 0 a 10) a 13 dos rácios mais significativos. Este sistema é baseado em thresholds (limites) estabelecidos na literatura financeira.

Este processo criou 14 novas colunas: 13 colunas score_... e uma coluna total_score, resultando no dataframe final df_scored (96 colunas).

Abaixo está a justificação acadêmica para os thresholds utilizados.

3.1. Liquidez & Solvência

Estes scores medem a capacidade da empresa de cumprir obrigações de curto e longo prazo.

Métrica

Thresholds (Limites)

Justificativa Acadêmica

score_current_ratio

<1.0 = 0; 1–1.5 = 5; 1.5–2.5 = 8; >2.5 = 10

Van Horne & Wachowicz (2008): Sugerem uma faixa ideal entre 1.5 e 2.5.

score_quick_ratio

<0.5 = 0; 0.5–1.0 = 5; 1–1.5 = 8; >1.5 = 10

Brigham & Ehrhardt (2017): Um valor próximo de 1.0 é considerado saudável.

score_debt_to_equity

>3.0 = 0; 2–3 = 3; 1–2 = 6; <1 = 10

Damodaran (2015): Valores acima de 3.0 indicam alta alavancagem e risco.

score_debt_to_assets

>0.8 = 0; 0.6–0.8 = 3; 0.4–0.6 = 6; <0.4 = 10

OECD: Alinhado com dados de estrutura de capital de economias da OCDE.

score_interest_coverage

<1 = 0; 1–3 = 5; 3–5 = 8; >5 = 10

Ohlson (1980): Valores baixos são fortes indicadores de "distress" financeiro.

score_retained_to_assets

<0 = 0; 0–0.1 = 4; 0.1–0.3 = 8; >0.3 = 10

Altman (1968): Esta é uma variável chave no Z-Score de Altman para prever falência.

3.2. Eficiência (Gestão de Ativos)

Mede a eficiência com que a empresa utiliza seus ativos para gerar receita.

Métrica

Thresholds (Limites)

Justificativa Acadêmica

score_asset_turnover

<0.3 = 0; 0.3–0.6 = 5; 0.6–1.0 = 8; >1.0 = 10

OECD: Baseado em benchmarks de eficiência industrial de dados da OCDE.

score_inventory_turnover

<2 = 0; 2–4 = 5; 4–8 = 8; >8 = 10

Princípios Contábeis: Um giro mais alto indica gestão de estoque eficiente.

score_receivable_turnover

<2 = 0; 2–5 = 5; 5–10 = 8; >10 = 10

Brigham (2017): Um giro alto indica que a empresa coleta pagamentos rapidamente.

3.3. Métricas de Crescimento

Mede a expansão da empresa, um indicador de saúde e demanda de mercado.

Métrica

Thresholds (Limites)

Justificativa Acadêmica

score_sales_growth

<0 = 0; 0–5% = 4; 5–15% = 7; >15% = 10

Damodaran (2024): Alinhado com taxas de crescimento sustentável (~10%).

score_asset_growth

<0 = 0; 0–5% = 4; 5–15% = 7; >15% = 10

Reflete uma taxa de reinvestimento razoável e não excessivamente agressiva.

score_net_income_growth

<0 = 0; 0–5% = 4; 5–20% = 8; >20% = 10

Reflete melhoria na lucratividade (bottom-line).

3.4. Risco / Exposição Cambial (FX)

Mede a vulnerabilidade da empresa a flutuações na taxa de câmbio.

Métrica

Thresholds (Limites)

Justificativa Acadêmica

score_fx_position_ratio

< -0.2 = 0; -0.1–0 = 5; 0–0.1 = 8; >0.1 = 10

Relatórios de Estabilidade (ex: CBRT): Posições líquidas negativas representam um risco significativo.

4. Features Finais para Modelagem

O dataset df_scored está agora pronto para a modelagem e contém três tipos de features:

Dados Brutos (ex: ativos_circulantes, dívidas_financeiras): Dados originais.

Rácios Contínuos (ex: current_ratio, debt_to_equity): Métricas de saúde financeira lineares.

Features Pontuadas (ex: score_current_ratio, total_score): Métricas ordinais que capturam o julgamento de especialistas e relações não-lineares, ideais para modelos de machine learning.