## Fundamenta√ß√£o Comportamental e Feature Engineering

#### Intelig√™ncia Preditiva para Interven√ß√£o de Cr√©dito Respons√°vel

Justificativa da necessidade do modelo de ML e Dicion√°rio de Features baseadas no risco brasileiro, **validado por resultados Out-of-Time (OOT)**.

---

### 1. Introdu√ß√£o: O Ciclo Vicioso e a Tese da Interven√ß√£o Proativa

**Insight Validado:** O modelo confirmou que **exposi√ß√£o total ao cr√©dito (limite)** e **risco sist√™mico (SCR)** s√£o os principais preditores, superando at√© mesmo a utiliza√ß√£o percentual do limite.

**Estrat√©gia Otimizada:** Threshold em **0.20** garantindo **100% de recall** para capturar todos os clientes em risco real, transformando falsos positivos em oportunidades de fideliza√ß√£o.

---


## 2. üáßüá∑ Panorama do Endividamento e a Urg√™ncia Preditiva (Contexto de Mercado)

O sucesso deste modelo preditivo √© diretamente proporcional √† escalada do endividamento no Brasil, que move clientes historicamente bons para o alto risco de cr√©dito (Rotativo).

### 2.1. O Est√°gio do Risco no Consumidor (Serasa/ANBIMA)

A tese de *Feature Engineering* √© solidamente ancorada em dados de mercado que demonstram a magnitude e a fragilidade financeira do consumidor brasileiro:

| Fonte | Dado Relevante (SETEMBRO/2025) | Implica√ß√£o para o Neg√≥cio |
| :--- | :--- | :--- |
| **SERASA** | **79,1 milh√µes de inadimplentes** e valor m√©dio da d√≠vida de **R$ 6.274,82** por pessoa. | **Justifica a urg√™ncia:** Demonstra a magnitude do risco sist√™mico. A interven√ß√£o proativa se torna uma prioridade de capital e risco. |
| **ANBIMA** | O **"Raio X do Investidor Brasileiro"** √© a principal refer√™ncia sobre o tema, validando a necessidade de uma abordagem **comportamental** e n√£o apenas est√°tica na gest√£o de risco. | **Legitima a Tese:** Endossa a estrat√©gia de focar em tend√™ncias de gasto e comprometimento impl√≠cito como sinais reais de estresse. |

### 2.2. A Tese do Estresse Agudo e as Features Comportamentais Chave

Nossa estrat√©gia transforma esse contexto macro em vari√°veis preditivas. As *features* mais cr√≠ticas s√£o constru√≠das especificamente para capturar os **sinais precoces de esgotamento de liquidez** que antecedem a entrada no Rotativo, garantindo que o modelo aprenda com o comportamento de crise:

* **`scr_tcr_implicita` (Taxa de Comprometimento Impl√≠cita):**
    * **L√≥gica:** Esta vari√°vel √© a principal *proxy* para medir a **press√£o financeira real**. Captura o aumento da depend√™ncia do cliente em usar o limite dispon√≠vel para cobrir despesas b√°sicas ou outras d√≠vidas, um **sinal cl√°ssico de estresse** que precede o Rotativo. Sua import√¢ncia elevada no modelo **valida a tese comportamental**.
* **`gasto_crescim_3m` (Crescimento do Gasto em 3 Meses):**
    * **L√≥gica:** Monitora o **desalinhamento or√ßament√°rio**. O crescimento do gasto descontrolado √© um indicador de que o cliente est√° perdendo a capacidade de fechar as contas apenas com a renda, for√ßando o uso de cr√©dito de alto custo. A inclus√£o de uma an√°lise *lagged* (tendencial) √© crucial aqui para evitar *data leakage* e garantir o poder preditivo.

---

### 3. O Foco no Estresse Agudo: Cart√£o de Cr√©dito e Sinais Din√¢micos

**Objetivo:** Isolar as linhas de cr√©dito que s√£o o alvo direto da interven√ß√£o e as features que capturam a mudan√ßa de comportamento.

| Vari√°vel BACEN | Fonte (API) | Conclus√£o para o Projeto |
| :--- | :--- | :--- |
| Concess√µes de cr√©dito - Cheque especial | bcdata.sgs.20665 | O Cheque Especial e o Rotativo s√£o os principais gatilhos de estresse. A Feature Engineering foca em **m√©dias m√≥veis e taxas de crescimento** para capturar o uso recorrente e a acelera√ß√£o do endividamento. |
| Concess√µes de cr√©dito - Cart√£o de cr√©dito rotativo | bcdata.sgs.20679 | O uso do Rotativo √© um forte preditor. Nossa interven√ß√£o permite √† Fintech oferecer a **liquida√ß√£o do Rotativo com Empr√©stimo Pessoal** antes da Resolu√ß√£o BACEN 4.549 obrigar o parcelamento (uma solu√ß√£o pior para o cliente). |


---

### 4. Fatores de Risco Comportamental (Validados pelo Modelo Final)

**Objetivo:** Justificar a inclus√£o de features que foram comprovadamente os maiores preditores do risco no modelo LightGBM.

| Risco Comportamental (Teoria) | Implica√ß√£o para a Feature Engineering | Valida√ß√£o (Import√¢ncia do Modelo) |
| :--- | :--- | :--- |
| Exposi√ß√£o ao Cr√©dito | O limite total do cart√£o √© o fator mais cr√≠tico de risco | Feature #1: limite_cartao (354 de import√¢ncia) |
| Risco Sist√™mico (SCR) | Exposi√ß√£o total no sistema financeiro atrav√©s do TCR | Feature #2: scr_tcr_implicita (333 de import√¢ncia) |
| Estresse de Liquidez Imediata | Utiliza√ß√£o recorrente do limite como proxy de depend√™ncia	| Feature #3: utilizacao_limite_media_3m (297 de import√¢ncia) |
| Deteriora√ß√£o Financeira | Crescimento acelerado da d√≠vida total no mercado | Feature #4: scr_crescim_divida_3m (208 de import√¢ncia) |
| Estresse de Consumo | Acelera√ß√£o do gasto mensal precedendo incapacidade de pagamento | Feature #5: gasto_crescim_3m (186 de import√¢ncia) |
| Comportamento Rotativo | Frequ√™ncia de uso do cr√©dito rotativo | Feature #6: contagem_rotativo_3m (40 de import√¢ncia) |

---

### 5. Feature Set Final: Dicion√°rio de Vari√°veis e Valida√ß√£o Preditiva

O conjunto de features foi desenhado em tr√™s pilares para garantir a m√°xima predi√ß√£o do Estresse Agudo, conforme a **Valida√ß√£o Out-of-Time (OOT)** do modelo LightGBM:

#### 5.1. Pilares e Features Otimizadas

| Categoria | Feature | Justificativa e Import√¢ncia Comprovada |
| :--- | :--- | :--- |
| **Pilar 1: Exposi√ß√£o ao Cr√©dito** | `limite_cartao` | **#1 no ranking (354)** Fator mais cr√≠tico de risco | 
| **Pilar 2: Risco Sist√™mico (SCR)** | `scr_tcr_implicita` | **#2 no ranking (333)** Exposi√ß√£o total no sistema financeiro |
| **Pilar 3: Estresse de Liquidez** | `utilizacao_limite_media_3m` | **#3 no ranking (297)** Utiliza√ß√£o recorrente do limite |
| **Pilar 2: Risco Sist√™mico (SCR)** | `scr_crescim_divida_3m` | **#4 no ranking (208)** Crescimento acelerado da d√≠vida |
| **Pilar 3: Estresse de Consumo** | `gasto_crescim_3m` | **#5 no ranking (186)** Acelera√ß√£o do gasto mensal |
| **Pilar 4: Comportamento Rotativo** | `contagem_rotativo_3m` | **#6 no ranking (40)** Frequ√™ncia de uso do rotativo |

---

### 6. Conclus√£o Estrat√©gica: Performance Comprovada e Implanta√ß√£o

#### 6.1. O Ciclo se Concretizou:

1. **Fundamenta√ß√£o Te√≥rica** ‚Üí Hip√≥tese de estresse agudo validada com novos insights sobre import√¢ncia do limite absoluto
2. **Modelo Preditivo (LightGBM)** validado com performance robusta e de alta diferencia√ß√£o (AUC = 0.7776) em Valida√ß√£o Out-of-Time (OOT)
3. **Estrat√©gia Otimizada** ‚Üí Threshold ajustado para **0.20**, resultando em Recall de **100%** para a Classe 1 (Rotativo)
4. **Viabilidade Operacional** ‚Üí O Trade-off (Precision 36%) √© gerenciado transformando Falsos Positivos em **Oportunidades de Fideliza√ß√£o** atrav√©s da interven√ß√£o consultiva


#### 6.2. Resultados de Performance (OOT - Out-of-Time):

- **AUC Score:** 0.7721
- **Recall (Classe 1):** 100%
- **Precision (Classe 1):** 36%
- **F1-Score (Classe 1):** 53%
- **Acur√°cia Global:** 55%
- **Distribui√ß√£o do Target:** 79.11% Classe 0 vs 20.89% Classe 1
- **Peso Otimizado da Classe 1:** 4.19x

#### 6.3. Insights Estrat√©gicos Descobertos:

Surpresas no Ranking de Features:

1. Limite do Cart√£o (#1): Exposto como preditor mais importante, redefinindo prioridades de monitoramento

2. SCR TCR Impl√≠cita (#2): Risco sist√™mico superou expectativas como indicador de estresse

3. Features Demogr√°ficas: Baixa import√¢ncia relativa confirmando foco comportamental sobre sociodemogr√°fico

Valida√ß√£o do Desbalanceamento:

1. Distribui√ß√£o natural de 79.11% vs 20.89% reflete realidade operacional

2. Estrat√©gia de peso (4.19x) comprovadamente eficaz para recall m√°ximo

#### 6.4. Pr√≥ximos Passos para Implanta√ß√£o:

1. Integra√ß√£o com Sistemas de cobran√ßa e atendimento ao cliente

2. Automa√ß√£o de Alertas para equipe de relacionamento baseada no novo ranking de features

3. Dashboard de Monitoramento cont√≠nuo da performance do modelo com foco nas top 5 features

4. Retreinamento Peri√≥dico com dados atualizados do mercado

5. Revis√£o de Pol√≠ticas de limite considerando a descoberta sobre import√¢ncia do limite absoluto

### 7. . An√°lise de Impacto Business

Efic√°cia Comprovada: O modelo captura 100% dos clientes em risco real de entrar no rotativo, permitindo interven√ß√£o proativa.

Oportunidade de Neg√≥cio: Os 64% de falsos positivos representam clientes de baixo risco que recebem ofertas de empr√©stimo personalizado, aumentando cross-selling e fideliza√ß√£o.

Diferencial Competitivo: Manter inadimpl√™ncia abaixo da m√©dia do mercado atrav√©s de intelig√™ncia preditiva validada estatisticamente.