# Por que m√©tricas tradicionais de Machine Learning falham em modelos de decis√£o?

Este notebook demonstra, com um exemplo simples, por que m√©tricas tradicionais de Machine Learning
(como acur√°cia) podem ser insuficientes quando o objetivo do modelo √© **tomar decis√µes de neg√≥cio**,
e n√£o apenas fazer boas previs√µes.


## Motiva√ß√£o

Em muitos problemas reais, Machine Learning n√£o √© usado apenas para prever resultados,
mas para **guiar decis√µes**.

Exemplos:
- Oferecer ou n√£o um desconto
- Entrar ou n√£o em contato com um cliente
- Aprovar ou n√£o um cr√©dito

O problema √© que m√©tricas tradicionais avaliam **o qu√£o bem o modelo prev√™ o passado**,
mas n√£o dizem se a **decis√£o sugerida realmente muda o resultado**.


## Modelos Preditivos vs Modelos de Decis√£o

üîπ **Modelo preditivo**  
Tenta responder:  
> "Qual √© a probabilidade de um evento acontecer?"

Exemplo:
- Qual a probabilidade de um cliente cancelar?

üîπ **Modelo de decis√£o**  
Tenta responder:  
> "O que acontece se eu agir?"

Exemplo:
- O cliente cancelaria **mesmo se eu oferecer um desconto?**

Essa diferen√ßa √© crucial ‚Äî e muitas m√©tricas de ML ignoram isso.


## Experimento Simulado

Neste experimento, vamos simular:
- Um problema de **churn**
- Uma a√ß√£o de neg√≥cio: **oferecer desconto**
- Um modelo simples de regress√£o log√≠stica

O objetivo √© mostrar que:
‚úî O modelo pode ter alta acur√°cia  
‚ùå Mas ainda assim n√£o responder √† pergunta certa


In [1]:
import numpy as np
import pandas as pd
from sklearn.metrics import accuracy_score
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

In [2]:
np.random.seed(42)

In [3]:
n = 1000

In [4]:
X = pd.DataFrame({
    "uso_produto": np.random.normal(50, 10, n),
    "reclamacoes": np.random.poisson(2, n),
    "desconto_oferecido": np.random.binomial(1, 0.5, n)
})

## Gera√ß√£o dos Dados

Criamos um conjunto de dados sint√©tico com tr√™s vari√°veis:

- `uso_produto`: intensidade de uso do cliente
- `reclamacoes`: n√∫mero de reclama√ß√µes
- `desconto_oferecido`: a√ß√£o control√°vel pelo neg√≥cio

Importante:
‚û°Ô∏è O desconto **realmente reduz churn no mundo simulado**  
‚û°Ô∏è Mas isso n√£o fica claro apenas olhando para a acur√°cia


In [5]:
logit = (
    0.05 * X["uso_produto"]
    + 0.8 * X["reclamacoes"]
    - 1.5 * X["desconto_oferecido"]
)
prob_churn = 1 / (1 + np.exp(-logit))
y = np.random.binomial(1, prob_churn)

In [6]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

In [7]:
model = LogisticRegression()
model.fit(X_train, y_train)

## Treinamento do Modelo

Utilizamos uma **Regress√£o Log√≠stica**,
comumente usado para problemas de churn.

Aqui o modelo aprende **correla√ß√µes** presentes nos dados,
mas n√£o necessariamente **efeitos causais**.


In [8]:
y_pred = model.predict(X_test)
print("Acur√°cia:", accuracy_score(y_test, y_pred))

Acur√°cia: 0.9266666666666666


## Avalia√ß√£o com M√©trica Tradicional

Avaliamos o modelo usando **acur√°cia**.

Essa m√©trica responde bem √† pergunta:
> "O modelo prev√™ corretamente quem vai cancelar?"

Mas **n√£o responde**:
> "Oferecer desconto muda o comportamento do cliente?"
