### Modelos de Classifica√ß√£o vs. Modelos de Regress√£o

Como j√° vimos, modelos de **Regress√£o Linear** s√£o excelentes para prever valores cont√≠nuos, como o pre√ßo de um im√≥vel ou a quantidade de vendas de um produto.

Entretanto, em muitos cen√°rios, queremos prever uma categoria, n√£o um n√∫mero. Por exemplo:
- Este e-mail √© *spam* ou *n√£o spam*?
- Este cliente ir√° *cancelar* ou *n√£o cancelar* a assinatura?
- O paciente est√° *doente* ou *saud√°vel*?

Para esses casos, usamos os **Modelos de Classifica√ß√£o**. Eles nos ajudam a classificar uma observa√ß√£o em uma de duas ou mais categorias.

### O que √© a Regress√£o Log√≠stica?

Apesar do nome "Regress√£o", a Regress√£o Log√≠stica √© um **modelo de classifica√ß√£o**. Ela √© o nosso ponto de partida por ser uma t√©cnica poderosa e fundamental.

A ideia central √© modelar a **probabilidade** de uma observa√ß√£o pertencer a uma determinada classe. Por exemplo, a probabilidade de um e-mail ser spam, dado o seu conte√∫do.

Para fazer isso, precisamos entender um conceito estat√≠stico chave: **Odds (Chance)**.

<img src="regressao_logistica.png"/>


## Passo 1: Entendendo o Conceito de Odds (Chance)

Em estat√≠stica, **Odds** (ou **Chance**, em portugu√™s) √© uma forma de expressar a probabilidade. Ela representa a raz√£o entre a probabilidade de um evento acontecer (sucesso) e a probabilidade de ele n√£o acontecer (fracasso).

A f√≥rmula √© bem simples:

$$\text{Odds} = \frac{P}{1 - P}$$

Onde \( P \) √© a probabilidade de sucesso.

#### üí° Exemplo Pr√°tico (Matem√°tica Primeiro!)

Vamos supor que a probabilidade de um aluno ser aprovado em um exame √© de 80% (ou \( P = 0,8 \)).

Qual √© a chance (Odds) de ele ser aprovado?

1.  **Probabilidade de sucesso (P)**: \( 0,8 \)
2.  **Probabilidade de fracasso (1 - P)**: \( 1 - 0,8 = 0,2 \)

Agora, aplicamos a f√≥rmula:

$\text{Odds de Aprova√ß√£o} = \frac{0,8}{0,2} = 4$

> **Interpreta√ß√£o:** A chance de um aluno ser aprovado √© de **4 para 1**. Ou seja, √© 4 vezes mais prov√°vel que ele seja aprovado do que n√£o seja.

In [1]:
# Agora, vamos replicar o c√°lculo com Python
p_sucesso = 0.8

# Calculando as Odds
odds = p_sucesso / (1 - p_sucesso)

print(f"A probabilidade de sucesso √©: {p_sucesso}")
print(f"As Odds de sucesso s√£o: {odds:.1f} para 1")

A probabilidade de sucesso √©: 0.8
As Odds de sucesso s√£o: 4.0 para 1


## Passo 2: A M√°gica do Logaritmo - O Log-Odds

Voc√™ pode se perguntar: *"Por que n√£o modelamos a probabilidade diretamente?"*

A resposta √© que a probabilidade √© restrita (entre 0 e 1), mas os modelos lineares (como a base da regress√£o log√≠stica) podem prever qualquer valor de -‚àû a +‚àû. Precisamos de uma forma de "esticar" a escala de probabilidade.

√â aqui que entra o **logaritmo natural**! Ao aplicarmos o `log` nas Odds, criamos o **Log-Odds** (ou **Logit**).

$$\text{Log-Odds} = \log(\text{Odds}) = \log\left( \frac{P}{1 - P} \right)$$

O Log-Odds transforma a escala de `(0, 1)` para `(-‚àû, +‚àû)`, que √© exatamente o que um modelo linear precisa!

**A sacada da Regress√£o Log√≠stica √© modelar o Log-Odds como uma combina√ß√£o linear das nossas vari√°veis**, assim como na regress√£o linear simples!

$$\log\left( \frac{P}{1 - P} \right) = z = \theta_0 + \theta_1 x_1 + \theta_2 x_2 + \dots + \theta_n x_n$$

#### üí° Continuando nosso Exemplo

J√° calculamos que as Odds de aprova√ß√£o s√£o 4. Agora, vamos calcular o Log-Odds.

**Matematicamente:**
$\text{Log-Odds} = \log(4) \approx 1.386$

In [2]:
import numpy as np

# O valor 'z' representa o resultado da equa√ß√£o linear (o Log-Odds)
z = np.log(odds)

print(f"O valor de Log-Odds (z) √©: {z:.4f}")

O valor de Log-Odds (z) √©: 1.3863


## Passo 3: Revertendo o Processo com a Fun√ß√£o Sigmoide

√ìtimo! O modelo vai nos dar um valor `z` (o Log-Odds). Mas no final do dia, queremos uma **probabilidade** (algo entre 0 e 1), que √© muito mais f√°cil de interpretar.

Para fazer o caminho de volta (de Log-Odds para Probabilidade), usamos a fun√ß√£o inversa, chamada de **Fun√ß√£o Sigmoide** (ou Fun√ß√£o Log√≠stica).

$$P = \frac{1}{1 + e^{-z}}$$

Essa fun√ß√£o "espreme" qualquer n√∫mero real (de -‚àû a +‚àû) para dentro do intervalo `(0, 1)`, resultando em uma curva em formato de "S".

#### üí° Finalizando nosso Exemplo

Nosso modelo previu um Log-Odds (`z`) de `1.386`. Vamos aplicar a fun√ß√£o Sigmoide para encontrar a probabilidade original.

**Matematicamente:**
$P = \frac{1}{1 + e^{-1.386}} = \frac{1}{1 + 0.25} = \frac{1}{1.25} = 0.8$

Chegamos de volta √† nossa probabilidade inicial de 80%! Isso mostra que o Log-Odds e a Sigmoide s√£o opera√ß√µes inversas.

In [3]:
# Vamos criar a fun√ß√£o sigmoide em Python
def sigmoid(z):
    return 1 / (1 + np.exp(-z))

# Revertendo o Log-Odds (z) para a probabilidade original
probabilidade_revertida = sigmoid(z)

print(f"O valor de Log-Odds (z) era: {z:.4f}")
print(f"A probabilidade revertida pela fun√ß√£o Sigmoide √©: {probabilidade_revertida:.1f}")

O valor de Log-Odds (z) era: 1.3863
A probabilidade revertida pela fun√ß√£o Sigmoide √©: 0.8


## Resumo: A F√≥rmula Completa da Regress√£o Log√≠stica

Juntando tudo, o modelo de Regress√£o Log√≠stica faz duas coisas:

1.  **Calcula o Log-Odds (z)** como uma fun√ß√£o linear das vari√°veis de entrada $ (x_1, x_2, ...) $:
    $$z = \theta_0 + \theta_1 x_1 + \dots + \theta_n x_n$$

2.  **Aplica a Fun√ß√£o Sigmoide** em `z` para obter a probabilidade final da classe ser 1 (sucesso):
    $$\hat{y} = P(y=1) = \sigma(z) = \frac{1}{1 + e^{-z}}$$

### E como o modelo aprende os coeficientes (Œ∏)?

O modelo utiliza um processo de otimiza√ß√£o, como o **Gradiente Descendente**, para encontrar os melhores valores para os coeficientes $ \theta_0, \theta_1, \dots, \theta_n $. O objetivo √© ajustar esses valores de forma que as probabilidades previstas pelo modelo $ \hat{y} $ fiquem o mais pr√≥ximo poss√≠vel dos resultados reais (0 ou 1) no conjunto de dados de treino. Mas isso √© um t√≥pico para a nossa pr√≥xima aula!

## üìå Resumo dos Conceitos

| Conceito      | F√≥rmula                               | O que representa?                          |
|---------------|----------------------------------------|--------------------------------------------|
| Odds (Chance) | $\frac{P}{1 - P}$                 | A raz√£o entre sucesso e fracasso. |
| Log-Odds      | $\log\left( \frac{P}{1 - P} \right)$ | A escala linear que o modelo usa para trabalhar. |
| Sigmoide      | $\frac{1}{1 + e^{-z}}$                | Converte o Log-Odds de volta em probabilidade. |

Espero que esta explica√ß√£o tenha clareado as coisas! A Regress√£o Log√≠stica √© uma ferramenta fant√°stica e entender sua base matem√°tica te dar√° muito mais confian√ßa.

**Alguma d√∫vida at√© aqui? Qual t√≥pico voc√™ gostaria de explorar a seguir? Que tal aplicarmos isso a um conjunto de dados real?**