# ❓ O que é o algoritmo de Regressão Logística?

A **regressão logística** é um algoritmo de **aprendizado supervisionado** utilizado principalmente para problemas de **classificação binária**, embora possa ser estendido para **classificação multiclasse**.

> ⚠️ Apesar do nome "regressão", a regressão logística é usada para **classificação**, e **não** para predição de valores contínuos.

---

### 🧠 Como funciona?

O algoritmo funciona modelando a **probabilidade de que uma determinada amostra pertença a uma classe específica**, permitindo uma interpretação probabilística dos resultados.


![image.png](attachment:image.png)

# 📈 Função Sigmoide na Regressão Logística

A Regressão Logística utiliza a função **sigmoide** para transformar a saída de uma regressão linear em uma **probabilidade** entre 0 e 1:

$$
p = \frac{1}{1 + e^{-y}}
$$

---

### 📌 Onde:

- **p** representa a **probabilidade** de uma instância **pertencer a uma classe** analisada ou evento (geralmente positivo).
- **y** representa um **número real**, dado pela **combinação linear dos atributos utilizados na predição**, derivado da regressão linear.

---

Essa função é essencial para problemas de **classificação binária**, pois permite interpretar a saída como **nível de confiança** da predição.

## 🎯 Limiar de Decisão (Threshold)

Para realizar uma **classificação baseada em probabilidade**, define-se um **limiar de decisão** (_threshold_).  

📌 Se a **probabilidade calculada** ultrapassar esse limiar, o registro é classificado como **classe 1**.  
Caso contrário, é considerado como **classe 0**.

---

### 🧠 Por que isso é útil?

A regressão logística não apenas classifica instâncias, mas também é capaz de:

- 📈 **Informar o grau de certeza ou incerteza** associado à classificação  
- 🧪 Ajudar na **interpretação do modelo** por meio da probabilidade calculada

---

➡️ Essa característica é especialmente valiosa em **aplicações sensíveis**, como diagnósticos médicos ou modelos de crédito, onde o grau de confiança importa tanto quanto a decisão em si.

## 🧮 Fórmulas da Regressão Logística

### 🔢 Modelo Linear:
A combinação linear dos atributos de entrada é definida como:

$$
y = f(x) = b_0 + b_1 x_1 + \ldots + b_n x_n
$$

---

### 📈 Função Sigmoide (transforma a saída em uma probabilidade):

$$
p = \frac{1}{1 + e^{-(b_0 + b_1 x_1 + \ldots + b_n x_n)}}
$$

---

### ✨ Reescrevendo a probabilidade como razão de chances (odds):

$$
e^{(b_0 + b_1 x_1 + \ldots + b_n x_n)} = \frac{p}{1 - p}
$$

---

### 🔄 Função Logit (forma linearizada da Regressão Logística):

$$
b_0 + b_1 x_1 + \ldots + b_n x_n = \ln\left( \frac{p}{1 - p} \right)
$$

---

Essas transformações permitem que a Regressão Logística seja treinada como um modelo **linear**, mas com interpretação **probabilística**!

## 🎲 Odds e Função Logit

### 🧾 Fórmula da Chance (Odds):

$$
odds(p) = \frac{p}{1 - p}
$$

---

### 📌 Interpretação:

- **odds(p)** é a **chance de ocorrência de um evento**, definida como a razão entre:
  - a **probabilidade do evento ocorrer** (p)
  - e a **probabilidade do evento não ocorrer** (1 - p)

---

### 🧠 Relação com a Regressão Logística:

É a partir dessa definição de **chance** que surge a base da **regressão logística**, permitindo:

- o cálculo da **probabilidade associada à predição**
- a **quantificação da incerteza** sobre uma instância
- por meio da **função logit**:

$$
\ln\left( \frac{p}{1 - p} \right)
$$


## 🧪 Exemplo prático: Regressão aplicada à classificação

Suponha que temos uma base de dados em que queremos **classificar (prever)** se um aluno será **aprovado no teste final** com base na informação:  
📌 _"Ele dormiu bem na noite anterior?"_

---

### 🔢 Modelo de Regressão Linear utilizado:

$$
y = f(x) = b_0 + b_1 x_1 + \ldots + b_n x_n
$$

---

### 📌 Coeficientes obtidos:

- \( b_0 \) ou \( a = 0{,}12 \) → *intercepto da reta (y-intercept)*  
- \( b_1 \) ou \( b = 0{,}45 \) → *variável binária indicando se o aluno dormiu bem na noite anterior (0 ou 1)*

---

Esse modelo será transformado por uma **função sigmoide** para gerar uma **probabilidade de aprovação**, típica da regressão logística.

Queremos definir a **probabilidade de um aluno passar no teste final**, considerando que ele **dormiu bem na noite anterior**.

---

### 🔢 Passo 1: Calcular o valor de \( y \)

Com base nos coeficientes:

- \( b_0 = 0{,}12 \)
- \( b_1 = 0{,}45 \)
- \( x_1 = 1 \) (dormiu bem)

Temos:

$$
y = 0{,}12 + (0{,}45 \cdot 1) = 0{,}57
$$

---

### 📈 Passo 2: Aplicar a função sigmoide para obter \( p \)

$$
p = \frac{1}{1 + e^{-y}} = \frac{1}{1 + e^{-0{,}57}} \approx 0{,}63876 \Rightarrow \textbf{63,87%}
$$

---

### 🎲 Passo 3: Calcular a chance (odds)

$$
\text{chance}(p) = \frac{p}{1 - p} = \frac{0{,}6387}{1 - 0{,}6387} \approx 1{,}768 \text{ para } 1
$$

---

📌 **Conclusão:**  
A probabilidade de aprovação, dado que o aluno dormiu bem, é de **63,87%**, e a **chance de aprovação** é de aproximadamente **1,77 para 1**.


## 🧠 Treinamento do Modelo e Função de Custo

O treinamento de um modelo de **regressão logística** consiste em encontrar a melhor função **sigmoide** que se ajuste aos dados de treinamento com a maior **precisão possível**.

> Em outras palavras, buscamos **determinar os coeficientes** \( b_0, b_1, \dots, b_n \) que **minimizem os erros de predição**, resultando em um modelo mais eficiente.

---

### ⚙️ Função de Custo: Entropia Cruzada Binária

Para alcançar esse objetivo, usamos uma **função de erro** chamada **Entropia Cruzada Binária**, que mede a divergência entre a predição do modelo e os valores reais:

$$
H_i = - \left( y_i \cdot \ln(p) + (1 - y_i) \cdot \ln(1 - p) \right)
$$

---

📌 Essa função penaliza fortemente previsões incorretas com alta confiança e é **amplamente usada em classificadores binários**.

# 📊 Métricas de Classificação

## 🟢 Área sob a Curva ROC (AUC)

A **Curva ROC** (*Receiver Operating Characteristics*) é uma representação gráfica da:

- **Taxa de Verdadeiros Positivos** (*Recall*)  
- versus **Taxa de Falsos Positivos** (1 - Especificidade)

...em diferentes **limiares de classificação**.

---

### 📈 O que a Curva ROC mostra?

Ela avalia o desempenho do modelo sob diversas configurações de limiar, permitindo entender como ele **equilibra a taxa de acertos e erros**.

---

### 📐 Interpretação da AUC (Área sob a curva):

| Valor de AUC | Interpretação |
|--------------|----------------|
| AUC = 0.5    | Modelo tão bom quanto um classificador aleatório |
| AUC < 0.5    | Modelo pior que um classificador aleatório       |
| AUC > 0.5    | Modelo melhor que um classificador aleatório     |

---

📌 Quanto **maior o valor da AUC**, melhor é a **capacidade discriminativa** do modelo.

✅ Um AUC próximo de **1** indica um **modelo excelente**, capaz de distinguir perfeitamente entre as classes.

![image.png](attachment:image.png)