# üìè Exerc√≠cio: Predi√ß√£o Conforme (Conformal Prediction) para Regress√£o

Neste exerc√≠cio, voc√™ vai implementar o m√©todo de **Conformal Prediction** para prever intervalos de confian√ßa em tarefas de regress√£o. Vamos usar um modelo simples de regress√£o (como Regress√£o Linear) e aplicar **Conformal Prediction com split**.

---

## üéØ Objetivo

Prever n√£o apenas um valor pontual para $Y$, mas um **intervalo** $[L(x), U(x)]$ que contenha o valor verdadeiro com uma probabilidade pr√≥xima de $1 - \alpha$, mesmo sem fazer suposi√ß√µes fortes sobre a distribui√ß√£o dos erros.

---

## üìÇ Passo 1 ‚Äî Carregando os dados

Vamos usar um conjunto de dados sint√©tico:

    import numpy as np
    from sklearn.datasets import make_regression
    import matplotlib.pyplot as plt

    X, y = make_regression(n_samples=300, n_features=1, noise=15, random_state=42)

---

## ‚úÇÔ∏è Passo 2 ‚Äî Divis√£o treino / calibra√ß√£o / teste

Dividimos os dados em tr√™s partes:

- **Treino**: para ajustar o modelo  
- **Calibra√ß√£o**: para estimar os res√≠duos e ajustar os quantis  
- **Teste**: para avaliar a cobertura e largura dos intervalos

    from sklearn.model_selection import train_test_split

    X_train_full, X_test, y_train_full, y_test = train_test_split(X, y, test_size=0.2, random_state=0)
    X_train, X_calib, y_train, y_calib = train_test_split(X_train_full, y_train_full, test_size=0.25, random_state=0)

---

## üß† Passo 3 ‚Äî Ajuste do modelo de regress√£o

    from sklearn.linear_model import LinearRegression

    model = LinearRegression()
    model.fit(X_train, y_train)

---

## üìè Passo 4 ‚Äî Predi√ß√£o conforme (Split Conformal Prediction)

### üåü Ideia-chave

Queremos construir intervalos $[ \hat{y}(x) - q, \hat{y}(x) + q ]$ tais que a chance de conter o verdadeiro valor $y$ seja de pelo menos $1 - \alpha$, **sem assumir distribui√ß√£o do erro**.

### üìê Etapas:

1. Usar o conjunto de calibra√ß√£o para calcular os **res√≠duos absolutos**:

   $$
   r_i = |y_i - \hat{y}(x_i)|
   $$

2. Calcular o **quantil ajustado**:

   $$
   q = \text{quantil}_{1 - \alpha}(r_1, \ldots, r_n)
   $$

   ou, mais corretamente:

   $$
   q = \text{quantil}_{\lceil (1 - \alpha)(n + 1) \rceil / n}(r_1, \ldots, r_n)
   $$

3. Construir intervalo para cada novo ponto:

   $$
   [ \hat{y}(x) - q, \hat{y}(x) + q ]
   $$

---

## üßÆ Passo 5 ‚Äî Calculando o quantil ajustado

    from sklearn.metrics import mean_absolute_error

    y_calib_pred = model.predict(X_calib)
    residuals = np.abs(y_calib - y_calib_pred)

    alpha = 0.1
    n_calib = len(residuals)
    q = np.quantile(residuals, np.ceil((1 - alpha) * (n_calib + 1)) / n_calib)

---

## üîç Passo 6 ‚Äî Fazendo predi√ß√µes e construindo intervalos

    y_test_pred = model.predict(X_test)
    lower_bounds = y_test_pred - q
    upper_bounds = y_test_pred + q

---

## üìä Passo 7 ‚Äî Avaliando a cobertura


Avalie a cobertura empirica m√©dia dos intervalos, isto √©, quantas vezes a previs√£o real est√° dentro do intervalo conforme.

---

## üñºÔ∏è Passo 8 ‚Äî Visualizando os intervalos

Crie uma visualiza√ß√£o com o valor real vs valor predito e o intervalo conforme. 

---

## ‚úÖ Conclus√£o

- O m√©todo **Split Conformal Prediction** fornece intervalos **v√°lidos** com **garantia de cobertura** marginal.  
- N√£o assume nada sobre a distribui√ß√£o dos res√≠duos.  
- O uso do **quantil ajustado** com calibra√ß√£o √© o truque fundamental para garantir validade.

Voc√™ pode experimentar com outros modelos (por exemplo, Random Forest ou SVR) e ver como isso afeta a largura dos intervalos e a cobertura.
