# 📏 Exercício: Intervalos de Predição Conforme com Variância Heterocedástica

Neste exercício, você irá aplicar **Conformal Prediction** em um conjunto de dados sintético onde a variância dos erros depende da entrada. Seu objetivo será prever não apenas o valor de saída, mas também construir **intervalos de predição válidos**, mesmo quando a incerteza varia com $x$.

---

## 📂 Passo 1 — Gerando os dados

Execute o código abaixo para criar um conjunto de dados com ruído que cresce com $|x|$:

    import numpy as np
    import pandas as pd

    def make_variable_data(n, std_dev=1/5):
        x = np.random.uniform(low=-1, high=1, size=n)
        y = (x**3) + 2 * np.exp(-6 * (x - 0.3)**2)
        y += np.random.normal(scale=std_dev * np.abs(x), size=n)
        df = pd.DataFrame({'x': x, 'y': y})
        return df

    # Gerando os dados
    df = make_variable_data(300)
    print(df.head())

---

## 🔍 Tarefa

Aplique **Split Conformal Prediction** usando um modelo de regressão de sua escolha (ex: Boosting). Divida os dados em três conjuntos:

- Treino
- Calibração
- Teste

Construa intervalos de predição com nível de confiança $1 - \alpha = 90\%$, e **visualize os intervalos junto com os pontos reais**.

---


# 📏 Exercício: Conformal Prediction com Boosting e Partições Locais

Neste exercício, você aplicará **Predição Conforme para regressão**, utilizando **Boosting** como modelo base. A inovação será construir **intervalos adaptativos**, baseando-se em uma **árvore de decisão treinada sobre os resíduos** para identificar regiões com diferentes níveis de incerteza.

---

## 📂 Passo 1 — Geração dos dados

Use o código abaixo para gerar dados sintéticos com variância que depende da entrada:

    import numpy as np
    import pandas as pd

    def make_variable_data(n, std_dev=1/5):
        x = np.random.uniform(low=-1, high=1, size=n)
        y = (x**3) + 2 * np.exp(-6 * (x - 0.3)**2)
        y += np.random.normal(scale=std_dev * np.abs(x), size=n)
        df = pd.DataFrame({'x': x, 'y': y})
        return df

    df = make_variable_data(300)

---

## 📋 Instruções

1. **Divida os dados** em três conjuntos: treino, calibração e teste.  
   Em seguida, divida o conjunto de calibração em duas partes de igual tamanho.

2. **Treine um modelo de boosting** (por exemplo, GradientBoostingRegressor) usando apenas o conjunto de treino.

3. **Use a primeira metade da calibração** para calcular os resíduos absolutos do modelo e treine uma **árvore de decisão** para aprender a estrutura desses resíduos.

4. **Aplique a árvore na segunda metade da calibração**, e para cada folha, calcule o **quantil ajustado** dos resíduos dessa região.

5. **No conjunto de teste**, para cada ponto:
   - Identifique a folha correspondente da árvore.
   - Use o quantil da folha para construir um **intervalo de predição adaptado**.

6. **Visualize os resultados**:
   - Plote as predições do modelo como linha.
   - Mostre os intervalos como faixas adaptadas por região.
   - Sobreponha os pontos reais para avaliar a cobertura.
   - Compare com o método de predição conforme usual.

---