# üìè Exerc√≠cio: Intervalos de Predi√ß√£o Conforme com Vari√¢ncia Heteroced√°stica

Neste exerc√≠cio, voc√™ ir√° aplicar **Conformal Prediction** em um conjunto de dados sint√©tico onde a vari√¢ncia dos erros depende da entrada. Seu objetivo ser√° prever n√£o apenas o valor de sa√≠da, mas tamb√©m construir **intervalos de predi√ß√£o v√°lidos**, mesmo quando a incerteza varia com $x$.

---

## üìÇ Passo 1 ‚Äî Gerando os dados

Execute o c√≥digo abaixo para criar um conjunto de dados com ru√≠do que cresce com $|x|$:

    import numpy as np
    import pandas as pd

    def make_variable_data(n, std_dev=1/5):
        x = np.random.uniform(low=-1, high=1, size=n)
        y = (x**3) + 2 * np.exp(-6 * (x - 0.3)**2)
        y += np.random.normal(scale=std_dev * np.abs(x), size=n)
        df = pd.DataFrame({'x': x, 'y': y})
        return df

    # Gerando os dados
    df = make_variable_data(300)
    print(df.head())

---

## üîç Tarefa

Aplique **Split Conformal Prediction** usando um modelo de regress√£o de sua escolha (ex: Boosting). Divida os dados em tr√™s conjuntos:

- Treino
- Calibra√ß√£o
- Teste

Construa intervalos de predi√ß√£o com n√≠vel de confian√ßa $1 - \alpha = 90\%$, e **visualize os intervalos junto com os pontos reais**.

---


# üìè Exerc√≠cio: Conformal Prediction com Boosting e Parti√ß√µes Locais

Neste exerc√≠cio, voc√™ aplicar√° **Predi√ß√£o Conforme para regress√£o**, utilizando **Boosting** como modelo base. A inova√ß√£o ser√° construir **intervalos adaptativos**, baseando-se em uma **√°rvore de decis√£o treinada sobre os res√≠duos** para identificar regi√µes com diferentes n√≠veis de incerteza.

---

## üìÇ Passo 1 ‚Äî Gera√ß√£o dos dados

Use o c√≥digo abaixo para gerar dados sint√©ticos com vari√¢ncia que depende da entrada:

    import numpy as np
    import pandas as pd

    def make_variable_data(n, std_dev=1/5):
        x = np.random.uniform(low=-1, high=1, size=n)
        y = (x**3) + 2 * np.exp(-6 * (x - 0.3)**2)
        y += np.random.normal(scale=std_dev * np.abs(x), size=n)
        df = pd.DataFrame({'x': x, 'y': y})
        return df

    df = make_variable_data(300)

---

## üìã Instru√ß√µes

1. **Divida os dados** em tr√™s conjuntos: treino, calibra√ß√£o e teste.  
   Em seguida, divida o conjunto de calibra√ß√£o em duas partes de igual tamanho.

2. **Treine um modelo de boosting** (por exemplo, GradientBoostingRegressor) usando apenas o conjunto de treino.

3. **Use a primeira metade da calibra√ß√£o** para calcular os res√≠duos absolutos do modelo e treine uma **√°rvore de decis√£o** para aprender a estrutura desses res√≠duos.

4. **Aplique a √°rvore na segunda metade da calibra√ß√£o**, e para cada folha, calcule o **quantil ajustado** dos res√≠duos dessa regi√£o.

5. **No conjunto de teste**, para cada ponto:
   - Identifique a folha correspondente da √°rvore.
   - Use o quantil da folha para construir um **intervalo de predi√ß√£o adaptado**.

6. **Visualize os resultados**:
   - Plote as predi√ß√µes do modelo como linha.
   - Mostre os intervalos como faixas adaptadas por regi√£o.
   - Sobreponha os pontos reais para avaliar a cobertura.
   - Compare com o m√©todo de predi√ß√£o conforme usual.

---