# Utilisation du paramètre `prefit` avec un réseau de neurones

`MapieRegressor` peut être utilisé pour estimer les incertitudes de gros modèles pour lesquels le coût de la validation croisée est trop élevé. Par exemple, les réseaux de neurones reposent en général sur un seul ensemble de validation.

Dans cet exemple, nous ajustons d'abord un réseau de neurones sur le jeu d'entraînement. Nous calculons ensuite les résidus sur un jeu de validation avec le paramètre `cv="prefit"`. Enfin, nous estimons les intervalles de prédiction sur un jeu de test.

## 1. Génération des données

In [None]:
import scipy
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPRegressor
import plotly.graph_objects as go

**Exercice.** Commençons par importer `MapieRegressor` et `coverage_score`.

In [None]:
from mapie.estimators import MapieRegressor  # correction
from mapie.metrics import coverage_score  # correction

Commençons par générer un jeu de données univarié avec bruit gaussien homoscédastique.

In [None]:
def f(x: np.ndarray) -> np.ndarray:
    """Polynomial function used to generate one-dimensional data."""
    return np.array(5*x + 5*x**4 - 9*x**2)

In [None]:
sigma = 0.1
n_samples = 10000
X = np.linspace(0, 1, n_samples)
y = f(X) + np.random.normal(0, sigma, n_samples)

**Exercice.** Séparons le jeu de données en un jeu d'entraînement, un jeu de validation, et un jeu de test.

In [None]:
# Train/validation/test split
test_size = 1/10
X_train_val, X_test, y_train_val, y_test = train_test_split(
    X, y, test_size=test_size  # correction
)
test_size = 1/9
X_train, X_val, y_train, y_val = train_test_split(
    X_train_val, y_train_val, test_size=test_size  # correction
)

## 2. Définition et entraînement du modèle

**Exercice.** Définissons notre modèle [`MLPRegressor`](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPRegressor.html) avec les paramètres par défaut (une seule couche à 100 neurones avec une fonction d'activation "relu") et optimisons le sur le jeu d'entraînement.

In [None]:
model = MLPRegressor(random_state=1)  # correction
model.fit(X_train.reshape(-1, 1), y_train)  # correction

**Exercice.** Utilisons `MapieRegressor` pour calibrer les incertitudes avec l'option `cv="prefit"` sur le jeu de validation. Le MLP déjà entraîné est utilisé dans MAPIE pour estimer les résidus sur le jeu de validation.

In [None]:
mapie = MapieRegressor(model, cv="prefit")  # correction
mapie.fit(X_val.reshape(-1, 1), y_val);

## 3. Estimation des intervalles de prédiction

**Exercice.** Evaluons maintenant les intervalles de prédiction sur le jeu de test pour `alpha = 0.1`.

In [None]:
alpha = 0.1
y_preds = mapie.predict(X_test.reshape(-1, 1), alpha=alpha)  # correction
y_pred_low, y_pred_up = y_preds[1][:, 0, 0], y_preds[1][:, 1, 0]

**Question.** Quel est la couverture effective obtenue sur le jeu de test ? Est-elle cohérente avec la couverture cible de 90% (pour un alpha de 0.1) ? 

In [None]:
coverage = coverage_score(y_test, y_pred_low, y_pred_up)  # correction
print(coverage)  # correction

## 4. Visualisation des résultats

In [None]:
theoretical_semi_width = scipy.stats.norm.ppf(1 - alpha)*sigma
y_test_theoretical = f(X_test)
order = np.argsort(X_test)

In [None]:
fig = go.Figure()
# lower/upper bounds
fig.add_trace(go.Scatter(
    name="lower bound",
    x=X_test[order].ravel(),
    y=y_pred_low[order],
    mode="lines",
    line=dict(color="rgba(0, 0, 255, 0.3)", dash='solid')
))
fig.add_trace(go.Scatter(
    name="upper bound",
    x=X_test[order].ravel(),
    y=y_pred_up[order],
    mode="lines",
    fill="tonexty",
    fillcolor="rgba(0, 0, 255, 0.1)",
    line=dict(color="rgba(0, 0, 255, 0.3)", dash='solid')
))
# data
fig.add_trace(go.Scatter(
    name="data",
    x=X_test,
    y=y_test,
    mode="markers",
    marker=dict(color="red", size=4)
))
# predictions
fig.add_trace(go.Scatter(
    name="predictions",
    x=X_test[order].ravel(),
    y=y_preds[0][order],
    mode="lines",
    line=dict(color="blue", dash='solid')
))
# true function
fig.add_trace(go.Scatter(
    name="true function",
    x=X_test[order].ravel(),
    y=y_test_theoretical[order],
    mode="lines",
    line=dict(color="black", dash='solid')
))
fig.add_trace(go.Scatter(
    name="theoretical upper bound",
    x=X_test[order].ravel(),
    y=y_test_theoretical[order] - theoretical_semi_width,
    mode="lines",
    line=dict(color="black", dash='dash')
))
fig.add_trace(go.Scatter(
    name="theoretical lower bound",
    x=X_test[order].ravel(),
    y=y_test_theoretical[order]  + theoretical_semi_width,
    mode="lines",
    line=dict(color="black", dash='dash')
))
fig.update_layout(
    xaxis_title="x",
    yaxis_title="y",
    font = dict(family='Computer Modern', size=20, color='#7f7f7f'),
    hovermode="x",
    showlegend=False
)
fig.show()