## Import des bibliothèques

In [18]:
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error


## Génération de données synthétiques (fonction Bayesienne)

In [19]:
np.random.seed(0)
n_train = 1000
n_test = 500

def true_function(x):
    return 3 * np.log(x + 1)

## Génération des vitesses de vent (X) et production d'énergie (Y)

In [20]:
X_train = np.random.uniform(0, 20, n_train).reshape(-1, 1)
Y_train = true_function(X_train) + np.random.normal(0, 0.5, X_train.shape)

X_test = np.random.uniform(0, 20, n_test).reshape(-1, 1)
Y_test = true_function(X_test) + np.random.normal(0, 0.5, X_test.shape)

## Estimateur f̃ : régression linéaire

In [21]:
linear_model = LinearRegression()
linear_model.fit(X_train, Y_train)
f_tilde_preds = linear_model.predict(X_test)

## Estimateur f* : prédicteur Bayesien (espérance conditionnelle simulée par true_function)

In [22]:
f_star_preds = true_function(X_test)

## Calcul des risques empiriques

In [None]:
risk_f_tilde = mean_squared_error(Y_test, f_tilde_preds)
risk_f_star = mean_squared_error(Y_test, f_star_preds)
bayes_risk = np.mean((Y_test - f_star_preds)**2)

## Affichage des résultats

In [24]:
print(f"Erreur de généralisation pour f̃ (linéaire) : {risk_f_tilde:.4f}")
print(f"Erreur de généralisation pour f* (Bayesien) : {risk_f_star:.4f}")
print(f"Risque de Bayes (approché) : {bayes_risk:.4f}")

Erreur de généralisation pour f̃ (linéaire) : 0.7334
Erreur de généralisation pour f* (Bayesien) : 0.2278
Risque de Bayes (approché) : 0.2278
