# Question 1
Nous allons considèrer la consomation moyenne d'electricité d'une maison en fonction de la température exterieur.  
Soit $X\in\mathbb{R}$ qui définit la température exterieur, en degrés Celcius
Soit $Y\in\mathbb{R}$ qui définit la consomation electrique de la maison en Watt

$X \sim \mathcal{U}[0,40]$  
$Y \sim 2X + \epsilon$  
avec : $\epsilon = \mathcal N[0,100]$

### Fonction de perte
Nous allons utiliser la perte quadratique:  
$l(y_{true}, y_{pred}) = (y_{true} - y_{pred})²$

### Prédicteur de Bayes
$$f(x)=\mathbb{E}[Y|X=x]$$  
donc:
$$f(x)=\mathbb E[2X+\epsilon|X=x]$$
d'ou, $$f(x) = 2X$$

### Risque de Bayes

$$R(f)=\mathbb E[(Y - f(X))²]$$
Donc,  
$$R(f) = \mathbb E[\epsilon²]$$

In [2]:
import numpy as np
rng = np.random.default_rng()

## Nous allons utiliser
- `X` pour la température en Celcius qui est défini dans $\mathbb{R}$
- `y` consomation électrique en MW qui est défini dans $\mathbb{R}$

In [24]:
X = rng.uniform(size=(100,))
y = X + rng.normal(size=(100,))

### Nous allons utiliser la square loss pour pénaliser les grandes erreurs

In [None]:
def loss(y_pred, y_true):
    return np.mean((y_pred - y_true) ** 2)

In [None]:
def bayes(X, y, x_query, precision=1):
    X_rounded = np.round(X, precision)
    x_query_rounded = np.round(x_query, precision)
    mask = X_rounded == x_query_rounded
    if np.sum(mask) == 0:
        return np.nan
    return np.mean(y[mask])

def bayes_risk(X, y, precision=1):
    X_rounded = np.round(X, precision)
    unique_x = np.unique(X_rounded)
    risk = 0
    for x_val in unique_x:
        mask = X_rounded == x_val
        y_true = y[mask]
        y_pred = np.mean(y_true)
        local_risk = np.mean((y_true - y_pred) ** 2)
        prob_x = np.mean(mask)
        risk += local_risk * prob_x
    return risk

In [47]:
bayes_risk_value = bayes_risk(X, y)
print("Bayes risk:", bayes_risk_value)

Bayes risk: 0.1875
