# Question 0

Soit $
f(x) : \begin{cases}
\mathbb{R} \longrightarrow \mathbb{R} \\
x \mapsto x^3
\end{cases}
$, on a donc $f'(x) = 3x^2$. Tout d'abord, résolvons $f'(x) = 0$

$$f'(x) = 0 \Leftrightarrow 3x^2 = 0 \Leftrightarrow x = 0$$

Notons $x_0$ = 0, le point en lequel la dérivée de la fonction $f$ s'annule. À présent, déterminons si le point $x_0$ est un extremum local de la fonction $f$. 

Or $\forall x \in \mathbb{R}, f'(x) \ge 0$, celle-ci ne change donc pas de signe en $x_0$. Donc le point $f(x_0)$ ne s'agit donc par d'un extremum local de la fonction $f$.

Pour conclure, la fonction $f$ admet bien un point $x_0$ en lequel la dérivée $f'(x)$ s'annule. De plus $f(x_0)$ c'est pas un extremum local de cette fonction.

# Question 1

Il faut choisir une distribution asymétrique et s'assurer que les calculateurs de médiane et de moyenne produisent des valeurs différentes, influençant ainsi les risques associés.

## Proposition d'une situation où $f^*_{L_{absolute}} \ne f^*_{L{squared}}$

### Considérons une distribution asymétrique pour Y

Utilisons une distribution log-normale pour modéliser Y. La distribution log-normale est asymétrique et la moyenne et la médiane ne coïncident pas.

1. **Définition de l'estimateur h** :
    - Supposons que h(x) soit la médiane de Y. La médiane minimise naturellement la perte absolue.
2. **Calcul des risques associés** :
    - **Risque pour la perte absolue avec h** : La médiane minimise la perte absolue.
    - **Risque pour la perte absolue avec $f^*_{L{squared}} \: f^*_{L{squared}}(x) = E[Y| X = x]$**. Pour une distribution log-normale, la moyenne et la médiane sont différentes, ce qui devrait montrer des différences dans les risques calculés.

### Simulation

In [3]:
import numpy as np

np.random.seed(0)
x = np.linspace(0, 10, 100)
y = np.random.lognormal(mean=2.0, sigma=1.0, size=100)

h = np.median(y)

R_L_absolute_h = np.mean(np.abs(y - h))

f_L_squared_star = np.mean(y)

R_L_absolute_f_L_squared = np.mean(np.abs(y - f_L_squared_star))

print("R_L_absolute(h):", R_L_absolute_h)
print("R_L_absolute(f_L_squared_star):", R_L_absolute_f_L_squared)


R_L_absolute(h): 8.71964977920684
R_L_absolute(f_L_squared_star): 9.915588354803303


# Question 2

Déterminons le prédicteur Bayésien qui utilise la fonction de perte valeur absolue $f^*_{\text absolute}(x)$. Sachant que:

$$f^*_{\text absolute}(x) = \argmin_{z \in \mathbb{R}} E[|y-z||X=x]$$
$$=\argmin_{z \in \mathbb{R}} \int_{y \in \mathbb{R}}|y-z|p_{Y|X=x}(y)dy$$

On note $g(z)=\int_{y \in \mathbb{R}}|y-z|p_{Y|X=x}(y)dy$. En séparant la valeur absolue en deux intégrales, nous obtenons:

$$g(z)=\int_{-\infty}^{z} (z-y)p_{Y|X=x}(y)dy + \int_{z}^{+\infty}(y-z)p_{Y|X=x}(y)dy$$

$$=z\int_{-\infty}^{z} p_{Y|X=x}(y)dy - \int_{-\infty}^{z} yp_{Y|X=x}(y)dy+ \int_{z}^{+\infty}yp_{Y|X=x}(y)dy -z\int_{z}^{+\infty}p_{Y|X=x}(y)dy$$

Afin de déterminer $f^*_{\text absolute}(x) = \argmin_{z\in \mathbb{R}} g(z)$, nous voulons résoudre $g'(z)=0$. Tout d'abord, déterminons la dérivée de la fonction $g$ en fonction de $z$.

$$g'(z)=\int_{-\infty}^{z} p_{Y|X=x}(y)dy -\int_{z}^{+\infty}p_{Y|X=x}(y)dy$$

Résolvons $g'(z) =0$.

$$g'(z) =0 \Leftrightarrow \int_{-\infty}^{z} p_{Y|X=x}(y)dy -\int_{z}^{+\infty}p_{Y|X=x}(y)dy = 0 $$

$$\Leftrightarrow \int_{-\infty}^{z} p_{Y|X=x}(y)dy = \int_{z}^{+\infty}p_{Y|X=x}(y)dy$$

Cela implique que la probabilité conditionnelle $P(Y|X=x)$ jusqu'à $z$ est égale à cette probabilité au-delà de $z$. Or, nous savons que cela correspond exactement à la définition de la médiane. 

Nous pouvons donc conclure que le prédicteur Bayésien avec la fonction de perte valeur absolue est:

$$f^*_{\text absolute}(x) = médiane(Y|X=x) $$