# Exercice : convolution pour le calcul d'une probabilité

## Résumé

Dans cette page, nous calculons la distribution de la somme de deux variables aléatoires. Pour cela, nous utilisons le produit de convolution. Nous appliquons ces concepts à la somme d'une variable uniforme et d'une variable gaussienne.


## Introduction

Soient $X$ et $Y$ deux variables aléatoires réelles continues. On considère la variable $Z$ définie par :

$$
Z = X-Y.
$$

Soit $f_X$ (resp. $f_Y$ et $f_Z$) la densité de probabilité de la variable $X$ (resp. $Y$ et $Z$) et soit $F_X$ (resp. $F_Y$ et $F_Z$) la fonction de répartition de la variable $X$ (resp. $Y$ et $Z$). 

Pour tout $z\in\mathbb{R}$, on a :

$$
F_Z(z) = \int_{-\infty}^\infty F_X(z + y) f_Y(y) dy.
$$

## Références

"An introduction to probability theory and its applications", Volume 2, William Feller, John Wiley & Sons, Chapitre 1, Section 2, page 6.

## Application : poutre sollicitée en traction

We consider a simple beam stressed by a traction load F at both sides.

<img src="axial-stressed-beam.png" width="250">

We assume that the problem can be modeled by two variables:

- $R$, the strength,
- $S$, the stress associated with the force $F$.

Failure occurs when the beam plastifies, i.e. when the stress gets bigger than the strength:

$$
R - S \leq 0.
$$
 
The probability of failure is:

$$
P_f = \text{Prob}(R - S \leq 0).
$$

We consider the following distribution functions.

| Variable | Distribution |
|--|--|
| R | Uniform($\min=a_R, \max=b_R$) [Pa] |
| S | Normal($\mu_S, \sigma_S$) [Pa] |

We assume that the two variables $R$ and $S$ are independent.

The parameters of the distribution of $R$ and $S$ are:

$$
a_R = 2.627\times 10^6\textrm{ (Pa)}, \qquad b_R = 3.392\times 10^6\textrm{ (Pa)},
$$

and: 

$$
\mu_S = 2.546 \times 10^6\textrm{ (Pa)}, \qquad \sigma_S = 0.09549 \times 10^6\textrm{ (Pa)}.
$$

## Exemple

L'objectif de cet exercice est de calculer la densité de probabilité de la variable 

$$
Z = R-S
$$

par deux moyens différents :

- directement, par l'arithmétique des distributions dans OpenTURNS,
- par calcul d'une intégrale.

Dans chaque cas, on souhaite calculer la probabilité de défaillance $P_f$.

*Questions*

- Méthode 1 : avec l'arithmétique des distributions.
 - Utiliser la classe `Uniform` et créer la variable `R` de loi Uniforme($\min=2.627\times 10^6$, $\max=3.392\times 10^6$). Dessiner la PDF de `R`.
 - Utiliser la classe `Normal` et créer la variable `S` de loi $\mathcal{N}(\mu_S=2.546\times 10^6, \sigma_S=0.09549\times 10^6)$. Dessiner la PDF de `S`.
 - Utiliser l'opérateur arithmétique `-` pour créer la variable `Z=R-S`. Dessiner la PDF de `Z`.
 - Utiliser la méthode `computeCDF` de la variable `Z` pour calculer la valeur de la fonction de répartition de la variable $Z$ au point $z=0.$, c'est à dire la valeur de $P_f$. 
- Méthode 2 : par calcul d'une intégrale
 - Pour `z` donné, définir la variable `g` de type `PythonFunction` associée à l'intégrande :

$$
g(z)= F_R(z + s) f_S(s)
$$

pour tout $s\in\mathbb{R}$. 
 - Définir la règle de Gauss-Kronrod en utilisant la classe `GaussKronrodRule` avec la règle `G11K23`.
 - Définir la méthode d'intégration de Gauss-Kronrod en utilisant la classe `GaussKronrod`. 
 - Utiliser la méthode `integrate` pour calculer la valeur de la fonction de répartition de la variable $Z$ au point $z=0.$. 
- Comparer les deux résultats : sont-ils en accord ?

## Annexe - Démonstration : convolution pour le calcul de la loi de la différence

Dans cette page, nous calculons la fonction de répartition de la différence de deux variables aléatoires.

Soient $X$ et $Y$ deux variables aléatoires réelles continues. On considère la variable $Z$ définie par :

$$
Z = X+Y.
$$

Soit $f_X$ (resp. $f_Y$ et $f_Z$) la densité de probabilité de la variable $X$ (resp. $Y$ et $Z$) et soit $F_X$ (resp. $F_Y$ et $F_Z$) la fonction de répartition de la variable $X$ (resp. $Y$ et $Z$). 

Nous allons démontrer que la fonction de répartition de la variable $Z$ est :

\begin{align*}
F_Z(z)
&= \int_{-\infty}^\infty F_X(z + y) f_Y(y) dy
\end{align*}

pour tout $z\in\mathbb{R}$. 

*Preuve*

Par définition de la fonction de répartition de $Z$, on a :

\begin{align*}
F_Z(z)
&= P(Z\leq z) \\
&= P(X-Y\leq z) \\
&= P(X\leq z + Y)
\end{align*}

pour tout $z\in\mathbb{R}$. 
Or la probabilité $P(X\leq z + Y)$ peut s'exprimer comme l'espérance de la fonction indicatrice $\mathbb{1}_{\{X\leq z + Y\}}$. 
Par conséquent, pour tout $z\in\mathbb{R}$, on a :

\begin{align*}
F_Z(z)
&= E\left(\mathbb{1}_{\{X\leq z + Y\}}\right).
\end{align*}

La loi de l'espérance totale implique :

\begin{align*}
F_Z(z)
&= E\left(E\left(\mathbb{1}_{\{X\leq z + Y\}}|Y=y\right)\right) \\
&= E\left(P(X\leq z + Y|Y=y)\right)
\end{align*}

pour tout $z\in\mathbb{R}$. 
Par conséquent, pour tout $z\in\mathbb{R}$, on a :

\begin{align*}
F_Z(z)
&= \int_{-\infty}^\infty P(X\leq z + y) f_Y(y) dy \\
&= \int_{-\infty}^\infty F_X(z + y) f_Y(y) dy.
\end{align*}

## Références

"An introduction to probability theory and its applications", Volume 2, William Feller, John Wiley & Sons, Chapitre 1, Section 2, page 6.