<h1 style="font-family: Georgia, serif;font-size: 2.5em;margin-left: 3em;margin-right: 4em;"> 

---

Probabilités 2024/25 : Projet numérique

---

</h1> 

In [None]:
## Import des packages et des fonctions utiles pour le projet

#-----------------------------------------------------

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from matplotlib.collections import PatchCollection

#-----------------------------------------------------

## Vecteur de couleurs
Cat=np.array(['#F8B005','#E35704','#A92A04'])
Dext = [-2, 2]
D = [-1, 1]

## Fonction pour représenter les simulations
def plotSim(S,figsize=(7,7),fromAbove=True,cropSim=True):

    ## Sort by increasing time
    Sim=S.copy()
    indSort=np.argsort(Sim[:,0])
    if fromAbove==False:
        indSort=np.flip(indSort)
    Sim=Sim[indSort,:]
    
    coordinates,sizes,colors = Sim[:,1:3], Sim[:,3], Cat[Sim[:,4].astype(int)]
    
    # Calculate bottom-left corner of each rectangle to center it
    bottom_left_coords = coordinates - np.stack([sizes, sizes], axis=1)*(2**0.5)/2

    # Create the rectangles
    rectangles = [patches.Rectangle((x, y), w, h,angle=45,rotation_point='center') for (x, y), w, h in zip(bottom_left_coords, sizes*(2**0.5), sizes*(2**0.5))]

    # Create a PatchCollection and apply the colors
    collection = PatchCollection(rectangles, facecolor=colors, edgecolor='black')
    
    ## Plot
    fig,ax = plt.subplots(figsize=figsize)
    ax.add_collection(collection)
    if cropSim:
        ax.set_xlim(D[0],D[1])
        ax.set_ylim(D[0],D[1])
    else:
        ax.set_xlim(Dext[0],Dext[1])
        ax.set_ylim(Dext[0],Dext[1])
    plt.show()

## Introduction

<h1 style="font-family: Georgia, serif;font-size: 1.1em;margin-left: 3em;margin-right: 4em;"> 

---

La géométrie stochastique est une branche des probabilités qui s'intéresse à la modélisation d'objets géométriques (e.g. points, lignes, polygones,...) dont les attributs et/ou la position dans l'espace sont aléatoires. Ces modèles sont utilisés pour modéliser un grand nombre de phénomènes, comme par exemple la position des épicentres  de séismes, la positions des arbres dans une forêt, ou la disposition de fibres ou de grains dans des matériaux composites.

L'objectif de ce projet est de construire et de simuler un modèle simple de géométrie stochastique, le modèle dit des *feuilles mortes*. Il tire son nom du fait qu'il peut être vu comme une façon de modéliser des tapis de feuilles mortes sur le sol. L'idée est la suivante: on assimile les feuilles à des carrés "apparaissant" à des temps aléatoires et à des positions aléatoires sur un domaine $\mathcal{D}\subseteq \mathbb{R}^2$ (le sol). On considère également que la taille et la couleur de ces carrés sont aléatoires. En supposant que les feuilles tombent depuis un temps $t=-\infty$ et on considère l'état du domaine $\mathcal{D}$ à l'instant $t=0$ (le tapis de feuilles).

---

</h1> 

## I - Temps d'arrivée des feuilles

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

On suppose qu'on observe le tapis de feuille mortes au temps $T_0=0$ et que des feuilles sont tombées depuis un temps infini. On note ainsi $(T_{k})_{k\in\mathbb{Z}_-^*}$ la séquence des temps d'arrivée sur le sol des feuilles: $T_{-1}\le 0$ est le temps d'arrivée de la dernière feuille du tapis, $T_{-2}\le T_{-1}$ le temps d'arrivée de l'avant-dernière feuille, etc.

Afin de modéliser les temps aléatoires $(T_{-i})_{i\in\mathbb{N}^*}$ auxquels les feuilles mortes tombent sur le sol, nous recourrons à un modèle permettant de représenter des points aléatoires dans l'intervalle $I = ]-\infty, 0]$: le processus de Poisson (homogène). Ce modèle est défini de la manière suivante :

1. Pour tout $ A \in {\cal B} (]-\infty, 0])$ borné et fixé, le nombre de points $N (A)=\text{Card}\lbrace i\in\mathbb{N}^* : T_{-i} \in A\rbrace$ suit
      une loi de Poisson de paramètre $\theta \, | A |$, où $\theta \in \mathbb{R}^+$ et $|A|$ est la mesure de Lebesgue de $A$. On a donc
      $$ \mathbb{P} ( N (A) = n) = \exp \bigl( - \theta | A | \bigr) \frac{
        \bigl( \theta | A | \bigr)^n }{n!},~n \in \N $$

2. Pour tout $p\ge 2$, si $A_1,...,A_p \in {\cal B} (]-\infty, 0]) $ sont 
      disjoints deux à deux, alors $ N(A_1),...,N(A_p)$ sont 
      mutuellement indépendants.

Le paramètre $\theta$ est appelé l'intensité (ou densité) du processus de Poisson.

---

</h1> 


**Question 1.a.** Pour $i\in\mathbb{N}^*$ on pose $E_i = T_{-i +1} - T_{-i}$. Justifier que $\forall i\in\mathbb{N}^*, \tau >0,$  les événements $\lbrace E_i > \tau\rbrace$ et $\lbrace N( \left[ T_{-(i-1)}-\tau, T_{-(i-1)} \right[)=0\rbrace$ sont identiques, tout comme les évènements $\lbrace T_{-(i-1)}=t\rbrace$ et $ \lbrace  N([t,0[)=i-1\rbrace \cap\lbrace  N(]t,0[)=i-2 \rbrace$ pour $t<0$ et $i>1$.


**Réponse**

Soit $i\in \N$. Si $E_i > \tau$ alors $T_{-i+1} - T_{-i} > \tau$ et aucune feuille ne tombe durant l'intervalle de temps $]T_{-i},T_{-i+1}[$. Or puisque $T_{-i+1} - T_{-i} > \tau$, on a $T_{-i} < T_{-i+1} - \tau$, et donc $ [T_{-(i-1)}-\tau, T_{-(i-1)}[ \subset ]T_{-i},T_{-i+1}[ $. Puisque $N(]T_{-i},T_{-i+1}[ ) = 0$, on en déduit que $N([T_{-(i-1)}-\tau, T_{-(i-1)}[)=0$. 

Réciproquement, si $N[T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0$ alors on sait que $T_{-i} < T_{-(i-1)} - \tau$ et donc $ E_i > \tau$.

Soit $t<0$ et $i>1$.
Si $T_{-(i-1)} =t$ alors on sait que i-1 feuilles sont tombées sur l'intervalle $[t,0[$ et par définition de la variable aléatoire $N([t,0[)$, on sait que celle-ci prend la valeur i-1 et que $N(]t,0[) = i-2$. Réciproquement, si $ N([t,0[) = i-1$ et $N(]t,0[) = i-2$, cela signifie qu'une feuille exactement est tombée à l'instant $t$, et que cette feuille était la i-1ème en partant de la fin, soit $T_{-i+1} = t$.

**Question 1.b.** En déduire que $\forall i\in\mathbb{N}^*$, $E_i$ suit une loi exponentielle de paramètre $\theta$.

*Indication: Pour $i>1$, on pourra passer par le calcul de $\mathbb{P}(N([T_{-(i-1)}-\tau, T_{-(i-1)}[)=0)$ et utiliser le théorème de l'espérance totale pour calculer cette probabilité (la définition de la loi de $N(A)$ n'étant valable a priori que pour des boréliens $A$ déterministes/fixés).* 

**Réponse**

Soit $i>0$. 

$$ \mathbb{P}(N([T_{-(i-1)} - \tau, T_{-(i-1)}[ )= 0 ) = \mathbb{E} ( \mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0 })
$$
Or d'après le théorème de l'espérance totale,

$$ 
 \mathbb{E} ( \mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[ )= 0 }) = \mathbb{E} ( \mathbb{E} ( \mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0 } \vert T_{-(i-1)}))
$$

Soit $t<0$. On sait que $$\mathbb{E} ( \mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0 } \vert T_{-(i-1)}=t) = \mathbb{P} (N([t-\tau,t[) = 0 ) = e^{-\theta \tau}$$ et cette dernière expression ne fait pas apparaître $t$.

Ainsi, $\mathbb{E} (\mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[ )= 0 } \vert T_{-(i-1)}) = e^{-\theta \tau}$, et donc $\mathbb{E} ( \mathbb{E} ( \mathbb{1}_{N([T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0 } \vert T_{-(i-1)})) = e^{-\theta \tau}$.

Finalement,
$$
\mathbb{P}(N([T_{-(i-1)} - \tau, T_{-(i-1)}[) = 0 ) = e^{-\theta \tau}
$$
Et d'après la question **1. a**, $\mathbb{P}(N([T_{-(i-1)} - \tau, T_{-(i-1)}[ ) = 0 ) = \mathbb{P} (E_i > \tau)$.

On en conclut que

$$
1-\mathbb{P} (E_i \leqslant \tau) = e^{-\theta \tau}
$$
Et donc que la fonction de partition $F$ de $E_i$ est :
$$
F(\tau) = 1 - e^{-\theta \tau}
$$

D'où l'on en déduit que $E_i$ suit une loi exponentielle de paramètre $\theta$.

**Question 1.c.** Soit $n\in\mathbb{N}$ où $n\ge 2$, et soient $e_1, \dots, e_{n-1} \in \R_+$. Montrer que $\mathbb{P}(E_n>\tau\vert E_1=e_1, \dots, E_{n-1}=e_{n-1} ) = \mathbb{P}(E_n>\tau)$. 

*Indication: On pourra poser  $\mathcal{H}_{n-1} = \lbrace E_1=e_1, \dots, E_{n-1}=e_{n-1}\rbrace$ et exprimer $\mathcal{H}_{n-1}$ en fonction des variables $T_{-i}$.* 

**Réponse**

En posant $\mathcal{H}_{n-1} = \lbrace E_1=e_1, \dots, E_{n-1}=e_{n-1}\rbrace$, on remarque que $\mathcal{H}_{n-1} = \lbrace T_{-1} = -e_1, T_{-2} = -(e_1 + e_2), \dots, T_{-(n-1)} = -(e_1 + \dots + e_{n-1}) \rbrace$ car l'égalité se déduit immédiatement du fait que $T_0 = 0$.

Or on peut réécrire ce dernier événement si l'on suppose que $e_1,\dots,e_{n-1}$ sont non nuls 
$$
\lbrace N(\lbrace -(e_1+\dots + e_{n-1}\rbrace)=1, N(]-(e_1+\dots+e_{n-1}),-(e_1+\dots+-e_{-(n-2)}[) =0, N(\lbrace -(e_1+\dots+e_{n-2})\rbrace) = 1, N(]-(e_1+\dots + e_{n-2}), -(e_1+\dots+e_{n-3})[)=0, \dots, N(\lbrace -e_1 \rbrace)=1, N(]-e_1,0[)=0 \rbrace
$$
Sinon, la dernière écriture se généralise en adaptant les valeurs prises pour les $N(\lbrace -e_i \rbrace)$ au nombre de variables $T$ qui valent $-e_i$ et en adaptant la forme des segments ouverts considérés.

Dans tous les cas, on peut écrire $\mathcal{H}_{n-1}$ comme une intersection d'événements faisant intervenir des variables aléatoires mutuellement indépendantes, puisque les boréliens considérés à l'intérieur des $N(\dots)$ sont deux à deux disjoints.

Puisque 
$$
\mathbb{P} (E_n > \tau \vert \mathcal{H}_{n-1})= \frac{\mathbb{P}((E_n>\tau)\cap \mathcal{H}_{n-1})}{\mathbb{P}(\mathcal{H}_{n-1})}
$$
Et que
$$
\lbrace E_n >\tau \rbrace \cap \mathcal{H}_{n-1} = \lbrace T_{-n} < -(e_1+\dots+e_{n-1})- \tau \rbrace \cap \mathcal{H}_{n-1} = \lbrace N([-(e_1+\dots+e_{n-1}) -\tau, -(e_1+\dots+e_{n-1})[)=0 \rbrace \cap \mathcal{H}_{n-1}
$$
Ce qui fait intervenir des boréliens deux à deux disjoints, on en déduit que 
$$
\mathbb{P} (E_n > \tau \vert \mathcal{H}_{n-1})= \frac{\mathbb{P}( N([-(e_1+\dots+e_{n-1}) -\tau, -(e_1+\dots+e_{n-1})[)=0 )\mathbb{P}(\mathcal{H}_{n-1})}{\mathbb{P}(\mathcal{H}_{n-1})}
$$
D'où
$$
\mathbb{P} (E_n > \tau \vert \mathcal{H}_{n-1})=\mathbb{P}( N([-(e_1+\dots+e_{n-1}) -\tau, -(e_1+\dots+e_{n-1})[)=0 )=e^{-\theta\tau}=\mathbb{P}(E_n>\tau)
$$
D'après la question précédente.

On remarque que l'égalité reste vraie avec une inégalité large :

$$
\mathbb{P} (E_n \geq \tau \vert E_1=e_1,\dots,E_{n-1}=e_{n-1}) = \mathbb{P}(E_n \geq \tau)
$$

**Question 1.d.** En déduire que la suite $(E_i)_{i\in\mathbb{N}^*} $ est une suite de variables aléatoires indépendantes, toutes de loi exponentielle de paramètre $\theta$.

**Réponse**

On vient de montrer que pour tout $n \in \N$, tous $e_1,\dots,e_{n-1} \in \R^{+}$
$$
\mathbb{P}(E_n >\tau, E_{n-1}=e_{n-1},\dots,E_1=e_1)=\mathbb{P}(E_n>\tau \vert E_{n-1}=e_{n-1},\dots,E_1=e_1)\mathbb{P}(E_{n-1}=e_{n-1},\dots,E_1=e_1)=\mathbb{P}(E_n>\tau)\mathbb{P}(E_{n-1}=e_{n-1},\dots,E_1=e_1)
$$
Or puisque la dernière égalité est vérifiée pour une inégalité large, on en déduit que pour $e_n \in \R^+$,
$$
\mathbb{P}(E_n=e_n,E_{n-1}=e_{n-1},\dots,E_1=e_1) = \mathbb{P}(E_n \geq e_n,E_{n-1}=e_{n-1},\dots,E-1=e_1) - \mathbb{P}(E_n > e_n,E_{n-1}=e_{n-1},\dots,E_1=e_1)=\mathbb{P}(E_n=e_n)\mathbb{P}(E_{n-1}=e_{n-1},\dots,E_{1}=e_1)
$$
On en déduit en raisonnant de proche en proche que
$$
\mathbb{P}(E_n=e_n,\dots,E_1=e_1)=\mathbb{P}(E_n=e_n)\dots\mathbb{P}(E_1=e_1)
$$
Ceci nous assure que pour tout $n\in \N$, pour tous $i_1,\dots,i_m \in \lbrace 1,\dots, n\rbrace$ avec $m \leq n$ et les $i_j$ deux à deux distincts, pour tous boréliens $A_{i_1},\dots,A_{i_m}$ de ${\cal B} (]-\infty, 0])$,
$$
\mathbb{P}(\bigcap_{j} (E_{i_j}\in A_{i_j})) = \prod_{j} \mathbb{P}(E_{i_j} \in A_{i_j})
$$
Car il suffit en effet d'intégrer sur les $A_{i_j}$ et d'appliquer le théorème de Fubini.
Ainsi, les variables $(E_i)_{i\in \N^*}$ sont indépendantes, et d'après la question **1. b**, elles suivent une loi exponentielle de paramètre $\theta$.

**Question 1.dbis.(Bonus)** Montrer que inversement, si $(E_i)_{i\in\mathbb{N}^*} $ est une suite de variables aléatoires indépendantes, toutes de loi exponentielle de paramètre $\theta$, alors la suite $(T_{-i})_{i\in\mathbb{N}^*}$ telle que $E_i = T_{-i +1} - T_{-i}$ définit un processus de Poisson sur $]-\infty, 0[$.

**Éléments de réponse**

D'après la formule proposée pour les $T_{-i}$, on en déduit que $T_{-n} = -\sum_{i\in \lbrace 1,\dots,n \rbrace} E_i$. Mais on sait que la somme de deux variables aléatoires indépendantes à densité a pour densité leur produit de convolution.
Ainsi, il faudrait calculer le produit de convolution des $-E_i$ pour $i\in \lbrace 1,\dots,n \rbrace$ pour montrer le résultat demandé.

**Question 1.e.**  Implémenter une fonction qui, étant données une valeur $t_{\min}<0$ et une valeur de $\theta$, permet de simuler les temps d'arrivée des feuilles tombant dans l'intervalle $[t_{\min},0[$, i.e. les variables $(T_{-i})_{i\in\mathbb{N}^*}$ telles que $T_{-i} \in [t_{\min},0[$. On veillera à ce que les temps d'arrivées soient retournés un vecteur trié dans l'ordre croissant.

In [None]:
def simTempsArrivee(t_min,theta):
    #on génère un processus exponentiel de paramètre theta qui représente les différents E_i, tant que la somme des E_i est inférieure à -t_min
    t = 0
    instant_chute_feuille = []

    while t > t_min :
        a = - np.log(np.random.uniform())/theta
        t = t - a
        if t > t_min:
            instant_chute_feuille.append(t)
    return np.array(instant_chute_feuille[::-1])

In [None]:
simTempsArrivee(-300 ,5)

## II - Caractéristiques des feuilles

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 


---

Dans la suite du projet, on pose $\mathcal{D}=[-1,1]\times [-1,1]$ et $\mathcal{D}_{ext}=[-2,2]\times[-2,2]$.


On passe maintenant à la modélisation des caractéristiques des feuilles $F$, à savoir leur position, leur couleur et leur taille.

Comme indiqué en introduction, les feuilles sont assimilées à des carrés de $\mathbb{R}^2$. En particulier, on suppose que toutes les feuilles tombent avec la même orientation: on peut donc assimiler ces feuilles/carrés à des ''boules'' (fermées) pour la norme $\Vert\cdot\Vert_1$ définie par $\Vert x\Vert_1 = \vert x_1\vert + \vert x _2\vert$, $x=(x_1,x_2)\in\mathbb{R}^2$. Ainsi chaque feuille $F$ est en somme une boule de centre $\chi(F)\in\mathbb{R}^2$ et de rayon $\rho(F)>0$ aléatoires.

La position d'une feuille $F$ sur le sol est spécifiée par le centre $\chi(F)\in\mathbb{R}^2$ du carré/de la boule correspondant(e). On suppose que les feuilles tombent uniformément dans $\mathcal{D}_{ext}$, i.e. $\chi(F)\sim \mathcal{U}(\mathcal{D}_{ext})$.

La taille d'une feuille $F$ est spécifiée par le rayon $\rho(F)>0$ de la boule correspondante. Ce rayon suit une loi qui sera précisée plus tard, mais on suppose que la taille des feuilles est bornée par $1/2$, de sorte que seules les feuilles tombant dans $\mathcal{D}_{ext}$ intersectent la zone d'étude $\mathcal{D}$. 

On représente ci-dessous une feuille $F$ pour fixer les idées.

</h1> 

In [None]:
## Figure représentant une feuille F
fig,ax=plt.subplots(figsize=(5,5))
ax.plot([-1,0,1,0,-1],[0,1,0,-1,0],color="black")
ax.plot([0,1],[0,0],color="darkblue")
ax.scatter(0,0,color="darkred")
ax.text(-0.,-0.1,r"$\chi(F)$",fontsize=15,ha='center', va='top',color="darkred")
ax.text(0.5,0.05,r"$\rho(F)$",fontsize=15,ha='center', va='bottom',color="darkblue")
ax.set_title("Représentation d'une feuille F",fontsize=15)
ax.axis('off')
plt.show()


<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

La couleur d'une feuille $F$ est quant à elle modélisée par un entier $c(F)\in\lbrace 0,...,N_c-1\rbrace$ où $N_c$ désigne le nombre de couleurs possibles. La probabilité qu'une feuille soit de couleur $k$ est notée $\mathbb{P}(c(F)=k)=p_k\in[0,1]$ et on a $\sum_{k=0}^{N_c-1}p_k=1$.

Enfin, on considère que les caractéristiques (position, taille, couleur) d'une feuille sont indépendantes de son temps d'arrivée.
Ainsi, si on note $F$ une feuille arrivant à un des temps $T_{-i}$, $i\in\mathbb{N}^*$, alors $\chi(F)$,  $c(F)$ et $\rho(F)\in ]0,1/2[$  sont des variables aléatoires indépendantes de $T_{-i}$. 
On supposera également que  $\chi(F)$ est indépendante de $c(F)$ et $\rho(F)$, et que la loi de $\rho(F)$ dépend de la couleur $c(F)$ de la feuille.

---

</h1> 


**Question 2.a.** Soit $x_0 \in\mathcal{D}$ quelconque. Montrer que la probabilité qu'une feuille $F$ de couleur $c(F)=i\in\lbrace 0,\dots,N_c-1\rbrace$ et de taille $\rho(F)=r\in]0,1/2[$ recouvre le point $x_0$ est donnée par
$$
\begin{aligned}
P(x_0\in F \;\vert\; c(F)=i,\; \rho(F)=r)
%=\frac{\vert B_1(x_0, r)\vert }{\vert \mathcal{D}\vert}
=\frac{r^2 }{8}
\end{aligned}
$$

**Réponse**

Puisque $x_0 \in \mathcal{D}$, il suffit que $\chi(F)$ appartienne au losange de centre $x_0$ et de rayon $r$ pour que $x_0 \in F$. Or on sait que $\chi(F)\sim \mathcal{U}(\mathcal{D}_{ext})$.
La proba cherchée est donc le rapport de l'aire du losange de centre $x_0$ et de rayon $r$ et de l'aire de $\mathcal{D}_{ext}$ :
$$
\mathbb{P}(x_0 \in F \vert c(F)=i, \rho(F)=r) = \frac{2r^2}{4 \times 4} = \frac{r^2}{8}
$$


**Question 2.b.** Montrer que la probabilité qu'une feuille $F$ de couleur $i$  recouvre le point $x_0 \in\mathcal{D}$ est donnée par
$$
\begin{aligned}
\mathbb{P}(c(F)=i, x_0\in F)
&=\frac{p_ir_i^2}{8}
\end{aligned}
$$
où on note $p_i = \mathbb{P}(c(F)=i) $ et $r_i^2=\mathbb{E}\big[\rho(F)^2 \,\big\vert\, c(F)=i\big]$.


**Réponse**

Par définition :
$$
\mathbb{P}(c(F)=i, x_0\in F) = \mathbb{P}(x_0\in F \;\vert\; c(F)=i)*\mathbb{P}(c(F)=i) = \mathbb{P}(x_0\in F \;\vert\; c(F)=i)*p_i
$$
Or d'après la formule du balayage conditionnel :
$$
\mathbb{P}(x_0\in F \;\vert\; c(F)=i) = \int_{0}^{1/2}\mathbb{P}(x_0\in F \;\vert\; c(F)=i,\;\rho (F)=r)d\mathbb{P}_{\rho (F) \;\vert\; c(F)=i}(r)
$$
D'où en utilisant la question 2.a. :
$$
\mathbb{P}(x_0\in F \;\vert\; c(F)=i) = \int_{0}^{1/2}\frac{r^2}{8}d\mathbb{P}_{\rho (F) \;\vert\; c(F)=i}(r)
$$
Or par définition :
$$
r_i^2 = \mathbb{E}\big[\rho (F)^2\;\big\vert\; c(F) = i\big] = \int_{0}^{1/2}{r^2}d\mathbb{P}_{\rho (F) \;\vert\; c(F)=i}(r)
$$
D'où finalement :
$$
\mathbb{P}(c(F)=i, x_0\in F) = p_i*\frac{1}{8}*r_i^2 = \frac{p_ir_i^2}{8}
$$

**Question 2.c.** En déduire que  la probabilité qu'une feuille $F$ recouvre le point $x_0 \in\mathcal{D}$ est donnée par
$$
\begin{aligned}
\mathbb{P}(x_0\in F)
&=\frac{1}{8}\sum_{j=0}^{N_c-1} p_jr_j^2
\end{aligned}
$$
et que la probabilité qu'une feuille $F$ soit de couleur $i$  sachant qu'elle recouvre le point $x_0 \in\mathcal{D}$ est donnée par
$$
\begin{aligned}
\mathbb{P}(c(F)=i \vert x_0\in F)
&=\frac{p_ir_i^2}{\sum_{j=0}^{N_c-1} p_jr_j^2}
\end{aligned}
$$

**Réponse**

D'après la formule des probabilités totales et la question 2.b. :
$$
\mathbb{P}(x_0\in F) = \sum_{j=0}^{N_c-1} \mathbb{P}(x_0\in F, c(F)=j) = \frac{1}{8}\sum_{j=0}^{N_c-1} p_jr_j^2
$$
Puis d'après la formule de Bayes :
$$
\mathbb{P}(c(F)=i \;\vert\; x_0\in F) = \frac{\mathbb{P}(x_0\in F \;\vert\; c(F)=i)}{\sum_{j=0}^{N_c-1}\mathbb{P}(x_0\in F \;\vert\; c(F)=j)}
$$
D'où après simplification par $\frac{1}{8}$ :
$$
\mathbb{P}(c(F)=i \vert x_0\in F)=\frac{p_ir_i^2}{\sum_{j=0}^{N_c-1} p_jr_j^2}
$$


<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

**Remarque:** Soit $C(x_0)\in\lbrace 0,\dots,N_c-1\rbrace$ la couleur de la feuille recouvrant le point $x_0\in\mathcal{D}$  au temps $T_0=0$. $C(x_0)$ correspond donc à la couleur de la dernière feuille recouvrant $x_0$.  On note que puisque les couleurs des feuilles sont tirées indépendamment de leurs temps d'arrivée, la distribution de la couleur de la dernière feuille recouvrant le point $x_0$ est la même que la distribution de la couleur de n'importe quelle autre feuille recouvrant $x_0$, à savoir $\mathbb{P}(c(F)= \cdot ~ \vert x_0\in F)$. On peut dès lors conclure que

$$
\begin{aligned}
\mathbb{P}(C(x_0)=i)=\mathbb{P}(c(F)=i \vert x_0\in F) = \frac{p_ir_i^2}{\sum_{j=0}^{N_c} p_jr_j^2}, \quad i\in \lbrace 0,\dots,N_c-1\rbrace.
\end{aligned}
$$

---

</h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

**Question 2.cbis.(Bonus).**  Soit $\tilde N(x_0,\tau)$ le nombre de feuilles recouvrant le point $x_0$ et étant tombées dans l'intervalle de temps $[-\tau,0[$. Montrer que $ \tilde N(x_0,\tau)$ suit une loi de Poisson de paramètre $\tilde\theta\tau$ avec 

$$\tilde\theta=\frac{\theta}{8}\sum_{j=0}^{N_c-1} p_jr_j^2$$

*Indication: On pourra introduire la variable $\tilde N(\tau)$ donnant le nombre total de feuilles tombées  dans l'intervalle de temps $[-\tau,0[$ (quelle que soit leur couleur ou leur position).*

**Réponse**

En notant $\tilde N(\tau)$ le nombre total de feuilles tombées dans l'intervalle de temps $[-\tau, 0[$, $\tilde N(\tau) = N([-\tau, 0[)$.

Puis, en appliquant la formule des probabilités totales :

$$
\mathbb{P}(\tilde N(x_0, \tau)= k)
= \sum_{n=0}^{+\infty} \mathbb{P}(\tilde N(x_0, \tau)= k \;\vert\; \tilde N(\tau)=n)\mathbb{P}(\tilde N(\tau)=n)
= \sum_{n=k}^{+\infty} \mathbb{P}(\tilde N(x_0, \tau)= k \;\vert\; \tilde N(\tau)=n)\mathbb{P}(\tilde N(\tau)=n)
$$
Or :
$$
\mathbb{P}(\tilde N(x_0, \tau)= k \;\vert\; \tilde N(\tau)=n)
= \mathbb{P}\big( \bigsqcup_{\underset{|\mathcal{F}| = k}{\mathcal{F}\subset\mathcal{F_\tau}}}\big[\big(\bigcap_{F\in\mathcal{F}}(x_0\in F)\big ) \cap \big(\bigcap_{F\notin\mathcal{F}}(x_0 \notin \mathcal{F}\big )\big)\big]\big )
$$
avec $\mathcal{F_\tau}$ l'ensemble des feuilles $F$ tombées pendant l'intervalle de temps $[-\tau, 0[$.

Par indépendance des évènements $\big((x_0\in F)\big)_{F\in\mathcal{F_\tau}}$ :
$$
\mathbb{P}(\tilde N(x_0, \tau)= k \;\vert\; \tilde N(\tau)=n)
= \sum_{\underset{|\mathcal{F}| = k}{\mathcal{F}\subset\mathcal{F_\tau}}}\big(\prod_{F\in\mathcal{F}}\mathbb{P}(x_0\in F)\big ) \big(\prod_{F\notin\mathcal{F}}\mathbb{P}(x_0 \notin \mathcal{F}\big )\big)
$$
Donc en notant $p = \mathbb{P}(x_0\in F)$ (probabilité qui ne dépend pas de la feuille choisie) :
$$
\mathbb{P}(\tilde N(x_0, \tau)= k \;\vert\; \tilde N(\tau)=n) = \sum_{\underset{|\mathcal{F}| = k}{\mathcal{F}\subset\mathcal{F_\tau}}} p^k (1-p)^{n-k} = \binom{n}{k}p^k(1-p)^{n-k}
$$
Ainsi :
$$
\mathbb{P}(\tilde N(x_0, \tau)= k)
= \sum_{n=k}^{+\infty} \binom{n}{k}p^k(1-p)^{n-k}\mathbb{P}(\tilde N(\tau)=n) = \sum_{n=k}^{+\infty} \frac{n!}{k!(n-k)!}p^k(1-p)^{n-k}e^{-\theta\tau}\frac{(\theta\tau)^n}{n!}
$$
$$
\mathbb{P}(\tilde N(x_0, \tau)= k) =  e^{-\theta\tau}\,\frac{p^k\,(\theta\tau)^k}{k!}\,\sum_{n=0}^{+\infty} \frac{\big(\theta\tau(1-p)\big)^k}{k!}
= e^{-\theta\tau}\,\frac{(p\theta\tau)^k}{k!}\,e^{\theta\tau(1-p)}
$$
D'où finalement :
$$
\mathbb{P}(\tilde N(x_0, \tau)= k) = e^{-p\theta\tau}\,\frac{(p\theta\tau)^k}{k!}
$$

Donc $\tilde\N(x_0,\tau)\sim\mathcal{P}(\tilde\theta\tau)$ avec $\tilde\theta =p\,\theta = \frac{\theta}{8}\sum_{j=0}^{N_c-1} p_jr_j^2$ (d'après la question 2.c.).

**Question 2.d.** En déduire que la probabilité qu'aucune feuille ne recouvre le point $x_0\in\mathcal{D}$ au temps $T_0=0$ est nulle (en pensant à bien justifier d'éventuels passages à la limite).


La probabilité qu'aucune feuille ne recouvre le point $x_0\in\mathcal{D}$ au temps $T_0=0$ est $\mathbb{P}\big(\bigcap_{n\in\mathbb{N}}(\tilde N(x_0, n) = 0)\big)$.

Par décroissance des $\big((\tilde N(x_0, n) = 0)\big)_{n\in\mathbb{N}}$, en appliquant la proprité de continuité monotone :
$$
\mathbb{P}\big(\bigcap_{n\in\mathbb{N}}(\tilde N(x_0, n) = 0)\big)
= \lim_{n \,\rightarrow +\infty}\mathbb{P}(\tilde N(x_0, n) = 0)
= \lim_{n \,\rightarrow +\infty}e^{-\tilde\theta n}
= 0
$$

car $\tilde\theta >0$ (en considérant que $\rho (F)$ n'est pas identiquement nulle). 

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

On considère que la taille $\rho(F)$ d'une feuille dépend de la couleur $c(F)$ de la feuille comme suit: si la couleur de la feuille est $c(F)=i\in\lbrace 0,\dots, N_c-1\rbrace$, alors $\rho(F)$ suit une loi uniforme sur $[a_i,b_i]$ pour un certain $a_i\in[0,1/2[$ et un certain $b_i\in]a_i,1/2[$.

---

</h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 


**Question 3.a.** Montrer que l'expression de la fonction de répartition de $\rho(F)$ est donnée par:
$$
\mathcal{F_\rho}(r)
 = \sum_{i=0}^{N_c-1} p_i (\frac{r-a_i}{b_i-a_i}\mathbf{1}_{[a_i,b_i]}(r)+\mathbf{1}_{]b_i,+\infty[}(r)), \quad r\ge 0.
$$

**Réponse**

Soit $r\ge 0$. D'après la formule des probabilités totales :
$$
\mathcal{F_\rho}(r)
= \mathbb{P}(\rho (F)\le 0)
= \sum_{i=0}^{N_c-1} \mathbb{P}(\rho (F)\le 0 \;\vert\; c(F) = i)\mathbb{P}(c(F)=i)
$$
Donc :
$$ 
\mathcal{F_\rho}(r)
= \sum_{i=0}^{N_c-1} p_i \,\int_{-\infty}^{r} \frac{1}{b_i-a_i}\mathbb{1}_{[a_i, \, b_i]}(s)ds
$$
Or $\forall i\in \llbracket 0, N_c-1\rrbracket$ :
$$
\int_{-\infty}^{r} \frac{1}{b_i-a_i}\mathbb{1}_{[a_i, \, b_i]}(s)ds =
\left\{
    \begin{aligned}
    0\;\; &\quad si \;r < a_i \\
    \frac{r-a_i}{b_i-a_i} &\quad si \; r \in [a_i, b_i] \\
    1\;\; &\quad si \; r > b_i 
    \end{aligned}
\right.

$$
*i.e* 
$$
\int_{-\infty}^{r} \frac{1}{b_i-a_i}\mathbb{1}_{[a_i, \, b_i]}(s)ds =\frac{r-a_i}{b_i-a_i}\mathbf{1}_{[a_i,b_i]}(r)+\mathbf{1}_{]b_i,\infty[}(r)
$$
D'où finalement :

$$
\mathcal{F_\rho}(r)
= \sum_{i=0}^{N_c-1} p_i (\frac{r-a_i}{b_i-a_i}\mathbf{1}_{[a_i,b_i]}(r)+\mathbf{1}_{]b_i,+\infty[}(r)).
$$

**Question 3.b.** Implémenter une fonction permettant d'évaluer la fonction de répartition $\mathcal{F_\rho}$ et son inverse (généralisée) $\mathcal{F_\rho}^{-1}$. Ces fonctions prendront en entrée la valeur $r$ (resp. $p$) à laquelle on souhaite évaluer $\mathcal{F_\rho}$ (resp. $\mathcal{F_\rho}^{-1}$), ainsi qu'un vecteur $a\in [0,1/2]^{N_c}$ contenant les valeurs $a_i$ et un vecteur $b\in [0,1/2]^{N_c}$ contenant les valeurs $b_i$.

*Indication: On pourra utiliser la fonction "minimize_scalar" du package "scipy.optimize" afin de calculer les valeurs de $\mathcal{F_\rho}^{-1}$ à partir de celles de $\mathcal{F_\rho}$*

In [None]:
from scipy.optimize import minimize_scalar
Nc = 3
p = np.empty(Nc)
def F_rho(r,a,b):
    somme = 0
    for i in range(Nc) :
        if r >= a[i] and r <= b[i] :
            somme += p[i]*((r-a[i])/b[i]-a[i])
        elif r > b[i] :
            somme += p[i]
    return somme

def fonction_a_minimiser(r, p, a, b) : # Fonction minimale quand F_rho(x) -> p par la droite, donc permet d'obtenir inf({x | F_rho(x) >= p}) par croissance de F_rho. 
    
    return abs(F_rho(r,a,b)-p)
    
def invF_rho(p,a,b):
    
    def f(r) :
        return fonction_a_minimiser(r, p, a, b)
    
    if p < 0 or p > 1 :
        print('Error : p is not a probability.')
        return None
    else :
        return minimize_scalar(f,bounds=(0,0.5),method='bounded').x


<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

On considère dorénavant que $N_c=3$ et on pose les valeurs suivantes pour les vecteurs $a$ et $b$, et les probabilités $p_i$.

---

</h1> 

In [None]:
#Nombre de couleurs
Nc = 3

## Probabilités p_i (stockées dans un vecteur)
p = np.array([0.5,0.4,0.1])

# Vecteur a
a = np.array([0.1,0.1,0.2])

# Vecteur b
b = np.array([0.25,0.25,0.5])

**Question 3.c.**  On appelle quantile d'ordre $\alpha\in [0,1]$ d'une variable aléatoire $X$ toute valeur $q_\alpha \in\mathbb{R}$ telle que $F_X(q_\alpha)=\alpha$. Calculer les quantiles de $\rho(F)$ pour $\alpha = k/50$ avec $k~\in~\lbrace 1,\dots,49\rbrace$.

In [None]:
# Vecteur contentant les quantiles
qth = np.array([invF_rho(k/50, a, b) for k in range(1, 50)])
print(qth)

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

Un QQ-plot est une figure permettant de comparer visuellement deux distributions de probabilité au travers de leurs quantiles. Il s'agit d'un nuage de points où on représente en abscisse les quantiles de la première distribution et en ordonnée les quantiles de la deuxième. Si ce nuage de point est aligné avec la droite $y=x$, cela signifie que les deux distributions ont des quantiles (et donc des fonctions de répartition) similaires. 

---

</h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 


**Question 3.d.**  Simuler 10000 réalisations de la variable $\rho(F)$. Calculer les quantiles de la distribution empirique associée à ces échantillons (en utilisant la fonction *quantile* du package *numpy*) pour $\alpha = k/50$ avec $k~\in~\lbrace 1,\dots,49\rbrace$ et les comparer aux quantiles théoriques (calculés à la question précédente) avec un QQ-plot.

In [None]:
## Simulation de rho(F)
rho_sim = np.array([invF_rho(np.random.uniform(), a, b) for k in range(10**4)])

# Calcul des quantiles des réalisations
alpha_k = np.array([k/50 for k in range(1, 50)])
qexp = np.quantile(rho_sim, alpha_k)

In [None]:
## QQ-plot
fig,ax=plt.subplots()
ax.axline((0, 0), (0.5, 0.5), linewidth=1, color='r')
ax.scatter(qth,qexp)
ax.set_xlabel("Quantiles theoriques")
ax.set_ylabel("Quantiles des simulations")
fig.show()

## III - Simulation du tapis de feuilles mortes

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

On s'intéresse dorénavant à la simulation de tapis de feuilles mortes. On prend en particulier les valeurs suivantes pour les variables $\mathcal{D}$,$\mathcal{D}_{ext}$ et $\theta$.

---

</h1> 

In [None]:
## Taille des fenêtres
D = [-1,1]
Dext = [-2,2]

## Paramètre du processus de Poisson
theta = 1

**Question 4.a.** Implémenter une fonction permettant de simuler la taille d'une feuille étant donnée sa couleur $i$, et les vecteurs $a,b\in\R^3$ définis à Q.3.b.

In [None]:
def simTaille(i,a,b):
    return np.random.uniform(a[i], b[i])

**Question 4.b.** Implémenter une fonction permettant de simuler la couleur d'une feuille étant donné le vecteur $p\in\R^3$ contenant les probabilités $p_i=\mathbb{P}(c(F)=i)$.

In [None]:
def simCouleur(p):
    u = np.random.uniform()
    F_p, i = p[0], 0
    while u > F_p :
        i += 1
        F_p += p[i]
    return i

**Question 4.c.** Implémenter une fonction permettant de simuler la position d'une feuille étant donné le domaine $\mathcal{D}_{ext}$.

In [None]:
def simPosition(Dext): #chi(F) suit une loi uniforme sur Dext = [D[0], D[1]]^2
    x = np.random.uniform(Dext[0], Dext[1])
    y = np.random.uniform(Dext[0], Dext[1])
    return x, y

**Question 4.d.** Implémenter une fonction permettant de simuler le temps d'arrivée et les caractéristiques des feuilles tombant dans l'intervalle $[t_{\min},0[$, étant donnée une valeur de $t_{\min}<0$. La fonction devra retourner un tableau dont les colonnes contiennent, dans l'ordre, le temps d'arrivée, la position,la taille et la couleur des feuilles. On veillera à ce que les temps d'arrivées soient ordonnés dans l'ordre croissant.

*Indication: On pourra repartir de l'implémentation de la fonction permettant de simuler les temps d'arrivées et utiliser les fonctions implémentées aux Q.4.a-c.*

In [None]:
def simFeuilles(t_min,theta,p,a,b,Dext):
    temps_arrivee = simTempsArrivee(t_min,theta)
    
    Sim = []

    for i in range(len(temps_arrivee)):
        x,y = simPosition(Dext)
        couleur = simCouleur(p)
        taille = simTaille(couleur,a,b)
        Sim.append( [temps_arrivee[i],x,y,taille,couleur])
    return np.array(Sim)
    


<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

D'après le modèle des feuilles mortes, des feuilles sont censées tomber depuis le temps $t=-\infty$, ce qui supposerait d'appeler la fonction définie à la question précédente avec $t_{\min}=-\infty$. Ceci est bien sûr impossible en pratique. 

On s'intéresse maintenant à comment obtenir une simulation du modèle en temps (de calcul) fini.

---

</h1> 

**Question 5.** Générer des simulations pour $t_{\min}=-100$ et $t_{\min}=-500$. Le domaine $\mathcal{D}$ est-il entièrement recouvert? Quelle contradiction obtenons-nous avec les résultats obtenus en Q.2? Existe-t-il une valeur finie de $t_{\min}$ qui permettrait, presque-sûrement, de lever cette contradiction?

In [None]:
# Test: Simulation de tapis de feuilles

## t_min = -100
Sim_m100 = simFeuilles(t_min= -100, theta=theta,p=p,a=a,b=b,Dext=Dext)
## Plot
plotSim(Sim_m100)

## t_min = -500
Sim_m500 = simFeuilles(t_min= -500, theta=theta,p=p,a=a,b=b,Dext=Dext)
## Plot
plotSim(Sim_m500)

In [None]:
Sim_m100

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

Pour lever la contradiction observée à la question précédente, on aurait besoin de déterminer a priori la valeur de $t_{\min}$ à partir de laquelle le sol est entièrement recouvert de feuilles. Cette valeur est aléatoire, car elle dépend des caractéristiques des feuilles qui tombent dans l'intervalle $[t_{\min},0[$. Afin de pouvoir tout de même accéder à une telle valeur, on se propose de considérer le modèle suivant.

Cette fois, on commence à $t=U_0=0$ avec un sol vide, et on fait tomber des feuilles selon un processus de Poisson $(U_i)_{i\in\mathbb{N}^*}$ sur $]0,\infty[$. Les caractéristiques des feuilles $F_i$ tombées à chaque instant $U_i$ sont déterminées de la même facon que pour le modèle des feuilles mortes. Soit $M = \inf\lbrace i \in\mathbb{N}^* : \mathcal{D}\subset\cup_{1\le k\le i} F_i  \rbrace$, c'est-à-dire l'indice (aléatoire) $M$ à partir duquel le sol est recouvert de feuilles.

---

</h1> 

**Question 6.a.** Soit $E \sim \mathcal{E}(\theta)$ indépendante des $U_i$. Pour $i\in\lbrace 1,...,M\rbrace$, on pose 
$$ T_{-i} = U_{M+1-i} - (U_M+E)$$
Montrer que les feuilles $(F_i)_{1\le i\le M}$ correspondent aux $M$ dernières feuilles d'un modèle des feuilles mortes ayant pour temps d'arrivée $(T_{-i})_{1\le i\le M}$ (i.e. $F_M$ arrive au temps $T_{-1}$, $F_{M-1}$ arrive au temps $T_{-2}$,...).

*Indication: On pourra utiliser la caractérisation des temps d'arrivée d'un modèles des feuilles mortes donnée en Q.1.dbis.*

**Réponse**

Il s'agit de montrer que les variables $(T_{-i})_{i\in \lbrace 1,\dots,M \rbrace}$ suivent la même loi que leurs homologues de la partie 1.

Pour cela, il suffit de montrer d'après la question **1. dbis** que les variables $E_i = T_{-i + 1} - T_{-i}$ sont indépendantes et de loi $\mathcal{E} (\theta)$ pour prouver le résultat demandé. 

Or pour $i \in \lbrace 2, \dots, M \rbrace$, un tel $E_i$ est donné par :
$$
E_i = U_{M+1 - i +1} - U_{M+1 - i}
$$
Et pour $i=1$,
$$
E_1 = 0 - T_{-1} = E
$$
Qui est aussi de loi exponentielle de paramètre $\theta$ et indépendante des $E_i$ pour $i \geq 2$ puisqu'indépendate des $U_i$ pour tout $i$.

Puisque les $(U_i)_{ 1 \le i \le M }$ définissent eux-mêmes un processus de Poisson de paramètre $\theta$ (a priori), le résultat est acquis d'après la question **1. d** car on sait alors que les $E_i$ sont bien indépendantes et de loi $\mathcal{E} (\theta)$.

**Question 6.b.** En déduire une fonction permettant de simuler ces feuilles.

*Indication: Pour vérifier que les points du sol sont recouverts, on se contentera de vérifier que les points d'un maillage fin du sol, appelé Ddiscr dans le code ci-dessous, sont recouverts par une feuille.*

In [None]:
## Maillage du sol
Ddiscr=np.stack(np.meshgrid(np.arange(D[0],D[1]+0.01,0.01),np.arange(D[0],D[1]+0.01,0.01)),axis=-1).reshape(-1,2)
Ddiscr[1:10,:]

In [None]:
def point_dans_feuille(point, feuille):
    x0, y0 = point[:,0], point[:,1]
    norme = np.abs(x0 - feuille[1]) + np.abs(y0 - feuille[2])
    return norme <= feuille[3]


In [None]:
def simFeuillesStop(theta,p,a,b,Dext):

   feuilles = [] 
   temps = [0]
   points_restants = np.full(Ddiscr.shape[0],True,dtype=bool)

   while np.any(points_restants == np.full(Ddiscr.shape[0], True, dtype=bool)):
      
      delta_t = - np.log(np.random.uniform())/theta
      temps.append( temps[-1] + delta_t )
      
      x,y = simPosition(Dext)
      couleur = simCouleur(p)
      taille = simTaille(couleur,a,b)
      feuilles.append([temps[-1],x,y,taille,couleur])
      
      
      points_restants[points_restants] = ~point_dans_feuille(Ddiscr[points_restants],feuilles[-1]) #on actualise les points restants qui n'ont pas déjà été traités

   return np.array(feuilles)

         
      

In [None]:
## Simulation du tapis de feuilles
Sim = simFeuillesStop(theta,p,a,b,Dext)

In [None]:
Sim

In [None]:
plotSim(np.array(Sim))

**Question 6.c.**  Quelle est la distribution de la taille de la dernière feuille tombée sur le sol? La comparer, avec un QQ-plot, à la taille de la dernière feuille sur un échantillon de 1000 tapis de feuilles simulés avec la fonction créée à la question précédente. Que peut-on en conclure sur la méthode de simulation proposée?

In [None]:
## Simulation des tapis et extraction de la taille de la dernière feuille
def taille_derniere_feuille_stop() -> 'list[float]':
    L = []
    for i in range(1000):
        Sim = simFeuillesStop(theta,p,a,b,Dext)
        L.append(Sim[-1][3])
    return L

In [None]:
taille_derniere_feuille_stop()

In [None]:
## Quantiles théoriques 
qth = np.array([invF_rho(k/50, a, b) for k in range(1, 50)])

## Quantiles des simulations
qexp = [np.quantile(taille_derniere_feuille_stop(),k/50) for k in range(1,50)]

In [None]:
## QQ-Plot
fig,ax=plt.subplots()
ax.axline((0, 0), slope=1, linewidth=1, color='r')
ax.scatter(qth,qexp)
ax.set_xlabel("Quantiles theoriques")
ax.set_ylabel("Quantiles des simulations")
plt.show()

<h1 style="font-family: Georgia, serif;font-size: 1em;margin-left: 3em;margin-right: 4em;"> 

---

Face à cette nouvelle déconvenue, on adopte un point de vue différent sur le tapis de feuilles mortes. Jusqu'à maintenant, on observait les feuilles tomber et s'empiler (pendant un temps infini), sur le sol. Ainsi, à $t=T_0=0$, on observe, en vue de dessus notre tapis de feuilles mortes. 

Supposons désormais qu'il nous est possible d'observer le sol par en-dessous (par exemple, parce que le sol est en fait une verrière plane en dessous de laquelle on se trouve). Comme pour la question précédente,  on commence à $t=U_0=0$ avec un sol vide, et on fait tomber des feuilles selon un processus de Poisson $(U_i)_{i\in\mathbb{N}^*}$ sur $]0,\infty[$. Les caractéristiques des feuilles $F_i$ tombées à chaque instant $U_i$ sont déterminées de la même façon que pour le modèle des feuilles mortes et $M$ désigne une nouvelle fois l'indice (aléatoire) $M$ à partir duquel le sol est recouvert de feuilles.

Puisqu'on observe maintenant le sol par en-dessous, après l'instant $U_{M}$, le tapis ne change plus car le sol est recouvert de feuilles et donc les nouvelles feuilles qui tombent sont cachées par celle qui sont déjà présentes. Ainsi, contrairement à la construction précédente, le tapis est fixé à partir d'un certain temps. 

---

</h1> 


**Question 7.a.**  Pour $i\in\lbrace 1,...,M\rbrace$, on pose 
$$ T_{-i} = -U_{i}$$
Montrer qu'en associant la feuille $F_i$ au temps $T_{-i}$, les feuilles $(F_i)_{1\le i\le M}$ correspondent aux $M$ dernières feuilles d'un modèle des feuilles mortes.

**Réponse**

De même qu'en 6.a., il s'agit de montrer que les variables $(T_{-i})_{i\in \lbrace 1,\dots,M \rbrace}$ suivent la même loi que leurs homologues de la partie 1.

1. Pour tout $ A \in {\cal B} (]-\infty, 0])$ borné et fixé, on note $N (A)=\text{Card}\lbrace i\in \llbracket 1,M\rrbracket\,\vert\, T_{-i} \in A\rbrace$ et $-A = \lbrace-x \,\vert\, x\in A\rbrace \in {\cal B}([0, +\infty[)$, qui est également borné et fixé.

Pour tout $B\in {\cal B}([0, +\infty[)$ borné et fixé, on note $\tilde N (B)=\text{Card}\lbrace i\in \llbracket 1,M\rrbracket\,\vert\, U_{i} \in B\rbrace$, qui suit une loi de Poisson de paramètre $\theta \, | B |$, où $\theta \in \mathbb{R}^+$ et $|B|$ est la mesure de Lebesgue de $B$ ; par définittion des $(U_{i})_{i\in \llbracket 1,M\rrbracket}$. On a donc, pour tous $A \in {\cal B} (]-\infty, 0]), n \in \mathbb{N}$:
      $$ \mathbb{P} ( N (A) = n) = \mathbb{P} (\tilde N(-A)\exp \bigl( - \theta | A | \bigr) \frac{
        \bigl( \theta | A | \bigr)^n }{n!},~n \in \N $$

2. Pour tout $p\ge 2$, si $A_1,...,A_p \in {\cal B} (]-\infty, 0]) $ sont 
      disjoints deux à deux, alors $ N(A_1),...,N(A_p)$ sont 
      mutuellement indépendants.

Pour cela, il suffit de montrer d'après la question **1. dbis** que les variables $E_i = T_{-i + 1} - T_{-i}$ sont indépendantes et de loi $\mathcal{E} (\theta)$ pour prouver le résultat demandé. 

Or pour $i \in \lbrace 2, \dots, M \rbrace$, un tel $E_i$ est donné par :
$$
E_i = U_{i} - U_{i-1}
$$
Et pour $i=1$,
$$
E_1 = 0 - T_{-1} = U_{1}
$$
Qui est aussi de loi exponentielle de paramètre $\theta$ et indépendante des $E_i$ pour $i \geq 2$ puisqu'indépendate des $U_i$ pour tout $i$.

Puisque les $(U_i)_{ 1 \le i \le M }$ définissent eux-mêmes un processus de Poisson de paramètre $\theta$ (a priori), le résultat est acquis d'après la question **1. d** car on sait alors que les $E_i$ sont bien indépendantes et de loi $\mathcal{E} (\theta)$.

**Question 7.b.** En déduire une fonction permettant de simuler ces feuilles. 

In [None]:
def simFeuillesDessous(theta,p,a,b,Dext) : #Il suffit de simuler une chute de feuilles jusqu'à ce que le sol soit recouvert de feuilles, puis d'inverser l'ordre d'arrivée
    feuilles = simFeuillesStop(theta, p, a, b, Dext)
    n = feuilles.shape[0]
    T_max = feuilles[n][0]
    for i in range(n) :
        feuilles[i][0] = T_max - feuilles[i][0]
    return feuilles


In [None]:
## Simulation du tapis de feuilles
Sim = simFeuillesDessous(theta,p,a,b,Dext)

## Plot
plotSim(Sim)

**Question 7.c.**  Comparer la distribution, avec un QQ-plot, de la taille de la dernière feuille tombée sur le sol à la taille de la dernière feuille sur un échantillon de 1000 tapis de feuilles simulés avec la fonction créée à la question précédente. Que peut-on en conclure sur la méthode de simulation proposée?

In [None]:
## Simulation des tapis et extraction de la taille de la dernière feuille
def taille_derniere_feuille_dessous() -> 'list[float]':
    L = []
    for i in range(1000):
        Sim = simFeuillesDessous(theta,p,a,b,Dext)
        L.append(Sim[-1][3])
    return L

In [None]:
taille_derniere_feuille_dessous()

In [None]:
## Quantiles théoriques 
qth = np.array([invF_rho(k/50, a, b) for k in range(1, 50)])

## Quantiles des simulations
qexp = [np.quantile(taille_derniere_feuille_dessous(),k/50) for k in range(1,50)]

In [None]:
## QQ-Plot
fig,ax=plt.subplots()
ax.axline((0, 0), slope=1, linewidth=1, color='r')
ax.scatter(qth,qexp)
ax.set_xlabel("Quantiles theoriques")
ax.set_ylabel("Quantiles des simulations")
plt.show()

**Question 7.cbis.(Bonus)** Montrer qu'avec ce modèle, on retrouve que la probabilité que la couleur du tapis au point $x_0\in\mathcal{D}$  soit $i$ est également donnée par
$$P(C(x_0)=i)=\frac{p_i r_i^2}{\sum_{j=1}^{N_c} p_jr_j^2}$$

**Question 7.d.** Implémenter une fonction permettant, étant donné un ensemble de points $x_0\in\mathcal{D}$, de recalculer numériquement les probabilités $\mathbb{P}(C(x_0)=i)$ pour $i\in\lbrace 1, \dots, N_c\rbrace$ à partir de simulations de tapis (réalisées avec la fonction simFeuillesDessous). Appliquer cette fonction à l'ensemble de points $X_0$ défini dans le code et interpréter les résultats.

In [None]:
##  Fonction de calcul des probabilités 
### X0 : Tableau contenant les coordonnées (sur chaque ligne) des points sur lequels on souhaite calculer les probabilités
### nsim : Nombre de simulations
def calcProb(X0,nsim):
    
    ## COMPLETER ###

In [None]:
## Points sur lesquels évaluer les probabilités
X0=np.stack(np.meshgrid(np.arange(D[0],D[1]+0.2,0.2),np.arange(D[0],D[1]+0.2,0.2)),axis=-1).reshape(-1,2)

## Calcul et représentation
pvec=calcProb(X0,1000)
fig, ax = plt.subplots(3,1,figsize=(5,15))
Ngd=int(X0.shape[0]**0.5)
for i in range(Nc):
    im=ax[i].pcolormesh(X0[:,0].reshape((Ngd,Ngd)),X0[:,1].reshape((Ngd,Ngd)),pvec[:,i].reshape((Ngd,Ngd)))
    ax[i].set_title("Carte de probabilité pour la couleur i="+str(i))
    fig.colorbar(im)
plt.show()     

**Question 7.dbis.(Bonus)** Proposer un code permettant de simuler un tapis de feuille étant donnée qu'on fixe la couleur $i_0$ de la feuille au point $(0,0)$. Calculer numériquement les probabilités afin de valider les résultats de simulation.

In [None]:
## Simulation conditionnelle
def simFeuillesDessousCond(i0,theta,p,a,b,Dext):   
    ## COMPLETER ###    
