# Quantification des incertitudes

## Résumé

Dans cette page, nous utilisons le cas de sollicitation d'une poutre en flexion dans le but d'identifier la loi qui s'ajuste à un échantillon unidimensionnel donné.

# Introduction

On considère une poutre dont le module d'Young est noté $E$ (Pa).

<img src="poutre.png" width="200">

**Figure 1.** Déviation verticale $Y$ de la poutre de longueur $L$. 

La distribution de référence pour la variable $E$ est :

$$
Beta\left(\alpha = 0.9, \, \beta = 2.6, \, a = 2.8\times 10^7, \, b = 4.8\times 10^7\right)
$$

On suppose que cette distribution est inconnue. On dispose d'un échantillon de 229 mesures de $E$ dans le fichier `sample_E.csv`. L'objectif de cet exercice est d'identifier la loi qui s'ajuste le mieux à cet échantillon. 

In [1]:
import openturns as ot

In [2]:
data = ot.Sample.ImportFromCSVFile("sample_E.csv")
data.setDescription(["Young Modulus"])  # Optionnel
n = data.getSize()
print("Sample size=%d" % (n))

Sample size=229


In [3]:
data[0:10]

0,1
,Young Modulus
0.0,2.995319e+07
1.0,2.868042e+07
2.0,3.064115e+07
3.0,3.205095e+07
4.0,3.778573e+07
5.0,3.797256e+07
6.0,3.706933e+07
7.0,3.017982e+07
8.0,3.72172e+07


## Question 1 : statistiques descriptives

**Questions.**
- Calculer les principales caractéristiques de l'échantillon : moyenne, écart-type, médiane, minimum, maximum, intervalle inter-quartiles (i.e. à 25% et 75%).

## Question 2 : histogramme empirique

**Questions.**
- Utiliser la classe `HistogramFactory` pour dessiner l'histogramme empirique de l'échantillon.

## Question 3 : ajuster une loi beta

**Questions.**
* Utiliser la classe `BetaFactory` pour estimer les paramètres de la loi Beta s'ajustant au données. 
* Dessiner la PDF de cette loi ajustée.
* Afficher les paramètres estimés.

## Question 4 : réaliser le test de Kolmogorov-Smirnov

**Questions.**
- Utiliser la classe `FittingTest.Lilliefors` pour réaliser le test de Lilliefors, c'est-à-dire le test Kolmogorov-Smirnov associée à une distribution dont les paramètres sont estimés en fonction de l'échantillon. 
- Calculer la p-valeur.
- Doit-on rejeter la loi beta ou non ?

## Question 5 : QQ-plot

**Questions.**
- Utiliser la classe `VisualTest.DrawQQplot` pour dessiner le qq-plot. 
- L'ajustement est-il satisfaisant ?

## Question 6 : sélection de modèle par le critère BIC

On souhaite déterminer quelle loi s'ajuste le mieux au sens du critère BIC (c'est-à-dire menant à la plus petite valeur du critère BIC). 

**Questions.**
- Comparer les lois suivantes du point de vue du critère : uniforme, gaussienne, beta, log-normale. Quelle est la loi qui est la meilleure du point de vue du critère BIC ?
- La méthode `FittingTest.BestModelBIC` permet de renvoyer la distribution réalisant le meilleur critère BIC dans une liste de distributions candidates. Pour créer cette liste, on peut utiliser la méthode `GetContinuousUniVariateFactories`. Quelle distribution ressort de cette méthode ? Est-elle satisfaisante du point de vue du QQ-Plot ?

Notice that the `ot.FittingTest.BIC` has a different behaviour if the input argument is a `Factory` or a `Distribution`. 
- If a `Factory` is provided, then the number of estimated parameters is set to the number of parameters of the distribution. 
- If a `Distribution` is provided, then the number of estimated parameters must be set by the user. Otherwise, the default is to set the number of estimated parameters to the number of parameters of the distribution. 

Reference
- https://github.com/openturns/openturns/issues/2198

## Question 7 : histogramme

**Questions.**
- Utiliser la classe `HistogramFactory` pour créer la distribution de type histogramme qui s'ajuste aux données. 
- Utiliser le QQ-plot pour valider graphiquement cette distribution. 
- Quelle est la limite de cette technique ?
- L'histogramme est-il une distribution satisfaisante de ce cas particulier ? Dans quel type d'études cette méthode pourrait convenir ?

## Question 8 : méthode de lissage à noyau

**Questions.**

- Utiliser la classe `KernelSmoothing` pour utiliser une méthode à noyau pour estimer la distribution. 
- Utiliser le QQ-Plot pour valider le résultat graphiquement.
- Utiliser la méthode `setBoundaryCorrection()` pour activer la correction au bord. Qu'observez-vous ?

## Question 9 : synthèse

On souhaite comparer les trois distributions suivantes :
- la distribution Beta,
- la distribution issue de l'estimation par lissage à noyau,
- l'histogramme empirique.

**Questions.**

Comparer ces distributions du point de vue de la PDF : 
- quelles différences observez-vous ?
- quelle semble être la loi la plus appropriée ?