# Quantification des incertitudes

## Résumé

Dans cette page, nous utilisons le cas de sollicitation d'une poutre en flexion dans le but d'identifier la loi qui s'ajuste à un échantillon unidimensionnel.

# Introduction

On considère une poutre dont le module d'Young est noté $E$ (Pa).

<img src="poutre.png" width="200">

La distribution de référence pour la variable $E$ est :

$$
Beta\left(\alpha = 0.9, \, \beta = 2.6, \, a = 25\times 10^6, \, b = 50\times 10^6\right)
$$

On suppose que cette distribution est inconnue. 

On dispose d'un échantillon de 229 mesures de $E$ dans le fichier `sample_E.csv`. L'objectif de cet exercice est d'identifier la loi qui s'ajuste le mieux à cet échantillon. 

In [1]:
import numpy as np
import openturns as ot

In [2]:
data = ot.Sample.ImportFromCSVFile("sample_E.csv")
data.setDescription(["Young Modulus"])  # Optionnel
n = data.getSize()
print("Sample size=%d" % (n))

Sample size=229


In [3]:
data[0:10]

0,1
,Young Modulus
0.0,29953190.3164
1.0,28680424.0701
2.0,30641152.1182
3.0,32050954.2039
4.0,37785731.7381
5.0,37972564.9492
6.0,37069328.655
7.0,30179823.8992
8.0,37217196.053


## Question 1 : statistiques descriptives

- Calculer les principales caractéristiques de l'échantillon: moyenne, écart-type, médiane, minimum, maximum, intervalle inter-quartiles (i.e. à 25% et 75%)

## Question 2 : histogramme empirique

- Utiliser la classe `HistogramFactory` pour dessiner l'histogramme empirique de l'échantillon.

## Question 3 : ajuster une loi beta

* Utiliser la classe `BetaFactory` pour estimer les paramètres de la loi Beta s'ajustant au données. 
* Desiner la PDF de cette loi ajustée.
* Afficher les paramètres estimés.

## Question 4 : réaliser le test de Kolmogorov-Smirnov

- Utiliser la classe `FittingTest.Kolmogorov` pour réaliser le test de Kolmogorov-Smirnov. 
- Calculer la p-valeur.
- Doit-on rejeter la loi beta ou non ?

## Question 5 : QQ-plot

- Utiliser la classe `VisualTest_DrawQQplot` pour dessiner le qq-plot. 
- L'ajustement est-il satisfaisant ?

## Question 6 : sélection de modèle par le critère BIC

On souhaite déterminer quelle loi s'ajuste le mieux au sens du critère BIC. 

- Comparer les lois suivantes du point de vue du critère : uniforme, gaussienne, beta, log-normale. Quelle est la loi qui est la meilleure du point de vue du critère BIC ?
- La méthode `FittingTest_BestModelBIC` permet de renvoyer la distribution réalisant le meilleur critère BIC dans une liste de distributions candidates. Pour créer cette liste, on peut utiliser la méthode `GetContinuousUniVariateFactories`. Quelle distribution ressort de cette méthode ? Est-elle satisfaisante du point de vue du QQ-Plot ?

## Question 7 : histogramme

- Utiliser la classe `HistogramFactory` pour créer la distribution de type histogramme qui s'ajuste aux données. 
- Utiliser le QQ-plot pour valider graphiquement cette distribution. 
- Quelle est la limite de cette technique ?
- L'histogramme est-il une distribution satisfaisante de ce cas particulier ? Dans quel type d'études cette méthode pourrait convenir ?

## Question 8 : méthode à noyau

- Utiliser la classe `KernelSmoothing` pour utiliser une méthode à noyau pour estimer la distribution. 
- Utiliser le QQ-Plot pour valider le résultat graphiquement.

## Question 9 : synthèse

On souhaite comparer les trois distributions suivantes :
- la distribution Beta 
- la distribution issue de l'estimation à noyau 
- l'histogramme empirique

Comparer ces distributions du point de vue de la PDF : 
- quelles différences observez-vous ?
- quelle semble être la loi la plus appropriée ?