# <p style="text-align:center";>Projet NUMQI</p>
## <p style="text-align:center";>Rupture du barrage de Teton par effet renard</p>
### <p style="text-align:center";>Auteurs : Chambrin Vincent / Rouillon Fabien</p>

## 2.1 Modélisation probabiliste


In [None]:
import openturns as ot

#### Question 1

In [None]:
L = ot.Uniform(95, 105)
delta_Hw = ot.Uniform(28, 32)
gamma_g = ot.Uniform(2500, 2600)
parameters = ot.LogNormalMuSigma(1*10**-3, 1*10**-4)
k_er = ot.ParametrizedDistribution(parameters)
tau_c = ot.TruncatedNormal(20, 5, 12, 28)
Rd = ot.Uniform(0.25, 0.50)
Rmax = ot.Uniform(55, 65)

g = 9.81
gamma_w = 1000

In [None]:
ot.Show(L.drawPDF())

In [None]:
ot.Show(delta_Hw.drawPDF())

In [None]:
ot.Show(gamma_g.drawPDF())

In [None]:
ot.Show(k_er.drawPDF())

In [None]:
ot.Show(tau_c.drawPDF())

In [None]:
ot.Show(Rd.drawPDF())

In [None]:
ot.Show(Rmax.drawPDF())

#### Question 2

In [None]:
Z = 2 * L / (gamma_w * delta_Hw)

In [None]:
Z_mean = Z.getMean()[0]
Z_sd = Z.getStandardDeviation()[0]
graph = Z.drawPDF(Z_mean - 3*Z_sd, Z_mean + 3*Z_sd, 100)
graph.setTitle('Z PDF')
# the following line causes a crash
# graph.setLegends([]) 
# this one works
graph.setLegendPosition('')
ot.Show(graph)

#### Question 3

In [None]:
# D'après l'énoncé, les variables aléatoires définies à la question 1) 
# sont supposées indépendantes, le vecteur X que l'on doit définir est 
# donc composés de v.a. indépandantes.
# On peut donc laisser le constructeur de ComposedDistribution utiliser 
# une IndependentCopula comme dernier paramètre.
marginals = [Z, gamma_g, k_er, tau_c, Rd, Rmax]
X = ot.ComposedDistribution(marginals)

#### Question 4

In [None]:
X_loi = X
X = ot.RandomVector(X_loi)

#### Question 5

In [None]:
print("mean(X) : ", X.getMean())
covs = X.getCovariance()
dim = covs.getDimension()
import math
print("sd(X) : ",  [math.sqrt(covs[(i,i)]) for i in range(dim)])

| Variable      | Moyenne | Ecart-type  |
|---------------|---------|-------------|
| $Z$           | 6.68e-3 | 3.22e-4     |
| $\gamma_g$    | 2550    | 28.868      |
| $k_{er}$      | 0.001   | 1e-4        |
| $\tau_c$      | 20      | 3.88        |
| $R_d$         | 0.375   | 0.0722      |
| $R_{max}$     | 60      | 2.89        |

## 2.2 Création de la variable d'intérêt


#### Question 1

In [None]:
# Z = 2 * L / (gamma_w * delta_Hw)
# Rmin = 2 * L * tau_c / (gamma_w * delta_Hw)
#      = Z * tau_c
# t_er = 2 * gamma_g * L / (g * gamma_w * k_er * delta_Hw)
#      = Z * gamma_g / (g * k_er)
# delta_tu = t_er log( (Rmax - Rmin) / (Rd - Rmin) )
f = ot.SymbolicFunction(['Z', 'gamma_g', 'k_er', 'tau_c', 'Rd', 'Rmax'],
                        ['Z * gamma_g / (9.81 * k_er) * log( (Rmax - Z * tau_c) / (Rd - Z * tau_c) )'])

#### Question 2

In [None]:
Y = ot.RandomVector(f, X)

#### Question 3

In [None]:
n = 10000
samples = Y.getSample(n)
mean = samples.computeMean()
sd = samples.computeStandardDeviation()
print('Mean of {} realizations of Y :'.format(n), mean)
mean = mean[0]
print('--> {}h{}m{}s'.format(int(mean/3600), int((int(mean)%3600)/60), int(mean)%60))
print('Standard deviation of {} realizations of Y :'.format(n), sd)
sd = sd[(0,0)]
print('--> {}h{}m{}s'.format(int(sd/3600), int((int(sd)%3600)/60), int(sd)%60))

Bien que l'écart-type soit raisonnable, il ne serait pas prudent de raisonner en terme de moyenne car, dans ce genre de situation, quelques minutes peuvent faire la différence.

In [None]:
kernel = ot.KernelSmoothing()
fittedDist = kernel.build(samples)
graph = fittedDist.drawPDF()
ot.Show(graph)

## 2.3 Calcul de probabilité d’événements rares

In [None]:
E1 = ot.Event(Y, ot.Less(), 90 * 60) # E1 : le barrage s'effondre avant 1h30 (durée nécessaire à l'évacuation)
E2 = ot.Event(Y, ot.Greater(), 180 * 60) # E2 : le barrage peut être stabilisé

#### Question 1

On utilise les méthodes [getCallsNumber()](http://openturns.github.io/openturns/master/user_manual/_generated/openturns.SymbolicFunction.html#openturns.SymbolicFunction.getCallsNumber), 
[getGradientCallsNumber()](http://openturns.github.io/openturns/master/user_manual/_generated/openturns.SymbolicFunction.html#openturns.SymbolicFunction.getGradientCallsNumber), 
[getHessianCallsNumber()](http://openturns.github.io/openturns/master/user_manual/_generated/openturns.SymbolicFunction.html#openturns.SymbolicFunction.getHessianCallsNumber), de la classe [SymbolicFunction](http://openturns.github.io/openturns/master/user_manual/_generated/openturns.SymbolicFunction.html) pour obtenir le nombre d'appels effectués. Comme la classe ne semble pas fournir un mécanisme permettant de remettre à zéro les compteurs, et que reconstruire à chaque fois les objets n'est pas très pratique, on calcul le nombre d'appels avant le lancement de l'algorithme et après pour savoir combien d'appels ont été fait.

In [None]:
print("FORM")

solver = ot.SQP()
form = ot.FORM(solver, E1, X.getMean())
c1, c2, c3 =  f.getCallsNumber(), f.getGradientCallsNumber(), f.getHessianCallsNumber()
form.run()
result = form.getResult()
print("Probability of E1 :", result.getEventProbability())
print('Number of calls to f:', f.getCallsNumber() - c1)
print('Number of calls to f.gradient:', f.getGradientCallsNumber() - c2)
print('Number of calls to f.hessian:', f.getHessianCallsNumber() - c3)

In [None]:
print("FORM")
solver = ot.SQP()
form = ot.FORM(solver, E2, X.getMean())
c1, c2, c3 =  f.getCallsNumber(), f.getGradientCallsNumber(), f.getHessianCallsNumber()
form.run()
result = form.getResult()
print("Probability of E2 :", result.getEventProbability())
print('Number of calls to f:', f.getCallsNumber() - c1)
print('Number of calls to f.gradient:', f.getGradientCallsNumber() - c2)
print('Number of calls to f.hessian:', f.getHessianCallsNumber() - c3)

In [None]:

print("SORM")

solver = ot.SQP()
sorm = ot.SORM(solver, E1, X.getMean())
c1, c2, c3 =  f.getCallsNumber(), f.getGradientCallsNumber(), f.getHessianCallsNumber()
sorm.run()
result = sorm.getResult()
print("Probability of E1 :", result.getEventProbabilityBreitung())
print('Number of calls to f:', f.getCallsNumber() - c1)
print('Number of calls to f.gradient:', f.getGradientCallsNumber() - c2)
print('Number of calls to f.hessian:', f.getHessianCallsNumber() - c3)

In [None]:
print("SORM")
solver = ot.SQP()
sorm = ot.SORM(solver, E2, X.getMean())
c1, c2, c3 =  f.getCallsNumber(), f.getGradientCallsNumber(), f.getHessianCallsNumber()
sorm.run()
result = sorm.getResult()
print("Probability of E2 :", result.getEventProbabilityBreitung())
print('Number of calls to f:', f.getCallsNumber() - c1)
print('Number of calls to f.gradient:', f.getGradientCallsNumber() - c2)
print('Number of calls to f.hessian:', f.getHessianCallsNumber() - c3)

La méthode FORM semble être un peu moins gourmande en appels de fonction. La probabilité de $E_2$ semble être la plus facile à évaluer car les deux méthodes sont à peu près d'accord pour dire qu'elle vaut environ 0.20. Pour $E_1$ c'est plus compliqué, on a vraiment là un évènement rare et une probabilité qui serait de l'ordre de $10^{-7}$ ou $10^{-6}$.

On peut s'interroger sur la dénomination "évènement rare" dans le cas de $E_2$ car la probabilité est relativement élevée. 

#### Question 2

> La probabilité de $E_1$ est de l'ordre de $10^{-6}$, pour avoir un écart-type de l'ordre
de $0.1 \times 10^{-6}$, il faut faire environ $1 / (0.1^2 \times 10^{-6})$ évalutations.

In [None]:
1/(0.1**2 * 10**-6)

> La probabilité de $E_2$ est de l'ordre de 0.2, pour avoir un écart-type de l'ordre 
 de $0.1 \times 0.2$, il faut faire environ $1 / (0.1^2 \times 0.2)$ évaluations.


In [None]:
1/(0.1**2 * 0.2)

#### Question 3

On s'inspire du script `monteCarlo.py` disponible sur le serveur pédagogique.

In [None]:
monte_carlo = ot.MonteCarloExperiment()
verbose = True
simu = ot.ProbabilitySimulationAlgorithm(E1, monte_carlo, verbose)
simu.setBlockSize(2) ## number of cpu
simu.setMaximumOuterSampling(1000)
simu.setMaximumCoefficientOfVariation(0.1)
simu.run()
print('Probability estimate of E1 = %.8f' % simu.getResult().getProbabilityEstimate())
print('Coefficient of variation : ', simu.getResult().getCoefficientOfVariation())

[Note: la dernière fois que j'ai lancé l'algo j'ai obtenue une proba de 0, il y a peut être un problème de paramétrage des algo...]

In [None]:
monte_carlo = ot.MonteCarloExperiment()
verbose = True
simu = ot.ProbabilitySimulationAlgorithm(E2, monte_carlo, verbose)
simu.setBlockSize(2) ## number of cpu
simu.setMaximumOuterSampling(1000)
simu.setMaximumCoefficientOfVariation(0.1)
simu.run()
print('Probability estimate of E2 = %.6f' % simu.getResult().getProbabilityEstimate())
print('Coefficient of variation : ', simu.getResult().getCoefficientOfVariation())

On en déduit qu'il est extrêmement improbable de ne pas pouvoir évacuer la population.
En revanche, on ne pourra stabiliser la brèche que dans 1 cas sur 5 en moyenne.

#### Question 1

On crée deux variables aléatoires supplémentaires $T_{evac}$ et $T_{stabi}$ correspondant aux temps d'évacuation et de stabilisation.

In [None]:
T_evac  = ot.Uniform(90*60, 120*60)
T_stabi = ot.Uniform(3*60*60, 4*60*60)

marginals = [Z, gamma_g, k_er, tau_c, Rd, Rmax, T_evac, T_stabi]
Xtilde_loi = ot.ComposedDistribution(marginals)
Xtilde = ot.RandomVector(Xtilde_loi)

#### Question 2

On étudie ensuite deux quantités d'intérêts $W_{evac}$ et $W_{stabi}$.

In [None]:

f_tilde_evac = ot.SymbolicFunction(['Z', 'gamma_g', 'k_er', 'tau_c', 'Rd', 'Rmax', 'T_evac', 'T_stabi'],
                        ['Z * gamma_g / (9.81 * k_er) * log( (Rmax - Z * tau_c) / (Rd - Z * tau_c) ) - T_evac'])
W_evac = ot.RandomVector(f_tilde_evac, Xtilde)

f_tilde_stabi = ot.SymbolicFunction(['Z', 'gamma_g', 'k_er', 'tau_c', 'Rd', 'Rmax', 'T_evac', 'T_stabi'],
                        ['Z * gamma_g / (9.81 * k_er) * log( (Rmax - Z * tau_c) / (Rd - Z * tau_c) ) - T_stabi'])
W_stabi = ot.RandomVector(f_tilde_stabi, Xtilde)

#### Question 3

On associe à ces quantités deux évènements $\tilde E_1$ et $\tilde E_2$ correspondant à l'impossibilité d'évacuer et à la possibilité de colmater la brèche.

In [None]:
E1_tilde = ot.Event(W_evac, ot.Less(), 0) # E1 : le barrage s'effondre avant l'evacuation
E2_tilde = ot.Event(W_stabi, ot.Greater(), 0) # E2 : le barrage peut être stabilisé

#### Question 4

In [None]:
print("FORM")

solver = ot.SQP()
form = ot.FORM(solver, E1_tilde, Xtilde.getMean())
form.run()
result = form.getResult()
print("Probability of E1_tilde :", result.getEventProbability())

In [None]:
print("FORM")
solver = ot.SQP()
form = ot.FORM(solver, E2_tilde, Xtilde.getMean())
form.run()
result = form.getResult()
print("Probability of E2_tilde :", result.getEventProbability())

La probabilité de ne pas pouvoir évacué la population reste très faible. En revanche, celle de pouvoir colmater la brèche a fortement diminuée.

## 2.4 Approximation de modèle

#### Question 1

In [None]:
Xtilde.getDimension()

In [None]:
d = Xtilde.getDimension()
Xtilde_loi = Xtilde.getDistribution()
enumerateFunction = ot.LinearEnumerateFunction(d)
H = [ot.StandardDistributionPolynomialFactory(ot.AdaptiveStieltjesAlgorithm(Xtilde_loi.getMarginal(i))) for i in range(d)]
productBasis = ot.OrthogonalProductPolynomialFactory(H,ot.LinearEnumerateFunction(d))
m = enumerateFunction.getStrataCumulatedCardinal(3)
print(m)

In [None]:
in_sample = Xtilde.getSample(100)

In [None]:
# On se place dans le cas où l'on s'intéresse à la possibilité de stabiliser.
out_sample = f_tilde_stabi(in_sample)

In [None]:
p = 3

In [None]:
algoSelection = ot.LeastSquaresMetaModelSelectionFactory(ot.LARS(),ot.CorrectedLeaveOneOut())
algo_meta = ot.FunctionalChaosAlgorithm(in_sample,out_sample,Xtilde_loi,ot.FixedStrategy(productBasis,m),ot.LeastSquaresStrategy(algoSelection))
algo_meta.run()
result = algo_meta.getResult()
meta_model = result.getMetaModel()

#### Question 3

In [None]:
test_in_sample = Xtilde.getSample(100)
test_out_sample = f_tilde_stabi(test_in_sample)

In [None]:
valid = ot.MetaModelValidation(test_in_sample, test_out_sample, meta_model)

In [None]:
q2 = valid.computePredictivityFactor()
print(q2)

In [None]:
ot.Show(valid.drawValidation())

Le meta-modèle est de qualité !

#### Question 4

In [None]:
monte_carlo = ot.MonteCarloExperiment()
verbose = True
simu = ot.ProbabilitySimulationAlgorithm(E2_tilde, monte_carlo, verbose)
simu.setBlockSize(2) ## number of cpu
simu.setMaximumOuterSampling(1000)
simu.setMaximumCoefficientOfVariation(0.01)
simu.run()
print('Probability estimate of E2_tilde = %.6f' % simu.getResult().getProbabilityEstimate())

## 2.5 Analyse de sensibilité

#### Question 1

In [None]:
T = T_stabi
marginals = [Z, gamma_g, k_er, tau_c, Rd, Rmax, T]
X_loi = ot.ComposedDistribution(marginals)
X = ot.RandomVector(X_loi)
model = ot.SymbolicFunction(['Z', 'gamma_g', 'k_er', 'tau_c', 'Rd', 'Rmax', 'T'],
                            ['Z * gamma_g / (9.81 * k_er) * log( (Rmax - Z * tau_c) / (Rd - Z * tau_c) ) - T'])

In [None]:
d = X.getDimension()
enumerateFunction = ot.LinearEnumerateFunction(d)
H = [ot.StandardDistributionPolynomialFactory(ot.AdaptiveStieltjesAlgorithm(X_loi.getMarginal(i))) for i in range(d)]
productBasis = ot.OrthogonalProductPolynomialFactory(H,ot.LinearEnumerateFunction(d))
degree = 3
m = enumerateFunction.getStrataCumulatedCardinal(degree)
print(m)

In [None]:
algoSelection = ot.LeastSquaresMetaModelSelectionFactory(ot.LARS(),ot.CorrectedLeaveOneOut())
in_sample = X.getSample(1000)
out_sample = model(in_sample)
algo_meta = ot.FunctionalChaosAlgorithm(in_sample,out_sample,X_loi,ot.FixedStrategy(productBasis,m),ot.LeastSquaresStrategy(algoSelection))
#algo_meta = ot.FunctionalChaosAlgorithm(model, X_loi,ot.FixedStrategy(productBasis,m),ot.LeastSquaresStrategy(algoSelection))
algo_meta.run()
result = algo_meta.getResult()

In [None]:
fcrv = ot.FunctionalChaosRandomVector(result)

In [None]:
for i in range(d):
    name = model.getInputDescription()[i]
    print(name, ':', fcrv.getSobolIndex([i]))

In [None]:
for i in range(d):
    name = model.getInputDescription()[i]
    print(name, ':', fcrv.getSobolTotalIndex([i]))

#### Question 2

In [None]:
in_sample = X.getSample(10000)
out_sample = model(in_sample)
kept = []
for i in range(len(out_sample)):
    if out_sample[i][0] > 0:
        kept.append(in_sample[i])
    if len(kept) == 100:
        break

In [None]:
avg_X_cond_E2 = ot.NumericalSample(kept).computeMean()
avg_X_cond_E2