L’exercice proposé ci-dessous est basé sur un problème de recalage de modèle à partir de mesures de rigidités transversales pour des enveloppes poids lourd. Les données sont mises à disposition dans les fichiers « 315 80 R 22.5.txt, 385 55 R 22.5.txt, 495 45 R 22.5.txt » avec 3 colonnes : 
- Charge (noté $Fz$) en Newton,
- Pression (noté $P$) en Bar,
- Rigidité (noté $Dz$) en N/°. 

Les coefficients à optimiser sont notés $a1, a2, a3, a4$ et $a5$. Le modèle à ajuster est le suivant :

$ \displaystyle Dz = (a1 \times P + a2) \times \sin \left(a3 \times \arctan{\left(\frac{Fz}{a4 \times P + a5}\right)} \right)$

Cet exercice est séparé en dex parties. La première consiste à résoudre le problème d'identification de paramètres en utilisant des outils classiques d'optimisation. La seconde vise à trouver les solutions via une approche d'optimisation bayesienne.

## Identification par Optimisation Classique

### Chargement des Données

Veuillez tout d'abord charger les mesures de rigidités de dérive contenues dans le fichier " 315 80 R 22.5.txt".

In [1]:
import numpy as np
import scipy as sp
from scipy import linalg as LA
from scipy.optimize import leastsq as LB
import matplotlib.pyplot as plt

%matplotlib notebook

#chemin = C:\Users\perra\Documents\Cours Polytech 5A\Michelin\Projet\OptimisationBayesienne 
chemin = "315 80 R 22.5.txt"
mat = np.loadtxt(chemin)
mat
z = mat[:,0]   # N
p  = mat[:,1]   # Bar
dz = mat[:,2]   # N/°

Ces mesures correspondents à des valeurs de rigidités de dérive pour trois niveaux de pression 7, 8.5 et 9.5 bars. Chaque palier de pression comporte 7 points de mesure.
Afficher les mesures $Dz(Fz)$ pour chaque palier de pression

In [2]:
# Affichage des Mesures 

z1=z[:7]
z2=z[7:14]
z3=z[14:21]

p1=np.array(sorted(p[:7]))
p2=np.array(sorted(p[7:14]))
p3=np.array(sorted(p[14:21]))

dz1=np.array(sorted(dz[:7]))
dz2=np.array(sorted(dz[7:14]))
dz3=np.array(sorted(dz[14:21]))

In [3]:
### Afiichage de Dz en fonction de Z

In [4]:
plt.plot(z1,dz1, label='Pression =7.5')
plt.plot(z2,dz2,label='Pression =8')
plt.plot(z3,dz3,label='Pression =8.5')
plt.legend()
plt.savefig("dz(fz)")

<IPython.core.display.Javascript object>

In [5]:
plt.close()

In [6]:
plt.scatter(p1,z1)
plt.savefig("ex1_1")

<IPython.core.display.Javascript object>

In [7]:
plt.close()

In [8]:
plt.scatter(p2,z2)
plt.savefig("ex1_2")

<IPython.core.display.Javascript object>

In [9]:
plt.close()

In [10]:
plt.scatter(p3,z3)
plt.savefig("ex1_3")

<IPython.core.display.Javascript object>

In [11]:
plt.close()

In [12]:
print(z1)
print(p1)
print(dz1)

[11736. 25447. 39179. 48986. 58788. 68591. 78373.]
[6.98 6.98 6.99 6.99 6.99 7.   7.01]
[1557.64 3237.7  4438.22 4961.65 5287.09 5448.14 5460.77]


In [13]:
print(z1)
print(z2)
print(z3)

[11736. 25447. 39179. 48986. 58788. 68591. 78373.]
[11730. 25454. 39178. 49003. 58799. 68603. 78363.]
[11734. 25463. 39198. 49004. 58790. 68606. 78402.]


On remarque ici que dans p1 on a plusieurs fois les même valeurs donc ona décidé de prendre une seul valeurs a chaque fois
Se qui nous donne les liste p4, z4 et dz4

In [14]:
print(p1)
p4=[p1[0],p1[2],p1[5],p1[6]]
z4=[z1[0],z1[2],z1[5],z1[6]]
dz4=[dz1[0],dz1[2],dz1[5],dz1[6]]
print(p4)
print(z4)

[6.98 6.98 6.99 6.99 6.99 7.   7.01]
[6.98, 6.99, 7.0, 7.01]
[11736.0, 39179.0, 68591.0, 78373.0]


In [15]:
plt.scatter(p4,z4)
plt.savefig("ex1_4")

<IPython.core.display.Javascript object>

In [16]:
plt.close()

### Estimation des Valeurs Initiales

L’exercice est un problème d’optimisation continue, non linéaire et sans contrainte. Il est donc nécessaire d'initialiser les paramètres afin de pouvoir lancer un algorithme d'optimisation type recherche linéaire ou région de confiance.

Comment, à votre avis, peut-on essayer d’estimer les coefficients du modèle à partir des mesures ? Pour vous aider, n’oubliez pas que la fonction sinus est bornée. De plus, cadeau, je vous conseille d’approcher a3 par la valeur 2. Il vous reste seulement 4 petits coef à trouver…

Second conseil, le modèle peut également s’écrire sous la forme suivante, idéale quand on connaît déjà $a1, a2$ et $a3$, avec quelques restrictions cependant sur le domaine de définition des fonctions $1/x$, $\arctan$ et $\arcsin$:

$ \displaystyle a4 \times P + a5 = \frac{Fz}{\tan \left(\frac{1}{3} \times \arcsin\left(\frac{Dz}{a1 \times P + a2} \right) \right)}$

#### Recherche de a1 et a2

on a remarquer en trançant p4 en fonction de z4 que l'on obtenais une droite du coup on a décider de calculer a1 et a2 en 
prennant a1 comme le vecteur directeur de la droite et a2 comme l'odonné a l'originie

In [17]:
# Estimation initiale de a1

a1=(z4[0]-z4[1])/(p4[0]-p4[1])
a1


2744300.0000000587

In [18]:
# Estimation initiale de a1
a2=z4[0]-a1*p4[0]
a2

-19143478.00000041

In [19]:
a2=z4[0]-a1*p4[0]
a2

-19143478.00000041

#### Recherche de a4 et a5

Maintenant que l'on a a1 et a2 on peut utiliser la formule précédement donner pour essayer de trouver a4 et a5 

In [20]:
def f(P,Fz,Dz):
    arg_arcsin = Dz / (a1 * P + a2)

    # Calcul de l'arc sinus
    arcsin_result = np.arcsin(arg_arcsin)

    # Calcul de l'argument de la tangente
    arg_tan = (1 / 3) * arcsin_result

    # Calcul de la tangente
    tan_result = np.tan(arg_tan)

    # Calcul final de l'expression
    result = Fz / tan_result
    return result

In [21]:
data45=[]
for i in range(len(p4)):
    data45.append(f(p4[i],z4[i],dz4[i]))

In [22]:
data45

[264317.4551483314, 1034852.6245760171, 2512839.3452871474, 4047281.2302307207]

In [23]:
plt.scatter(p4,data45)
plt.savefig("ex1_5")

<IPython.core.display.Javascript object>

In [24]:
plt.close()

Comme l'indique la formule les valeurs que l'on a dans data45 suit une droite de coefficient directeur a4 et d'ordonnée a 
l'origine a5 donc on vas calculer comme on la fait précédement pour a1 et a2 en utilisant les valeurs de data45

In [25]:
# Estimation de a4

a4=(data45[0]-data45[1])/(p4[0]-p4[1])
a4

77053516.94277021

In [26]:
# Estimation de a5

a5=data45[0]-a4*p4[0]
a5

-537569230.8053877

#### Récapitulatif des valeurs trouver pour les paramètre

In [27]:
#a1=2744300.0000000587
#a2=-19143478.00000041
a3=2
#a4=77053516.94277021
#a5=-537569230.8053877

In [28]:
param=[a1,a2,a3,a4,a5]
param

[2744300.0000000587,
 -19143478.00000041,
 2,
 77053516.94277021,
 -537569230.8053877]

Superposer les courbes de mesures et de prédictions obtenues avec l'initialisation trouvée. Que constatez-vous?

In [29]:
# Fonction permettant de simuler le modèle
# Entrées: paramètres du modèle
# Return: la valeur de Dz 

def Fonction_DZ(parametres, P, Fz):
    DZ=[]
    a1, a2, a3, a4, a5 = parametres
    for i in range(P.shape[0]):
        Valeur=(a1 * P[i] + a2) * np.sin(a3 * np.arctan(Fz[i] / (a4 * P[i] + a5)))
        DZ.append(Valeur)
    return DZ


In [30]:
# On vas calculer pour les 3 pressions les valeurs de DZ

Pour le niveau de pression = 7.5

In [31]:
DZ1_pred=Fonction_DZ(param,p1,z1)
DZ1_pred

[1040.1333001803005,
 2238.9995829159657,
 2962.3484213714305,
 3700.8780365346565,
 4437.049174881186,
 5054.961779831051,
 5718.601296755186]

Pour le niveau de pression = 8

In [32]:
DZ2_pred=Fonction_DZ(param,p2,z2)
DZ2_pred

[836.0163788319983,
 1814.1414199040244,
 2792.2589842766347,
 3492.4843003460273,
 4190.65298919194,
 4889.391666729592,
 5584.953584259393]

Pour le niveau de pression = 8,5

In [33]:
DZ3_pred=Fonction_DZ(param,p3,z3)
DZ3_pred

[836.1165383365069,
 1814.3833546861842,
 2793.0683108923363,
 3491.788890523085,
 4189.09197223595,
 4888.526023758913,
 5586.53306893166]

In [34]:
# Affichage de la superposition mesures/prédictions

Pour la pression de 7.5

In [35]:
plt.plot(z1,dz1, label='Vrai')
plt.plot(z1,DZ1_pred,label='Préd')
plt.title("Mesure/Prédiction pour la pression 7.5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_7_5")

<IPython.core.display.Javascript object>

In [36]:
plt.close()

Pour la pression de 8

In [37]:
plt.plot(z2,dz2, label='Vrai')
plt.plot(z2,DZ2_pred,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8")

<IPython.core.display.Javascript object>

In [38]:
plt.close()

Pour la pression = 8.5

In [39]:
plt.plot(z3,dz3, label='Vrai')
plt.plot(z3,DZ3_pred,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8.5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8_5")

<IPython.core.display.Javascript object>

In [40]:
plt.close()

### Fine Tuning des valeurs

Dans le but d'affiner les valeurs obtenues à l'issue de la phase d'initialisation, il est nécessaire de faire appel à un algorithme d'optimisation non linéaire.

En l'occurence, il s'agit d'un problème de curve fitting. 

Quel critère est-il pertinent de considérer? 

Quel type d'algorithme peut-on mettre en oeuvre? 

Implémenter l'optimisation des valeurs des coefficients.

On va mettre en place un algo des moindre carré pour essayer d'obtenir les paramètres optimaux

In [41]:
# Fonction permettant de calculer la fonction coût
# Entrées: paramètres à optimiser
# Return: la valeur du critère à optimiser 

def cost_function(params,P,Fz,Dz):
    predicted_Dz = np.array(Fonction_DZ(params,P,Fz))
    Diff = predicted_Dz - Dz
    return Diff

In [42]:
Fz = np.concatenate((z1, z2, z3), axis=0)
Fz

array([11736., 25447., 39179., 48986., 58788., 68591., 78373., 11730.,
       25454., 39178., 49003., 58799., 68603., 78363., 11734., 25463.,
       39198., 49004., 58790., 68606., 78402.])

In [43]:
P= np.concatenate((p1, p2,p3), axis=0)
P

array([6.98, 6.98, 6.99, 6.99, 6.99, 7.  , 7.01, 8.46, 8.47, 8.48, 8.49,
       8.49, 8.49, 8.51, 9.4 , 9.42, 9.45, 9.47, 9.47, 9.48, 9.49])

In [44]:
Dz= np.concatenate((dz1, dz2, dz3), axis=0)
Dz

array([1557.64, 3237.7 , 4438.22, 4961.65, 5287.09, 5448.14, 5460.77,
       1399.18, 2950.42, 4140.05, 4760.91, 5212.09, 5572.68, 5788.68,
       1320.73, 2799.98, 3963.98, 4590.18, 5119.2 , 5516.78, 5839.33])

In [45]:
# Optimisation des paramètres
parametres_optimaux,_= LB(cost_function, param, args=(P, Fz, Dz))
parametres_optimaux



array([ 7.03051235e+06, -4.90515983e+07,  2.32994007e-01,  1.97720298e+07,
       -1.37974866e+08])

Superposer les courbes de mesures et de prédictions obtenues avec les valeurs finales trouvées. A-t-on améliorer la qualité de prédiction du modèle par rapport à la phase d'initialisation? Comment peut-on le quantifier?

In [46]:
# Affichage de la superposition mesures/prédictions avec les nouvelles valeurs optimisées des paramètres

Pour le niveau de pression = 7.5

In [47]:
DZ1_pred_opt=Fonction_DZ(parametres_optimaux,p1,z1)
DZ1_pred_opt

[1658.2724834079402,
 3195.1143579946797,
 3578.525271083519,
 4450.419450224799,
 5306.6851967863995,
 5977.7476577386715,
 6728.674237013597]

In [48]:
plt.plot(z1,dz1, label='Vrai')
plt.plot(z1,DZ1_pred_opt,label='Préd')
plt.title("Mesure/Prédiction pour la pression 7.5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_7_5_optimaux")

<IPython.core.display.Javascript object>

In [49]:
plt.close()

Pour le niveau de pression = 8

In [50]:
DZ2_pred_opt=Fonction_DZ(parametres_optimaux,p2,z2)
DZ2_pred_opt

[972.673216106012,
 2110.679512608715,
 3248.6715121307384,
 4063.3434433448174,
 4875.6287254286435,
 5688.576291100015,
 6497.8001656883625]

In [51]:
plt.plot(z2,dz2, label='Vrai')
plt.plot(z2,DZ2_pred_opt,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8_optimaux")

<IPython.core.display.Javascript object>

In [52]:
plt.close()

Pour le niveau de pression = 8.5

In [53]:
DZ3_pred_opt=Fonction_DZ(parametres_optimaux,p3,z3)
DZ3_pred_opt

[972.6672360335513,
 2110.696519373403,
 3249.2057793460567,
 4062.0280589704125,
 4873.206147495618,
 5686.8585287435235,
 6498.849300902253]

In [54]:
plt.plot(z3,dz3, label='Vrai')
plt.plot(z3,DZ3_pred_opt,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8,5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8_5_optimaux")

<IPython.core.display.Javascript object>

In [55]:
plt.close()

## Identification par Optimisation Bayesienne

Comme précisé plus haut, cette partie vise à résoudre le problème d'identification via une approche bayesienne. Pour ce faire, nous allons nous appuyer sur le package python scikit-optimize (https://scikit-optimize.github.io/stable/).

In [56]:
from skopt import gp_minimize
from skopt.plots import plot_gaussian_process, plot_convergence

### Premier Essai

Nous travaillons toujours avec la même fonction objectif utilisée dans la première partie du TP. On va considérer de plus les bornes suivantes:
- $200 \leq a1 \leq 300$
- $3000 \leq a2 \leq 4500$
- $1 \leq a3 \leq 3$
- $1e4 \leq a4 \leq 2e4$
- $-5e3 \leq a5 \leq -2e3$

La fonction d'acquisition qui sera utilisée dans un premier temps est l'amélioration espérée (Expected Improvement). Nous fixerons le nombre d'appels à la fonction coût originale à 100. Enfin, on utilise un plan de type LHS avec 50 points pour construire le modèle de krigeage avant la permière minimisation de la fonction d'acquisition.

A l'aide de la documentation du package scikit-optimize, implémenter cette première tentative d'optimisation bayesienne et visualiser le graphe de convergence. A-t-on le même niveau de convergence qu'observé dans la première section du TP? Comment pourrait-on améliorer la convergence?

In [57]:
# Fonction permettant de calculer la fonction coût au format attendu par scikit-optimize (donc elle doit prendre qu'un paramètre)
# Entrées: paramètres à optimiser
# Return: la valeur du critère à optimiser 
# Définir la fonction coût wrapper
def wrapper(params):
    a1, a2, a3, a4, a5 = params
    result = cost_function([a1, a2, a3, a4, a5], p, z, dz)
    return np.sum(result**2) 


In [58]:
# Définition des bornes
Bornes = [(200, 300), (3000, 4500), (1, 3), (1e4, 2e4), (-5e3, -2e3)]

In [59]:
# Estimation des paramètres par optimisation bayesienne

result_1 = gp_minimize(wrapper, Bornes, acq_func='EI', n_calls=100, n_random_starts=50,random_state=42)


AttributeError: module 'numpy' has no attribute 'int'.
`np.int` was a deprecated alias for the builtin `int`. To avoid this error in existing code, use `int` by itself. Doing this will not modify any behavior and is safe. When replacing `np.int`, you may wish to use e.g. `np.int64` or `np.int32` to specify the precision. If you wish to review your current use, check the release note link for additional information.
The aliases was originally deprecated in NumPy 1.20; for more details and guidance see the original release note at:
    https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations

In [None]:
# Affichage de l'évolution de la fonction coût au fil des itérations via la fonction "plot_convergence" de scikit-optimize

plot_convergence(result_1)

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'Convergence plot'}, xlabel='Number of calls $n$', ylabel='$\\min f(x)$ after $n$ calls'>

In [None]:
#plot_gaussian_process(result_1)
# marche pas car on a 5 paramètre a optimiser et ça c'est quand on veux regarder que pour un seul

In [None]:
plt.close()

In [None]:
optimal_params = result_1.x

In [None]:
optimal_params

[200, 4073, 3, 17575.280368435888, -2000.0]

In [None]:
### Voir les courbes si cela a changer

Pour la pression 7.5

In [None]:
DZ1_pred_opt_bay=Fonction_DZ(optimal_params,p1,z1)
DZ1_pred_opt_bay

[1568.290622246474,
 3193.1512560660453,
 4419.772386219511,
 5005.522807106081,
 5347.88052617038,
 5471.426553392122,
 5412.53121320403]

In [None]:
plt.plot(z1,dz1, label='Vrai')
plt.plot(z1,DZ1_pred_opt_bay,label='Préd')
plt.title("Mesure/Prédiction pour la pression 7,5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_7_5_Bay")

<IPython.core.display.Javascript object>

In [None]:
plt.close()

Pour la pression = 8

In [None]:
DZ2_pred_opt_bay=Fonction_DZ(optimal_params,p2,z2)
DZ2_pred_opt_bay

[1366.936000393652,
 2839.6494583279386,
 4062.1094537552476,
 4740.7473144522555,
 5243.715586405539,
 5573.25431342815,
 5742.409046843938]

In [None]:
plt.plot(z2,dz2, label='Vrai')
plt.plot(z2,DZ2_pred_opt_bay,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8_Bay")

<IPython.core.display.Javascript object>

In [None]:
plt.close()

Pour la pression = 8.5

In [None]:
DZ3_pred_opt_bay=Fonction_DZ(optimal_params,p3,z3)
DZ3_pred_opt_bay

[1271.9063628575564,
 2662.3209307857937,
 3857.2960744838924,
 4556.469237297156,
 5115.74183763558,
 5529.457161140957,
 5801.889777280235]

In [None]:
plt.plot(z3,dz3, label='Vrai')
plt.plot(z3,DZ3_pred_opt_bay,label='Préd')
plt.title("Mesure/Prédiction pour la pression 8,5")
plt.legend()
# Enregistrer la figure
plt.savefig("Mesure_Prédiction_Pression_8_5_Bay")

<IPython.core.display.Javascript object>

In [None]:
plt.close()

### Amélioration de la configuration de l'algorithme

Essayer différents nombres de points d'évaluation et les fonctions d'acquisition PI et LCB pour tenter d'améliorer le paramétrage de l'algorithme. A partir de l'analyse des graphiques de convergence et de fonctions d'acquisition, quelle est la configuration la plus efficiente?

In [None]:
# Tests et évaluation avec différentes options du solver

On utilise la fonction PI pour 50 point d'évaluation

In [None]:
result_2 = gp_minimize(wrapper, Bornes, acq_func='EI', n_calls=100, n_random_starts=50,random_state=42)



In [None]:
# Affichage de l'évolution de la fonction coût au fil des itérations via la fonction "plot_convergence" de scikit-optimize

plot_convergence(result_2)

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'Convergence plot'}, xlabel='Number of calls $n$', ylabel='$\\min f(x)$ after $n$ calls'>

In [None]:
plt.close()

On utilise la fonction PI pour 100 point d'évaluation

In [None]:
result_3 = gp_minimize(wrapper, Bornes, acq_func='EI', n_calls=100, n_random_starts=100,random_state=42)

In [None]:
# Affichage de l'évolution de la fonction coût au fil des itérations via la fonction "plot_convergence" de scikit-optimize

plot_convergence(result_3)

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'Convergence plot'}, xlabel='Number of calls $n$', ylabel='$\\min f(x)$ after $n$ calls'>

In [None]:
plt.close()

On utilise la fonction LCB pour 50 point d'évaluation

In [None]:
result_4 = gp_minimize(wrapper, Bornes, acq_func='LCB', n_calls=100, n_random_starts=50,random_state=42)

In [None]:
# Affichage de l'évolution de la fonction coût au fil des itérations via la fonction "plot_convergence" de scikit-optimize

plot_convergence(result_4)

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'Convergence plot'}, xlabel='Number of calls $n$', ylabel='$\\min f(x)$ after $n$ calls'>

In [None]:
plt.close()

On utilise la fonction LCB pour 100 point d'évaluation

In [None]:
result_5 = gp_minimize(wrapper, Bornes, acq_func='LCB', n_calls=100, n_random_starts=100,random_state=42)

In [None]:
# Affichage de l'évolution de la fonction coût au fil des itérations via la fonction "plot_convergence" de scikit-optimize

plot_convergence(result_5)

<IPython.core.display.Javascript object>

<AxesSubplot:title={'center':'Convergence plot'}, xlabel='Number of calls $n$', ylabel='$\\min f(x)$ after $n$ calls'>

In [None]:
plt.close()