 <div align="center"><h1> ANALYSE DES CLASSEMENTS DE PRODUITS </h1></div>

## CAS - Logiciels Gestionnaires de Mots de Passe

Dans son numéro de septembre 2018, le magazine 60 millions de consommateurs compare dix gestionnaires de mots de passe sur oridnateur et sur mobile. 

Nous allons appliquer la même méthode que pour le classement des couches-culottes précédent afin d'étudier la qualité du modèle d'évaluation.

<img src="./docs/tableau.png">

Dans cette section, nous essayerons d’analyser ce classement élaboré à partir de deux critères : la performance et la
composition avec des poids respectifs de 60% et 40 %.

## 1. Le score global (/20) associé à chaque produit peut-il être expliqué par une somme pondérée ?

A la lecture du classement publié, il semble clair, pour un consommateur, que le score global donné à chaque produit
résulte d’une moyenne pondérée (somme pondérée) de ses évaluations sur les deux critères performance et composition.
L’objectif dans cette partie est de vérifier l’exactitude ou non de cette hypothèse.

Pour cela, nous allons associer un nombre réel positif à chaque évaluation qualitative attribuée à un produit. Ainsi, pour
le produit “Joone” représenté par la lettre a sur le Tableau 1, si son score de 17/20 est obtenu à partir d’une somme
pondérée notée f, alors il existe des nombres réels positifs U1a(+++) ∈ [17, 20] et U2a(+++) ∈ [17, 20] tels que

**<p style="text-align: center;">f(a) = 0.6 U1a(+++) + 0.4 U2a(+++) = 17</p>**

Plus généralement, pour un produit x dont le score global f(x) est donné par une somme pondérée f, si on note Uix(αix)
le nombre réel associé à l’évaluation qualitative αix du produit x sur le critère i (la valeur qualitative αix étant donnée
par le magazine), alors on aura


**<p style="text-align: center;">f(x) = 0.6 U1x(α1x) + 0.4 U2x(α2x)</p>**

Pour déterminer si le classement des couches-culottes, fourni par le magazine, est compatible avec un modèle d’évaluation
basé sur la somme pondérée, il nous suffit alors de résoudre le programme linéaire PL1 suivant (un système d’inéquations
linéaires est suffisant pour ce test) :

<img src="./docs/pl.png">

où
* La fonction objectif donnée par l’équation (3) consiste, ici, à maximiser le nombre réel U1a(+++) associé à l’évaluation de la couche-culotte “Joone” sur le critère Performance. En réalité, étant donné que nous cherchons simplement à satisfaire les contraintes de ce programme linéaire, le choix de n’importe quelle fonction objectif suffira à résoudre notre problème. En clair le choix de la fonction objectif de PL1 est arbitraire.


* Les contraintes (4) à (15) correspondent à l’écriture sous forme de somme pondérée, comme dans la formule 2 ci-dessus, des 12 produits à évaluer.


* Les contraintes (16) à (19) correspondent à l’ordre établi dans le classement des 12 produits du magazine. A noter que la valeur 0.1, dans certains de ces contraintes, permet simplement de satisfaire une inégalité stricte, en termesde notes globales, entre certains produits.

* Les contraintes (20) à (29) permettent d’assurer l’appartenance de chaque nombre réel Uix(αix) à un intervalle lié à la note qualitative αix telle que donnée par le magazine.

In [1]:
import os
import sys
module_path = os.path.abspath(os.path.join('./src'))
if module_path not in sys.path:
    sys.path.append(module_path)

 ### 1.1 fonction CheckAdditiveModel

In [2]:
from system import checkAdditiveModel, createUpdateModel, compareRankings
from optlang import Variable
from loader import getOriginalData, exportInExcel
from IPython.display import display, display_html, HTML
from json2html import *
from IPython.display import HTML

**CheckAdditiveModel** retourne un message d’erreur si le classement n’est pas explicable par un modèle type
somme pondérée (dans ce cas, le programme linéaire ou système linéaire correspondant n’admet pas de solution
réalisable). Au cas où cela est possible, le programme retournera alors des valeurs numériques à associer à chaque
produit (pour chaque critère d’évaluation), ainsi que la valeur de la somme pondérée qui lui correspond, dans ce notebook et sous fichier **Excel** (répertoire **data_solved**)

La fonction est construite pour être générique et sera appelée sur différentes propositions de résolution du problème

 ## 1.2 
 ### 1.2.1 Test de la fonction avec le classement des couches-culottes

In [3]:
csv_name='./data/data_couches_original.xlsx'
model_name_1 = 'Programme Lineaire - Classement Couches-culottes avec notes' 

La résolution du problème passe par une formalisation en Programme Linéaire

In [4]:
result_2_1 = checkAdditiveModel(csv_name=csv_name,
                      model_name=model_name_1,
                      eval_expr='x1',
                      direction='max',
                      with_scores=True)
print(result_2_1)

Le Programme Lineaire - Classement Couches-culottes avec notes 
 du fichier ./data/data_couches_original.xlsx n'admet pas de solution


#### Commentaires

Le problème ainsi formalisé n'admet donc pas de solution

 ### 1.2.2 CheckAdditiveModel avec le classement des couches lorsque la note globale de chaque couche-culotte n’est pas fixée

In [5]:
model_name_2 = 'Programme Lineaire - Classement Couches-culottes sans note'

In [6]:
result_2_2 = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_2,
                  eval_expr='x1',
                  direction='max')
print(result_2_2)

Le Programme Lineaire - Classement Couches-culottes sans note 
 du fichier ./data/data_couches_original.xlsx n'admet pas de solution


Le problème ainsi formalisé n'admet également pas de solution

 ### 1.2.3 Commentaires

# 1.3

Dans cette question, nous allons supposer que l’évaluation globale n’est pas la même pour les couches-culottes
“Naty” et “Pamp. Activ” d’une part, et les couches-culottes “Love & Green” et “Lotus Baby” d’autre part.

Pour cela, nous allons supprimer du programme PL1 les deux contraintes suivantes : **fd = fe** de l’équation (17)
et **fi = fj** de l’équation (18). 

Nous allons également supprimer du programme PL1 la contrainte **17 < U2c(+++)**,
liée à la couche c-Pamp.Baby.

## 1.3.1 Le meilleur et le pire score global obtenu par le produit “Joone”

#### Meilleur score

In [7]:
update_model_Q3 = createUpdateModel([Variable ('x6', ub = 20)], ['c16', 'c21'])

In [8]:
result_original = getOriginalData(csv_name)
model_name_3 = 'Programme Lineaire - Meilleur score Joone'
result_3_1_max = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_3,
                  eval_expr='y1',
                  direction='max',
                  update_model=update_model_Q3)

In [9]:
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_3_1_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_3)

display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,+++,+++,17.0
1,b- Pamp. Prem,++,++,14.5
2,c- Pamp. Baby,+,+++,12.5
3,d- Naty,+,+++,12.5
4,e- Pamp. Activ.,+,+,12.5
5,f- Carref.Baby,++,+,12.5
6,g- Lupilu,++,-,12.0
7,h- Mots d’enfants,+,-,12.0
8,i- Love & Green,++,-,9.5
9,j- Lotus Baby,++,--,9.5

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,20.0,20.0,20.0
1,b- Pamp. Prem,13.0,13.0,13.0
2,c- Pamp. Baby,12.5,13.25,12.8
3,d- Naty,10.0,17.0,12.8
4,e- Pamp. Activ.,12.5,10.75,11.8
5,f- Carref.Baby,13.0,10.0,11.8
6,g- Lupilu,13.1667,7.0,10.7
7,h- Mots d’enfants,12.5,8.0,10.7
8,i- Love & Green,13.0,7.0,10.6
9,j- Lotus Baby,13.0,0.0,7.8


#### Pire score

In [10]:
model_name_4 = 'Programme Lineaire - Pire score Joone'
result_3_1_min = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_4,
                  eval_expr='y1',
                  direction='min',
                  update_model=update_model_Q3)

In [11]:
df2_s = result_3_1_min.style.set_table_attributes("style='display:inline'").set_caption(model_name_4)
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,+++,+++,17.0
1,b- Pamp. Prem,++,++,14.5
2,c- Pamp. Baby,+,+++,12.5
3,d- Naty,+,+++,12.5
4,e- Pamp. Activ.,+,+,12.5
5,f- Carref.Baby,++,+,12.5
6,g- Lupilu,++,-,12.0
7,h- Mots d’enfants,+,-,12.0
8,i- Love & Green,++,-,9.5
9,j- Lotus Baby,++,--,9.5

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,17.0,17.0,17.0
1,b- Pamp. Prem,13.0,13.0,13.0
2,c- Pamp. Baby,12.5,13.25,12.8
3,d- Naty,10.0,17.0,12.8
4,e- Pamp. Activ.,12.5,10.75,11.8
5,f- Carref.Baby,13.0,10.0,11.8
6,g- Lupilu,13.1667,7.0,10.7
7,h- Mots d’enfants,12.5,8.0,10.7
8,i- Love & Green,13.0,7.0,10.6
9,j- Lotus Baby,13.0,0.0,7.8


#### Commentaires

## 1.3.2 Le meilleur et le pire score global obtenu par le produit “Lillydoo”

#### Meilleur score

In [12]:
model_name_5 = 'Programme Lineaire - Meilleur score Lillydoo'
result_3_2_max = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_5,
                  eval_expr='y12',
                  direction='max',
                  update_model=update_model_Q3)

In [13]:
df2_s = result_3_2_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_5)
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,+++,+++,17.0
1,b- Pamp. Prem,++,++,14.5
2,c- Pamp. Baby,+,+++,12.5
3,d- Naty,+,+++,12.5
4,e- Pamp. Activ.,+,+,12.5
5,f- Carref.Baby,++,+,12.5
6,g- Lupilu,++,-,12.0
7,h- Mots d’enfants,+,-,12.0
8,i- Love & Green,++,-,9.5
9,j- Lotus Baby,++,--,9.5

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,17.0,17.0,17.0
1,b- Pamp. Prem,13.0,13.0,13.0
2,c- Pamp. Baby,12.5,13.25,12.8
3,d- Naty,10.0,17.0,12.8
4,e- Pamp. Activ.,12.5,10.75,11.8
5,f- Carref.Baby,13.0,10.0,11.8
6,g- Lupilu,13.1667,7.0,10.7
7,h- Mots d’enfants,12.5,8.0,10.7
8,i- Love & Green,13.0,7.0,10.6
9,j- Lotus Baby,16.5,0.75,10.2


#### Pire Score

In [14]:
model_name_6 = 'Programme Lineaire - Pire score Lillydoo'
result_3_2_min = checkAdditiveModel(csv_name=csv_name,
                  model_name='Programme Lineaire - Pire score Lillydoo',
                  eval_expr='y12',
                  direction='min',
                  update_model=update_model_Q3)

In [15]:
df2_s = result_3_2_min.style.set_table_attributes("style='display:inline'").set_caption(model_name_6)
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,+++,+++,17.0
1,b- Pamp. Prem,++,++,14.5
2,c- Pamp. Baby,+,+++,12.5
3,d- Naty,+,+++,12.5
4,e- Pamp. Activ.,+,+,12.5
5,f- Carref.Baby,++,+,12.5
6,g- Lupilu,++,-,12.0
7,h- Mots d’enfants,+,-,12.0
8,i- Love & Green,++,-,9.5
9,j- Lotus Baby,++,--,9.5

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,17.0,17.0,17.0
1,b- Pamp. Prem,13.0,13.0,13.0
2,c- Pamp. Baby,12.5,13.25,12.8
3,d- Naty,10.0,17.0,12.8
4,e- Pamp. Activ.,12.5,10.75,11.8
5,f- Carref.Baby,13.0,10.0,11.8
6,g- Lupilu,13.1667,7.0,10.7
7,h- Mots d’enfants,12.5,8.0,10.7
8,i- Love & Green,13.0,7.0,10.6
9,j- Lotus Baby,13.0,0.0,7.8


#### Commentaires

## 1.3.3 Conclusions

In [27]:
%%capture
dict_max_y1 = compareRankings(result_original['Score'], result_3_1_max['Score'])
dict_min_y1 = compareRankings(result_original['Score'], result_3_1_min['Score'])
dict_max_y12 = compareRankings(result_original['Score'], result_3_2_max['Score'])
dict_min_y12 = compareRankings(result_original['Score'], result_3_2_min['Score'])

In [28]:
#Coefficients Q3.1
print("Max Score Joone")
display(HTML(json2html.convert(json = dict_max_y1)))
print("Min Score Joone")
display(HTML(json2html.convert(json = dict_min_y1)))
#Coefficients Q3.2
print("Max Score Lillydoo")
display(HTML(json2html.convert(json = dict_max_y12)))
print("Min Score Lillydoo")
display(HTML(json2html.convert(json = dict_min_y12)))

Max Score Joone


0,1
coef - Spearman,0.9803024573066308
p - Spearman,2.2594333336834262e-08
tau - Kendall,0.9503819266229828
p_val - Kendall,6.317712090483196e-05


Min Score Joone


0,1
coef - Spearman,0.9803024573066308
p - Spearman,2.2594333336834262e-08
tau - Kendall,0.9503819266229828
p_val - Kendall,6.317712090483196e-05


Max Score Lillydoo


0,1
coef - Spearman,0.9803024573066308
p - Spearman,2.2594333336834262e-08
tau - Kendall,0.9503819266229828
p_val - Kendall,6.317712090483196e-05


Min Score Lillydoo


0,1
coef - Spearman,0.9803024573066308
p - Spearman,2.2594333336834262e-08
tau - Kendall,0.9503819266229828
p_val - Kendall,6.317712090483196e-05


Min Score Lillydoo


0,1
coef - Spearman,1.0
p - Spearman,0.0
tau - Kendall,1.0
p_val - Kendall,1.4827983767297566e-05


## 1.4

A présent, nous choisissons de ne plus tenir compte de l’ordre des produits fourni dans le classement publié par le
magazine. En d’autres termes, nous supprimons les contraintes **(16)** à **(19)**. Nous allons également supprimer du
programme PL1 la contrainte **17 < U2c(+++)**, liée à la couche **c-Pamp.Baby**.

In [18]:
update_model_Q4 = createUpdateModel([Variable ('x6', ub = 20)], ['c13', 'c14', 'c15', 
                                                                    'c16', 'c17', 'c18',
                                                                    'c19', 'c20', 'c21',
                                                                    'c22', 'c23'])

## 1.4.1 Score global maximal obtenu par chacun des 12 produits

Nous résolvons à chaque fois le programme linéaire correspondant

In [19]:
%%capture
model_name_7 = 'Programme Lineaire - Score global maximal pour chaque produit'
result_4_1_all_max = checkAdditiveModel(csv_name=csv_name,
                      model_name=model_name_5,
                      eval_expr='all',
                      direction='max',
                      update_model=update_model_Q4)

dict_max_all = compareRankings(result_original['Score'], result_4_1_all_max['Score']) 

In [20]:
df2_s = result_4_1_all_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_7)
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,+++,+++,17.0
1,b- Pamp. Prem,++,++,14.5
2,c- Pamp. Baby,+,+++,12.5
3,d- Naty,+,+++,12.5
4,e- Pamp. Activ.,+,+,12.5
5,f- Carref.Baby,++,+,12.5
6,g- Lupilu,++,-,12.0
7,h- Mots d’enfants,+,-,12.0
8,i- Love & Green,++,-,9.5
9,j- Lotus Baby,++,--,9.5

Unnamed: 0,Produit,Performance,Composition,Score
0,a- Joone,20.0,20.0,20.0
1,b- Pamp. Prem,16.5,16.5,16.5
2,c- Pamp. Baby,12.5,20.0,15.5
3,d- Naty,12.5,20.0,15.5
4,e- Pamp. Activ.,12.5,12.5,12.5
5,f- Carref.Baby,16.5,12.5,14.9
6,g- Lupilu,16.5,9.5,13.7
7,h- Mots d’enfants,12.5,9.5,11.3
8,i- Love & Green,16.5,9.5,13.7
9,j- Lotus Baby,16.5,6.5,12.5


In [21]:
print("Max Score pour toutes les marques")
display(HTML(json2html.convert(json = dict_min_y12)))

Max Score pour toutes les marques


0,1
coef - Spearman,0.9803024573066308
p - Spearman,2.2594333336834262e-08
tau - Kendall,0.9503819266229828
p_val - Kendall,6.317712090483196e-05


## 1.4.2 Conclusion

In [22]:
exportInExcel('./Partie_1_Analyse_Classement.xlsx', 'Q3.1',
                 [result_original, result_3_1_max, result_3_1_min],
                 ['Modèle Original',model_name_3, model_name_4],
                 [dict_max_y1,dict_min_y1])

<openpyxl.workbook.workbook.Workbook at 0x1bcffd4ac88>

In [23]:
exportInExcel('./Partie_1_Analyse_Classement.xlsx', 'Q3.2',
                 [result_original, result_3_2_max, result_3_2_min],
                 ['Modèle Original',model_name_5, model_name_6],
                 [dict_max_y12,dict_min_y12])


<openpyxl.workbook.workbook.Workbook at 0x1bcffdd1ef0>

In [24]:
exportInExcel('./Partie_1_Analyse_Classement.xlsx', 'Q4',
                 [result_original, result_4_1_all_max],
                 ['Modèle Original',model_name_7],
                 [dict_max_all])

<openpyxl.workbook.workbook.Workbook at 0x1bcffdfd5f8>