 <div align="center"><h1> ANALYSE DES CLASSEMENTS DE PRODUITS </h1></div>

Note : *Le code source est disponible [ici](https://github.com/toshiro10/LangageScript)*

## CAS - Logiciels Gestionnaires de Mots de Passe

Dans son numéro de septembre 2018, le magazine 60 millions de consommateurs compare dix gestionnaires de mots de passe sur oridnateur et sur mobile. 

Nous allons appliquer la même méthode que pour le classement des couches-culottes précédent afin d'étudier la qualité du modèle d'évaluation.

<img src="../docs/tableau_logiciels.png">

Le tableau ci-dessus recense les informations relatives au classement des logiciels de gestionnaires de mot de passe. Nous nous baserons sur ce tableau pour effectuer nos analyses

## 1. Contexte - Logiciels Gestionnaires de Mots de Passe

Le magazine 60 millions de consomateurs dans son numéro N°540 a publié une analyse de dix logiciels de mots de passe sur 4 critères :

* Utilisation sur ordinateurs, ce critère englobe tout ce qui s’agit de la facilité d’installation du logiciel, de sa compatibilité avec tous les systèmes d’exploitation, l’ergonomie de l’IHM, la gestion des mots de passes et des formulaires de saisie..

* Utilisation sur appareils mobiles, c’est-à-dire si le logiciel est compatible avec les appareils mobiles ou pas.

* Protection du gestionnaire et conseils de sécurité, ce critère concerne l’ensemble des conseils de sécurité et de l’audit des mots de passe fournis par le logiciel ainsi que la protection du gestionnaire.

* Aide à l’utilisateur

Avec des seuils de majorité respectifs de 35%, 35%, 20% et 10%.

Nous allons maintenant appliquer ce que nous avons vu auparavant (les deux méthodes d’analyse : sommes pondérées et Electre tri) sur le jeu de données que nous avons créés à partir des données fournies par le magazine . 


## 2. Résultats de la méthode de Sommes pondérées : 

In [1]:
import os
import sys
module_path = os.path.abspath(os.path.join('../src'))
if module_path not in sys.path:
    sys.path.append(module_path)   

In [2]:
from system import checkAdditiveModel, createUpdateModel, compareRankings
from optlang import Variable
from loader import getOriginalData, exportInExcel
from IPython.display import display, display_html, HTML
from json2html import *
from IPython.display import HTML

In [3]:
csv_name='../data/data_logiciels_original.xlsx'
export_name = './results_notebook/Logiciels_Analyse_Classement.xlsx'
result_original = getOriginalData(csv_name)

Nous avons dans un premier temps essayé vérifier si le classement proposé par le magazine était issu d’une somme pondérée. Nous avons établi un programme linéaire modélisant le classement proposé par le magazine. 

In [4]:
model_name_1 = 'Programme Lineaire - Classement Logiciels avec notes' 
result_2_1 = checkAdditiveModel(csv_name=csv_name,
                      model_name=model_name_1,
                      eval_expr='x1',
                      direction='max',
                      with_scores=True)
print(result_2_1)

Le Programme Lineaire - Classement Logiciels avec notes 
 du fichier ../data/data_logiciels_original.xlsx n'admet pas de solution


En reprenant exactement les notes affectées par le magazine, on s’aperçoit que le programme linéaire n’a pas de solution. Cela signifie que dans ces conditions, le classement présenté par le magazine ne peut être expliqué par une somme pondérée.


Nous nous sommes ensuite affranchis des notes finales présentées par le magazine.

In [5]:
model_name_2 = 'Programme Lineaire - Classement Logiciels sans note'
result_2_2 = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_2,
                  eval_expr='x1',
                  direction='max')


In [6]:
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_2_2.style.set_table_attributes("style='display:inline'").set_caption(model_name_2)

display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,16.5,13.0,13,13,14.225
1,b- LastPass,17.0,10.0,10,7,12.15
2,c- Roboform,12.0,13.0,10,7,11.45
3,d- Kaspersky,17.0,7.14286,10,10,11.45
4,e- Keeper,13.8571,10.0,10,10,11.35
5,f- 1Password,13.0,10.0,13,7,11.35
6,g- Enpass,10.0,7.14286,13,7,9.3
7,h- Norton,3.28571,17.0,7,7,9.2
8,i- True Key,12.5,11.5,0,7,9.1
9,j- Avast,13.0,7.0,7,7,9.1


In [7]:
%%capture
dict_max_x1 = compareRankings(result_original['Score'], result_2_2['Score'])
exportInExcel(export_name, 'Q2.2',
    [result_original, result_2_2],
    ['Modèle Original',model_name_2],
    [dict_max_x1])


In [8]:
print("Classement sans notes affectées")
display(HTML(json2html.convert(json = dict_max_x1)))

Classement sans notes affectées


0,1
coef - Spearman,1.0
p - Spearman,0.0
tau - Kendall,1.0
p_val - Kendall,0.0001196206154918
Diff Moyenne,-1.3325000000000018


#### Commentaires

Nous avons simplement considéré que chaque note pouvait aller de 0 à 20. L’ordre des notes affichées par le magazine étant cependant toujours respecté (Dashlane doit avoir une note supérieure à LastPass, etc…). Nous avons testé le programme sous ces nouvelles conditions et avons obtenu une solution réalisable. Cela signifie donc que sous ces conditions, les scores obtenus pour chaque logiciels peuvent être modélisés par un modèle de sommes pondérées selon les 4 critères énoncés (Utilisation sur ordinateurs, Utilisation sur appareils mobiles, Protection du gestionnaire et conseils de sécurité, Aide à l'utilisation). Les notes ne sont cependant pas les mêmes que celles affichées par le magazine. Des marques comme Norton ou Enpass passent sous la moyenne.


### 2.1 Modifications des contraintes, Maximisation et minimisations des produits extrêmes



Après cela, nous avons cherché à savoir comment évoluait le classement s’il on supprimait les contraintes d’égalité des logiciels ayant la même note dans le classement du magazine. Comme dans la partie précédente, nous avons cherché à maximiser et minimiser les scores des produits extrêmes (Dashlane et Avast),en modifiant les contraintes d'égalité C13 C15 et C19. 


In [9]:
#On retire les contraintes d'égalités de score des logiciels
update_model_test = createUpdateModel([], ['c13', 'c15', 'c19']) #c13 pour y3 = y4, c15 pour y5 = y6 et c19 pour y9 = 10


model_name_test = 'Programme Lineaire - Meilleur score Dashlane'
result_test_max = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_test,
                  eval_expr='y1',
                  direction='max',
                  update_model=update_model_test)

In [10]:
%%capture
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_test_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_test)
dict_max_y1 = compareRankings(result_original['Score'], result_test_max['Score'])

In [11]:
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

print("Classement Max Dashlane")
display(HTML(json2html.convert(json = dict_max_y1)))

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,16.5,16.5,16.5,16.5,16.5
1,b- LastPass,17.0,10.0,10.0,7.0,12.15
2,c- Roboform,10.0,13.0,10.0,7.0,10.75
3,d- Kaspersky,17.0,7.0,10.0,10.0,11.4
4,e- Keeper,13.0,10.0,10.0,10.0,11.05
5,f- 1Password,13.0,10.0,13.0,7.0,11.35
6,g- Enpass,10.0,7.0,13.0,7.0,9.25
7,h- Norton,0.0,17.0,7.0,7.0,8.05
8,i- True Key,10.0,10.0,0.0,7.0,7.7
9,j- Avast,13.0,7.0,7.0,7.0,9.1


Classement Max Dashlane


0,1
coef - Spearman,0.9235862696337804
p - Spearman,0.0001359168097324
tau - Kendall,0.828078671210825
p_val - Kendall,0.0011169267142126
Diff Moyenne,-1.4700000000000002


#### Commentaires

Après avoir modifié les contraintes d'égalité entre les scores identiques, nous nous apercevons que l'ordre des produits change. Roboform, Keeper et True Key descendent dans le classement. 

In [12]:
%%capture
model_name_test2 = 'Programme Lineaire - Pire score Dashlane'
result_test_min = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_test,
                  eval_expr='y1',
                  direction='min',
                  update_model=update_model_test)


dict_min_y1 = compareRankings(result_original['Score'], result_test_min['Score'])





In [13]:
%%capture
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_test_min.style.set_table_attributes("style='display:inline'").set_caption(model_name_test2)
dict_min_y1 = compareRankings(result_original['Score'], result_test_min['Score'])

exportInExcel(export_name, 'Dashlane',
             [result_original, result_test_max, result_test_min],
             ['Modèle Original',model_name_test, model_name_test2],
             [dict_max_y1,dict_min_y1])

In [14]:
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

print("Classement Min Dashlane")
display(HTML(json2html.convert(json = dict_min_y1)))

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,13,13,13,13,13.0
1,b- LastPass,17,10,10,7,12.15
2,c- Roboform,10,13,10,7,10.75
3,d- Kaspersky,17,7,10,10,11.4
4,e- Keeper,13,10,10,10,11.05
5,f- 1Password,13,10,13,7,11.35
6,g- Enpass,10,7,13,7,9.25
7,h- Norton,0,17,7,7,8.05
8,i- True Key,10,10,0,7,7.7
9,j- Avast,13,7,7,7,9.1


Classement Min Dashlane


0,1
coef - Spearman,0.9235862696337804
p - Spearman,0.0001359168097324
tau - Kendall,0.828078671210825
p_val - Kendall,0.0011169267142126
Diff Moyenne,-1.8200000000000005


#### Commentaires

Nous remarquons ici que le classement est identique à celui obtenu en maximisant le score de Dashlane.

In [15]:
%%capture
model_name_test3 = 'Programme Lineaire - Meilleur score Avast'
result_test_avast_max = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_test3,
                  eval_expr='y10',
                  direction='max',
                  update_model=update_model_test)



dict_max_y10 = compareRankings(result_original['Score'], result_test_avast_max['Score'])






In [16]:
%%capture
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_test_avast_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_test3)


In [17]:
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

print("Classement Max Avast")
display(HTML(json2html.convert(json = dict_max_y10)))

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,13.0,13.0,13.0,13.0,13.0
1,b- LastPass,17.0,10.0,10.0,7.0,12.15
2,c- Roboform,10.0,13.0,10.0,7.0,10.75
3,d- Kaspersky,17.0,7.0,10.0,10.0,11.4
4,e- Keeper,13.0,10.0,10.0,10.0,11.05
5,f- 1Password,13.0,10.0,13.0,7.0,11.35
6,g- Enpass,10.0,7.0,13.0,7.0,9.25
7,h- Norton,0.0,17.0,7.0,7.0,8.05
8,i- True Key,10.0,10.0,0.0,7.0,7.7
9,j- Avast,16.5,9.5,9.5,9.5,11.95


Classement Max Avast


0,1
coef - Spearman,0.64834532835219
p - Spearman,0.0425995398495612
tau - Kendall,0.5980568180967069
p_val - Kendall,0.0185761389929565
Diff Moyenne,-1.5349999999999997


#### Commentaire

Nous observons qu'Avast passe au-dessus de la moyenne et n'est plus du tout dernier au classement. Le coefficient de Spearman indique qu'il y a une importante variation entre le classement original et celui obtenu en maximisant Avast.

In [18]:
%%capture
model_name_test4 = 'Programme Lineaire - Pire score Avast'
result_test_avast_min = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_test4,
                  eval_expr='y10',
                  direction='min',
                  update_model=update_model_test)
dict_min_y10 = compareRankings(result_original['Score'], result_test_min['Score'])

In [19]:
%%capture
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_test_avast_min.style.set_table_attributes("style='display:inline'").set_caption(model_name_test4)


In [20]:
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

print("Classement Min Avast")
display(HTML(json2html.convert(json = dict_min_y10)))

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,13,13,13,13,13.0
1,b- LastPass,17,10,10,7,12.15
2,c- Roboform,10,13,10,7,10.75
3,d- Kaspersky,17,7,10,10,11.4
4,e- Keeper,13,10,10,10,11.05
5,f- 1Password,13,10,13,7,11.35
6,g- Enpass,10,7,13,7,9.25
7,h- Norton,0,17,7,7,8.05
8,i- True Key,10,10,0,7,7.7
9,j- Avast,13,7,7,7,9.1


Classement Min Avast


0,1
coef - Spearman,0.9235862696337804
p - Spearman,0.0001359168097324
tau - Kendall,0.828078671210825
p_val - Kendall,0.0011169267142126
Diff Moyenne,-1.8200000000000005


In [21]:
%%capture
exportInExcel(export_name, 'Avast',
             [result_original, result_test_avast_max, result_test_avast_min],
             ['Modèle Original',model_name_test3, model_name_test4],
             [dict_max_y10,dict_min_y10])

#### Commentaires

En comparant chacun des classements obtenus à celui du magazine, on observe les mêmes coefficients de Spearman et de Kendall, respectivement 92,36 % et 82,81%. Les classements obtenus évoluent donc dans le même sens que celui du magazine.
On remarque que la différence de moyenne est négative, cela signifie que les notes de notre classement sont en moyenne inférieure de 1,82 points que celle du classement du magazine.
On observe aussi que le classement obtenu est exactement le même que celui obtenu en maximisant et en minimisant le score de Dashlane.



### 2.2  Score global  maximal pour chaque produit

Enfin, nous avons décidé de ne plus prendre en compte l'ordre des notes établi par le classement du magazine (ex : La note de Dashlane n’est plus forcément meilleure que celle de LastPass, etc…).
En comparant le classement fourni par le magazine au nôtre, on constate un coefficient de Spearman de 89% et un coefficient de Kendall de  76%. Ceci semble cohérent compte tenu de la variation du classement de nos logiciels (2 logiciels ex-aequo au dernier rang contre 2 logiciels ex-aequo à l'avant dernier rang.

In [22]:
%%capture
update_model_Q4 = createUpdateModel([], ['c11', 'c12', 'c13', 
                                                                    'c14', 'c15', 'c16',
                                                                    'c17', 'c18', 'c19'])

    
    
model_name_7 = 'Programme Lineaire - Score global maximal pour chaque produit'
result_4_1_all_max = checkAdditiveModel(csv_name=csv_name,
                  model_name=model_name_7,
                  eval_expr='all',
                  direction='max',
                  update_model=update_model_Q4)
   
dict_max_all = compareRankings(result_original['Score'], result_4_1_all_max['Score']) 
   

In [23]:
%%capture
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = result_4_1_all_max.style.set_table_attributes("style='display:inline'").set_caption(model_name_7)


In [24]:
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

print("Classement Max tous les produits")
display(HTML(json2html.convert(json = dict_max_all)))

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,16.5,16.5,16.5,16.5,16.5
1,b- LastPass,20.0,12.5,12.5,9.5,14.825
2,c- Roboform,12.5,16.5,12.5,9.5,13.6
3,d- Kaspersky,20.0,9.5,12.5,12.5,14.075
4,e- Keeper,16.5,12.5,12.5,12.5,13.9
5,f- 1Password,16.5,12.5,16.5,9.5,14.4
6,g- Enpass,12.5,9.5,16.5,9.5,11.95
7,h- Norton,6.5,20.0,9.5,9.5,12.125
8,i- True Key,12.5,12.5,6.5,9.5,11.0
9,j- Avast,16.5,9.5,9.5,9.5,11.95


Classement Max tous les produits


0,1
coef - Spearman,0.8926548357716761
p - Spearman,0.0005093751240016
tau - Kendall,0.7676494735787385
p_val - Kendall,0.0027071274871154
Diff Moyenne,1.2324999999999988


In [25]:
%%capture
exportInExcel(export_name, 'Q4',
                 [result_original, result_4_1_all_max],
                 ['Modèle Original',model_name_7],
                 [dict_max_all])

#### Commentaire

En observant la différence moyenne, on remarque qu’elle est plus importante avec les hypothèses actuelles. Puisque la différence de moyenne est positive cela signifie que les notes de notre classement sont en moyenne supérieure de 1,23 points que celle du classement du magazine.

In [26]:
df2 = result_4_1_all_max.sort_values(by='Score', ascending=False)
df1_s = result_original.style.set_table_attributes("style='display:inline'").set_caption('Modèle original')
df2_s = df2.style.set_table_attributes("style='display:inline'").set_caption(model_name_7)
display_html(df1_s._repr_html_()+df2_s._repr_html_(), raw=True)

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,++,++,++,++,15.0
1,b- LastPass,+++,+,+,-,14.0
2,c- Roboform,+,++,+,-,13.0
3,d- Kaspersky,+++,-,+,+,13.0
4,e- Keeper,++,+,+,+,12.5
5,f- 1Password,++,+,++,-,12.5
6,g- Enpass,+,-,++,-,12.0
7,h- Norton,--,+++,-,-,11.0
8,i- True Key,+,+,--,-,9.5
9,j- Avast,++,-,-,-,9.5

Unnamed: 0,Produit,Ordinateurs,Mobiles,Protection,Aide,Score
0,a- Dashlane,16.5,16.5,16.5,16.5,16.5
1,b- LastPass,20.0,12.5,12.5,9.5,14.825
5,f- 1Password,16.5,12.5,16.5,9.5,14.4
3,d- Kaspersky,20.0,9.5,12.5,12.5,14.075
4,e- Keeper,16.5,12.5,12.5,12.5,13.9
2,c- Roboform,12.5,16.5,12.5,9.5,13.6
7,h- Norton,6.5,20.0,9.5,9.5,12.125
6,g- Enpass,12.5,9.5,16.5,9.5,11.95
9,j- Avast,16.5,9.5,9.5,9.5,11.95
8,i- True Key,12.5,12.5,6.5,9.5,11.0


Le classement obtenu change beaucoup par rapport à celui du magazine. Nous remarquons notamment qu'Avast n'est plus dernier et que 1Password remonte bien dans le classement également.

# Classification des logiciels et mots de passe

## 1.2 Application d’une démarche de classification multicritère : la méthode ELECTRE TRI

Dans cette partie, au lieu d’attribuer une note (/20) à chaque logiciels , nous allons plutôt l’affecter à une classe à l’aide d’une approche ne nécessitant pas une normalisation des critères : La méthode ELECTRE TRI. Cette dernière est une approche d’Aide MultiCritère à la Décision qui vise à résoudre des problèmes d’affectation (classification) d’objets dans des catégories prédéfinies.

Comme indiqué ci-dessus, les poids associés aux quatre critères du classement des logiciels, utilisations sur ordinateurs,utilisation sur mobiles , protection du gestionnaire et aide à l'utilisatione, sont donnés par le vecteur W = (0.35;0.35;0.2;0.1). Nous retenons ici comme catégories ou classes, les 5 catégories suivantes (compatibles avec celles suggérées par le magazine) : ‘Très Bon” (catégorie C5), “Bon” (catégorie C4), “Acceptable” (C3), “Insuffisant” (catégorie C2) et “Inacceptable” (C1).


La méthode ELECTRE-TRI consiste alors à affecter chacune des 10 logiciels à une de ces 5 catégories.
On va également supposer que chaque catégorie Ci est délimitée par une frontière supérieure notée bi+1 et une frontière inférieure bi. Les frontières bi+1 et bi sont appelées “profils” et représentent des couches-culottes de référence qui peuvent être fictives. Il y a une dominance paréto-stricte entre bi+1 et bi. Pour ce classement des couches, nous aurons :
• C1 délimitée par b2 et b1 ; 
• C2 délimitée par b3 et b2 ; 
• C3 délimitée par b4 et b3;
• C4 délimitée par b5 et b4;
• C5 délimitée par b6 et b5.

Ainsi, comme l’affectation se fait dans 5 catégories distinctes, le profil b3 représente la frontière entre les classes “Très Bon” et “Bon”, et b2 la frontière entre les classes “Bon” et “Moyen”.

Le principe de la méthode ELECTRE TRI consiste, non pas à comparer les logiciel entre eux, mais à les comparer aux six logiciels de référence b6, b5, b4, b3, b2 et b1 dont les évaluations sur chaque critère sont résumés à la Table 2. 

Attention : dans ce tableau, les profils b6 et b1 doivent toujours avoir des valeurs extrêmes, ne pouvant jamais être atteintes, sur chaque critère.

Ainsi, l’affectation d’un logiciel à une catégorie dépendra de sa comparaison aux profils b6, b5, b4, b3, b2 et b1. Plus formellement, l’affectation d’une couches-culottes dans les catégories se base sur le concept de sur-classement.

<img src="../docs/tableaulogiciel.png">

On dira qu’un logiciel H surclasse le profil bi (respectivement le profil bi surclasse le logiciel H) et on note H S bi (respectivement bi S H) si H est au moins aussi bon que bi (respectivement bi est au moins aussi bon que H) sur une majorité de les critères (la majorité étant définie par un seuil de majorité λ). Les étapes de la méthode ELECTRE TRI se décrivent comme suit :

### Etape 1 : Matrices de concordances Partielles

Pour chaque critère j, l’indice de concordance partiel entre le logiciel H et le profil bi est donné par :

<img src="../docs/concorde.png">

avec gj(H) et gj(bi) représentant respectivement le score du logiciel H et bi sur le critère j. Dans notre exemple, ce score représente l’évaluation qualitative attribuée à H et bi . Par conséquent, la comparaison gj (H ) ≥ gj (bi ) signifie simplement que la valeur qualitative de H est au moins aussi bonne que celle de bi.

In [27]:
import os
import sys
module_path = os.path.abspath(os.path.join('./src'))
if module_path not in sys.path:
    sys.path.append(module_path)

In [28]:

from electre_tri import ConcordancePartielleHbi, ConcordancePartiellebiH, ConcordonceGlobaleHbi,ConcordonceGlobalebiH 
from electre_tri import SurclassementHbi,SurclassementbiH,EvaluationPessimiste,EvaluationOptimiste, compareClassification
from loader import getElectreTriData, exportInExcel
import pandas as pd

In [35]:
csv_name='../data/data_logiciels_original.xlsx'
direction="max"
result_original = getElectreTriData(csv_name) 
lambda_2=0.75

#### commentaires : 

nous avons ajouté les libraires ainsi les listes des fonctions que nous avons implementé afin de  calculer nos matrices de concodances partielles par la  suite .

In [30]:
result_2_5_1Hbi = ConcordancePartielleHbi(csv_name=csv_name,
                      direction=direction)

result_2_5_1biH = ConcordancePartiellebiH(csv_name=csv_name,
                      direction=direction)

les fonctions concordanceHbi et concordancebiH renvoit une liste de matrice selon les nombre de critères .
Pour les logiciels on aura 4 matrices ,  pour les ordinateurs ,mobiles,protection du gestionnaire et aide à l'utilisation .

### Etape 2 : Matrcies de concordances Globales

L’indice de concordance global entre le logiciel H et le profil bi est donné par la formule suivante :

<img src="../docs/globale.png">

#### calculons les matrices de concordances globaux  globaux 


In [31]:
result_2_5_2Hbi = ConcordonceGlobaleHbi(csv_name=csv_name,
                      direction=direction )

result_2_5_2_biH = ConcordonceGlobalebiH(csv_name=csv_name,
                      direction=direction )

le resultat de la premiere fonction correspond au matrice  C(H,bi) de concordance globale pour les 4 critères des logiciels .

la resultat de la deuxième fonction correspond au matrice  C(bi,H) de concordance globale pour les 4 critères des logiciels .

Nous allons par la suite utilser ces matrices afin calculer les surclassements et les methodes d'evaluation pessimiste optimiste .

###  Etape 3  : La methode de surclassment des logiciels

on dit : 

H surclasse bi et on notera H S bi si et seulement si C(H, bi) ≥ λ.

bi surclasse H et on notera bi S H si et seulement si C(bi, H) ≥ λ.

PS : λ est le seuil de majorité généralement superieure à 50 %

####  test de la fonction SurclassementHbi et SurclassementbiH selon λ = 75%



In [32]:
result_2_5_3Hbi=SurclassementHbi(lamda=lambda_2,
                      csv_name=csv_name,
                      direction=direction)


result_2_5_3biH = SurclassementbiH(lamda=lambda_2,
                     csv_name=csv_name,
                     direction=direction)

### Etape 4  Procedures d'evaluation Optimiste et pessimiste

#### a. Test des procedures EvalOptimiste et EvalPessimiste ainsi les taux de mauvaise classification(optimiste pessimiste) selon λ = 75 % 

In [36]:
EvalPessimisteResult_lambda_2 = EvaluationPessimiste(lamda=lambda_2,
                     csv_name=csv_name,
                     direction=direction)
EvalOptimisteResult_lambda_2 = EvaluationOptimiste(lamda=lambda_2,
                     csv_name=csv_name,
                     direction=direction)  
taux_mauvaise_classification_opt_lambda_2= compareClassification(TypeEval="optimiste",
                                                       lamda=lambda_2,
                                                       csv_name=csv_name,
                                                       direction=direction)
taux_mauvaise_classification1_pess_lambda_2 = compareClassification(TypeEval="pessimiste",
                                                       lamda=lambda_2,
                                                       csv_name=csv_name,
                                                       direction=direction)


result_original['Eval Pessimiste'] = EvalPessimisteResult_lambda_2
result_original['Eval Optimiste'] = EvalOptimisteResult_lambda_2
display(result_original)

    
print("Taux mauvaise classification Optimiste", taux_mauvaise_classification_opt_lambda_2,'%')
   
print("Taux mauvaise classification Pessimiste", taux_mauvaise_classification1_pess_lambda_2,'%')


df_Eval_Opt_lambda_2=pd.DataFrame(EvalOptimisteResult_lambda_2,columns=["Classement Optimiste"])
df_Eval_Pes_lambda_2=pd.DataFrame(EvalPessimisteResult_lambda_2,columns=["Classement Pessimiste"])


new_df_lambda_2 = pd.concat([result_original, df_Eval_Opt_lambda_2, df_Eval_Pes_lambda_2], axis=1, sort=False)

result_lambda_2 = {"Tx Optimiste": taux_mauvaise_classification_opt_lambda_2, "Tx Pessimiste" :taux_mauvaise_classification1_pess_lambda_2}  

Unnamed: 0,Produit,Note_magazine,Eval Pessimiste,Eval Optimiste
0,a- Dashlane,C4,Bon,Bon
1,b- LastPass,C4,Acceptable,Bon
2,c- Roboform,C4,Acceptable,Acceptable
3,d- Kaspersky,C4,Insuffisant,Bon
4,e- Keeper,C3,Acceptable,Acceptable
5,f- 1Password,C3,Acceptable,Acceptable
6,g- Enpass,C3,Insuffisant,Insuffisant
7,h- Norton,C3,Très Insuffisant,Bon
8,i- True Key,C2,Insuffisant,Insuffisant
9,j- Avast,C2,Insuffisant,Acceptable


Taux mauvaise classification Optimiste 40.0 %
Taux mauvaise classification Pessimiste 50.0 %


#### b. Test des procedures EvalOptimiste et EvalPessimiste ainsi les taux de mauvaise classification(optimiste pessimiste) selon λ = 55 %

In [37]:
lambda_1 = 0.55
result_2_5_3Hbi=SurclassementHbi(lamda=lambda_1,
                      csv_name=csv_name,
                      direction=direction)


result_2_5_3biH = SurclassementbiH(lamda=lambda_1,
                     csv_name=csv_name,
                     direction=direction)

EvalPessimisteResult_lambda_1 = EvaluationPessimiste(lamda=lambda_1,
                     csv_name=csv_name,
                     direction=direction)
EvalOptimisteResult_lambda_1 = EvaluationOptimiste(lamda=lambda_1,
                     csv_name=csv_name,
                     direction=direction)  

taux_mauvaise_classification_opt_lambda_1= compareClassification(TypeEval="optimiste",
                                                       lamda=lambda_1,
                                                       csv_name=csv_name,
                                                       direction=direction)
taux_mauvaise_classification1_pess_lambda_1 = compareClassification(TypeEval="pessimiste",
                                                       lamda=lambda_1,
                                                       csv_name=csv_name,
                                                       direction=direction)


result_original['Eval Pessimiste'] = EvalPessimisteResult_lambda_1
result_original['Eval Optimiste'] = EvalOptimisteResult_lambda_1
display(result_original)
   
   
   
print("Taux mauvaise classification Opt", taux_mauvaise_classification_opt_lambda_1,'%')
   
print("Taux mauvaise classification Pessimiste", taux_mauvaise_classification1_pess_lambda_1,'%')

df_Eval_Opt_lambda1=pd.DataFrame(EvalOptimisteResult_lambda_1,columns=["Classement Optimiste"])
df_Eval_Pes_lambda1=pd.DataFrame(EvalPessimisteResult_lambda_1,columns=["Classement Pessimiste"])
   
new_df_lambda1 = pd.concat([result_original, df_Eval_Opt_lambda1, df_Eval_Pes_lambda1], axis=1, sort=False)

result_lambda1 = {"Tx Optimiste": taux_mauvaise_classification_opt_lambda_1, "Tx Pessimiste" :taux_mauvaise_classification1_pess_lambda_1  }

Unnamed: 0,Produit,Note_magazine,Eval Pessimiste,Eval Optimiste
0,a- Dashlane,C4,Bon,Bon
1,b- LastPass,C4,Acceptable,Acceptable
2,c- Roboform,C4,Acceptable,Acceptable
3,d- Kaspersky,C4,Acceptable,Acceptable
4,e- Keeper,C3,Acceptable,Acceptable
5,f- 1Password,C3,Bon,Bon
6,g- Enpass,C3,Acceptable,Acceptable
7,h- Norton,C3,Insuffisant,Insuffisant
8,i- True Key,C2,Acceptable,Acceptable
9,j- Avast,C2,Insuffisant,Insuffisant


Taux mauvaise classification Opt 60.0 %
Taux mauvaise classification Pessimiste 60.0 %


### Intérpretation des resultats pour λ = 55 % et λ = 75%

Nous remarquons que :

Comme pour le classement précédent des couches-culottes, les classements des logiciels de mots de passes proposés par les deux procédures ne sont pas les mêmes quand lambda=0.75, par contre ces derniers sont identiques lorsque lambda=0.55.

Le meilleur logiciel de mots de passe d’après les deux méthodes d’affectation est a- Dashlane.

Si on se réfère au classement optimiste, les logiciels b-Last Pass, d-Kaspersky et h-Norton sont bons aussi 
Les classements obtenues par Electre tri sont différents du résultat obtenue par le magazine, on remarque que le taux de mauvaise classification le plus bas est de 40% et il revient à la méthode optimiste pour un seuil de majorité égal à 55%, tout en sachant qu’on arrive même à un taux de mauvaise classification de 60% quand lambda=0.75.



In [38]:
%%capture
csv_export='./results_notebook/Logiciels_Analyse_Classement.xlsx'
exportInExcel(csv_export, 'Electre-tri-Logiciels',
                 [new_df_lambda1, new_df_lambda_2],
                 ['Modèle lambda 0.55', 'Modèle lambda 0.75'],
                 [result_lambda1, result_lambda_2], 
                 electre = True)