[Retour au sommaire](../index.ipynb)

# Traitement de données en tables : tri

Cette année nous avons implémenté en Python deux types d'algorithmes de tri:
- Le [tri par selection](../8_Algorithmique/2_tri_insertion_selection.ipynb#tri_selection)
- Le [tri par insertion](../8_Algorithmique/2_tri_insertion_selection.ipynb#tri_insertion)

Python possède évidemment sa propre implémentation native du tri. (Il en existe d'ailleurs plusieurs) 

## La méthode *sort* pour les listes

Les listes possèdent leur propre méthode *sort* qui modifie directement la liste, on appelle cela un tri en place (in place).

In [None]:
liste = [8,6,4,2,0,7,5,3,1]
liste.sort()
liste

In [None]:
liste.sort(reverse=True)
liste

In [None]:
help(liste.sort)

Il est également possible de définir sa propre fonction de tri.

In [None]:
# take second element for sort
def takeSecond(elem):
    return elem[1]

# random list
random = [(2, 2), (3, 4), (4, 1), (1, 3)]

# sort list with key
random.sort(key=takeSecond)

# print list
print('Sorted list:', random)

## La fonction sorted

Cette fonction, contrairement à la méthode *sort* qui s'applique uniquement aux listes, permet de tri tout type d'itérable:

- liste
- tuple
- chaîne
- dictionnaire
- ...

Contrairement à la méthode *sort*, cette fonction renvoie un nouvelle itérable et **n'affecte pas l'iterable d'origine**.

Voici sa syntaxe

```
Syntaxe: sorted (iterable, key, reverse = False)

Paramètres:
Iterable: séquence (liste, tuple, chaîne) ou collection (dictionnaire, ensemble, frozenset) ou tout autre itérateur à trier.
Clé (facultatif): une fonction qui servirait de clé ou de base de comparaison de tri.
Inverser (facultatif): Si défini sur True, l’itérable serait trié dans l’ordre inverse (décroissant), par défaut, il est défini sur False.

Type de retour : renvoie une liste triée.
```

### Un tri simple

Commençons simplement avec une **liste de mots**.

In [None]:
phrase = "Bonjour, comment allez vous ?"
mots = phrase.split(' ')
mots_tries = sorted(mots)
mots_tries

In [None]:
mots # La liste d'origine est conservée.

Cette fonction s'applique également aux **clés de dictionnaires**.

In [None]:
dico = {26:'Z',4:'D', 1:'A', 3:'C'}
sorted(dico)

### Un tri qui utilise une clef

Le paramètre *key* permet de préciser une fonction qui peut être appelée sur chacun des éléments de l'itérable.


In [None]:
lettres = ('a','E', 'i', 'o', 'U', 'y') # ici on utilise un tuple
lettres_triees1 = sorted(lettres) # Les lettres majuscules précèdent les lettres minuscules
lettres_triees1

In [None]:
lettres_triees2 = sorted(lettres, key = str.lower) # Ici on précise que la fonction lower (minuscule) est prise en compte
lettres_triees2

Il est également possible de trier selon les fonctions *itemgetter* et *attrgetter*.

Avant de faire un tri expliquons ce que sont ces fonctions. Les opérateurs standards de Python sont réportoriés dans le module [operator](https://docs.python.org/fr/3/library/operator.html#module-operator).
Quand on effectue une opération comme 2+3 python utilise la fonction *add*.

In [None]:
from operator import add
add(2,3)

De même, l'accès aux éléments d'un itérateur s'effectue par *itemgetter*.

In [None]:
from operator import itemgetter

eleves = (('Régis', '2nde1', 22),
          ('Mathilde', '1ere2', 17),
          ('Robert', '1ere1', 16),
          ('Gaston', '2nde1', 16),
          ('Maurice', '1ere3', 17))
# Nous allons trier par classe puis par age
eleves_tries = sorted(eleves, key=itemgetter(1,2))
eleves_tries

De même pour une liste de dictionnaires

In [None]:
eleves = [{'prenom':'Régis', 'classe':'2nde1', 'age':22},
          {'prenom':'Mathilde', 'classe':'1ere2', 'age':17},
          {'prenom':'Robert', 'classe':'1ere1', 'age':16},
          {'prenom':'Gaston', 'classe':'2nde1', 'age':16},
          {'prenom':'Maurice', 'classe':'1ere3', 'age':17},
         ]
# Nous allons trier par classe puis par age
eleves_tries = sorted(eleves, key=itemgetter('classe','age'))
eleves_tries

Puis dans l'ordre inverse avec le paramètre *reverse* qui vaut True.

In [None]:
# Nous allons trier par classe puis par age, le tout dans l'ordre inverse
eleves_tries = sorted(eleves, key=itemgetter('classe','age'), reverse = True)
eleves_tries

Il est également possible de créer ses propres fonctions de tris, pour cela, [la documentation](https://docs.python.org/fr/3/howto/sorting.html) est là pour ça.

## Application aux données issues d'un fichier csv

Dans le chapitre précédent nous avons vu comment **chercher et filtrer** nos données.
Il est également important de savoir **trier nos données**.

### En utilisant la fonction *sorted* de Python

 - Trier les collèges par nom de commune puis par nom d'établissement.
 - Trier les collèges par nom de commune puis par statut.

### En utilisant la librairie *[pandas](https://pandas.pydata.org/)*

La librairie pandas poosède ses [propres méthodes de tri](https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.sort_values.html).

In [51]:
import pandas as pd
colleges = pd.read_csv("https://www.data.gouv.fr/fr/datasets/r/a1075259-09ca-4c22-9e35-b2cd6bbf5c36", delimiter=';')
colleges.sort_values(by='nom_et')

Unnamed: 0,commune_et,nom_et,statut,adresse,code_postal,telephone,fax,courriel,point_geo_ban
46,CROZON,Alain,Public,10 rue Nominoë - BP 27,29160.0,02.98.27.04.44,02 98.26.20.31,ce.0290032c@ac-rennes.fr,"48.250987,-4.491672"
91,BREST,Anna Marly,Public,8 rue Jules Lesven - BP 32049,29220.0,02.98.80.43.93,02 98 46 71 28,ce.0291661y@ac-rennes.fr,"48.402453,-4.473504"
0,BREST,Anne-Marie Javouhey (St Sauveur),Privé,4 rue du Rempart - BP 60417,29604.0,02.98.45.17.70,02 98 05 28 11,grp29.rd-javouhey.brest@enseignement-catholiqu...,"48.383137,-4.502319"
63,ILE-DE-BATZ,Annexe Les Iles-du-Ponant,Public,,,,,,"48.744036,-4.01158"
36,OUESSANT,Annexe Les Iles-du-Ponant,Public,,,,,,"48.457085,-5.098181"
...,...,...,...,...,...,...,...,...,...
53,BREST,Sainte-Anne,Privé,20 rue Lamotte Picquet - BP 22021,29220.0,02.98.44.76.82,02 98 43 30 65,grp29.ste-anne.brest@enseignement-catholique.bzh,"48.396535,-4.490385"
68,PLOUGASTEL-DAOULAS,Sainte-Anne,Privé,9 rue Jean Corre B.P. 11,29470.0,02.98.40.36.12,02 98 40 37 65,col29.ste-anne.plougastel@enseignement-catholi...,"48.372944,-4.371936"
21,QUIMPERLE,Théodore Hersart de La Villemarqué,Public,1 rue Jules Ferry,29391.0,02.98.96.02.54,02 98 96 09 75,ce.0290107j@ac-rennes.fr,"47.869245,-3.547144"
22,PLOUZANE,Victoire Daubié,Public,Avenue Jacques Prévert BP 25,29280.0,02.98.45.89.30,02 98 45 07 36,ce.0291753y@ac-rennes.fr,"48.381207,-4.606047"


<div class="alert alert-infos">Faire les tris demandés en csv avec la librairie pandas.</div>

<table style="width:100%">
    <tr>
        <td style="text-align:left;"><a href="2_recherche.ipynb"><< 2. Rechercher des données</a></td>
        <td style="text-align:right;"><a href="4_fusion.ipynb">4. Fusionner des tables >></a></td>
    </tr>
</table>

[Retour au sommaire](../index.ipynb)