<img style='margin-right:0' src="http://dinfo.ca/logoDptInfo.jpg" width=300>

# Tris de données (Python)
---

Les tris en Python s'effectuent selon deux (2) mécanismes:

- méthode `sort()` qui modifie sur-place la collection
- fonction prédéfinie `sorted()` qui génère une nouvelle liste

In [1]:
sorted([6,2,5,8,9,1,3,7,4])

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [5]:
valeurs = [6,2,5,8,9,1,3,7,4]
valeurs.sort()
valeurs

[1, 2, 3, 4, 5, 6, 7, 8, 9]

#### Comparaison de valeurs numériques

In [8]:
sorted([12.0, 24.0, 12.5, 11.5, 10.0]) # ordre naturel

[10.0, 11.5, 12.0, 12.5, 24.0]

#### Comparaison de chaînes de caractères

In [10]:
sorted(['ab','ad','aa','bc','ba','dd'])

['aa', 'ab', 'ad', 'ba', 'bc', 'dd']

In [12]:
sorted(['ab','Ad','aa','bc','Ba','dd'])

['Ad', 'Ba', 'aa', 'ab', 'bc', 'dd']

In [26]:
# Basé sur la comparaison des chaînes
print("Marco" < "Marc")
print("Marc" < "Marco")
print("Marc-Antoine" < "Marc-Anthony")

False
True
False


In [27]:
if 'A' < 'a':
    print("Majuscule plus petite que minuscule")

Majuscule plus petite que minuscule


In [28]:
print("Valeur de 'A': décimal %d -- hex: %02x" % (ord('A'), ord('A')))
print("Valeur de 'a': décimal %d -- hex: %02x" % (ord('a'), ord('a')))

Valeur de 'A': décimal 65 -- hex: 41
Valeur de 'a': décimal 97 -- hex: 61


#### Représentation ASCII 7-bits

![](https://upload.wikimedia.org/wikipedia/commons/thumb/1/1b/ASCII-Table-wide.svg/800px-ASCII-Table-wide.svg.png)

In [31]:
sorted(['Marco','Marc','Marc-André','Marcel','Marc-Antoine'])

['Marc', 'Marc-André', 'Marc-Antoine', 'Marcel', 'Marco']

### Paramètre `key` au tri

On peut fournir un paramètre nommé (forme spéciale) qui est une fonction qui sera **invoquée par le tri**.  

Cette fonction n'accepte qu'un paramètre et le résultat sera utilisé _uniquement_ dans la comparaison.  

In [46]:
# Tri de chaînes sans considérer la casse de caractère
sorted(['ab','Ad','aa','bc','Ba','dd'], key=str.lower)

['aa', 'ab', 'Ad', 'Ba', 'bc', 'dd']

In [52]:
print( sorted(['ddddddd', 'ccccc', 'ddd','aa','z']) )
# Basé sur la longueur
print( sorted(['ddddddd', 'ccccc', 'ddd','aa','z'], key=len) )

['aa', 'ccccc', 'ddd', 'ddddddd', 'z']
['z', 'aa', 'ddd', 'ccccc', 'ddddddd']


#### Explication

Référence: `developers.google.com/edu/python/images/sorted-key.png`

![](https://developers.google.com/edu/python/images/sorted-key.png)

In [51]:
#### Définir notre propre fonction pour le tri
def inverserSigne(val):
    return -val
sorted([6,2,5,8,9,1,3,7,4], key=inverserSigne)

[9, 8, 7, 6, 5, 4, 3, 2, 1]

### Paramètre `reverse` au tri

* Préférable d'utiliser cette technique pour avoir l'ordre inverse (décroissant)

In [41]:
sorted([6,2,5,8,9,1,3,7,4], reverse=True)

[9, 8, 7, 6, 5, 4, 3, 2, 1]

In [42]:
sorted(['ab','ad','aa','bc','ba','dd'], reverse=True)

['dd', 'bc', 'ba', 'ad', 'ab', 'aa']

### Comparateur externe

Adaptation spéciale selon la nouvelle version de Python.

Fonction `cmp_to_key(mycmp)` à recopier intégralement.

In [47]:
def cmp_to_key(mycmp):
    'Convert a cmp= function into a key= function'
    class K(object):
        def __init__(self, obj, *args):
            self.obj = obj
        def __lt__(self, other):
            return mycmp(self.obj, other.obj) < 0
        def __gt__(self, other):
            return mycmp(self.obj, other.obj) > 0
        def __eq__(self, other):
            return mycmp(self.obj, other.obj) == 0
        def __le__(self, other):
            return mycmp(self.obj, other.obj) <= 0  
        def __ge__(self, other):
            return mycmp(self.obj, other.obj) >= 0
        def __ne__(self, other):
            return mycmp(self.obj, other.obj) != 0
    return K

def comparateurImpairPair(x, y):
    if x % 2 == 1:
        if y % 2 == 1:
            r = x - y
        else:
            r = -1
    elif y % 2 == 1:
        r = 1
    else:
        r = x - y
    return r
print( sorted([2,3,1,5,8,6,10,9]) )
print( sorted([2,3,1,5,8,6,10,9], key=cmp_to_key(comparateurImpairPair)) )

[1, 2, 3, 5, 6, 8, 9, 10]
[1, 3, 5, 9, 2, 6, 8, 10]


In [49]:
def comparateurLongueur(x,y):
    return len(x) - len(y)
print( sorted(['ddddddd', 'ccccc', 'ddd','aa','z'], key=cmp_to_key(comparateurLongueur)) )

['z', 'aa', 'ddd', 'ccccc', 'ddddddd']
