# Algorithmes gloutons

> __Remarque :__ le projet __"Harry se fait la malle !"__ était une introduction ludique aux algorithmes gloutons. Après la pratique, ce notebook a pour objet de théoriser cette notion.

Lors de la résolution d’un __problème d’optimisation__, la construction d’une solution se fait souvent de manière séquentielle, l’algorithme faisant à chaque étape un certain nombre de choix. 

> __Définition : Le principe glouton consiste à faire le choix qui semble le meilleur sur le moment (choix local), sans se préoccuper des conséquences dans l’avenir, et sans revenir en arrière__. 

Un algorithme glouton est donc un algorithme qui ne se remet jamais en question et qui se dirige le plus rapidement possible vers une solution. Aveuglé par son appétit démesuré, __le glouton n’est pas sûr d’arriver à une solution optimale__, mais il fournit un __résultat rapidement__. 

Même si la __solution n’est pas optimale__, il n’est pas rare que l’on s’en contente ([par exemple pour un problème NP-difficile, comme celui dit du "sac à dos"](https://www.youtube.com/watch?v=AgtOCNCejQ8)). On rentre alors dans le monde des algorithmes d’approximation. 

Pour que la méthode gloutonne ait une chance de fonctionner, __il faut que le choix local aboutisse à un problème similaire plus petit__. Chaque choix local successif permet d'avancer vers une solution globale "acceptable".

## Exemple du rendu de monnaie

Lors d'un achat en argent liquide, il arrive souvent que l'on soit obligé de rendre la monnaie. Si l'on imagine un pays dans lequel il n'y ait que des prix entiers, supposons qu’un achat induise un rendu de 49 €. Quelles pièces peuvent être rendues ? 

La réponse, bien qu’évidente, n’est pas unique. Quatre pièces de 10 €, 1 pièce de 5 € et deux pièces de 2 € conviennent. Mais quarante-neuf pièces de 1 € conviennent également ! 

Si la question est de __rendre la monnaie avec un minimum de pièces__, le problème change de nature.

Comment rendre la monnaie en utilisant le plus petit nombre de pièces ?

- On commence par choisir le système de monnaie utilisé
- On utilise un algorithme glouton en déterminant le choix fait à chaque étape :
  1. __On choisit la plus grande pièce disponible inférieure à la somme à rendre__
  2. On recommence sur la nouvelle somme à rendre.

> **Remarques :** 
- Le système de monnaie (type de pièces disponibles) permet ou non de répondre de façon correcte au problème. 
- Dans le système de pièces européen, l'algorithme glouton donne toujours une solution optimale.

## Algorithmes glouton de rendu de monnaie
### Préambule sur le choix de la boucle

Pour cet algorithme glouton, nous avons besoin de parcourir  le tableau contenant les valeurs de billets / pièces disponibles.

Laquelle de la __boucle POUR ou TANT QUE est la plus adaptée__ ?

Si nous savons par avance qu'il faudra, quoi qu'il arrive, parcourir TOUT le tableau, une boucle POUR est à privilégier. 

Ici, on peut considérer qu'il y aura un nombre de situations suffisament important où le parcours complet du tableau n'est pas utile : par exemple, dans tous les cas d'un rendu de monnaie avec un chiffre des unités pair, il sera inutile de rendre une pièce de 1 €.

__Nous privilegierons donc l'utilisation d'une boucle TANT QUE__, pour profiter de toutes les situations où le parcours du tableau ne sera pas complet.

### Algorithme glouton de rendu de monnaie, 1ère version

    VARIABLES

    somme_a_rendre : entier > 0 
    SYSTEME_MONNAIE : constante, tuple d'entiers trié par ordre décroissant
                      contenant la valeurs des pièces /billets
    pieces_rendues : tableau d'entiers

    DEBUT

        SYSTEME_MONNAIE ← (200, 100, 50, 20, 10, 5, 2, 1)
        pieces_rendues ← []
        i ←  0

        TANT_QUE somme_a_rendre > 0
            SI somme_a_rendre ≥ SYSTEME_MONNAIE[i]
                AJOUTER LA VALEUR SYSTEME_MONNAIE[i] À pieces_rendues
                somme_a_rendre ← somme_a_rendre − SYSTEME_MONNAIE[i] 
            SINON
                i ← i + 1
            FIN_SI
        FIN_TANT_QUE
    FIN


En voici la traduction en Python :

In [None]:
SYSTEME_MONNAIE = (200, 100, 50, 20, 10, 5, 2, 1)
SYSTEME_MONNAIE_IMPARFAIT = (200, 100, 50, 20, 10, 5, 2)

def rendu_de_monnaie(somme_a_rendre, systeme_monnaie):
    '''
    Calcule le nombre de pièces / billets à rendre pour une somme donnée
    
    Entrée : entier, somme sur laquelle il faut rendre la monnaie
             tuple d'entiers trié, système de monnaie utilisé
                                     (liste des pièces / billets disponibles)
    Sortie : liste de l'ensemble des pièces / billets à rendre

    '''

    pieces_rendues = []

    # i est l'indice de la première pièce à comparer avec à la somme à rendre
    # c'est à dire le plus gros billet

    i = 0

    while somme_a_rendre > 0:
        if somme_a_rendre >= systeme_monnaie[i]:
            pieces_rendues.append(systeme_monnaie[i])
            somme_a_rendre -= systeme_monnaie[i]                
        else:
            i += 1

    return pieces_rendues

In [None]:
# Tester le code ci-dessous avec... 
rendu_de_monnaie(11, SYSTEME_MONNAIE)

In [None]:
# Puis avec... 
rendu_de_monnaie(11, SYSTEME_MONNAIE_IMPARFAIT)

> __Commentaires :__
- Dans certains cas, un algorithme glouton ne sera pas en mesure de rendre un résultat optimal (moins de pièces possibles), ni même correct (somme à rendre réellement rendue) avec ce système de monnaie bis.
- Dans le cas d'un système de monnaie non performant (système non canonique), il est donc possible que cet algorithme produise une erreur. Dans l'exemple ci-dessus, après avoir testé la valeur de pièce la plus petite, la somme à rendre n'est toujours pas nulle : l'indice `i` du tableau sera supérieur au plus grand indice, ce qui entraîne une erreur.
- Cette erreur montre bien qu'un algorithme glouton n'apporte pas toujours de solution optimale à un problème donné car, dans notre cas, on pourrait tout à fait rendre la monnaie de façon optimale : `[5, 2, 2, 2]`. Seulement voilà, le glouton préfère toujours un solution optimale locale (donner immédiatement deux billets de 5 €) plutôt que d'envisager une solution optimale globale.

Proposer des solutions pour gérer ce type de situation au mieux (en tout cas "au moins pire"...) en améliorant le programme :

- On pourrait ajouter une assertion, avec message d'erreur, pour contrôler ce cas critique.
- On pourrait utiliser une boucle POUR à la place de la boucle TANT QUE, ce qui résoudrait l'erreur d'indice : le programme s'arrêterait correctement mais la somme rendue ne serait toujours pas exacte. C'est loin d'être totalement satisfaisant.

### Algorithme glouton de rendu de monnaie, 2nde version

Dans cette seconde version, on va directement calculer le nombre de pièces / billets de chaque valeur à rendre.

On en profite pour améliorer la présentation du résutat dans un dictionnaire.

    VARIABLES

    somme_a_rendre : entier > 0 
    SYSTEME_MONNAIE : constante, tuple d'entiers trié par ordre croissant
                      contenant la valeurs des pièces /billets
    pieces_rendues : dictionnaire entier: entier
                                  valeur de pièce : nb de pièces
    nb_pieces : entier, valeur temporaire

    DEBUT

        SYSTEME_MONNAIE ← (200, 100, 50, 20, 10, 5, 2, 1)
        pieces_rendues ← {}
        i ←  0

        TANT_QUE somme_a_rendre > 0
            nb_pieces ← somme_a_rendre // SYSTEME_MONNAIE[i]
            SI nb_pieces > 0
                pieces_rendues[SYSTEME_MONNAIE[i]] ← nb_pieces
                somme_a_rendre ← somme_a_rendre % SYSTEME_MONNAIE[i] 
            FIN_SI
            i ← i + 1
        FIN_TANT_QUE
    FIN
    
Cette fois_ci, c'est à vous de jouer avec Python pour implémenter cette deuxième version. Profitez-en pour ajouter une assertion qui affichera une message d'erreur explicite dans le cas d'un rendu de monnaie incomplet.

In [None]:
def rendu_de_monnaie_2(somme_a_rendre, systeme_monnaie):
    '''
    Calcule le nombre de pièces / billets à rendre pour une somme donnée
    
    Entrée : entier, somme sur laquelle il faut rendre la monnaie
             tuple d'entiers trié, système de monnaie utilisé
                                     (liste des pièces / billets disponibles)
    Sortie : dictionnaire de l'ensemble des pièces / billets à rendre

    '''

    pieces_rendues = {}

    # i est l'indice de la première pièce à comparer avec à la somme à rendre
    # c'est à dire le plus gros billet

    i = 0

    while somme_a_rendre > 0:
        assert i < len(systeme_monnaie), f"Le rendu de monnaie est incomplet : {pieces_rendues}"
        nb_pieces = somme_a_rendre // systeme_monnaie[i]
        if nb_pieces > 0:
            pieces_rendues[systeme_monnaie[i]] = nb_pieces
            somme_a_rendre = somme_a_rendre % systeme_monnaie[i]                
        i += 1
        
    return pieces_rendues

In [None]:
# Tester le code ci-dessous avec... 
rendu_de_monnaie_2(11, SYSTEME_MONNAIE)

In [None]:
# Puis avec... 
rendu_de_monnaie_2(11, SYSTEME_MONNAIE_IMPARFAIT)

### Algorithme glouton de rendu de monnaie, 3ème version

Dans cette troisième version, il vous est demandé de coder le rendu de monnaie avec une boucle POUR. Le résultat de cette fonction doit toujours être renvoyé dans un dictionnaire.

In [None]:
def rendu_de_monnaie_3(somme_a_rendre, systeme_monnaie):
    '''
    Calcule le nombre de pièces / billets à rendre pour une somme donnée
    
    Entrée : entier, somme sur laquelle il faut rendre la monnaie
             tuple d'entiers trié, système de monnaie utilisé
                                     (liste des pièces / billets disponibles)
    Sortie : dictionnaire de l'ensemble des pièces / billets à rendre

    '''

    pieces_rendues = {}
    
    for piece in systeme_monnaie:
        if somme_a_rendre >= piece:
            pieces_rendues[piece] = somme_a_rendre // piece
            somme_a_rendre = somme_a_rendre % piece
    return pieces_rendues

In [None]:
# Tester le code ci-dessous avec... 
rendu_de_monnaie_3(11, SYSTEME_MONNAIE)

## Le remplissage de sac à dos
### Principe

Le remplissage du sac à dos est la seconde situation classique d'utilisation d'algorithme glouton.

Sa transposition peut supporter de nombreux exemples :

- Un cambrioleur remplissant son sac, cherche à maximiser la valeur de son larcin.
- Ali-baba dans la caverne au trésor.
- Harry Potter souhaitant maximiser la valeur magique des objets emportés dans sa malle.

Dans tous ces cas, la difficulté vient du fait que leur sac / malle ne supporte qu'un poids limite (on aurait aussi pu choisir un volume limite).

### Le remplissage d'une clé USB
#### Principe

En voici une transposition plus... moderne :

Nous disposons d’une __clé USB__ qui est déjà bien remplie et sur laquelle __il ne reste que 5 Go de libre__. Nous souhaitons __copier sur cette clé des fichiers vidéos__ pour l’emporter en voyage. Chaque fichier a une taille et chaque vidéo a une durée. La durée n’est
pas proportionnelle à la taille car les fichiers sont de format différents, certaines vidéos sont de grande qualité, d’autres sont très compressées.

Nous souhaitons __emporter la plus grande durée de vidéos__ sur notre clé USB, pour nous occuper le plus longtemps possible.

Le tableau qui suit présente les __fichiers de vidéos disponibles avec les durées données en minutes__.

|Fichier |Durée |Taille|
|:--:|:--:|:--:|
|Video 1| 114 |4,57 Go|
|Video 2| 32 |630 Mo|
|Video 3 |20 |1,65 Go|
|Video 4| 4 |85 Mo|
|Video 5| 18 |2,15 Go|
|Video 6 |80 |2,71 Go|
|Video 7 |5 |320 Mo|

#### Le choix de la structure de données

Dans un premier temps, on peut se poser la question : __comment stocker les données de ce tableau pour une exploitation numérique ?__

1. Le plus simple est de se limiter à une __unique unité__ pour la taille, en Go par exemple.
2. Trouver une structure de donnée adaptée : __une table__.
3. Quel type de table ? Une __liste de tuples ou une liste de dictionnaires__.

#### L'algorithme glouton à la rescousse

Dans un second temps, appliquons la __logique gloutonne__ à notre situation : trouvons la __meilleure solution locale__, c'est à dire à chaque étape de remplissage.

__La meilleure solution locale consiste à sélectionner la vidéo ayant la durée la plus longue, peu importe sa taille__.

1. Il faut donc __trier notre taille en fonction de la durée des vidéos__.
2. __Parcourir la table__, vidéo par vidéo. En commençant par celle de plus longue durée.
3. __Copier cette vidéo si sa taille est inférieure à l'espace encore disponible__ sur la clé USB.

#### Le choix du type de boucle pour parcourir la table

Dans le cas présent, il parait très improbable de remplir notre clé USB exactement à son maximum de capacité. Tant que la clé n'est pas complètement pleine, il faut donc vérifier s'il n'y a pas une vidéo de taille plus petite que l'on pourrait encore ajouter.

__Dans le "problème du sac à dos", il parait don préférable d'utiliser une boucle POUR__ car il est très probable qu'il faille parcourir l'ensemble de la table.

#### Algorithme pour maximiser la durée des vidéos

Voici une proposition d'algorithme utilisant une __approche gloutonne pour maximiser la durée des vidéos__ présentes sur la clé USB.

Pour cet algorithme, on fait le choix d'une __table composée d'une liste de tuples__ :

```
table_videos = [('Video 1', 114, 4.57), ('Video 2', 32, 0.630),
                ('Video 3', 20, 1.65), ('Video 4', 4, 0.085),
                ('Video 5', 18, 2.15), ('Video 6', 80, 2.71),
                ('Video 7', 5, 0.320)]
```

    VARIABLES

    videos : liste de tuples
    videos_sur_USB : liste de tuples
    espace_libre : entier, espace disponible sur la clé USB

    DEBUT

        TRIER videos PAR ORDRE DECROISSANT DE DUREE

        POUR video DANS videos
            SI video[2] <=  espace_libre
                AJOUTER LA VALEUR video À videos_sur_USB
                espace_libre ← espace_libre − video[2]
            FIN_SI
        FIN_POUR
    FIN

In [None]:
table_videos = [('Video 1', 114, 4.57), ('Video 2', 32, 0.630),
                ('Video 3', 20, 1.65), ('Video 4', 4, 0.085),
                ('Video 5', 18, 2.15), ('Video 6', 80, 2.71),
                ('Video 7', 5, 0.320)]

def remplissage_cle(videos, espace_libre):
    '''
    Remplie une clé USB avec des films de durée maximale
    
    Entrée : entier, espace disponible sur la clé USB
             table, liste de tuples ('Vidéo', durée, taille)

    Sortie : table, liste de tuples ('Vidéo', durée, taille)
    '''

    videos_sur_USB = []
    
    # On trie avec la méthode .sort()
    # On utilise une fonction lambda pour choisir le critère durée
    # En effet, la durée est à l'indice 1 des tuples de vidéos
    # On ajoute le paramètre reverse=True pour trier par ordre décroissant
    table_videos.sort(key=lambda x: x[1], reverse=True)
    
    for video in table_videos:
        if video[2] <= espace_libre:
            videos_sur_USB.append(video)
            espace_libre -= video[2]         

    return videos_sur_USB

remplissage_cle(table_videos, 5)

#### Approfondissement

Voici quelques adaptations pour aller un peu plus loin...

1. Adapter le programme pour __maximiser la présence de films de petite taille__.

In [None]:
def remplissage_cle(videos, espace_libre):
    '''
    Remplie une clé USB avec des films de taille minimale
    
    Entrée : entier, espace disponible sur la clé USB
             table, liste de tuples ('Vidéo', durée, taille)

    Sortie : table, liste de tuples ('Vidéo', durée, taille)
    '''

    videos_sur_USB = []
    
    # On trie avec la méthode .sort()
    # On utilise une fonction lambda pour choisir le critère taille
    # En effet, la durée est à l'indice 2 des tuples de vidéos
    table_videos.sort(key=lambda x: x[2])
    
    for video in table_videos:
        if video[2] <= espace_libre:
            videos_sur_USB.append(video)
            espace_libre -= video[2]         

    return videos_sur_USB

remplissage_cle(table_videos, 5)

2. Adapter le programme pour __maximiser le ratio durée / taille__.

In [None]:
def remplissage_cle(videos, espace_libre):
    '''
    Remplie une clé USB avec des films de taille minimale
    
    Entrée : entier, espace disponible sur la clé USB
             table, liste de tuples ('Vidéo', durée, taille)

    Sortie : table, liste de tuples ('Vidéo', durée, taille)
    '''

    videos_sur_USB = []
    
    # On trie avec la méthode .sort()
    # critère : ratio durée / taille
    table_videos.sort(key=lambda x: (x[1] / x[2]), reverse=True)
    
    for video in table_videos:
        if video[2] <= espace_libre:
            videos_sur_USB.append(video)
            espace_libre -= video[2]         

    return videos_sur_USB

remplissage_cle(table_videos, 5)

3. Adapter le programme pour utiliser une __table sous la forme d'une liste de dictionnaires__.

In [None]:
table_videos = [{'Nom': 'Video 1', 'Durée': 114, 'Taille': 4.57},
                {'Nom': 'Video 2', 'Durée': 32, 'Taille': 0.630},
                {'Nom': 'Video 3', 'Durée': 20, 'Taille': 1.65},
                {'Nom': 'Video 4', 'Durée': 4, 'Taille': 0.085},
                {'Nom': 'Video 5', 'Durée': 18, 'Taille': 2.15},
                {'Nom': 'Video 6', 'Durée': 80, 'Taille': 2.71},
                {'Nom': 'Video 7', 'Durée': 5, 'Taille': 0.320}]

def remplissage_cle(videos, espace_libre):
    '''
    Remplie une clé USB avec des films de taille minimale
    
    Entrée : entier, espace disponible sur la clé USB
             table, liste de tuples ('Vidéo', durée, taille)

    Sortie : table, liste de tuples ('Vidéo', durée, taille)
    '''

    videos_sur_USB = []
    
    # On trie avec la méthode .sort()
    # critère : ratio durée / taille
    table_videos.sort(key=lambda x: (x['Durée'] / x['Taille']), reverse=True)
    
    for video in table_videos:
        if video['Taille'] <= espace_libre:
            videos_sur_USB.append(video)
            espace_libre -= video['Taille']         

    return videos_sur_USB

remplissage_cle(table_videos, 5)

## Que retenir ?
### À minima...

- Les algorithmes gloutons sont souvent utilisés pour résoudre les problèmes d'optimisation. 
- On cherche une solution optimale en effectuant le meilleur choix possible à chaque étape de l'algorithme (choix local). 
- Dans ce type de résolution, il n'y a pas de retour en arrière : lorsqu'un choix est fait, il n'est pas modifié par la suite. 
- On se retrouve donc à chaque étape, avec un problème de plus en plus petit à résoudre.
- Cette méthode ne fournit pas systématiquement la solution optimale au problème proposé.
- Savoir résoudre un rendu de monnaie par méthode gloutonne (algorithme + programmation).
  
### Au mieux...

- Savoir résoudre un remplissage de sac à dos par méthode gloutonne (algorithme + programmation).
- Pour cela, il faut savoir trier une table d'après un critère précis.
- Les paramètres `key` et `reverse` de la méthode `.sort()` permettent ce tri.
- Savoir choisir une boucle POUR ou une boucle TANT QUE, en fonction de la situation.

---
[![Licence CC BY NC SA](https://licensebuttons.net/l/by-nc-sa/3.0/88x31.png "licence Creative Commons CC BY-NC-SA")](http://creativecommons.org/licenses/by-nc-sa/3.0/fr/)
<p style="text-align: center;">Auteurs : Pascale Rey du Boissieu & David Landry, Lycée Clemenceau - Nantes</p>