# Algorithmes gloutons - EXERCICES

Un algorithme glouton permet d'apporter une solution à un problème d'optimisation (*maximiser* ou *minimiser* une grandeur) tout en respectant certaines *contraintes*.


## Exercice 1

On cherche à sélectionner cinq nombres de la liste suivante en cherchant à avoir leur somme la plus grande possible (maximiser une grandeur) et en s'interdisant de choisir deux nombres voisins (contrainte).

| <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> | <!-- --> |
|---| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 15 | 4 | 20 |	17 | 11 | 8 | 11 | 16 |	7 | 14 | 2 | 7 | 5 | 17 | 19 | 18 |	4 |	5 |	13 | 8 |

Comme on souhaite avoir le plus grand résultat final, la stratégie gloutonne consiste à choisir à chaque étape le plus grand nombre possible dans les choix restants.

1. Appliquez cet algorithme glouton sur le tableau.
2. Vérifiez que $\{20, 18, 17, 16, 15\}$ est une autre solution possible.
3. Que dire de la solution gloutonne ?

## Exercice 2 : le problème du voyageur

Un voyageur a ciblé plusieurs villes qu'il souhaite visiter. Il cherche un itinéraire passant par toutes ces villes et qui minimise la distance totale parcourue. Les villes peuvent être visitées dans n'importe quel ordre mais aucune ne doit être négligée, et le visiteur doit revenir à la fin à sa ville de départ.

Le voyageur part de Nancy et souhaite visiter Metz, Paris, Reims et Troyes, avant de retourner à Nancy.

Voici un tableau donnant les distances kilométriques entre chacune des ces villes.

![tableau des distances](data/tableau_voyageur.png)

1. Quelle est la stratégie gloutonne à mettre en oeuvre ?
2. Mettez en oeuvre cette stratégie et donnez la solution.
3. Calculez la distance totale pour le parcours Metz - Reims - Paris - Troyes (départ et arrivée à Nancy sous-entendus)
4. Que dire de la solution gloutonne ?

## Exercice 3

### Introduction

Nous disposons d’une clé USB qui est déjà bien remplie et sur laquelle il ne reste que 8 Go de libre. Nous souhaitons copier sur cette  clé  des  fichiers  vidéos  pour  l’emporter  en  voyage.  Chaque  fichier  a  un poids  et  chaque  vidéo  a  une  durée.  La  durée  n’est pas proportionnelle à la taille car les fichiers sont de format différents, certaines vidéos sont de grande qualité, d’autres sont très compressées. Le tableau qui suit présente les fichiers disponibles avec les durées données en minutes.

| Nom 	| Durée en min (valeur) 	| Poids |
|---------	|-------	|---------	|
| Vidéo A 	| 114   	| 4.5 Go 	|
| Vidéo B 	| 85    	| 630 Mo  	|
| Vidéo C 	| 40    	| 3.35 Go 	|
| Vidéo D 	| 4     	| 85 Mo   	|
| Vidéo E 	| 18    	| 2,15 Go 	|
| Vidéo F 	| 80    	| 2,71 Go 	|
| Vidéo G 	| 5     	| 320 Mo  	|
| Vidéo H 	| 86    	| 3.7 Go  	|
| Vidéo I 	| 64     	| 2.4 Go  	|
| Vidéo J 	| 12     	| 6.4 Go  	|

On se demande quelles vidéos copier sur la clef pour obtenir une durée totale maximale ne dépassant pas 8 Go.

**Qestion 1** : Quel problème reconnaissez-vous ici ?

>**Objectifs** : 
- implémenter un algorithme glouton pour pour trouver une solution
- implémenter l'algorithme de *force brute* pour déterminer la solution optimale et comparer

La stratégie gloutonne choisie est la suivante : prendre toujours la vidéo de plus grand rapport $\frac{\text{valeur}}{\text{poids}}$ n'excédant pas la capacité restante. Il sera donc nécessaire de trier les vidéos selon ce critère.

### Représentation des données

On utilise un dictionnaire pour représenter une vidéo, la valeur étant la durée en minute et le poids étant donné en Go.

```python
{'nom': 'Vidéo A', 'valeur': 114, 'poids': 4.57}
```

On peut alors mémoriser l'ensemble des vidéos dans le tableau `table_videos` suivant.

In [25]:
table_videos = [{'nom' : 'video A', 'valeur' : 114, 'poids' : 4.5},
                {'nom' : 'video B', 'valeur' : 85, 'poids' : 0.63},
                {'nom' : 'video C', 'valeur' : 40, 'poids' : 3.35},
                {'nom' : 'video D', 'valeur' : 4, 'poids' : 0.085},
                {'nom' : 'video E', 'valeur' : 18, 'poids' : 2.15},
                {'nom' : 'video F', 'valeur' : 80, 'poids' : 2.71},
                {'nom' : 'video G', 'valeur' : 5, 'poids' : 0.32},
                {'nom' : 'video H', 'valeur' : 74, 'poids' : 3.7},
                {'nom' : 'video I', 'valeur' : 64, 'poids' : 2.4},
                {'nom' : 'video J', 'valeur' : 12, 'poids' : 6.4}]

On peut alors accéder aux éléments de cette table.

In [26]:
table_videos[0]['nom']

'video A'

In [27]:
table_videos[3]['valeur']

4

In [28]:
table_videos[9]['poids']

6.4

### Ecriture des fonctions utiles

Pour résoudre le problème, on a besoin d'accéder au poids des vidéos pour vérifier la contrainte du poids maximal. La fonction suivante permet de renvoyer le poids d'une vidéo entrée en paramètre (sous la forme d'un dictionnaire vu précédemment).

In [22]:
def poids(fichier):
    return fichier['poids']

assert poids({'nom' : 'video A', 'valeur' : 114, 'poids' : 4.5}) == 4.5
assert poids({'nom' : 'video D', 'valeur' : 4, 'poids' : 0.085}) == 0.085
assert poids({'nom' : 'video J', 'valeur' : 12, 'poids' : 6.4}) == 6.4

De même, on a besoin d'accéder aux durées des vidéos choisies pour connaître la durée totale de notre solution.

**Question 2** : Ecrivez une fonction `duree(fichier)` qui renvoie la durée (= valeur) d'une video entrée en paramètre (sous la forme d'un dictionnaire vu précédemment). Quelques assertions devant être vérifiées par votre fonction sont données ci-dessous.

In [None]:
def duree(fichier):
    # code à écrire ici


In [None]:
assert duree({'nom' : 'video A', 'valeur' : 114, 'poids' : 4.5}) == 114
assert duree({'nom' : 'video D', 'valeur' : 4, 'poids' : 0.085}) == 4
assert duree({'nom' : 'video J', 'valeur' : 12, 'poids' : 6.4}) == 12

De même, la stratégie gloutonne choisie prévoit de prendre la vidéo de plus grand rapport $\frac{\text{valeur}}{\text{poids}}$ n'excédant pas la capacité restante. Il est donc nécessaire d'accéder à cette donnée pour chaque vidéo.

**Question 3** : Ecrivez une fonction `rapport(fichier)` qui prend en paramètre une vidéo et renvoie son rapport $\frac{\text{valeur}}{\text{poids}}$. Quelques assertions devant être vérifiées par votre fonction sont données ci-dessous.

In [None]:
def rapport(fichier):
    # code à écrire ici
    

In [None]:
assert rapport({'nom' : 'video H', 'valeur' : 74, 'poids' : 3.7}) ==  20
assert rapport('nom' : 'video J', 'valeur' : 12, 'poids' : 6.4}) == 1.875
# vous remarquerez que l'on a pris soin de sélectionner les vidéos dont le rapport peut être représenté de manière exacte en machine

Enfin, comme le choix se fait par rapport $\frac{\text{valeur}}{\text{poids}}$ décroissant, il est judicieux de trier au préalable les vidéos par ordre décroissant selon ce rapport.

**Question 4** : Ecrivez une fonction `tri_rapport_decroissant(table_videos)` qui renvoie un *nouveau tableau* dans lequel les fichiers ont été triés par rapport $\frac{\text{valeur}}{\text{poids}}$ décroissant. Quelques assertions devant être vérifiées par votre fonction sont données ci-dessous.

*Indications* : l'instruction `help(sorted)` vous permet d'afficher l'aide de la fonction `sorted`. Si besoin, revoir le notebook sur le tri d'une table (Séquence 5, Chapitre 1, Activité 2).

In [24]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



In [None]:
def tri_rapport_decroissant(table_videos):
    # code à écrire ici
    

In [None]:
assert tri_rapport_decroissant(table_videos) == 
    [{'nom': 'video B', 'poids': 0.63, 'valeur': 85},
     {'nom': 'video D', 'poids': 0.085, 'valeur': 4},
     {'nom': 'video F', 'poids': 2.71, 'valeur': 80},
     {'nom': 'video I', 'poids': 2.4, 'valeur': 64},
     {'nom': 'video A', 'poids': 4.5, 'valeur': 114},
     {'nom': 'video H', 'poids': 3.7, 'valeur': 86},
     {'nom': 'video G', 'poids': 0.32, 'valeur': 5},
     {'nom': 'video C', 'poids': 3.35, 'valeur': 40},
     {'nom': 'video E', 'poids': 2.15, 'valeur': 18},
     {'nom': 'video J', 'poids': 6.4, 'valeur': 12}]

### Implémentation de l'algorithme glouton

**Question 5** : en vous inspirant de l'implémentation de l'algorithme glouton du rendu de monnaie (voir cours), écrivez une fonction `glouton(videos, poids_max)` qui prend en paramètre une table de vidéos `table_videos` et un poids maximal `poids_max` et renvoie une table `solution_glouton` contenant la solution gloutonne au problème.

In [None]:
def glouton(table_videos, poids_max):
    table_triee = tri_rapport_decroissant(videos)
    poids_total = 0
    solution_glouton = []
    # à compléter
    
    
    
    return solution_glouton

In [None]:
assert glouton(table_videos, 8) == 
    [{'nom': 'video B', 'poids': 0.63, 'valeur': 85},
     {'nom': 'video D', 'poids': 0.085, 'valeur': 4},
     {'nom': 'video F', 'poids': 2.71, 'valeur': 80},
     {'nom': 'video I', 'poids': 2.4, 'valeur': 64},
     {'nom': 'video G', 'poids': 0.32, 'valeur': 5}]

**Question 6** : Modifiez la fonction pour qu'elle renvoie également la durée totale de la solution gloutonne. Combien vaut-elle ?

### Implémentation de la *force brute*

Le principe est simple : il faut étudier tous les cas possibles. Ainsi, pour appliquer cette stratégie, il faut :
1. d'abord *énumérer* toutes les combinaisons possibles de vidéos 
2. puis conserver celles dont la capacité maximale n'est pas dépassée
3. enfin, trouver la meilleure solution parmi les combinaisons restantes

#### Etape 1 : énumération de toutes les combinaisons

Il s'agit de la difficulté majeure. Une approche consiste à créer des mots binaires représentant chaque combinaison. Par exemple, le mot '1101000001' signifie qu'on prend les vidéos A, B, D et J tandis que le mot '1111111111' signifie que l'on prend toutes les vidéos.

Dans notre exemple, nous avons 10 vidéos donc il y a $2^{10} = 1024$ combinaisons possibles. De manière générale il y a donc $2^n$ combinaisons pour un ensemble de $n$ vidéos.

Pour obtenir notre liste de mots binaires, on peut parcourir tous les entiers compris entre $0$ et $2^n-1$, les convertir en binaire et les ajouter à une liste appelée `combinaisons`.

>**Astuce** : la fonction `bin` prend un entier en paramètre et renvoie sa valeur binaire sous forme d'une chaîne de caractères. Par exemple, `bin(12)` renvoie la chaîne `'0b1101'`. Il suffira de supprimer les caractères `'0b'` en tête pour obtenir l'écriture binaire. On veillera également à compléter avec des zéros devant pour obtenir un mot de la longueur désirée.

In [23]:
combinaisons = []
n = len(table_videos)
for i in range(2**n):
    chaine = bin(i)[2:]  # le [2:] permet de supprimer les deux premiers caractères '0b'
    mot = '0'*(n-len(chaine)) + chaine # ajout de zéros devant pour obtenir que des mots de longeur n
    combinaisons.append(mot)

On peut vérifier que la liste `combinaisons` contient bien tous les mots binaires de longueur 10.

In [24]:
combinaisons

['0000000000',
 '0000000001',
 '0000000010',
 '0000000011',
 '0000000100',
 '0000000101',
 '0000000110',
 '0000000111',
 '0000001000',
 '0000001001',
 '0000001010',
 '0000001011',
 '0000001100',
 '0000001101',
 '0000001110',
 '0000001111',
 '0000010000',
 '0000010001',
 '0000010010',
 '0000010011',
 '0000010100',
 '0000010101',
 '0000010110',
 '0000010111',
 '0000011000',
 '0000011001',
 '0000011010',
 '0000011011',
 '0000011100',
 '0000011101',
 '0000011110',
 '0000011111',
 '0000100000',
 '0000100001',
 '0000100010',
 '0000100011',
 '0000100100',
 '0000100101',
 '0000100110',
 '0000100111',
 '0000101000',
 '0000101001',
 '0000101010',
 '0000101011',
 '0000101100',
 '0000101101',
 '0000101110',
 '0000101111',
 '0000110000',
 '0000110001',
 '0000110010',
 '0000110011',
 '0000110100',
 '0000110101',
 '0000110110',
 '0000110111',
 '0000111000',
 '0000111001',
 '0000111010',
 '0000111011',
 '0000111100',
 '0000111101',
 '0000111110',
 '0000111111',
 '0001000000',
 '0001000001',
 '00010000

#### Etape 2 : conservation des combinaisons possibles

On cherche maintenant à conserver uniquement les combinaisons ne dépassant pas la capacité maximale de 8 Go. Par exemple : 
- `'0000000001'` est à conserver puisqu'il s'agit uniquement de la vidéo J de 6.4 Go
- `'1000000001'` n'est pas à conserver car le poids total de cette combinaison (vidéos A et J) vaut 4.5 + 6.4 = 10.9 Go, ce qui dépasse la capacité maximale.

Pour cela, il faut d'abord associer à chaque combinaison la liste de vidéos correspondantes.

**Question 8** : Ecrivez une fonction `construction_table(combi)` qui prend en paramètre une combinaison `combi` (mot binaire écrit sous forme d'une chaîne de caractères) et qui renvoie une table `table_correspondante` avec les vidéos correspondantes. Quelques assertions devant être vérifiées par votre fonction sont données ci-dessous.

In [None]:
def construction_table(combi):
    table_correspondante = []
    # à compléter
    
    
    return table_correspondante

In [None]:
assert construction_table('0000000001') == [{'nom': 'video J', 'poids': 6.4, 'valeur': 12}]
assert construction_table('1000000001') == 
    [{'nom': 'video A', 'poids': 4.5, 'valeur': 114},
     {'nom': 'video J', 'poids': 6.4, 'valeur': 12}]
assert construction_table('1101000000') ==
    [{'nom': 'video A', 'poids': 4.5, 'valeur': 114},
     {'nom': 'video B', 'poids': 0.63, 'valeur': 85},
     {'nom': 'video D', 'poids': 0.085, 'valeur': 4}]

Maintenant que l'on sait construire la table de vidéos correspondant à une combinaison, il faut savoir calculer le poids total d'une table.

**Question 8** : Ecrivez une fonction `poids_total(table)` qui prend en paramètre une combinaison `table` (tableau de dictionnaires de la même forme que depuis le départ) et qui renvoie le poids total `poids_total` de celle-ci. Quelques assertions devant être vérifiées par votre fonction sont données ci-dessous.

In [29]:
def poids_total(table):
    poids_total = 0
    # à compléter
    
    return poids_total

In [36]:
table1 = [{'nom': 'video J', 'poids': 6.4, 'valeur': 12}]
table2 = [{'nom': 'video A', 'poids': 4.5, 'valeur': 114},
           {'nom': 'video J', 'poids': 6.4, 'valeur': 12}]
table3 = [{'nom': 'video A', 'poids': 4.5, 'valeur': 114},
          {'nom': 'video B', 'poids': 0.63, 'valeur': 85},
          {'nom': 'video D', 'poids': 0.085, 'valeur': 4}]

assert poids_total(table1) == 6.4   # on compare des nombres réels mais on a pris soin de bien choisir les exemples
assert poids_total(table2) == 10.9
assert poids_total(table3) == 5.215

Garder les tables de videos respectant la contrainte du poids maximal.

**Exercice9** : Ecrivez une fonction qui permet de conserver uniquement les tables de vidéos respectant la contrainte du poids maximal.

In [None]:
def extraire_tables_respect_contrainte(tables_videos, poids_max):
    tables_respect_contrainte = []
    # à compléter
    
    return tables_respect_contrainte

#### Etape 2 :  

>**Questions**
1. Appliquez chacune de ces stratégies gloutonnes à la situation précédente. 
2. Dans chaque cas, prouvez que la solution obtenue n'est pas optimale.

Dans le premier cas, en choisissant les objets par valeur décroissante, l'algorithme glouton donne le sac $\{A, D\}$ d'une valeur 4800 + 500 = 5300 €.

Dans le second cas, en choisissant les objets par masse croissante, l'algorithme glouton donne le sac $\{D, C, B\}$ d'une valeur 500 + 3000 + 4000 = 7500 €.

Pour le dernier cas, commençons par calculer le rapport $\frac{\text{valeur}}{\text{masse}}$ de chaque objet.

| objet  |  A  |  B  |  C  |  D  |
|:------:|:---:|:---:|:---:|:---:|
|  $\frac{\text{valeur}}{\text{masse}}$ |  600 |  800 |  750  |  500 |

Ainsi, en choisissant par rapport décroissant, l'algorithme glouton donne le sac $\{B, C, D\}$ d'une valeur 7500 €.