<h1 style="text-align: center; font-size: 35px">Programme de Première - Algorithmes à connaître</h1>

Voici la liste des algorithmes du programme de Première à connaître :

* [Les algorithmes de parcours séquentiel d'un tablau](#Algorithmes-de-parcours-s%C3%A9quentiel-d'un-tableau) :
    * [Recherche d'un élément](#Recherche-d'un-élément)
    * [Nombre d'occurrences d'un élément](#Nombre-d'occurrences)
    * [Recherche d'un extremum](#Recherche-d'un-extremum) (minimum ou maximum)
    * [Calcul d'une moyenne](#Calcul-d'une-moyenne)
* [Les algorithmes de tri](#Algorithmes-de-tri) :
    * [Tri par sélection](#Tri-par-sélection)
    * [Tri par insertion](#Tri-par-insertion)
* [Algorithme de recherche dichotomique](#Algorithme-de-recherche-dichotomique)
* [Algorithme des $k$ plus proches voisins](#Algorithme-des-$k$-plus-proches-voisins)
* [Algorithmes gloutons](#Algorithmes-gloutons) :
    * [Rendu de monnaie](#Problème-du-rendu-de-monnaie)
    * [Sac à dos](#Problème-du-sac-à-dos)

# Algorithmes de parcours séquentiel d'un tableau

## Recherche d'un élément

On avait donné l'algorithme suivant qui utilisait un booléen `trouve` :

```python
def est_present(T, x):
    """Renvoie True si x est dans le tableau T et False sinon"""
    trouve = False
    for elt in T:
        if elt == x:
            trouve = True
    return trouve
```

Voici une version plus courte qui n'utilise pas de booléen.

In [1]:
# --- Parcours par valeur ---
def est_present(T, x):
    """Renvoie True si x est dans le tableau T et False sinon"""
    for elt in T:
        if elt == x:
            return True
    return False

# --- Parcours par indice ---
def est_present(T, x):
    """Renvoie True si x est dans le tableau T et False sinon"""
    for i in range(len(T)):
        if T[i] == x:
            return True
    return False

# JEU DE TESTS

assert est_present([1, 2, 3], 1) == True
assert est_present([1, 2, 3], 4) == False
assert est_present([1, 1, 1], 1) == True
assert est_present([1, 1, 1], 2) == False
assert est_present([1], 1) == True
assert est_present([1], 2) == False
assert est_present([], 1) == False

## Nombre d'occurrences

In [2]:
def nb_occurrences(T, x):
    """Renvoie le nombre d'occurrences de l'élément x dans le tableau T."""
    n = 0
    for e in T:
        if e == x:
            n = n + 1
    return n

# JEU DE TESTS

assert nb_occurrences([1, 2, 3], 1) == 1
assert nb_occurrences([1, 2, 1], 1) == 2
assert nb_occurrences([1, 2, 3], 4) == 0
assert nb_occurrences([], 1) == 0

## Recherche d'un extremum

In [3]:
def maximum(T):
    """Renvoie la valeur maximale d'un tableau T d'entiers supposé non vide."""
    assert len(T) > 0, "le tableau T doit être non vide"
    maxi = T[0]
    for i in range(1, len(T)):
        if T[i] > maxi:
            maxi = T[i]
    return maxi

# JEU DE TESTS

assert maximum([1, 2, 3]) == 3
assert maximum([1, 3, 2]) == 3
assert maximum([4, 1, 1]) == 4
assert maximum([5, 5, 5, 5]) == 5
assert maximum([-2, -1]) == -1
assert maximum([4]) == 4

La recherche du minimum est très similaire : on inverse juste le sens de l'inégalité dans la comparaison.

In [4]:
def minimum(T):
    """Renvoie la valeur minimale d'un tableau T d'entiers supposé non vide."""
    assert len(T) > 0, "le tableau T doit être non vide"
    mini = T[0]
    for i in range(1, len(T)):
        if T[i] < mini:
            mini = T[i]
    return mini

minimum([2, 4, 5, 1, 3])

1

La version avec le parcours par indice est facilement adaptable pour renvoyer la position de l'extremum si nécessaire.

On peut aussi utiliser un parcours par valeur mais qui ne permet pas de renvoyer directement la position de l'extremum et parcoure la première valeur alors que ce n'est pas utile. :

```python
def maximum(T):
    """Renvoie la valeur maximale d'un tableau T d'entiers supposé non vide."""
    assert len(T) > 0, "le tableau T doit être non vide"
    maxi = T[0]
    for e in T
        if e > maxi:
            maxi = e
    return maxi
```

## Calcul d'une moyenne

On utilise une variable `s` pour sommer les différents éléments du tableau. Il n'y a qu'à diviser par le nombre d'éléments du tableau pour avoir la moyenne.

In [5]:
def moyenne(T):
    """Renvoie la moyenne des valeurs du tableau T d'entiers supposé non vide."""
    assert len(T) > 0, "le tableau doit être non vide"
    s = 0
    for e in T:
        s = s + e
    return s / len(T)

# ESSAI

moyenne([8, 10, 12, 14])

11.0

# Algorithmes de tri

## Tri par sélection

C'est celui que l'on utilise généralement pour trier un paquet de cartes.

**Principe** : 

- Rechercher le plus petit élément du tableau, et l'échanger avec l'élément d'indice 0 ;
- Rechercher le second plus petit élément du tableau, et l'échanger avec l'élément d'indice 1 ;
- Continuer de cette façon jusqu'à ce que le tableau soit entièrement trié.

Cela revient à faire à chaque étape une recherche de minimum. 

<a title="Joestape89, CC BY-SA 3.0 &lt;http://creativecommons.org/licenses/by-sa/3.0/&gt;, via Wikimedia Commons" href="https://commons.wikimedia.org/wiki/File:Selection-Sort-Animation.gif"><img width="64" alt="Selection-Sort-Animation" src="https://upload.wikimedia.org/wikipedia/commons/9/94/Selection-Sort-Animation.gif"></a>


La version proposée effectue un tri *en place* : le tableau passé en paramètre est trié (le tableau de départ est perdu).

In [6]:
def echange(T, i, j):
    """Echange T[i] et T[j]"""
    temp = T[i]
    T[i] = T[j]
    T[j] = temp

def tri_par_selection(T):
    """Trie le tableau T dans l'ordre croissant."""
    for i in range(len(T)):        
        # recherche de l'indice du minimum dans T[i:n-1]
        ind_min = i
        for j in range(i+1, len(T)):
            if T[j] < T[ind_min]:
                ind_min = j        
        # échange avec l'élément d'indice i
        echange(T, i, ind_min)
        
# ESSAI

tab = [4, 1, 7, 8, 1, 0, 2, 3, 5, 10]
tri_par_selection(tab)
tab

[0, 1, 1, 2, 3, 4, 5, 7, 8, 10]

## Tri par insertion

**Principe** : 
- Prendre le deuxième élément du tableau et l'insérer à sa place parmi les éléments qui le précède ;
- Prendre le troisième élément du tableau et l'insérer à sa place parmi les éléments qui le précède ;
- Continuer de cette façon jusqu'à ce que le tableau soit entièrement trié.

Pour l'*insertion* on peut procéder en décalant les termes nécessaires pour "insérer" l'élément à sa bonne place dans la partie triée de gauche.

<a title="Swfung8, CC BY-SA 3.0 &lt;https://creativecommons.org/licenses/by-sa/3.0&gt;, via Wikimedia Commons" href="https://commons.wikimedia.org/wiki/File:Insertion-sort-example-300px.gif"><img width="256" alt="Insertion-sort-example-300px" src="https://upload.wikimedia.org/wikipedia/commons/0/0f/Insertion-sort-example-300px.gif"></a>

In [7]:
def tri_par_insertion(T):
    """Trie le tableau T dans l'ordre croissant"""
    for i in range(1,len(T)):
        x = T[i]                    # pour stocker l'élément T[i] à insérer
        j = i
        while j > 0 and x < T[j-1]: # tant que l'élément à insérer est plus petit que ses précédents (et qu'on n'a pas atteint le premier)
            T[j] = T[j-1]           # on décale le précédent vers la droite
            j = j - 1               # et on passe à celui qui précède
        T[j] = x                    # à la fin, on insère l'élément T[i] en position j
        
# ESSAI

tab = [4, 1, 7, 8, 1, 0, 2, 3, 5, 10]
tri_par_insertion(tab)
tab

[0, 1, 1, 2, 3, 4, 5, 7, 8, 10]

**Rappels** : Ces deux algorithmes de tri ont un *coût quadratique*, c'est-à-dire de l'ordre de $n^2$ où $n$ est la taille du tableau à trier.

# Algorithme de recherche dichotomique

C'est un algorithme très efficace pour chercher une valeur `v` dans un tableau `T` **déjà trié**.

**Principe** : On prend l'élément médian et on le compare à la valeur cherchée :
- si l'élément médian est égale à `v`, on a terminé
- si l'élément médian est strictement supérieur à `v`, on élimine toute la partie de droite restante et on recommence
- si l'élément médian est strictement inférieur à `v`, on élimine toute la partie de gauche restante et on recommence
Si on arrive au bout sans avoir trouvé `v` on sait qu'il n'y ait pas.

## Version *itérative* vue en Première

La fonction qui suit est légèrement améliorée car elle permet de renvoyer une position `m` de l'élément `v` s'il se trouve dans le tableau `T`. Elle renvoie `None` sinon.

In [8]:
def recherche_dichotomique(T, v):
    """renvoie une position de v dans le tableau T, supposé trié,
    et None si v ne s'y trouve pas"""
    g = 0
    d = len(T) - 1
    while g <= d:
        m = (g + d) // 2
        if v < T[m]:
            d = m - 1
        elif v > T[m]:
            g = m + 1
        else:
            return m
    return None

# ESSAIS

T = [1, 2, 2, 5, 6, 6, 7, 9, 9, 10, 10, 13, 13, 15]
recherche_dichotomique(T, 9), recherche_dichotomique(T, 20)

(8, None)

## Version *récursive* vue en Terminale

On répète à chaque fois les mêmes instructions mais sur un tableau plus petit, on peut donc écrire récursivement cet algorithme.

In [9]:
def recherche(T, v, g, d):
    """renvoie une position de v dans T[g..d], supposé trié,
    ou None si v ne s'y trouve pas"""
    # à compléter
    if g > d:
        return None
    m = (g + d) // 2
    if T[m] > v:
        return recherche(T, v, g, m - 1)
    elif T[m] < v :
        return recherche(T, v, m + 1, d)
    else:
        return m
    
## pour lancer le premier appel sur tout le tableau
def recherche_dichotomique(T, v):
    """Renvoie une position de v dans le tableau T, ou None si v ne s'y trouve pas"""
    # à compléter
    return recherche(T, v, 0, len(T) - 1)

# ESSAIS

T = [1, 2, 2, 5, 6, 6, 7, 9, 9, 10, 10, 13, 13, 15]
recherche_dichotomique(T, 9), recherche_dichotomique(T, 20)

(8, None)

# Algorithme des $k$ plus proches voisins

L’algorithme des $k$ plus proches voisins appartient à la famille des algorithmes d’apprentissage automatique (machine learning) qui constituent le poumon de l'intelligence artificielle actuellement. Pour simplifier, l'apprentissage automatique part souvent de données (data) et essaye de dire quelque chose des données qui n'ont pas encore été vues : il s'agit de généraliser, de prédire.

**Principe** : 

A partir d'un jeu de données et d'une donnée cible, l'algorithme des $k$ plus proches voisins détermine les $k$ données les plus proches de la cible.

**Données et préconditions** :

* une table `donnees` de taille $n$ contenant les données et leurs classes
* une donnée cible : `cible`
* un nombre $k$ inférieur à $n$
* une règle permettant de calculer la distance entre deux données

**Résultat** : un tableau contenant les *k* plus proches voisins de la donnée cible.

**Algorithme** :

1. Créer une table `distances_voisins` contenant les éléments de la table `donnees` et leurs distances avec la donnée `cible`.  
2. Trier les données de la table `distances_voisins` selon la distance croissante avec la donnée `cible`
3. Renvoyer les `k` premiers éléments de cette table triée.

> **Remarques**:
>- On peut ensuite prédire la classe de la donnée `cible` en prenant la classe majoritaire de ses $k$ plus proches voisins.
>- La valeur de $k$ influe sur la qualité de la prédiction.

Voici une implémentation dans laquelle la table `distances_voisins` contient des dictionnaires représentant toutes les données et dont la clé `distance` contient la distante entre chaque donnée et la cible.

In [10]:
def tri_distance(d):  # clé du tri (selon la clé 'distance' des dictionnaires)
    return d['distance']

def kppv(donnees, cible, k):
    # étape 1 : création de la table avec les distances
    
    distances_voisins = [0]*len(donnees)
    for i in range(len(donnees)):
        distances_voisins[i] = donnees[i]                  # recopie des données dans la tableau distances_voisins
        distance = distance_euclidienne(donnees[i], cible) # ici c'est la distance euclidienne qui a été choisie
        distances_voisins[i]['distance'] = distance        # ajout de la distance entre les données et la cible

    # étape 2 : tri par distance croissante
    
    distances_voisins_triee = sorted(distances_voisins, key=tri_distance)
    
    # étape 3 : récupération de k plus proches voisins
    
    k_plus_proches_voisins = [distances_voisins_triee[i] for i in range(k)]
    
    return k_plus_proches_voisins

# Algorithmes gloutons

Les *algorithmes gloutons* forment une catégorie d'algorithmes permettant de donner une solution à des problèmes d'optimisation qui visent à maximiser/minimiser une quantité (**plus court** chemin (GPS), **plus petit** temps d'exécution, **meilleure** organisation d'un emploi du temps, etc.)

Le principe d'un algorithme glouton est le suivant :
- résoudre un problème étape par étape
- à chaque étape, faire le choix optimal de moindre coût (de meilleur gain)

Le choix effectué à chaque étape n'est jamais remis en cause, ce qui fait que cette stratégie permet d'aboutir rapidement à une solution au problème de départ. C'est en ce sens que l'adjectif *greedy* (glouton/avare) caractérise ces algorithmes : il terminent rapidement (*glouton*) sans fournir beaucoup d'efforts (*avare*).

## Problème du rendu de monnaie

Il faut rendre de la monnaie en utilisant le moins de pièces (ou billets) possibles. On suppose que l'on dispose des pièces et billets en quantité illimitée.

**Idée** : Rendre toujours la plus grande pièce (ou billet) possible.

Voici une implémentation possible :

In [11]:
def rendu_monnaie_glouton(s, pieces):
        """Renvoie la solution gloutonne du rendu de monnaie d'une somme s entière et positive. 
        Le tableau pieces contient les valeurs des pièces à disposition dans l'ordre décroissant."""
        solution = []
        i = 0 # position de la première pièce à tester (la plus grande)
        while s > 0 and i < len(pieces): # tant qu'il reste de l'argent à rendre et que toutes les pièces n'ont pas été testées
            valeur = pieces[i] # on prend la pièce d'indice i
            if valeur <= s: # s'il est possible de rendre la pièce
                solution.append(valeur) # on l'ajoute à solution
                s = s - valeur # et on déduit sa valeur de la somme à rendre
            else:
                i = i + 1 # sinon on passe à la pièce immédiatement inférieure
        return solution
    
# ESSAI

euros = [500, 200, 100, 50, 20, 10, 5, 2, 1]
rendu_monnaie_glouton(147, euros)

[100, 20, 20, 5, 2]

L'algorithme glouton est toujours optimal si on raisonne avec des "euros". 

Avec d'autres systèmes monétaires, la solution n'est pas forcément optimale :

In [12]:
rendu_monnaie_glouton(8, [6, 4, 1])  # solution non optimale trouvée (on pouvait rendre 8 en deux pièces : 4 et 4)

[6, 1, 1]

S'il manque la pièce unité, la solution n'est même pas forcément correcte :

In [13]:
rendu_monnaie_glouton(8, [5, 2])  # solution incorrecte trouvée (on pouvait rendre 8 : 2 + 2 + 2 + 2)

[5, 2]

## Problème du sac à dos

**Enoncé possible** :

Vous êtes un voleur et souhaitez emporter les objets pour maximiser la valeur totale du butin. Cependant, votre sac ne peut supporter qu'une masse maximale de 10 kg.  Chaque objet possède une valeur et un poids. Il s’agit de choisir les objets à emporter dans le sac afin maximiser la valeur totale tout en respectant la contrainte du poids maximal. C’est un problème d’*optimisation avec contrainte*.

Considérons les objets suivants et un sac de capacité maximale 10 kg. Quels objets faut-il prendre ?

| objet       |  A  |  B  |  C  |  D  |  E  |  F  |
|:------:     |:---:|:---:|:---:|:---:|:---:|:---:|
| poids (masse en kg) |  7  |  6  |  4  |  3  |  2  |  1  |
| valeur (€)  |9100 |7200 |4800 |2700 |2600 |200  |

Il y a plusieurs choix possibles :
- **Stratégie 1** : prendre toujours l'objet de plus grande valeur n'excédant pas la capacité restante (il faut trier préalablement par valeur décroissante)
- **Stratégie 2** : prendre toujours l'objet de plus faible masse (il faut trier préalablement par masse croissante)
- **Stratégie 3** : prendre toujours l'objet de plus grand rapport $\frac{\text{valeur}}{\text{poids}}$ n'excédant pas la capacité restante (il faut trier préalablement par rapport $\frac{\text{valeur}}{\text{poids}}$ décroissant)

In [14]:
table_objets = [{'nom' : 'A', 'poids' : 7, 'valeur' : 9100},
                {'nom' : 'B', 'poids' : 6, 'valeur' : 7200},
                {'nom' : 'C', 'poids' : 4, 'valeur' : 4800},
                {'nom' : 'D', 'poids' : 3, 'valeur' : 2700},
                {'nom' : 'E', 'poids' : 2, 'valeur' : 2600},
                {'nom' : 'F', 'poids' : 1, 'valeur' : 200}]

In [15]:
def poids(objet):
    return objet['poids']

def valeur(objet):
    return objet['valeur']

def rapport_poids_valeur(objet):
    return objet['valeur'] / objet['poids']

def glouton(table_objets, poids_max):
    # TRI DE LA TABLE
    table_triee = sorted(table_objets, key = valeur, reverse=True) # STRATEGIE : CHOIX PAR VALEUR DECROISSANTE
    # ALGORITHME GLOUTON
    poids_total = 0
    solution_gloutonne = []
    i = 0
    while i < len(table_triee) and poids_total < poids_max:  # tant qu'il reste des vidéos à ajouter et que le poids max n'est pas atteint
        objet = table_triee[i]  # on prend la vidéo d'indice i
        poids_objet = poids(objet) 
        if poids_total + poids_objet <= poids_max:  # si elle n'est pas trop lourde (capacité restante suffisante)
            solution_gloutonne.append(objet)  # on ajoute la vidéo d'indice i à notre solution
            poids_total = poids_total + poids_objet # on met à jour le poids total de notre solution
        i = i + 1  # on passe à la vidéo suivante
    return solution_gloutonne

In [16]:
glouton(table_objets, 10)

[{'nom': 'A', 'poids': 7, 'valeur': 9100},
 {'nom': 'D', 'poids': 3, 'valeur': 2700}]

---
Germain BECKER & Sébastien POINT, Lycée Mounier, ANGERS 

![Licence Creative Commons](https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png)