# Les algorithmes

Dans ce tutoriel, on va parler d'algorithmes.

**Tout d'abord, qu'est-ce qu'un algorithme?**

Les algorithmes est *une suite finie et non ambiguë d’opérations ou d'instructions permettant de résoudre une classe de problèmes* (définition venant directement de Wikipedia).

En d'autres termes, vous avez des données et un problème que vous aimeriez résoudre à partir de ces donnéees, un algorithme vous donne un moyen d'obtenir par une suite d'opérations automatiques le résultat recherché.

**Quel type de problèmes pouvez-vous résoudre avec des algorithmes?**

Eh... il y en a vraiment beaucoup. Il y a toute une branche de l'informatique dédiée à trouver des algorithmes plus efficaces, qui résolvent un plus grand nombre de problèmes.

Voici quelques exemples de problèmes qu'on veut pouvoir résoudre:

1. Si on a une liste de noms, les mettre par ordre alphabétique
2. Trouver le chemin de plus court pour sortir d'un labyrinthe
3. Trouver le chemin le plus court passant par un ensemble donnée de villes (appelé le problème du voyageur de commerce)
4. Résoudre un sudoku

**Pourquoi veut-on des algorithmes efficaces?**

Pour beaucoup problèmes faciles avec peu de données, l'efficacité de l'algorithme n'est pas très importante. Les ordinateurs sont tellement rapides que vous ne verrez pas la différence entre un algorithme efficace et un inefficace.

Mais quand la quantité de données augmente, l'efficacité de l'algorithme commence à jouer un très grand rôle. Si vous devez mettre un million de nom par ordre alphabetique, l'efficacité de l'algorithme sera beaucoup plus importante que si vous ne devez en trier que 100.

Ensuite, certains problèmes sont tellement complexes, que même avec les ordinateurs les plus puissants, il faut des années... voir des siècles... pour les résoudre. Pour ces problèmes-là, le mieux qu'on peut espérer est de trouver une valeur approximative.

À votre avis, quel est le problème le plus difficile à résoudre, mettre par ordre alphabétique 1000 mots, ou trouver le chemin le plus court pour visiter 1000 villes (problème du voyageur de commerce)?
.
.
.

**Réponse:** Sans conteste, le problème du voyageur de commerce. Avec un algorithme efficace, on peut mettre par ordre alphabétique 1000 mots avec environ 3000 opérations. Avec un algorithme inefficace (comme celui qu'on va voir ci-dessous), il faudrait environ un million d'opération. En comparaison, si on veut examiner toutes les possibilités pour trouver le plus court chemin dans le problème du voyageur de commerce, il faudrait examiner $1000!$ possibilités, c'est-à-dire $1000 \cdot 999 \cdot 998 \cdot 997 \cdot 996 \cdot 995 \cdot 994 \cdot ... \cdot 3 \cdot 2 \cdot 1$. Ce nombre vaut environ $4 \cdot 10^{2567}$, un nombre tellement gigantesque que ma machine à calculer refuse de l'afficher, même en notation scientifique...

### Premier algorithme
Voici tout d'abord un premier exercice d'algorithme: vous avez une liste de nombres `nombres` et vous voulez trouver le nombre le plus grand. Comment pouvez-vous procéder de manière automatique qui marche avec n'importe quelle liste de nombres? (Réfléchissez-y puis regardez une réponse possible ci-dessous).
.
.
.

**Réponse:** Une manière de procéder serait la suivante:
* Créer une variable `plusgrand` dans laquelle vous storez le premier nombre de la liste.
* Parcourir tous les nombre de la liste à partir du deuxième nombre:
  *    Vous comparez la valeur du nombre avec `plusgrand`. Si `plusgrand` est plus petit, vous remplacez la valeur storée dans plus grand avec le nouveau nombre.
* À la fin de la boucle, `plusgrand` contiendra le plus grand nombre de la liste.

Vous allez implémenter ça. Tout d'abord, quelques rappels:
* Pour accéder au premier nombre de la liste `nombres`, vous pouvez écrire `nombres[0]`.
* Le nombre d'élément de la liste `nombres` est donné par `len(nombres)`.
* Vous pouvez accéder au i-ème élément de la liste (où `i` est une variable) avec `nombres[i]`.
* Le dernier élément de la liste a un index de `len(nombres)-1` et non de `len(nombres)`, par exemple s'il y a 10 nombres dans la liste `nombres`, vous accédez au dernier nombre avec `nombres[9]`, puisque les listes sont indexées à partir de 0.
* Pour faire une boucle qui parcourt tous les nombres de la liste à partir du deuxième, vous devez écrire `for i in range(1,len(nombres)):`. De cette manière, i prendra des valeurs successives de 1 à `len(nombres)-1`.
* Noubliez pas d'indenter les lignes qui suivent le `for` (c'est-à-dire d'ajouter des espaces en début de ligne) pour montrer qu'elles font partie de la boucle.
* Pour tester si un nombre `a` est plus grand qu'un nombre `b`, vous pouvez utiliser `if a>b:`. N'oubliez pas non plus d'indenter les lignes qui suivent!

À vous de jouer! Ecrivez votre code dans l'espace réservé ci-dessous et exécutez-le!

In [None]:
# Liste de nombres
nombres = [45, 1, 7, 5656, 8, 23, 55, 65, -1, 53, -454, -31, 33, 764, 1, 6423, 12590, 43, 12, 23, 646, 8 ,12, 6431]

# Votre code vient ici






print(plusgrand)

Vous avez réussi? Avez-vous obtenu 12590? Voici une manière possible de programmer l'algorithme:

```
plusgrand = nombres[0]
for i in range(1,len(nombres)):
    if nombres[i]>plusgrand:
        plusgrand = nombres[i]
```

### Deuxième algorithme

On aimerait maintenant mettre une liste de noms d'élèves `noms` par ordre alphabétique. Avez-vous une idée comment procéder? Réfléchissez-y, puis lisez une solution possible ci-dessous.
.
.
.

**Réponse:**
Il y a beaucoup de manière possible de procéder, certaines beaucoup plus rapides que d'autres. En voici une, pas très efficace, mais facile à implémenter:

* Parcourir toute la liste et trouver le nom qui vient en premier par odre alphabétique, en utilisant la même manière qu'on a utilisé pour trouver le plus grand nombre d'une liste, puis l'échanger avec le premier nom de la liste.
* Parcourir toute la liste, sauf le premier nom (qui est déjà par ordre alphabétique) et trouver le premier nom par ordre alphabétique dans la liste restants, puis l'échanger avec le deuxième nom de la liste
* Parcourir toute la liste, sauf les deux premiers (qui sont déjà par ordre alphabétique) et trouver le premier nom par ordre alphabétique dans la liste restants, puis l'échanger avec le troisième nom de la liste
* Etc., jusqu'à ce que la fin de la liste soit atteinte, à quel point la liste sera complétement par ordre alphabétique.

Pour vous aider, j'ai préparé deux fonctions:
* `trouvePremier(liste, debut)`: cherche le premier nom par odre alphabétique de la liste `liste` à partir de l'élément `debut`. C'est presque le même code que celui pour trouver le nombre le plus grand d'une liste, sauf qu'on cherche le plus petit et qu'on retourne l'index du nom (c'est-à-dire sa position dans la liste), plutôt que le nom lui-même. Pour comparer deux noms, j'utilise `liste[i]<liste[premier]` qui regarde si le nom à l'index `i` vient avant par odre alphabétique que l'élément à l'index `premier`.
* `echangeElement(liste, i, j)`: échange les noms d'indices i et j. Pour cela, la fonction utilise une variable intermédiaire `element` où elle store le nom à la position `i`, puis elle écris le nom en `j` à la position `i`, puis le nom dans la variable `element` à la position `j`. Comprenez-vous pourquoi on a besoin d'une variable intermédiaire? Que se passerait-il si on écrivait directement le nom en `j` à la position `i`?

Lisez le code des fonctions ci-dessous, assurez-vous que vous le comprenenz, et exécutez-le:

In [None]:
## Cette fonction passe en revue la liste à partir de l'élément d'indexe "debut", trouve le premier élément par ordre
## alphabétique, et retourne son index
def trouvePremier(liste, debut):
    i = debut
    premier = i
    while i<len(liste):
        if liste[i]<liste[premier]:   # permet de comparer liste[i] et liste[premier] par ordre alphabétique
            premier = i
        i += 1
    return premier

## Cette fonction échange les éléments i et j de la liste
def echangeElement(liste, i,j):
    element = liste[i]
    liste[i] = liste[j]
    liste[j] = element

Maintenant, ça va être à vous de jouer:

* Vous devez faire une boucle qui parcourt tous les éléments de la liste `noms`.
* Pour chaque index `i` de la liste, vous appelez la fonction `trouvePremier(noms, i)` qui va trouver l'index du premier nom par ordre alpahbétique de la liste, puis vous l'échangez avec le nom en position `i` avec la fonction `echangeElement` (quels paramètres devez-vous donner à `echangeElement`?).

À vous de jouer! Complétez et exécutez le code ci-dessous!

In [None]:
noms=["Béatrice","Zoé","Zelna","Jennifer","Jean","Alfred","Bo","Georges","Agathe","Carole","Caroline",
      "Didi","Didier","Elaine","Jacob","Yves","Xavier","Manuel","Emmanuel"]

## Écrivez votre code ci-dessous pour trier la liste noms par ordre alphabétique







print(noms)

Avez-vous réussi? Si le résultat est correct, vous devez obtenir la liste

`['Agathe', 'Alfred', 'Bo', 'Béatrice', 'Carole', 'Caroline', 'Didi', 'Didier', 'Elaine', 'Emmanuel', 'Georges', 'Jacob', 'Jean', 'Jennifer', 'Manuel', 'Xavier', 'Yves', 'Zelna', 'Zoé']`

Voici une solution possible:

```
for i in range(0,len(noms)-1):
    premier = trouvePremier(noms, i)
    echangeElement(noms, i, premier)
```

**Votre code, pas-à-pas**

Pour être sûr de bien comprendre ce que fait un algorithme, ou pour trouver ce qui cloche quand un programme ne fait pas ce que vous voulez, il est utile de l'exécuter pas-à-pas dans notre tête et d'examiner ce qu'il fait:

La liste initiale contiennait:

`["Béatrice","Zoé","Zelna","Jennifer","Jean","Alfred","Bo","Georges","Agathe","Carole","Caroline",
      "Didi","Didier","Elaine","Jacob","Yves","Xavier","Manuel","Emmanuel"]`
      
À la première itération de votre code, vous appelez `trouvePremier(noms, 0)` qui va trouver le nom qui vient avant tous les autres dans l'ordre alphabétique. Ce nom est `"Agathe"` à l'index 8 de la liste. vous mettez ce nom en première position en l'échangeant avec le nom qui est actuellement en première position (`"Béatrice"`). Cet échange est effectué à l'aide de la fonction `echangeElement(noms, 0, 8)`.

Après cette opération, la liste est

`["Agathe","Zoé","Zelna","Jennifer","Jean","Alfred","Bo","Georges","Béatrice","Carole","Caroline",
      "Didi","Didier","Elaine","Jacob","Yves","Xavier","Manuel","Emmanuel"]`

À la deuxième itération de votre boucle, mais elle cherche cette fois-ci tous les noms à partir du deuxième nom de la liste en appelant la fonction `trouvePremier(noms, 1)`, qui retourne cette fois l'index 5 qui correspond au nom `"Alfred"`. `"Alfred"` est échangé alors avec `"Zoé"` qui se trouve en deuxième position.

Après cette opération, la liste est

`["Agathe","Alfred","Zelna","Jennifer","Jean","Zoé","Bo","Georges","Béatrice","Carole","Caroline",
      "Didi","Didier","Elaine","Jacob","Yves","Xavier","Manuel","Emmanuel"]`

Une des propriétés de cet algorithme est que après $i$ itérations, tous les noms d'indices 0 à $i$ sont par ordre alphabétique. Quand la boucle `for` aura fini de parcourir tous les indices, toute la liste est par ordre alphabétique.

**Efficace ou pas efficace?**

Comme déjà mentionné plus haut, cet algorithme pour mettre des noms par ordres alphabétiques n'est pas très efficaces. Le temps pris par cette algorithme est proportionnel à $n^2$, où $n$ est le nombre de mots de la liste. C'est-à-dire que pour une liste de 10 mots, il faudra un temps proportionnel à 100, pour 1000 mots, un temps proportionnel à 1 million, pour 1 million, un temps proportionnel à 1 billion, etc.

Il existe un algorithme beaucoup plus efficace, basé sur une technique appelée "diviser pour régner" qui a un temps d'exécution proportionnel à $n \log{n}$. Avec cet algorithme, il faut un temps proportionnel à 10 pour 10 mots, à 3000 pour 1000 mots et à 6 millions pour 1 million de mots, soit un temps environ 100'000 fois plus court qu'avec l'algorithme utilisé ici...

Vous pouvez utiliser cet algorithme en appelant tout simplement la fonction prédéfinie de Python `sort()`:

In [None]:
noms=["Béatrice","Zoé","Zelna","Jennifer","Jean","Alfred","Bo","Georges","Agathe","Carole","Caroline","Didi","Didier","Elaine","Jacob","Yves","Xavier","Manuel","Emmanuel"]

noms.sort()
print(noms)

### Résolution d'un sudoku

Maintenant, un défi: nous allons écrire un algorithme pour résoudre un ... sudoku!

Exécutez tout d'abord les quelques lignes suivantes:

In [None]:
import basicsudoku
board = basicsudoku.SudokuBoard(strict=False)  # Crée un sudoku vide
board.symbols = '2...8.3...6..7..84.3.5..2.9...1.54.8.........4.27.6...3.1..7.4.72..4..6...4.1...3'
originalBoard = board.symbols  # cette variable conserve l'état original du sudoku, pour qu'on puisse faire
                               # la différence entre les chiffres ajoutés par l'algorithme et les chiffres originaux

print(board)

Le code ci-dessus a créé un sudoku, en utilisant la librairie `basicsudoku`, une des plus de 100'000 librairies Phython qui peuvent être installées. Cette librairie permet d'afficher le sudoku et nous fourni, entre autres, la fonction `is_valid-board(board)` qui permet de vérifier si le sudoku est dans un état valide, c'est-à-dire qu'il n'y a pas deux fois le même nombre sur une ligne, une colonne ou dans un carré.

Si vous vouliez faire vous-même un sudoku, vous essaieriez de trouver des cases où il n'y a qu'un nombre possible. Par exemple, vous observeriez qu'à côté du 2 en haut à gauche du sudoku, il ne peut venir qu'un 4, car c'est le seul endroit possible du carré pour mettre un 4.

Bien qu'il soit possible de programmer exactement cette stratégie, elle ne permet pas toujours de finir un sudoku et il faudrait inclure d'autres stratégies toujours plus compliquées pour pouvoir trouver la solution dans tous les cas.

Les stratégies utilisées par les humains peuvent nous donner des idées, mais elles ne sont pas toujours appropriées pour les ordinateurs. À près tout, les ordinateurs sont beaucoup plus rapides que nous, ont une mémoire parfaite et ont donc des possibilités que l'on n'a pas.

La méthode préférée ici est la résolution par force brute:
1. on remplit le sudoku, case par case, avec des nombres successifs en commençant par 1
2. chaque fois qu'on rempli une case, on vérifie que le sudoku soit encore valide
3. s'il ne l'est pas, on essaie de mettre le nombre suivant dans la case
4. s'il est impossible de trouver un nombre valide pour cette case, on "backtracke", c'est-à-dire, on revient en arrière et essaye une autre possibilité pour une case déjà remplie précédemment.

Avec cette méthode, on essaie toutes les solutions de manière systèmatique, jusqu'à ce qu'on trouve une solution. Cette méthode est facile à implémenter et trouve toujours la solution si une solution existe.

Remarque: cette méthode d'explorer une solution possible aussi loin que l'on peut et de "backtracker" (ou "revenir sur ces pas") quand on rencontre une impasse est une méthode appelée "de parcours en profondeur" qui peut être utilisée pour résoudre un grand nombre de problèmes.

Pour vous aider à implémenter cet algorithme, j'ai créé ces trois fonctions:
- `caseSuivante()` retourne la prochaine case du sudoku qui n'a pas encore été initialisée ou retourne -1 si toutes les cases ont été remplies
- `nombreSuivant(i)` augmente le nombre dans la case `i` au nombre suivant possible qui maintient le sudoku dans un état valide. S'il n'y a pas de nombre possible, cette fonction retourne `False` et sinon `True`. 
- `backtrack(i)` qui permet de revenir en arrière à partir de la case `i`. Cette fonction retourne l'index de la case qui doit être modifiée. C'est la fonction qui doit être appelée quand l'algorithme est bloqué, c'est-à-dire qu'il n'est pas possible de trouver un chiffre acceptable pour la case courante `i`.

Remarque: les cases sont numérotées de 0 à 80, de gauche à droite et de haut en bas.

Exécutez la cellule ci-dessous pour définir ces fonctions. Comprenez-vous ce que chaque fonction fait?

In [None]:
## Cette fonction retourne le nombre dans la case i
def getBoard(i):
    return board[i % 9,i//9]

## Cette fonction met le nombre donné dans la case i
def setBoard(i, nombre):
    board[i % 9,i//9] = nombre

## Retourne l'indexe de la première case du sudoku qui n'a pas encore été initialisée
def caseSuivante():
    i = 0
    while i<len(board):
        if getBoard(i)=='.':
            return i
        i += 1
    return -1

## Revient en arrière et trouve une case avant la case i qui peut être modifiée. Retourne la case trouvée.
## Si aucune case ne peut être modifiée (par exemple parce que toutes les cases sont à 9), retourne -1.
def backtrack(i):
    setBoard(i, '.')
    i -= 1
    while (i>=0):
        if originalBoard[i]=='.':
            if board[i]!='9':
                break;
            else:
                setBoard(i, '.')
        i -= 1
    return i

## Incrémente le nombre dans la case i par 1. S'il n'y a pas de nombre dans la case, y met 1. Si le nombre ne peut pas être incrémenté car il vaut 9, retourne
## False, sinon retourne True
def incrementeCase(i):
    c = getBoard(i)
    if c=='.':
        setBoard(i, 1)
    elif c=='9':
        return False
    else:
        setBoard(i, int(c)+1)
    return True

## Incrémente la case i avec le prochain nombre possible qui garde le sudoku dans un état valide
def nombreSuivant(i):
    if incrementeCase(i):
        while not board.is_valid_board():
            if not incrementeCase(i):
                return False
    return True

Maintenant, à vous de jouer!

Voici ce que vous devez faire:
1. Initializer la variable `i` à `caseSuivante()`, c'est-à-dire à la première case qui contient un point.
2. Faire une boucle `while` qui continue tant que `i` est différent de -1 (programmatiquement, ça s'écrit `i != -1`). -1 est le nombre retourné par `caseSuivante` et par `backtrack` pour montrer qu'ils ne peuvent pas continuer, pour `backtrack` quand il n'y a pas de solution possible, et par `caseSuivante` quand toutes les cases ont pu être remplies par l'algorithme.
3. Appeller `nombreSuivant(i)` pour modifier le nombre dans la case `i`.
4. Si `nombreSuivant(i)` a retourné `False`, appeler `backtrack(i)` et storer le résultat dans la variable `i`.
5. Si `nombreSuivant(i)` a retourné `True`, aller à la case suivante en storant `caseSuivante()` dans `i`.

Indice: pour tester la valeur retournée par la fonction `nombreSuivant(i)`, vous pouvez mettre cette fonction dans la condition d'un `if`.

Aussi, n'oubliez pas d'indenter les lignes correctement (c'est-à-dire de mettre des espaces en début des lignes) pour indiquer quelles lignes appartiennent au `while` et au `if`.

À la fin, imprimez le sudoku final avec `print(board)`.

Attention: avant de tester votre code, vérifiez que vous savez encore comment arrêter le kernel (Kernel -> Interrupt), car une petite erreur de programmation résulte facilement en une boucle infinie avec `while`...

In [None]:
# À vous de jouer! Ecrivez votre code ci-dessous.









Vous avez réussi? Sinon, vous pouvez copier le code ci-dessous et le tester.

```
i = caseSuivante()
while i!=-1:
    if not nombreSuivant(i):
        i = backtrack(i)
    else:
        i = caseSuivante()
        
print(board)
```

Voilà, c'est fini pour les algorithmes. À la semaine prochaine avec les services en ligne!