<h1 style="color:#5A8E00; font-weight: bold;">
Algorithme A\*
</h1>
<br>Nous allons de ce pas nous immerger dans une application de l'algorithme A\*. Le but du script qui suit va être de déterminer les affectations qui minimisent le coût total d'une opération à partir d'un tableau à 2 dimensions dans lequel sont représentés les-dits coûts.

Un module .py existe pour cet algorithme à l'adresse suivante : https://perso.esiee.fr/~boittiac/a-etoile/affectations.py
<br>Et la <b style="color:#DB5B30">documentation</b> pour ce module est disponible ici : https://perso.esiee.fr/~boittiac/a-etoile/doc

On importe numpy pour réaliser des opérations plus vite que l'éclair, pandas pour afficher les résultats de manière élégante, ipywidgets et display pour intéragir de manière agréable avec ce notebook et heapq qui n'est autre qu'une implémentation des Tas (qui vont nous permettre de gagner un peu / pas mal de temps de calcul).
<br>Un petit coup d'oeil sur la documentation de heapq et notamment des fonctions <b style="color:#DB5B30">heappush</b> et <b style="color:#DB5B30">heappop</b> ne fait pas de mal : https://docs.python.org/3/library/heapq.html

In [1]:
import numpy as np
import pandas as pd
import ipywidgets as widgets
from heapq import heappush, heappop
from IPython.display import display

Ci-dessous sont les différentes heuristiques que nous avons trouvées. Chacune des fonctions pour le calcul de h prend donc en paramètre le noeud dont on doit calculer h et la table des coûts.
<br>Chacune des fonctions commence de la même manière. Tout d'abord si le noeud est un <b style="color:#DB5B30">but</b> alors <b style="color:#DB5B30">h=0</b> (car le cout du chemin optimal d'un noeud à lui même est de 0). Ensuite on isole sur la table des coûts les possible chemins restant à parcourir.
<br><b style="color:#DB5B30">Par exemple</b> si la matrice de coût est :
<table style="margin-left:0;font-family:'Arial'">
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">2</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">8</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">13</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">15</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">1</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">2</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">11</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">9</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">13</td>
  </tr>
</table>
<br>Et que nous sommes dans un noeud de profondeur 1 qui a eu comme première affectation 2 alors on garde seulement les lignes après la ligne 1 et on supprime toutes les colonnes qui sont déjà affectées, dans ce cas-ci seulement la colonne numéro 2.
<table style="margin-left:0;font-family:'Arial'">
  <tr style="background-color:white">
    <td style="background-color:#B7B7B7; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">2</td>
    <td style="background-color:#B7B7B7; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">8</td>
    <td style="background-color:#B7B7B7; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">13</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">15</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">1</td>
    <td style="background-color:#B7B7B7; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">2</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">11</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">9</td>
    <td style="background-color:#B7B7B7; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">13</td>
  </tr>
</table>
<br>Il nous reste donc la table suivante :
<table style="margin-left:0;font-family:'Arial'">
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">15</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">1</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">11</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">9</td>
  </tr>
</table>
<br>C'est ici que les heuristiques diffèrent. La première, somme_des_min_des_lignes, calcule comme son nom l'indique la somme des minimaux de chaque ligne. Dans notre exemple :
<table style="margin-left:0;font-family:'Arial'">
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">15</td>
    <td style="background-color:#FFA468; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">1</td>
  </tr>
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">11</td>
    <td style="background-color:#FFA468; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">9</td>
  </tr>
</table>
<span style="background-color:#D5BAD6">h = 1 + 9 = 10</span>
<br><br>La seconde heuristique, somme_des_min_des_colonnes, calcule la somme des minimaux de chaque colonne. Dans notre exemple :
<table style="margin-left:0;font-family:'Arial'">
  <tr style="background-color:white">
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">15</td>
    <td style="background-color:#FFA468; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">1</td>
  </tr>
  <tr style="background-color:white">
    <td style="background-color:#FFA468; border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">11</td>
    <td style="border: 1px solid black; border-collapse: collapse; width:30px; height:30px; text-align:center;">9</td>
  </tr>
</table>
<span style="background-color:#D5BAD6">h = 11 + 1 = 12</span>
<br><br>La troisème et dernière heuristique calcul tout simplement le maximum de ces deux valeurs, c'est à dire dans ce cas-ci :
<br><span style="background-color:#D5BAD6">h = max(10, 12) = 12</span>

<b style="color:#DB5B30">NB</b> : *np.delete(x, [0, 8], 1)* va supprimer du tableau x les indices 0 et 8 de l'axe 1 du tableau, l'axe 1 représente les colonnes tu tableau. Un petit coup d'oeil vers la doc : https://docs.scipy.org/doc/numpy-1.14.0/reference/generated/numpy.delete.html

*np.delete(couts[noeud.p:], noeud.affectations, 1)* renvoie donc un tableau qui supprime les colonnes déjà affectés du tableau de couts[p:] on a donc un tableau de couts sans les colonnes déjà affectés et avec les lignes qui restent à affecter.

<b style="color:#DB5B30">NB 2</b> : *np.amin(x, 1)* renvoie la liste des minimum des lignes de x. Doc : https://docs.scipy.org/doc/numpy/reference/generated/numpy.amin.html

In [2]:
def somme_des_min_des_lignes(noeud, couts):
    if noeud.estBut():
        return 0
    temp = np.delete(couts[noeud.p:], noeud.affectations, 1)
    return np.amin(temp, 1).sum()

def somme_des_min_des_colonnes(noeud, couts):
    if noeud.estBut():
        return 0
    temp = np.delete(couts[noeud.p:], noeud.affectations, 1)
    return np.amin(temp, 0).sum()

def max_des_deux(noeud, couts):
    if noeud.estBut():
        return 0
    temp = np.delete(couts[noeud.p:], noeud.affectations, 1)
    return max(np.amin(temp, 1).sum(), np.amin(temp, 0).sum())

calculer_h = max_des_deux

Nous vous proposons ci-dessous de choisir laquelle des heuristiques utiliser pour l'algorithme (et ceci avec une interface sympatoche et dynamique). Toutefois si l'interface ne marche pas (ce qui peut arriver), il vous faudra affecter manuellement la fonction <b style="color:#DB5B30">calculer_h</b> et ce en rentrant dans une cellule :
<br><span style="color:blue">set_heuristique</span>(<span style="color:#BA2121">'Somme des min des lignes'</span> OU <span style="color:#BA2121">'Somme des min des colonnes'</span> OU <span style="color:#BA2121">'Max des deux'</span>)
<br><br>Mais à priori l'interface devrait fonctionner... Rien de bien intéressant dans la cellule ci-dessous du coup (mais à exécuter pour faire le choix de l'heuristique).
<br><b style="color:#DB5B30">NB</b> : Si vous regardez ceci depuis une page web cette partie n'a pas trop d'intérêt...

In [3]:
def set_heuristique(heuristique):
    global calculer_h
    if heuristique == 'Somme des min des lignes':
        calculer_h = somme_des_min_des_lignes
    elif heuristique == 'Somme des min des colonnes':
        calculer_h = somme_des_min_des_colonnes
    else:
        calculer_h = max_des_deux

w = widgets.Dropdown(
    options=['Somme des min des lignes', 'Somme des min des colonnes', 'Max des deux'],
    value = 'Max des deux',
    description="Choix de l'heuristique :")
try:
    w.layout = widgets.Layout(width='375px')
    w.style.description_width = '150px'
except:
    pass
widgets.interact(set_heuristique, heuristique=w);

La classe Noeud ci-après représente une bonne partie de l'algorithme et mérite quelques éclaircissements. Nous vons invitons tout d'abord à jeter un oeil à cette dernière afin d'en notifier les principaux attributs et fonctions.

<u style="color:#5A8E00; font-size:16px">Attributs :</u>
* <b style="color:#DB5B30">n :</b> La profondeur maximale du graphe. Si le tableau de coûts est de dimensions m\*m alors n=m
* <b style="color:#DB5B30">g :</b> Le coût d'un chemin optimal du premier noeud à celui-ci (du noeud de profondeur 0 au noeud de profondeur p)
* <b style="color:#DB5B30">p :</b> La profondeur du noeud, c'est à dire le nombre d'ancêtres que possède ce noeud. Par exemple le premier noeud est de profondeur 0, et un noeud but est de profondeur n.
* <b style="color:#DB5B30">affectations :</b> Une liste contenant toutes les affectations "qui sont faîtes" pour ce noeud. Pour un noeud but on a une liste d'affectations complète qui décrira une situation d'allocations finie. Notre algorithme devant se terminer toujours par des affectations optimales, le dernier noeud choisi possèdera donc la liste des allocations optimales.
* <b style="color:#DB5B30">h :</b> L'heuristique du noeud. C'est une estimation du coût chemin optimal de ce noeud (de profondeur p) à un but (de profondeur n). Comme nous voulons trouver le chemin optimal de 0 à n, nous devons respecter la propriété $h(p) \leq h*(p)$ où h*(p) est le coût du chemin optimal de ce noeud à un but.
* <b style="color:#DB5B30">f :</b> Estimation du coût d'un chemin optimal de 0 à un but en passant par ce noeud. C'est donc ce paramètre là que l'on cherche à minimiser. Quand l'algorithme se termine, on veut que le noeud but sur lequel il se termine soit celui avec le plus petit f possible. Ce paramètre va donc nous servir à ordonner les noeuds.

<u style="color:#5A8E00; font-size:16px">Fonctions :</u>
* <b style="color:#DB5B30">estBut(self) :</b> Comme son nom l'indique cette fonction renvoie un booléen : True si le noeud est un but, False sinon. On exploite ici le fait que si le noeud est un but, alors sa profondeur est égale à la profondeur maximale du GRP.
* <b style="color:#DB5B30">developpe(self, couts) :</b> Cette fonction renvoie une liste de noeud développés à partir de celui sur lequel la fonction est appelée. Dans cette fonction on parcours tout simplement toutes les affectations possibles de faire depuis ce noeud et on crée les noeuds qui correspondent à toutes ces affecations.
* <b style="color:#DB5B30">\__lt__(self, other) :</b> va permettre de "classer" les objets Noeud (leur donne un ordre) ce qui va être très pratique pour l'implémentation du Tas. Un Noeud est "plus petit" qu'un autre si son **f** est plus petit que celui de l'autre.

In [4]:
class Noeud:
    def __init__(self, n, couts, g=0, p=0, affectations=list()):
        self.n = n
        self.g = g
        self.p = p
        self.affectations = affectations
        self.h = calculer_h(self, couts)
        self.f = self.g + self.h
    
    def estBut(self):
        return self.p == self.n
    
    def developpe(self, couts):
        heritiers = list()
        
        for i, cout in enumerate(couts[self.p]):
            if i not in self.affectations:
                heritiers.append(Noeud(self.n, couts, g=self.g+cout, p=self.p+1,
                                       affectations=self.affectations+[i]))
        
        return heritiers
    
    def __lt__(self, other):
        return self.f < other.f

<h3 style="color:#5A8E00; font-weight: bold;">Enfin, la progression !</h3>
<br>Nous avons suivi l'algorithme proposé par Nils John Nilsson. Cependant nous avons choisi un Tas plutôt qu'une liste pour la représentation d'OUVERT, en effet à chaque étape de la boucle, avec une liste, nous devions chercher le plus petit élément d'OUVERT ce qui était donc en O(k), k étant le nombre d'éléments dans OUVERT et pouvant rapidemment atteindre un nombre assez grand. Avec un Tas, il nous suffit d'ajouter chaque Noeud à OUVERT en complexité log(k). Et on a à chaque étape de la boucle au plus n Noeud créés, c'est donc en O(n\*log(k)), ce qui peut paraître pire mais en fait <span style="background-color:#D5BAD6">n << k</span>.
<br>Il est à noter que nous n'implémentons pas la liste FERME car notre GRP est un graphe sans cycle.

1. Tout premièrement créons une matrice <b style="color:#DB5B30">couts</b> aléatoirement.
2. Puis posons n = la longeur de couts, c'est la profondeur maximale du GRP.
3. Comme indiqué par M. Nilsson, mettons dans un Tas appelée OUVERT le sommet de départ du GRP
4. Ensuite bouclons tant que OUVERT n'est pas vide.
5. On prend le premier élément du Tas (le plut petit) et on l'en enlève (fonction <b style="color:#DB5B30">heappop</b>).
6. Si c'est un but on termine la procèdure avec succès.
7. On développe le noeud précédemment choisi et on met les noeuds résultants de cette opération dans OUVERT (fonction <b style="color:#DB5B30">heappush</b>).

In [5]:
couts = np.random.randint(1000, size=(10, 10))

n = len(couts)
OUVERT = [Noeud(n, couts)]

while len(OUVERT) > 0:
    
    noeud = heappop(OUVERT)
    
    if noeud.estBut():
        break
    
    for heritier in noeud.developpe(couts):
        heappush(OUVERT, heritier)

On a donc à la fin de l'exécution de l'algorithme l'ensemble des affectations dans noeud.affectations

In [6]:
print(noeud.affectations)

[5, 4, 2, 6, 7, 8, 3, 9, 1, 0]


Cette représentation étant assez peu lisible nous avons codé une fonction <span style="color:blue">print_affectations</span> qui affiche les résultats sous une forme plus esthétique.

In [7]:
def print_affectations(couts, affectations):
    df = pd.DataFrame(couts)
    try:
        display(df.style.apply(lambda tab: color_couts(len(couts), affectations), axis=None))
    except:
        print('print_affectations non supporté sur cette version de ipython')

def color_couts(n, affectations):
    ar = [['']*n for i in range(n)]
    for i, j in enumerate(affectations):
        ar[i][j] = 'background-color: #FFC900'
    return pd.DataFrame(ar)

print_affectations(couts, noeud.affectations)

Unnamed: 0,0,1,2,3,4,5,6,7,8,9
0,632,484,526,787,786,45,681,96,541,998
1,887,571,622,372,334,30,926,192,648,550
2,406,218,151,490,817,208,907,954,775,405
3,196,279,239,494,752,988,202,762,837,41
4,465,828,652,355,672,820,788,144,780,630
5,116,630,985,791,930,128,789,93,171,74
6,170,853,171,54,694,448,271,957,574,679
7,578,950,479,435,978,302,479,796,468,83
8,495,111,545,751,852,754,959,619,848,463
9,291,296,50,957,411,235,603,674,990,689


<h3 style="color:#5A8E00; font-weight: bold;">Meilleure heuristique</h3>
<br>On est bien content d'avoir trouvé nos affectations optimales, mais encore nous faut-il déterminer quelle est l'heuristique la plus efficace. Pour cela nous allons tout simplement regarder le nombre de noeuds développés par chacune des heuristiques pour les mêmes tables de coûts. On pourra ensuite comparer ce nombre de noeuds au nombre de noeuds total que possède le GRP.
<br><br>La fonction <span style="color:blue">tailleGRP</span>(n) calcul le nombre de noeuds total d'un GRP de profondeur maximale n.

In [8]:
def tailleGRP(n):
    T = 1
    R = n
    for i in range(n, 1, -1):
        T += R
        R = R*(i-1)
    T += R
    return T

Maintenant créons la fonction <span style="color:blue">affectations_optimales</span>(couts, verbose) qui va renvoyer un tuple avec les affectations optimales et le nombre de noeuds développés pour la table <b style="color:#DB5B30">couts</b>.
<br>Le paramètre <b style="color:#DB5B30">verbose</b> affichera toutes les affectations intermédiraires s'il vaut True.

In [9]:
def affectations_optimales(couts, verbose=False):
    n = len(couts)
    OUVERT = [Noeud(n, couts)]
    nb_noeuds_developpes = 1

    while len(OUVERT) > 0:
        noeud = heappop(OUVERT)
        
        if verbose:
            print_affectations(couts, noeud.affectations)
        
        if noeud.estBut():
            break
        
        for heritier in noeud.developpe(couts):
            heappush(OUVERT, heritier)
            nb_noeuds_developpes += 1
    
    return noeud.affectations, nb_noeuds_developpes

Une petite démonstration de la fonction :

In [10]:
affectations_optimales(np.random.randint(1000, size=(5, 5)), verbose=True)

Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


Unnamed: 0,0,1,2,3,4
0,809,748,281,994,463
1,229,256,555,651,693
2,248,882,647,305,144
3,552,376,836,382,884
4,285,605,769,864,220


([2, 1, 4, 3, 0], 19)

Pour un certain nombre de table de couts nous allons faire la comparaison du nombre de noeuds développés par chacune des méthodes de calcul heuristique.

In [11]:
comparaisons = list()

for n in range(5, 16):
    
    couts = np.random.randint(1000, size=(n, n))
    nb_noeuds_total = tailleGRP(n)
    
    for heuristique in ['Somme des min des lignes', 'Somme des min des colonnes', 'Max des deux']:
        
        set_heuristique(heuristique)
        nb_noeuds = affectations_optimales(couts)[1]
        
        comparaisons.append([n, heuristique, nb_noeuds, "%.2E"%(nb_noeuds/nb_noeuds_total)])

comparaisons_columns = ['n', 'Heuristique', 'Noeuds développés', 'Noeuds développés / Noeuds total']
comparaisons = pd.DataFrame(comparaisons, columns=comparaisons_columns)

Pour avoir une vue claire (le code ci-dessous n'a un intérêt que purement esthétique) :

In [12]:
def color_border(comparaisons):
    n = len(comparaisons)
    m = len(comparaisons.columns)
    ar = [['']*m for i in range(n)]
    bg_color = "#FFFFFF"
    for i in range(n-1):
        for j in range(m):
            ar[i][j] += 'background-color: ' + bg_color + ';'
        if comparaisons['n'][i] != comparaisons['n'][i+1]:
            if bg_color == "#FFFFFF":
                bg_color = "#DDDDDD"
            else:
                bg_color = "#FFFFFF"
            for j in range(m):
                ar[i][j] += 'border-bottom: 1px solid #228888;'
    return pd.DataFrame(ar, columns=comparaisons_columns)

try:
    disp = comparaisons.style.apply(lambda tab: color_border(comparaisons), axis=None)
    disp.set_table_styles(
            [{'selector': '.row_heading',
              'props': [('display', 'none')]},
             {'selector': '.blank.level0',
              'props': [('display', 'none')]}])
    display(disp)

except:
    display(comparaisons)

Unnamed: 0,n,Heuristique,Noeuds développés,Noeuds développés / Noeuds total
0,5,Somme des min des lignes,26,0.0798
1,5,Somme des min des colonnes,26,0.0798
2,5,Max des deux,26,0.0798
3,6,Somme des min des lignes,29,0.0148
4,6,Somme des min des colonnes,22,0.0112
5,6,Max des deux,22,0.0112
6,7,Somme des min des lignes,64,0.00467
7,7,Somme des min des colonnes,34,0.00248
8,7,Max des deux,34,0.00248
9,8,Somme des min des lignes,302,0.00276


On remarque donc qu'on a globalement le même dilemne en choisissant la <b style="color:#DB5B30">Somme des min des lignes</b> ou la <b style="color:#DB5B30">Somme des min des colonnes</b>, il y en a souvent un qui développe beaucoup plus de noeuds que l'autre. On constate aussi que c'est toujours l'heuristique <b style="color:#DB5B30">Max des deux</b> qui développe le moins de noeuds. On a tout intéret à choisir cette dernière !