# EL-HAMDAOUI MAROUANE | IAGI CI-2
# Partie 1 : Capteurs et Mouvements

Dans cette partie, vous allez implémenter les fonctions de base permettant au robot de percevoir son environnement et de se déplacer.

## Question 1.1 : Implémentation des fonctions de base

Implémentez les trois fonctions suivantes :

- **in_bounds(G, i, j)** : vérifie si la position (i, j) est dans les limites de la grille G
- **is_wall(G, i, j)** : vérifie si la position (i, j) est un mur (valeur 1) ou hors limites
- **move(i, j, d)** : calcule la nouvelle position après un déplacement dans la direction d

**Note :** Les directions sont codées par : `DIRS = [(-1,0), (0,1), (1,0), (0,-1)]` pour N, E, S, O

In [1]:
DIRS = [(-1,0), (0,1), (1,0), (0,-1)] # N, E, S, O

def in_bounds(G, i, j):
    return 0 <= i < len(G) and 0 <= j < len(G[0])

def is_wall(G, i, j):
    return not in_bounds(G, i, j) or G[i][j] == 1

def move(i, j, d):
    return i + DIRS[d][0], j + DIRS[d][1]

## Question 1.2 : Différence entre in_bounds et is_wall

Quelle est la différence entre les fonctions `in_bounds` et `is_wall` ? Pourquoi avons-nous besoin des deux ?

**Réponse :**
- **`in_bounds(G, i, j)`** : vérifie uniquement si les coordonnées (i, j) sont à l'intérieur des limites de la grille (indices valides)
- **`is_wall(G, i, j)`** : vérifie si une position **valide** contient un mur (valeur 1 dans la grille)

Nous avons besoin des deux fonctions car :
- `in_bounds` évite les erreurs d'accès hors limites (IndexError)
- `is_wall` identifie les obstacles ou bien la limite de la grille

## Question 1.3 : Comportement hors limites

Que se passe-t-il si le robot essaie de sortir de la grille ? Comment votre implémentation gère-t-elle ce cas ?

**Réponse :**
L'implémentation actuelle ne gère pas explicitement ce cas :
- La fonction `move()` calcule simplement la nouvelle position sans vérification
- Si le robot essaie de sortir, `is_wall()` tentera d'accéder à `G[i][j]` avec des indices invalides, ce qui causera une **IndexError**
- Pour gérer correctement ce cas, il faudrait vérifier `in_bounds()` **avant** d'appeler `is_wall()`, ou modifier `is_wall()` pour retourner `True` (obstacle) si la position est hors limites

# Partie 2 : Décision Locale (Règles Simples)
Dans cette partie, vous allez implémenter la stratégie de décision de l'agent réactif basée sur la
règle de la "main droite".

## Question 2.1: Implémentation de choose_action
Implémentez la fonction choose_action(G, i, j, d) qui choisit la prochaine direction selon la
priorité : droite →avant →gauche →demi-tour.
`Stratégie "main droite" : priorité droite > avant > gauche > demi-tour`

```python
def choose_action(G, i, j, d):
return d
```

In [2]:
# d will be an index of DIRS
# 0 -> North, 1 -> East, 2 -> South, 3 -> West
def choose_action(G, i, j, d):
    actions = ["right", "forward", "left", "back"]
    dirs = [1, 0, -1, 2]
    k = 0

    for action in actions:
        new_d = (d + dirs[k]) % 4
        new_i, new_j = move(i, j, new_d)
        
        if not is_wall(G, new_i, new_j):
            return action
        
        k += 1

    return None


## Question 2.2 : Description de la stratégie
Décrivez en vos propres mots la stratégie utilisée par l'agent pour choisir sa direction.

**Réponse :**
L'agent utilise une stratégie de type "main droite" pour naviguer dans le labyrinthe. À chaque étape, il tente de tourner à droite par rapport à sa direction actuelle. Si la case à droite est libre, il se déplace dans cette direction. Si la case à droite est bloquée, il essaie d'aller tout droit. Si cette direction est également bloquée, il tente de tourner à gauche. Enfin, si toutes les directions sont bloquées, il effectue un demi-tour pour revenir sur ses pas. Cette stratégie permet à l'agent de suivre les murs à sa droite et d'explorer le labyrinthe de manière systématique.

## Question 2.3 : Ordre de priorité
Pourquoi tester les directions dans l'ordre [droite, avant, gauche, demi-tour] ? Qu'est-ce que cela
simule ?

**Réponse :**
L'ordre de priorité simule la stratégie de la "main droite", où l'agent suit le mur à sa droite. Cette approche est couramment utilisée dans les labyrinthes car elle garantit que l'agent finira par explorer toutes les parties accessibles du labyrinthe, à condition que le labyrinthe soit simplement connecté.

## Question 2.4 : Cas bloqué
Que se passe-t-il si toutes les directions sont bloquées (murs partout) ? Comment votre fonction
gère-t-elle ce cas ?

**Réponse :**
Si toutes les directions sont bloquées, l'agent ne peut pas se déplacer. Dans ce cas, la fonction `choose_action` renvoie `None`, indiquant qu'aucune action n'est possible. Cela permet à la boucle de simulation de détecter que l'agent est coincé et d'arrêter la simulation.

## Question 2.5 : Variante "main gauche"
Proposez une modification de la fonction choose_action pour implémenter une stratégie "main
gauche" au lieu de "main droite".

In [3]:
def choose_action_G(G, i, j, d):
    actions = ["left", "forward", "right", "back"] 
    dirs = [-1, 0, 1, 2]
    idx = 0

    for action in actions:
        new_d = (d + dirs[idx]) % 4
        ni, nj = move(i, j, new_d)
        
        if not is_wall(G, ni, nj):
            return action
        
        idx += 1

    return None


# Partie 3 : Simulation du Déplacement

Dans cette partie, vous allez implémenter la boucle principale de simulation qui fait avancer le
robot jusqu'au but (ou jusqu'à atteindre le nombre maximum d'étapes).

## Question 3.1 : Implémentation de run_agent
Implémentez la fonction run_agent(G, start, goal, d0=0, max_steps=200) qui simule le
déplacement de l'agent.

```python
def run_agent(G, start, goal, d0=0, max_steps=200):
    return path

path = run_agent(LAB, S, G, d0=1)
print('Longueur du chemin :', len(path))
```

In [4]:
def run_agent(G: list, start: tuple, goal: tuple, d0=0, max_steps=200):
    i, j = start[0], start[1]
    d = d0
    steps = 0
    path = []

    if is_wall(G, i, j):
        print("Starting point is a wall")
        return path

    while (i, j) != (goal[0], goal[1]):
        if steps >= max_steps:
            print("Max steps reached")
            return path

        action = choose_action(G, i, j, d)
        if action is None:
            print("No possible action")
            return path
        
        path.append(action)
        
        match action:
            case "right":
                d = (d + 1) % 4
            case "left":
                d = (d - 1) % 4
            case "back":
                d = (d + 2) % 4

        i, j = move(i, j, d)
        steps += 1
        print(f"Step {steps}: position=({i},{j}), direction={d}, action={action}")
    return path

## Question 3.2 : Résultats de l'exécution

Exécutez le programme plusieurs fois. Notez :
- Le nombre d'étapes pour atteindre le but
- La longueur du chemin parcouru
- Le comportement observé

In [5]:
LAB = [
[1,1,1,1,1,1,1,1],
[1,0,0,0,1,0,0,1],
[1,0,1,0,0,0,1,1],
[1,0,1,0,1,0,0,1],
[1,0,0,0,1,1,0,1],
[1,1,1,0,0,0,0,1],
[1,0,0,0,1,0,0,1],
[1,1,1,1,1,1,1,1]
]

S = (1, 1)
G = (6, 6)

path = run_agent(LAB, S, G, d0=1)
print(path)
print('Longueur du chemin :', len(path))

Step 1: position=(2,1), direction=2, action=right
Step 2: position=(3,1), direction=2, action=forward
Step 3: position=(4,1), direction=2, action=forward
Step 4: position=(4,2), direction=1, action=left
Step 5: position=(4,3), direction=1, action=forward
Step 6: position=(5,3), direction=2, action=right
Step 7: position=(6,3), direction=2, action=forward
Step 8: position=(6,2), direction=3, action=right
Step 9: position=(6,1), direction=3, action=forward
Step 10: position=(6,2), direction=1, action=back
Step 11: position=(6,3), direction=1, action=forward
Step 12: position=(5,3), direction=0, action=left
Step 13: position=(5,4), direction=1, action=right
Step 14: position=(5,5), direction=1, action=forward
Step 15: position=(6,5), direction=2, action=right
Step 16: position=(6,6), direction=1, action=left
['right', 'forward', 'forward', 'left', 'forward', 'right', 'forward', 'right', 'forward', 'back', 'forward', 'left', 'right', 'forward', 'right', 'left']
Longueur du chemin : 16


### Question 3.3 : But atteint ?

Le but a-t-il été atteint ? Si non, pourquoi ? Si oui, le chemin est-il optimal ?

** Réponse :**
Oui, le but a été atteint. Cependant, le chemin parcouru n'est pas optimal car l'agent suit une stratégie locale (main droite) qui ne garantit pas le chemin le plus court vers le but. L'agent peut faire des détours ou tourner en rond avant de trouver le but.

## Partie 4 : Visualisation du Chemin

Pour mieux comprendre le comportement de l'agent, nous allons visualiser sa trajectoire sur la
grille.

### Question 4 : Implémentation de print_path

Implémentez la fonction `print_path(G, path, S, goal)` qui affiche la grille avec :
- 'S ' pour le départ
- 'G ' pour le but
- '█' pour les murs
- 'V ' pour les cases visitées
- ' ' (espaces) pour les cases libres non visitées

```python
def print_path(G, path, S, goal):
print_path(LAB, path, S, G)
```

In [6]:
def print_path(G, path, S, goal):
    visited = set()
    i, j = S
    visited.add((i, j))
    d = 1  # Initial direction (East)

    for action in path:
        match action:
            case "right":
                d = (d + 1) % 4
            case "left":
                d = (d - 1) % 4
            case "back":
                d = (d + 2) % 4

        i, j = move(i, j, d)
        visited.add((i, j))

    for r in range(len(G)):
        row_str = ""
        for c in range(len(G[0])):
            if (r, c) == S:
                row_str += "S "
            elif (r, c) == goal:
                row_str += "G "
            elif G[r][c] == 1:
                row_str += "█"
            elif (r, c) in visited:
                row_str += "V "
            else:
                row_str += "  "
        print(row_str)


# Example usage
print_path(LAB, path, S, G)


████████
█S     █    █
█V █      ██
█V █  █    █
█V V V ██  █
███V V V   █
█V V V █V G █
████████


## Partie 5 : Analyse et Réflexion

Cette dernière partie est consacrée à l'analyse critique du comportement de votre agent réactif.

### Question 5.1 : Garantie d'atteindre le but

L'agent atteint-il toujours le but ? Pourquoi ou pourquoi pas ? Donnez un exemple de configuration où il échouerait.

**Réponse :**
L'agent n'atteint pas toujours le but. La stratégie de la "main droite" peut conduire l'agent à tourner en rond dans certaines configurations de labyrinthe, notamment celles où le but est situé dans une zone isolée ou entourée de murs. Par exemple, si le labyrinthe a une boucle fermée autour du but, l'agent peut rester coincé à l'intérieur de cette boucle sans jamais trouver le chemin vers le but.

### Question 5.2 : Problème des boucles infinies

Que se passe-t-il si l'agent tourne en boucle (visite les mêmes cases indéfiniment) ? Comment pourriez-vous détecter ce problème ?

**Réponse :**
Si l'agent tourne en boucle, il visitera les mêmes cases indéfiniment sans atteindre le but. Pour détecter ce problème, on pourrait maintenir un historique des positions visitées par l'agent. Si l'agent revient à une position déjà visitée un certain nombre de fois, on peut conclure qu'il est en train de tourner en boucle. Une autre approche serait d'utiliser un compteur de mouvements sans progrès vers le but, et si ce compteur dépasse un seuil, on peut supposer que l'agent est coincé dans une boucle.

### Question 5.3 : Besoin de mémoire

L'agent a-t-il besoin d'une mémoire ? Si oui, quelle forme devrait-elle prendre ? Que devrait-il mémoriser ?

**Réponse :**
Oui, l'agent a besoin d'une mémoire pour éviter de tourner en boucle et pour améliorer son comportement. La mémoire pourrait prendre la forme d'une liste ou d'un ensemble des positions déjà visitées. L'agent devrait mémoriser les coordonnées des cases qu'il a déjà explorées, ainsi que peut-être la direction dans laquelle il se trouvait à chaque position. Cela lui permettrait de prendre des décisions plus informées, comme éviter de revenir sur ses pas ou de choisir des directions qui l'ont déjà conduit à des impasses.

### Question 5.4 : Amélioration de la stratégie

Comment pourriez-vous améliorer la stratégie de l'agent ? Proposez une solution utilisant un historique des positions visitées.

**Réponse :**
Pour améliorer la stratégie de l'agent, on pourrait implémenter une approche basée sur un historique des positions visitées. Par exemple, l'agent pourrait utiliser une structure de données telle qu'un ensemble pour stocker les positions déjà explorées. Lorsqu'il choisit une direction, il pourrait prioriser les directions qui mènent à des positions non visitées. De plus, l'agent pourrait utiliser un algorithme de recherche plus sophistiqué, comme A* ou Dijkstra, qui prend en compte l'ensemble des positions visitées pour trouver le chemin le plus court vers le but, plutôt que de se baser uniquement sur des règles locales.