# Algoritmi di Ricerca

## Laboratorio Python

### Esperimento 1: Algoritmi di ricerca non informata {#sec-algoritmi-di-ricerca-non-informata-in-python}

L'algoritmo generale di ricerca può essere ulteriormente dettaglia in un linguaggio pseudo-Python come segue:

``` python

Funzione RicercaGenerale(stato_iniziale, obiettivo, strategia):
    # Inizializza la frontiera con lo stato iniziale
    frontiera = CreaStrutturaDati(strategia)
    Aggiungi(frontiera, stato_iniziale)

    # Inizializza l'insieme dei nodi visitati (opzionale, per evitare cicli)
    visitati = InsiemeVuoto()

    Mentre la frontiera non è vuota:
        # Rimuovi un nodo dalla frontiera seguendo la strategia scelta
        nodo_corrente = Rimuovi(frontiera)

        # Controlla se lo stato corrente soddisfa l'obiettivo
        Se nodo_corrente == obiettivo:
            Restituisci "Soluzione trovata!"

        # Se il nodo corrente non è stato visitato
        Se nodo_corrente non è in visitati:
            # Aggiungi il nodo corrente ai nodi visitati
            Aggiungi(visitati, nodo_corrente)

            # Espandi il nodo corrente per generare i nodi figli
            nodi_figli = GeneraFigli(nodo_corrente)

            # Aggiungi i nodi figli alla frontiera
            Per ogni nodo in nodi_figli:
                Se nodo non è in visitati e nodo non è nella frontiera:
                    Aggiungi(frontiera, nodo)

    Restituisci "Problema senza soluzione"
```

Le struttre dati usate per la frontiera sono le seguenti: 

- **Stack**: L'ultimo nodo inserito è il primo estratto (LIFO = Last In First Out) --\> Algoritmo Depth-First Search (DFS). 
- **Queue**: Il primo nodo inserito è il primo estratto (FIFO = First In First Out) --\> Algoritmo Breadth-First Search (BFS). 
- **Priority Queue**: Il nodo con il valore di priorità più alto è il primo estratto --\> Usato per Greedy Best-First Search e A\*, dove la priorità è determinata da funzioni di costo o euristiche.

L'implementazione in Python di questo algoritmo riportata qui di seguito discende immediatamente dalla implementazione in pseudo-python vista qui sopra. Si noti che la funzione accetta in ingresso un grafo descritto da un dizionarip, uno stato iniziale, ovvero il nome del nodo inziale nel dizionario, uno stato obiettivo, ovvero il nome del nodo da raggiungere nel dizionario, e la strategia non informata che vogliamo usare, DFS o BFS.

In [None]:
from collections import deque

def ricerca_generale(grafo, stato_iniziale, obiettivo, strategia="BFS"):
    """
    Algoritmo generale di ricerca.

    :param grafo: Dizionario che rappresenta il grafo come lista di adiacenza
    :param stato_iniziale: Nodo di partenza
    :param obiettivo: Nodo obiettivo
    :param strategia: Strategia di ricerca, "BFS" (coda) o "DFS" (stack)
    :return: Tupla contenente (percorso dal nodo iniziale al nodo obiettivo, lista dei nodi visitati) o (messaggio di fallimento, lista dei nodi visitati)
    """
    if strategia == "BFS":
        frontiera = deque([[stato_iniziale]])  # Coda per BFS
    elif strategia == "DFS":
        frontiera = [[stato_iniziale]]  # Stack per DFS
    else:
        raise ValueError("Strategia non supportata. Usa 'BFS' o 'DFS'.")

    visitati = set()  # Insieme dei nodi visitati
    nodi_visitati = []  # Lista per memorizzare l'ordine dei nodi visitati

    while frontiera:
        # Rimuovi un percorso dalla frontiera (FIFO per BFS, LIFO per DFS)
        if strategia == "BFS":
            percorso_corrente = frontiera.popleft()
        else:  # strategia == "DFS"
            percorso_corrente = frontiera.pop()

        nodo_corrente = percorso_corrente[-1]  # Ultimo nodo nel percorso

        # Controlla se abbiamo raggiunto l'obiettivo
        if nodo_corrente == obiettivo:
            return percorso_corrente, nodi_visitati  # Restituisci il percorso completo e i nodi visitati

        # Se il nodo non è stato visitato
        if nodo_corrente not in visitati:
            visitati.add(nodo_corrente)  # Segna il nodo come visitato
            nodi_visitati.append(nodo_corrente)  # Aggiunge il nodo alla lista dei visitati

            # Aggiungi i vicini alla frontiera
            for vicino in grafo.get(nodo_corrente, []):
                if vicino not in visitati:
                    nuovo_percorso = percorso_corrente + [vicino]
                    frontiera.append(nuovo_percorso)

    return "Problema senza soluzione", nodi_visitati

Applichiamo la funzione di ricerca generale al seguente grafo:

``` {mermaid}
%%| label: fig-simple
%%| fig-cap: "Esempio di grafo per la funzione di ricerca generale non informata" 
graph TD
    A --- B
    A --- C
    A --- D
    B --- E
    E --- F
    C --- G
    C --- H
    G --- I
    D --- L
```

Tradotto in Python, il grafo è rappresentato da un dizionario dove le chiavi sono i nodi e i valori sono le liste di nodi adiacenti.

In [None]:
grafo = {
    'A': ['B', 'C', 'D'],
    'B': ['E'],
    'C': ['G', 'H'],
    'D': ['L'],
    'E': ['F'],
    'G': ['I'],
    'H': [],
    'I': [],
    'F': [],
    'L': []
}

Creiamo una semplice funzione Python per vedere il grafo in output su schermo:

In [None]:
def stampa_grafo(grafo):
    for nodo, vicini in grafo.items():
        print(f"{nodo} -> ", end="")
        for vicino in vicini:
            print(f"{vicino}", end=" ")
        print()  # Nuova linea dopo ogni nodo

Proviamo a stampare per verificare di aver caricato il grafo in maniera corretta:

In [None]:
stampa_grafo(grafo)

Adesso proviamo a eseguire la ricerca usando la strategia BFS:

In [None]:
# Esempi di utilizzo
print("Ricerca BFS:")
percorso, visitati = ricerca_generale(grafo, "A", "L", strategia="BFS")
print("Nodi visitati:", visitati)
print("Percorso completo:", percorso)

Proviamo adesso a eseguire la ricerca usando la strategia DFS:

In [None]:
print("\nRicerca DFS:")
percorso, visitati = ricerca_generale(grafo, "A", "L", strategia="DFS")
print("Nodi visitati:", visitati)
print("Percorso completo:", percorso)       

Si noti come, in questo caso, la strategia DFS visiti molti più nodi rispetto alla strategia BFS per arrivare allo stesso percorso

### Esperimento 2: ricerca non informata del cammino in un labirinto

Il caso del labirinto è un caso particolare di problema di ricerca in un grafo. Cominciamo con la definizione di un labirinto in formato testo. Possiamo descrivere un labirinto come una matrice di caratteri, dove i caratteri rappresentano le celle del labirinto. In particolare possiamo usare i seguenti caratteri:

-   `#`: Muro
-   : Passaggio libero
-   `S`: Inizio
-   `E`: Fine
-   `+`: Percorso trovato
-   `-`: celle visitate

Un esempio di labirinto è il seguente:

```         
###                 #########
#   ###################   # #
# ####                # # # #
# ################### # # # #
#                     # # # #
##################### # # # #
#   ##                # # # #
# # ## ### ## ######### # # #
# #    #   ##E#         # # #
# # ## ################ # # #
### ##             #### # # #
### ############## ## # # # #
###             ##    # # # #
###### ######## ####### # # #
###### ####             #   #
S      ######################
```

Evidentemente, al di fuori della matrice, il labirinto è circondato da un muro. Prima di tutto dobbiamo leggere il labirinto da un file di testo e trasformarlo in un grafo che rappresenta il labirinto. La funzione prende in input il nome di un file che contiene un labirinto, rappresentato come una griglia 2D di caratteri. Ogni carattere rappresenta elementi diversi: '\#' per i muri, 'S' per il punto di partenza, 'E' per il punto di arrivo e spazi vuoti per i percorsi percorribili. La funzione produce tre risultati: - un dizionario del grafo che mostra come le posizioni del labirinto sono collegate. Il dizionario del grafo usa coppie di coordinate (x,y) come chiavi, con ogni chiave che ha una lista delle coordinate dei vicini raggiungibili. - le coordinate della posizione iniziale - le coordinate della posizione finale.

Il funzionamento è il seguente: Per ogni posizione nella griglia del labirinto (i due cicli for uno per le righe e uno per le colonne) se non è un muro, controlla se è il punto di partenza ('S') o di arrivo ('E') e memorizza queste posizioni speciali. Poi, per ogni posizione valida, esamina le quattro possibili direzioni in cui ci si può muovere (su, destra, giù, sinistra) e aggiunge qualsiasi mossa valida alla lista delle connessioni di quella posizione nel grafo.

La principale trasformazione dei dati che avviene è la conversione da una rappresentazione a griglia 2D a una struttura a grafo dove ogni posizione è collegata ai suoi vicini accessibili.

Per esempio, se il labirinto ha un percorso dove ci si può muovere a destra e in basso dalla posizione (1,1), il grafo includerebbe qualcosa come: {(1,1): \[(2,1), (1,2)\]}, mostrando che dalla posizione (1,1) si possono raggiungere le posizioni (2,1) e (1,2).

In [None]:
def leggi_labirinto(file_path):
    """
    Legge un labirinto da un file ASCII e lo trasforma in un grafo.
    :param file_path: nome del file testo (.txt) contenente il labirinto.
    :return: Tupla contenente (labirinto, grafo, stato_iniziale, stato_finale.
    """
    with open(file_path, 'r') as file:
        labirinto = [list(line.rstrip()) for line in file]

    grafo = {}
    stato_iniziale = None
    stato_finale = None

    righe = len(labirinto)
    colonne = len(labirinto[0])

    for riga in range(righe):
        for colonna in range(colonne):
            if labirinto[riga][colonna] in (' ', 'S', 'E'):
                nodo = (riga, colonna)
                grafo[nodo] = []

                if labirinto[riga][colonna] == 'S':
                    stato_iniziale = nodo
                elif labirinto[riga][colonna] == 'E':
                    stato_finale = nodo

                # Controlla i vicini (su, giù, sinistra, destra)
                for dr, dc in [(-1, 0), (1, 0), (0, -1), (0, 1)]:
                    vicinino = (riga + dr, colonna + dc)
                    if 0 <= vicinino[0] < righe and 0 <= vicinino[1] < colonne and labirinto[vicinino[0]][vicinino[1]] in (' ', 'S', 'E'):
                        grafo[nodo].append(vicinino)

    return labirinto, grafo, stato_iniziale, stato_finale

Adesso ci occorre una funzione che, dato un labirinto e un percorso, stampi il labirinto con il percorso e i nodi visitati.

In [None]:
def stampa_labirinto(labirinto):
    """Stampa il labirinto in formato ASCII."""
    for riga in labirinto:
        print(''.join(riga))

def stampa_labirinto_con_percorso(labirinto, percorso, visitati):
    """Stampa il labirinto con il percorso e i nodi visitati."""
    labirinto_modificato = [riga.copy() for riga in labirinto]

    for riga, colonna in visitati:
        if labirinto_modificato[riga][colonna] not in ('S', 'E'):
            labirinto_modificato[riga][colonna] = '-'

    for riga, colonna in percorso:
        if labirinto_modificato[riga][colonna] not in ('S', 'E'):
            labirinto_modificato[riga][colonna] = '+'

    stampa_labirinto(labirinto_modificato)

Ipotizzando di aver memorizzato il labirinto nel file "labirinto.txt" possiamo leggerlo e memorizzarlo in un grafo nel seguente modo:

In [None]:
labirinto, grafo, stato_iniziale, stato_finale = leggi_labirinto("labirinto.txt")

Proviamo a risolvere il labirinto con l'algoritmo DFS:

In [None]:
percorso, visitati = ricerca_generale(grafo, stato_iniziale, stato_finale, strategia="DFS")

if isinstance(percorso, list):
    print("\nLabirinto con percorso trovato:")
    stampa_labirinto_con_percorso(labirinto, percorso, visitati)
else:
    print(percorso)

Come possiamo vedere, l'algoritmo DFS ha trovato un percorso, ma non è l'unico possibile. Per trovare il percorso ha visitatoo molti nodi:

In [None]:
print(f"Nodi visitati: {len(visitati)}")

Se proviamo a risolvere il labirinto con l'algoritmo BFS otteniamo il seguente risultato:

In [None]:
percorso, visitati = ricerca_generale(grafo, stato_iniziale, stato_finale, strategia="BFS")

if isinstance(percorso, list):
    print("\nLabirinto con percorso trovato:")
    stampa_labirinto_con_percorso(labirinto, percorso, visitati)
else:
    print(percorso)

Per trovare il percorso ha visitatoo molti nodi:

In [None]:
print(f"Nodi visitati: {len(visitati)}")

Come visto nel paragrafo [-@sec-algoritmi-di-ricerca-non-informati] anche in questo caso l'algoritmo BFS trova il percorso più breve visitando un minor numero di nodi rispetto al BFS.

### Esperimento 3: Algoritmi di ricerca informata {#sec-algoritmi-di-ricerca-informati-inpython}

Gli algoritmi di ricerca informata sono una categoria di algoritmi di ricerca che utilizzano informazioni aggiuntive oltre alla struttura del problema per guidare la ricerca verso una soluzione. Queste informazioni aggiuntive sono spesso chiamate **euristiche**. Vediamo l'esempio proposto nel testo:


``` {mermaid}
graph TD
    A(Castelnuovo di Porto):::start --- |Flaminia| B(Via Flaminia+GRA)
    A --- |Tiberina| B
    A --- |Salaria| D(GRA-Salaria)
    A --- |E35| C(E35+GRA)
    B --- |GRA| D
    C --- |GRA| D
    D --- |Salaria| E(Viale Pola):::stop
classDef start fill:#f9f,stroke:#333,stroke-width:2px;
classDef stop fill:#f9f,stroke:#333,stroke-width:2px;
classDef visited fill:#1f1,stroke:#333,stroke-width:2px;
```

**greedy best-first search**

Il grafo, come visto nel paragrafo precedente, può essere rappresentato da un dizionario Python:

In [None]:
# Definizione del grafo come lista di adiacenza
grafo = {
    "A": [("B", "Flaminia"), ("C", "E35"), ("D", "Salaria")],
    "B": [("D", "GRA")],
    "C": [("D", "GRA")],
    "D": [("E", "Salaria")],
    "E": []
}

Mentre l'euristica è rappresentata da un dizionario Python con i nodi come chiavi e i valori euristici, distanza tra il nodo e l'obiettivo, come valori:

In [None]:
# Definizione dei valori euristici
euristica = {
    "A": 23,
    "B": 7,
    "C": 7,
    "D": 8,
    "E": 0
}

La funzione per l'implementazione dell'algoritmo **greedy best-first search** è facilmente implementabile a partire dalla funzione di ricerca generale vista nel paragrafo modificando la frontiera in una coda a priorità (min-heap) che memorizza i nodi in base al valore di euristica. Inoltre, la funzione di valutazione della frontiera viene modificata per estrarre il nodo con il valore di euristica più basso. La libreria heapq di Python può essere utilizzata per implementare una coda a priorità.

In [None]:
from heapq import heappush, heappop

def greedy_best_first_search(grafo, euristica, start, goal):
    """
    Esegue la Ricerca Greedy Best-First sul grafo fornito.

    Parametri:
        grafo (dict): Lista di adiacenza che rappresenta il grafo.
        euristica (dict): Valori euristici per ogni nodo.
        start (str): Nodo iniziale.
        goal (str): Nodo obiettivo.

    Restituisce:
        list: Percorso dal nodo iniziale al nodo obiettivo.
    """
    # Coda a priorità (min-heap) per memorizzare (valore euristico, nodo, percorso)
    coda_prioritaria = []
    heappush(coda_prioritaria, (euristica[start], start, [start]))

    visitati = set()  # Per tenere traccia dei nodi visitati

    while coda_prioritaria:
        # Estrai il nodo con il valore euristico più piccolo
        valore_h, nodo_corrente, percorso = heappop(coda_prioritaria)

        # Se l'obiettivo è raggiunto, restituisci il percorso
        if nodo_corrente == goal:
            return percorso

        # Se il nodo è già stato visitato, saltalo
        if nodo_corrente in visitati:
            continue

        # Segna il nodo corrente come visitato
        visitati.add(nodo_corrente)

        # Esplora i vicini
        for vicino, _ in grafo.get(nodo_corrente, []):
            if vicino not in visitati:
                heappush(coda_prioritaria, (euristica[vicino], vicino, percorso + [vicino]))

    # Restituisce una lista vuota se non è stato trovato alcun percorso
    return []

Proviamo a trovare il percorso più breve trale località Castelnuovo di Porto e Viale Pola, ovvero tra i nodi A e E:

In [None]:
# Esecuzione dell'algoritmo
nodo_iniziale = "A"
nodo_obiettivo = "E"
percorso = greedy_best_first_search(grafo, euristica, nodo_iniziale, nodo_obiettivo)

print("Percorso da", nodo_iniziale, "a", nodo_obiettivo, ":", percorso)

Quindi il percorso più breve tra Castelnuovo di Porto e Viale Pola è: \['A', 'B', 'D', 'E'\]

Cioè Castelnuovo di Porto -\> Via Flaminia -\> GRA -\> Salaria -\> Viale Pola.

Si invita il lettore a provare a modificare l'euristica per vedere l'effetto nella ricerca del percorso più breve.

**Algoritmo A\***

L'algoritmo A\* è un algoritmo di ricerca informata che combina l'euristica con la ricerca di costo minimo.

Usiamo, come esempio, lo stesso grafo del paragrago del testo sugli algoritmi di ricerca informati e l'euristica definita nel paragrafo precedente.

``` {mermaid}
graph TD
    A(Castelnuovo di Porto):::start --- |Flaminia, 18| B(Via Flaminia+GRA)
    A --- |Tiberina, 23| B
    A --- |Salaria, 27| D(GRA-Salaria)
    A --- |E35, 21| C(E35+GRA)
    B --- |GRA, 2| D
    C --- |GRA, 1| D
    D --- |Salaria, 9| E(Viale Pola):::stop
    classDef start fill:#f9f,stroke:#333,stroke-width:2px;
    classDef stop fill:#f9f,stroke:#333,stroke-width:2px;
    classDef visited fill:#1f1,stroke:#333,stroke-width:2px;
```

Come nell'esperimento precedente, il grafo può essere rappresentato da un dizionario Python. Solo che in questo caso la lista delle adiacenze, oltre ai nomi dei nodi, contiene anche il costo del percorso tra i nodi:

In [None]:
# Definizione del grafo come lista di adiacenza con costi
grafo = {
    "A": [("B", 18), ("C", 21), ("D", 27)],
    "B": [("D", 2)],
    "C": [("D", 1)],
    "D": [("E", 9)],
    "E": []
}

Mentre l'implementazione dell'euristica è la stessa del paragrafo precedente.

In [None]:
# Definizione dei valori euristici
euristica = {
    "A": 23,
    "B": 7,
    "C": 7,
    "D": 8,
    "E": 0
}

Una possibile implementazione dell'algoritmo A\* basata sull'algoritmo generale di ricerca con l'aggiunta di una coda a priorità basata sulla somma del costo del percorso e dell'euristica, può essere la seguente:

In [None]:
from heapq import heappush, heappop

def a_star_search(grafo, euristica, start, goal):
    """
    Esegue l'algoritmo A* sul grafo fornito.

    Parametri:
        grafo (dict): Lista di adiacenza che rappresenta il grafo con costi.
        euristica (dict): Valori euristici per ogni nodo.
        start (str): Nodo iniziale.
        goal (str): Nodo obiettivo.

    Restituisce:
        list: Percorso dal nodo iniziale al nodo obiettivo.
    """
    # Coda a priorità (min-heap) per memorizzare (f(n), g(n), nodo, percorso)
    coda_prioritaria = []
    heappush(coda_prioritaria, (euristica[start], 0, start, [start]))

    visitati = set()  # Per tenere traccia dei nodi visitati

    while coda_prioritaria:
        # Estrai il nodo con il valore f(n) più piccolo
        _, costo_g, nodo_corrente, percorso = heappop(coda_prioritaria)

        # Se l'obiettivo è raggiunto, restituisci il percorso
        if nodo_corrente == goal:
            return percorso

        # Se il nodo è già stato visitato, saltalo
        if nodo_corrente in visitati:
            continue

        # Segna il nodo corrente come visitato
        visitati.add(nodo_corrente)

        # Esplora i vicini
        for vicino, costo in grafo.get(nodo_corrente, []):
            if vicino not in visitati:
                nuovo_costo_g = costo_g + costo
                valore_f = nuovo_costo_g + euristica[vicino]
                heappush(coda_prioritaria, (valore_f, nuovo_costo_g, vicino, percorso + [vicino]))

    # Restituisce una lista vuota se non è stato trovato alcun percorso
    return []

Proviamo a trovare il percorso più breve trale località Castelnuovo di Porto e Viale Pola, ovvero tra i nodi A e E:

In [None]:
# Esecuzione dell'algoritmo
nodo_iniziale = "A"
nodo_obiettivo = "E"
percorso = a_star_search(grafo, euristica, nodo_iniziale, nodo_obiettivo)

print("Percorso da", nodo_iniziale, "a", nodo_obiettivo, ":", percorso)

Quindi il percorso più breve tra Castelnuovo di Porto e Viale Pola è: \['A', 'B', 'D', 'E'\] Cioè Castelnuovo di Porto -\> Via Flaminia -\> GRA -\> Salaria -\> Viale Pola. Quindi l'algoritmo A\* ha trovato lo stesso percorso trovato con l'algoritmo di ricerca informata greedy best first search. Questo perche la funzione di costo associato a ogni arco è esattamente l distanza stradale tra i nodi. Si invita il lettore a provare a modificare la funzione di costo per vedere l'effetto nella ricerca del percorso più breve. Ad esempio si potrebbe modificare il costo tra i nodi A e B e tra A e C impostandolo a 50 per simulare un cantiere su Flaminia e Tiberina che rallenta di molto il traffico e vedere quale percorso suggerisce A\* in questo caso.