# Riassunto AI

## Agenti intelligenti

### Agenti razionali

**Agente**: un sistema che percepisce il suo ambiente attraverso dei **sensori** e agisce su di esso mediante degli **attuatori**

**Percezione**: input percettivi in un dato istante

**Sequence percettiva**: la storia completa di tutto quello che l'agente ha percepito nella sua esistenza

**Funzione agente**: funzione matematica astratta che descrive il comportamento di un agente (descrive la corrispondenza tra una qualsiasi sequenza percettiva e una specifica azione)

**Programma agente**: implementazione concreta della funzione agente, prende in input la percezione corrente dei sensori e restituisce un'azione agli attuatori

**Autonomia**: quando un agente NON si basa sulla conoscenza pregressa inserita dal programmatore

**Misure di prestazione**: valutano una sequenza di stati dell'ambiente. Vanno progettate in base all'effetto che si desidera ottenere sull'ambiente invece di su come si pensa che debba comportarsi l'ambiente

In un dato istante, ciò che è razionale dipende da:
- la misura di prestazione che definisce il criterio di successo
- la conoscenza pregressa dell'ambiente da parte dell'agente
- le azioni che l'agente può effettuare
- la sequenza percettiva dell'agente fino all'istante corrente

**Agente razionale**: per ogni possibile sequenza di percezioni, sceglie un'azione che massimizzi il valore atteso della sua misura di prestazione, date le informazioni fornite dalla sequenza percettiva e da ogni ulteriore conoscenza dell'agente.

Non si limita a raccogliere informazioni, ma deve anche essere in grado di apprendere il più possibile sulla base delle proprie percezioni per compensare la sua iniziale conoscenza parziale o erronea.

![image.png](images/agent.png)

### La struttura degli agenti

#### Agenti reattivi semplici

- Scelgono le azioni sulla base della percezione corrente, ignorando tutta la storia percettiva
- sono basati su regole condizione-azione (**if** condizione **then** azione)
- l'**ambiente** deve essere **completamente osservabile**, anche una minima parte di non-osservabilità può causare grandi problemi
- spesso non sono in grado di evitare cicli infiniti quando operano in ambienti parzialmente osservabili, questo si può risolvere randomizzando talvolta le azioni

![image.png](images/agent_reactive_simple.png)

#### Agenti reattivi basati su modello

- per gestire l'osservabilità parziale si può tener traccia della parte del mondo che non si può vedere nell'istante corrente
- quindi l'agente mantiene uno **stato interno** che dipende dalla storia delle percezioni
- possiede 2 tipi di conoscenza:
    - informazioni sull'evoluzione del mondo indipendentemente dalle sue azioni
    - informazioni sull'effetto delle sue azioni sul mondo

![image.png](images/agent_reactive_model_based.png)

#### Agenti basati su obiettivi

- oltre a tener traccia dello stato dell'ambiente, memorizza un insieme di obiettivi e sceglie l'azione che lo porterà (prima o poi) a soddisfarli

![image.png](images/agent_objective_based.png)

#### Agenti basati sull'utilità

- **funzione di utilità**: è un internazionalizzazione della misura di prestazione
- sceglie l'azione che massimizza l'utilità attesa dei risultati, ovvero l'utilità che l'agente si attende di ottenere

![image.png](images/agent_utility_based.png)

#### Agenti capaci di apprendere

- diviso in 4 componenti:
    - **elemento esecutivo**: si occupa della selezione delle azioni esterne, equivale agli agenti descritti precedentemente
    - **elemento critico**: dice all'elemento di apprendimento come si sta comportando l'agente rispetto ad uno standard di prestazione prefissato. E' necessario perchè di per se le percezioni non forniscono alcuna indicazione del successo dell'agente
    - **elemento di apprendimento**: responsabile del miglioramento interno, utilizza le informazioni provenienti dall'elemento critico riguardo le prestazioni correnti dell'agente e determina se e come modificare l'elemento esecutivo affinchè in futuro si comporti meglio. Può modificare uno qualsiasi dei componenti "di conoscenza" mostrati nei diagrammi precedenti
    - **generatore di problemi**: suggerisce le azioni che portino ad esperienze nuove e significative

![image.png](images/agent_capable_learn.png)

### Ambienti

- gli ambienti sono i problemi di cui gli agenti razionali rappresentano le soluzioni
- definire i **PEAS** (Performance, Environment, Actuators, Sensors) per ogni tipo di agente razionale

![image.png](images/environments.png)

- proprietà degli ambienti:
    - **completamente osservabile vs. parzialmente osservabile**: **completamente osservabile** quando i sensori danno accesso allo stato completo dell'ambiente in ogni momento, o almeno che misurino gli aspetti rilevanti. **Parzialmente osservabile** se i sensori sono inaccurati, presenza di rumore o alcuni dati rilevanti non vengono catturati da essi
    - **agente singolo vs. multiagente**: **agente singolo**, **multiagente competitivo** o **multiagente cooperativo**
    - **deterministico vs. stocastico**: **deterministico** se lo stato successivo dell'ambiente è completamente determinato dallo stato corrente e dall'azione eseguita dall'agente. Altrimenti è **stocastico**
    - **episodico vs. sequenziale**: **episodico** quando l'esperienza dell'agente è divisa in episodi atomici, ogni episodio non dipende dalle azioni intraprese in quelli precedenti. **Sequenziale** quando ogni decisione può influenzare tutte quelle successive
    - **statico vs. dinamico**: **dinamico** se l'ambiente può cambiare mentre un agente sta pensando altrimenti è **statico**. **Semidinamico** se l'ambiente non cambia con il passare del tempo, ma la valutazione dell'agente si
    - **discreto vs. continuo**: ci si riferisce al modo in cui è gestito il tempo
    - **noto vs. ignoto**: ci si riferisce alla conoscenza che ha l'agente circa le "leggi fisiche" dell'ambiente. In un ambiente **noto** sono conosciuti i risultati per tutte le azioni

![image.png](images/environments_2.png)

### Rappresentazione degli stati e transizioni

**rappresentazione atomica**: ogni stato del mondo è indivisibile, non ha struttura interna

![image.png](images/atomic_state.png)

**rappresentazione fattorizzata**: suddivide ogni stato in un insieme fissato di variabili o attributi, che possono essere booleani, numeri reali, ...

Si può rappresentare l'incertezza lasciando vuoto l'attributo corrispondente

![image.png](images/factored_state.png)

**rappresentazione strutturata**: include oggetti, ognuno dei quali può avere attributi propri oltre a relazioni con altri oggetti

![image.png](images/structured_state.png)

## Risolvere problemi con la ricerca

- metodi utilizzabili da:
    - **tipo agente**: **basato su obiettivi**
    - **rappresentazione**: **atomica**
    - **ambiente**:
        - **completamente osservabile** (stato iniziale conosciuto)
        - **deterministico** (non si possono gestire eventi inaspettati)
        - **statico**
        - **completamente noto**

**algoritmo di ricerca**: prende un problema come input e restituisce una soluzione sotto forma di sequenza di azioni

- l'agente svolge ciclicamente i seguenti passi:
    1. formula un obiettivo
    2. formula un problema da risolvere
    3. invoca una procedura di ricerca
    4. esegue la sequenza di azioni restituita dalla procedura di ricerca, mentre la esegue vengono ignorate le percezioni, poichè le conosce in anticipo

![image.png](images/simple_problem_solving_agent.png)

### Definizione dei problemi

- un **problema** è definito da:
    - **stato iniziale**: in cui si trova l'agente
    - **azioni possibili** dell'agente: dato uno stato $s$, $Azioni(s)$ restituisce l'insieme di azioni che possono essere eseguite in $s$
    - **modello di transizione**: descrizione di ciò che ogni azione fa. $Risultato(s, \alpha)$ restituisce lo stato risultante dall'esecuzione dell'azione $\alpha$ nello stato $s$
    - **test obiettivo**: funzione che verifica se uno stato è l'obiettivo
    - **costo cammino**: assegna un costo numerico ad ogni cammino. Costo di passo $c(s, \alpha, s')$: costo che dell'azione $\alpha$ che fa passare lo stato $s$ ad $s'$

**soluzione**: è una sequenza di azioni che porta dallo stato iniziale ad uno stato obiettivo. La sua qualità è in funzione del costo di cammino

### Cercare soluzioni

**spazio degli stati**: l'insieme di tutti gli stati raggiungibili a partire da quello iniziale mediante qualsiasi sequenza di azioni.

Questo forma un grafo (albero di ricerca), i cui nodi rappresentano gli stati e gli archi le azioni.

**cammino**: sequenza di stati collegati da una sequenza di azioni

**frontiera**: insieme di nodi che sono stati generati e non ancora espansi.

Ogni elemento è un nodo foglia (momentaneamente, potrebbe avere figli)

**stato ripetuto**: causato da un cammino ciclico o ridondante, può causare il fallimento di alcuni algoritmi.

Per evitare i cammini ridondanti spesso si usa una lista chiusa in cui si tiene traccia di dove si è passati.

#### Strutture dati per algoritmi di ricerca e prestazioni

- per ogni nodo dell'albero si hanno:
    - **stato**
    - **padre**
    - **azione**
    - **costo di cammino**
- i nodi vengono memorizzati in una coda le cui operazioni su di essa sono:
    - **isEmpty**
    - **push**
    - **pop**
- la coda può essere **FIFO**, **LIFO** o **con priorità**

- le prestazioni di misurano in base a:
    - **completezza**: l'algoritmo garantisce di trovare una soluzione
    - **ottimalità**: l'algoritmo trova la soluzione ottima (quella con costo di cammino più piccolo)
    - **complessità temporale**: tempo necessario per trovare la soluzione
    - **complessità spaziale**: quanta memoria necessita per effettuare la ricerca

- la complessità si esprime usando 3 quantità:
    - **fattore di ramificazione $b$**: numero massimo di successori di un nodo (numero di azioni massime che si possono fare su quel nodo come prossima azione)
    - **profondità $d$**: del nodo obiettivo più vicino allo stato iniziale, ovvero il numero di passi lungo il cammino a partire dalla radice
    - **lunghezza massima $m$**: dei cammini nello spazio degli stati

### Strategie di ricerca non informata

- sono strategie che non dispongono di informazioni aggiuntive sugli stati oltre a quella fornita dalla definizione del problema

#### Ricerca in ampiezza (Breadth-first search)

- si espande prima il nodo radice, poi tutti i suoi successori, cioè **espande i nodi meno profondi**
- tutti i nodi ad un certo livello devono essere espansi prima che si possa espandere uno dei nodi al livello successivo
- **frontiera**: coda **FIFO** (i successori sono inseriti in fondo)

- proprietà:
    - **completezza**: solo se $b$ è finito
    - **ottimalità**: solo se il costo per ogni passo $= 1$
    - **complessità temporale**: $O(b^{d+1})$
    - **complessità spaziale**: $O(b^{d+1})$. Si mantiene ogni nodo in memoria e questo scaturisce il problema principale di questo algoritmo.

![image.png](images/breadth_first_search_example.png)

![image.png](images/breadth_first_search.png)

#### Ricerca in profondità (Depth-first search)

- espande sempre per primo il nodo più profondo nella frontiera dell'albero di ricerca
- è problematica solo se $m$ è molto più grande di $d$, altrimenti è più veloce di **breadth-first search**
- **frontiera**: coda **LIFO** in cui viene scelto per l'espansione l'ultimo nodo generato

- proprietà:
    - **completezza**: solo negli spazi di stati finiti
    - **ottimalità**: no
    - **complessità temporale**: $O(b^m)$
    - **complessità spaziale**: $O(bm)$. I nodi espansi vengono cancellati dalla coda.

![image.png](images/depth_first_search_example.png)

#### Ricerca a profondità limitata (Depth-limited search)

- per evitare il problema degli alberi illimitati si imposta un limite alla profondità $= L$

- proprietà:
    - **completezza**: solo se $L \geq d$
    - **ottimalità**: no
    - **complessità temporale**: $O(b^L)$
    - **complessità spaziale**: $O(bL)$

![image.png](images/depth_limited_search.png)

#### Ricerca ad approfondimento iterativo (Iterative deepening search)