# Liste e Pattern Matching

In questo capitolo saranno illustrati alcuni aspetti relativi a tipi di dato strutturati e pattern matching nel linguaggio OCaml, in particolare relative al paradigma di programmazione funzionale, che quello su cui OCaml si basa principalmente. Il linguaggio prevede comunque aspetti di programmazione imperativa e a oggetti che vedremo successivamente.

### Riferimenti

Questo capitolo si basa su materiale ed esempi di codice tratti da:

- <A href="https://dev.realworldocaml.org/">Real World OCaml</A> (Versione 2), di Yaron Minsky, Anil Madhavapeddy e Jason Hickey

La licenza per l'utilizzo del testo e degli esempi di codice è disponibile nel sito indicato.

Inoltre, alcuni aspetti del linguaggio possono essere approfonditi consultando il manuale ufficiale di OCaml, disponibile a questo indirizzo:

- <A href="https://ocaml.org/manual/index.html">https://ocaml.org/manual/index.html</A>

## Liste

In OCaml le liste sono un tipo di dato predefinito

Lista = *sequenza finita e immutabile di valori dello stesso tipo*

In [1]:
let numeri = [3; 5; -1; 9; 14; 21] ;;

val numeri : int list = [3; 5; -1; 9; 14; 21]


Se gli elementi sono di tipo `XYZ`, il tipo della lista è `XYZ list`

Inoltre, la lista vuota si rappresenta semplicemente come `[]` e ha tipo generico:

In [2]:
let lista_vuota = [] ;;

val lista_vuota : 'a list = []


Da questi esempi è evidente che una lista si rappresenta come una sequenza di valori racchiusi tra parentesi quadre e separati da punto e virgola. Il fatto che sia una sequenza *immutabile* significa che non sarà possibile modificare (aggiungere, rimuovere o modificare) gli elementi della lista. Ogni operazione che vedremo sulle liste potrà leggere e processare gli elementi, e costuire nuove liste a partire da quelle esitenti, ma sempre senza possibilità di modificarle.

Le liste possono contenere elementi di qualunque tipo.

Una lista di stringhe:

In [3]:
let stringhe = ["cane"; "gatto"; "rana"; "gnu"];;

val stringhe : string list = ["cane"; "gatto"; "rana"; "gnu"]


Una lista di tuple (tutte dello stesso tipo):

In [4]:
let tuple = [ (1,"lun"); (2,"mar"); (3,"mer") ] ;;

val tuple : (int * string) list = [(1, "lun"); (2, "mar"); (3, "mer")]


Una lista di funzioni (tutte dello stesso tipo)

In [5]:
let funzioni = [ (fun x -> x+1) ; (fun x -> x-1) ; (fun x -> x) ] ;;

val funzioni : (int -> int) list = [<fun>; <fun>; <fun>]


Nell'ultimo esempio, in realtà, gli elementi della lista (funzioni) non hanno tutti lo stesso tipo. Mentre le prime due hanno tipo `int -> int`, la terza ha tipo `'a -> 'a`. Essendo però `'a -> 'a` compatibile con `int -> int` e più generico, i tipi delle tre funzioni possono essere unificati nel tipo più specifico `int -> int`. Approfondiremo questo aspetto tra poco.

Inoltre, è anche possibile creare liste di liste:

In [6]:
let liste = [ [1; 2; 3] ; [1; 3; 2] ; [2; 1; 3] ; [2; 3; 1] ; [3; 1; 2] ; [3; 2; 1] ] ;;

val liste : int list list =
  [[1; 2; 3]; [1; 3; 2]; [2; 1; 3]; [2; 3; 1]; [3; 1; 2]; [3; 2; 1]]


## Riflessione sul tipo di una lista
OCaml inferisce il tipo di una lista *unificando* i tipi dei suoi elementi:

In [7]:
[] ;;

- : 'a list = []


In [8]:
[[]; []] ;;

- : 'a list list = [[]; []]


In [9]:
[[]; []; [3]] ;;

- : int list list = [[]; []; [3]]


In [10]:
[[]; []; ["ciao"]] ;;

- : string list list = [[]; []; ["ciao"]]


Anche in questi esempi, come in quello della lista di funzioni visto poco sopra, si vede il meccanismo di unificazione dei tipi in opera. Le liste che contengono solo liste vuote hanno tipo (generico) `'a list list`. Non appena alle liste vuote si aggiunge una lista non vuota (di `int` e `string`, negli esempi) il tipo dell'intera lista viene reso più specifico (diventando `int list list` e `string list list`, rispettivamente).

Quello che fa il l'unificazione dei tipi è trovare il *tipo più generico possibile* che sia compatibile con tutti gli elementi della lista. Fintanto che nella lista vengono inserite solo liste vuote `[]` il tipo può rimanere generico (in quanto una lista vuota può essere di `int`, `string`, o qualunque altro tipo). Nel momento in cui nella lista venga incluso una lista non vuota (es. `[3]`), allora il tipo più generico possibile diventa il tipo di quella specifica lista, in quanto essa non può avere altri tipi se non quello dato dagli elementi che contiene (ad es. `int list`).

Con le funzioni:

In [2]:
let f x y = 3;;

val f : 'a -> 'b -> int = <fun>


In [3]:
let g x y = x+1 ;;

val g : int -> 'a -> int = <fun>


In [4]:
let h x y = y+1 ;;

val h : 'a -> int -> int = <fun>


In [5]:
let lista = [f ; g];;

val lista : (int -> 'a -> int) list = [<fun>; <fun>]


In [6]:
let lista2 = h::lista;;

val lista2 : (int -> int -> int) list = [<fun>; <fun>; <fun>]


Questi esempi con le funzioni consentono di osservare nuovamente il funzionamento dell'unificazione dei tipi. Le tre funzioni `f`, `g` e `h` hanno tipi generici diversi. La lista `lista` ha un tipo che è il più generico possibile che sia compatibile con i tipi di `f` e `g`, ossia `(int -> 'a -> int) list`. Aggiungendo alla lista `h` (in `lista2`) il tipo deve essere ulteriormente specializzato per tenere conto del fatto che `h` ha un secondo parametro di tipo `int`.

E' interessante vedere quale sia il tipo di una lista che contenga solo `g` e `h`:

In [7]:
let lista3 = [g ; h] ;;

val lista3 : (int -> int -> int) list = [<fun>; <fun>]


Nonostante sia `g` che `h` abbiano un tipo polimorfo (generico), il fatto che `g` preveda un primo parametro di tipo `int` e `h` un secondo parametro di tipo `int` implica che la lista abbia tipo `int -> int -> int list`, cioè che si tratti di una lista di funzioni con due parametri *entrambi interi*.

Il tipo inferito da OCaml tramite il meccanismo di unificazione descritto da questi esempi, prende il nome di *most general unifier*, ossia (come già detto) è il tipo più generico possibile che tenga conto di tutti i vincoli imposti dai tipi che sono stati unificati.

## L'operatore cons `::`
Una lista può essere *costruita* a partire da un'altra usando l'operatore `::` ("cons")

**Definizione (`::`).** Data una lista `l` di tipo `T list` e un elemento `e` di tipo `T`, si denota con `e :: l` la lista in cui il primo elemento è `e` seguito dagli elementi in `l`

In [16]:
let l1 = [3;2;1] ;;
let l2 = 4 :: l1 ;;

val l1 : int list = [3; 2; 1]


val l2 : int list = [4; 3; 2; 1]


La notazione `[1; 2; 3; 4]` è in realtà "zucchero sintattico" per la notazione

In [17]:
let lis = 1 :: (2 :: (3 :: (4 :: [] ))) ;;

val lis : int list = [1; 2; 3; 4]


che può essere scritta più semplicemente così (essendo `::` associativo a destra):

In [18]:
let lis = 1 :: 2 :: 3 :: 4 :: [] ;;

val lis : int list = [1; 2; 3; 4]


Questa rappresentazione evidenza la natura *induttiva* (incrementale) delle liste
* a partire dalla lista vuota `[]`, si concatena in testa `4`, poi `3`, poi `2`, poi `1`

**ATTENZIONE:** 

E' comune dire che `::` *aggiunga* un elemento in testa alla lista, ma non è esatto:
* Le liste sono immutabili, quindi `e :: l` concettualmente è una *lista diversa* con dentro `e` e gli elementi di `l`

Il fatto che le liste siano immutabili fa sì che OCaml non debba copiare gli elementi di `l` nella nuova lista

Vediamo perché...

Le liste in OCaml sono concepite come *liste concatenate singole*

La lista `lis1 = [2; 3; 4]` corrisponde a:

![Lista1](files/images/Lista1.png)

La lista `lis2 = 1 :: lis` può essere ottenuta concatenando in testa:

![Lista2](files/images/Lista2.png)

Essendo immutabili (= no modifiche ai valori) per il programmatore è come se fossero due liste diverse
* no spreco di memoria

## Concatenazione di liste (append - `@`)
Date due liste `lis1` e `lis2`, l'operazione *append* `lis1 @ lis2` descrive la loro concatenazione in un'unica lista  

In [19]:
let lis1 = [1;2;3] ;;
let lis2 = [4;5;6] ;;
let lis3 = lis1 @ lis2 ;;

val lis1 : int list = [1; 2; 3]


val lis2 : int list = [4; 5; 6]


val lis3 : int list = [1; 2; 3; 4; 5; 6]


Internamente, la concatenazione crea una copia della prima lista

Date `lis1 = [1; 2; 3]` e `lis2 = [4; 5; 6]`:

![Lista3](files/images/Lista3.png)

Ecco il risultato di `let lis3 = lis1 @ lis2`:

![Lista4](files/images/Lista4.png)

## Altre operazioni su liste (OCaml API)
Il modulo `List` dell'OCaml API (https://ocaml.org/api/List.html) fornisce moltissime funzioni per l'elaborazione di liste. Ad esempio:

In [20]:
List.length [5;2;1] ;; (* lunghezza della lista *)

- : int = 3


In [21]:
List.hd [5;2;1] ;; (* head - primo elemento della lista *)
List.tl [5;2;1] ;; (* tail - elementi successivi al primo *)

- : int = 5


- : int list = [2; 1]


In [22]:
List.rev [5;2;1] ;; (* rovescia la lista *)

- : int list = [1; 2; 5]


Interessante anche vedere il codice sorgente di tutte queste funzioni:
* https://github.com/ocaml/ocaml/blob/trunk/stdlib/list.ml

## Pattern Matching
Per accedere agli elementi di una lista è necessaria un'operazione di *destrutturazione*
* OCaml ha un potente meccanismo di *Pattern Matching* (non solo per liste)

**Sintassi:**
```
match EXP with
| P_1 -> EXP_1
| P_2 -> EXP_2
...
| P_N -> EXP_N
```

**Semantica informale:** 
* il risultato di `EXP` viene confrontato con i pattern `P_1, ..., P_n`
* se `P_i` è il primo pattern con cui *fa match*, si valuta l'espressione `EXP_i`

## Sintassi dei pattern
Considerando i tipi visti fino ad ora (tipi di base, tuple e liste) la sintassi dei pattern è data da:
* valori di tipi base (non funzioni): `true`,`false`,`0`,`1`,`2`,`2.3`,`4.5`,`'a'`,`'b'`,`'c'`,`"abc"`
* variabili: `x`,`y`,`z`,...
* tuple: `(P_1,...,P_N)`
* liste di lunghezza fissata: `[P_1,...,P_N]`
* liste con *cons*: `P_1 :: P_2`
* wildcard: `_`

dove `P_1`,....`P_N` sono a loro volta dei pattern

**Definizione (Match)** Un valore `v` fa *match* con un pattern `P` se:
* `P=_`
* `P=v`
* esiste un modo di istanziare le variabili in `P` ottenendo `P'` tale che `P'=v` 

Esempi:

| Pattern | Fanno match | Non fanno match |
| --- | --- | --- |
| `1` | `1` | `0`,`2`,`3` |
| `(3,2)` | `(3,2)` | `(2,3)`,`(4,2)` |
| `(x,y)` | `(3,2)`,`(2,3)`,`(4,2)` | `(1,3,2)`,`(1,4,3,2)` |
| `(x,2)` | `(3,2)`,`(4,2)`,`("ciao",2)` | `(2,3)`, `(4,2,1)` |
| `[]` | `[]` | `[3]`,`[1;5]`,`['a','b','c']` |
| `[3]` o (`3::[]`) | `[3]` | `[]`,`[1;5]`,`['a','b','c']` |
| `3::x` | `[3]`,`[3;4;5]` | `[]`,`[1;5]`,`['a','b','c']` |
| `x::y` | `[3]`,`[3;4;5]`,`[1;5]`,`['a','b','c']` | `[]` |
| `_` | `5`,`true`,`"abc"`,`(3,"hello")`, `[3;2;4]`, `[]` |  |

Esempi con tipi di dato di base:

In [23]:
let negazione b =
    match b with
    | true -> false
    | false -> true ;;

val negazione : bool -> bool = <fun>


In [24]:
let rec fibonacci n =
    match n with
    | 0 -> 0
    | 1 -> 1
    | _ -> fibonacci (n-1) + fibonacci (n-2);;

val fibonacci : int -> int = <fun>


La wildcard `_` messa in fondo cattura tutti gli altri casi

Qualche esempio con le tuple:

In [25]:
let my_or x y =
    match (x,y) with
    | (false,false) -> false
    | _ -> true;;

val my_or : bool -> bool -> bool = <fun>


In [26]:
let first_true t =
    match t with
    | (true,_,_) -> 1
    | (false,true,_) -> 2
    | (false,false,true) -> 3
    | (false,false,false) -> -1;;

val first_true : bool * bool * bool -> int = <fun>


Qualche esempio con le liste:

In [27]:
let is_empty lis =
    match lis with
    | [] -> true
    | _ -> false

val is_empty : 'a list -> bool = <fun>


In [28]:
let inizia_con_zero lis =
    match lis with
    | [] -> false
    | 0::lis' -> true
    | x::lis' -> false

val inizia_con_zero : int list -> bool = <fun>


In [29]:
let lunghezza_uno lis =
    match lis with
    | [] -> false
    | x::[] -> true
    | x::lis -> false

val lunghezza_uno : 'a list -> bool = <fun>


I casi `false` negli ultimi due esempi possono essere accorpati in `_`

### TODO: notare che in x::ls la x è un singolo elemento mentre ls è una lista

## Pattern matching e esaustività

E' opportuno (ma non obbligatorio) che i pattern siano *esaustivi*:
* per qualunque valore ci deve essere (almeno) un pattern con cui fa match

Esempio non esaustivo (warning a tempo di compilazione):

In [30]:
let giorno n =
    match n with
    | 1 -> "lunedì"  | 2 -> "martedì"  | 3 -> "mercoledì"
    | 4 -> "giovedì" | 5 -> "venerdì"
    | 6 -> "sabato"  | 7 -> "domenica"

File "[30]", line 2, characters 4-156:
2 | ....match n with
3 |     | 1 -> "lunedì"  | 2 -> "martedì"  | 3 -> "mercoledì"
4 |     | 4 -> "giovedì" | 5 -> "venerdì"
5 |     | 6 -> "sabato"  | 7 -> "domenica"
Here is an example of a case that is not matched:
0


val giorno : int -> string = <fun>


A tempo di esecuzione:

va tutto bene fintanto che i valori passati alla funzione sono tra quelli "matchabili"

In [31]:
giorno 7;;

- : string = "domenica"


altrimenti viene sollevata un'eccezione

In [32]:
giorno 8;;

error: runtime_error

## TODO:
accorpamento casi? --> attezione alle variabili che devono essere le stesse in tutti i casi

## La vera potenza del Pattern Matching

Abbiamo usato il pattern matching come strumento di *selezione condizionale*:
* l'abbiamo usato un po' come il costrutto `switch` presente in molti altri linguaggi (ad es. JavaScript)
* rispetto ad uno `switch` (o a un `if`) ci ha consentito di esprimere condizioni sulla struttura (ad es. lista non vuota, usando il pattern `x::lis`)

La vera potenza del pattern matching è che consente di "smontare" le strutture dati:
* processare i singoli elementi di una tupla
* processare i singoli elementi di una lista
* estrarre una sottolista

Questo grazie alle variabili presenti nei pattern!

Quando un valore fa match con un pattern `P_i` che contiene variabili, quelle variabili vengono istanziate e sono utilizzabili nell'espressione `EXP_i`

In [33]:
let primo t =
    match t with
    | (x,_) -> x ;;

val primo : 'a * 'b -> 'a = <fun>


In [34]:
let somma t =
    match t with
    | (x,y) -> x+y ;;

val somma : int * int -> int = <fun>


Abbiamo già visto che, sfruttando il pattern matching implicito in `let`, queste funzioni possono essere scritte più semplicemente così:

In [35]:
let primo (x,y) = x ;;
let somma (x,y) = x+y ;;

val primo : 'a * 'b -> 'a = <fun>


val somma : int * int -> int = <fun>


Un primo esempio con le liste:

In [36]:
let testa lis =
    match lis with
    | x::lis' -> x ;;

File "[36]", line 2, characters 4-37:
2 | ....match lis with
3 |     | x::lis' -> x...
Here is an example of a case that is not matched:
[]


val testa : 'a list -> 'a = <fun>


A causa del pattern matching non esaustivo, questa è una *funzione parziale*
* funziona solo su liste non vuote

## Funzioni ricorsive su liste
Il pattern matching ci consente ora di scrivere funzioni (ricorsive) che processano liste

In [37]:
let rec length lis =
    match lis with
    | [] -> 0
    | x::lis' -> 1 + length lis' ;;

val length : 'a list -> int = <fun>


In [38]:
let rec somma lis =
    match lis with
    | [] -> 0
    | x::lis' -> x + somma lis' ;;

val somma : int list -> int = <fun>


In [39]:
let rec contains x lis =
    match lis with
    | [] -> false
    | y::lis' -> if y=x then true
                 else contains x lis'

val contains : 'a -> 'a list -> bool = <fun>


Implementazione di `@`:

In [40]:
let rec append l1 l2 =
  match l1 with
    [] -> l2
  | x :: l1' -> x :: (append l1' l2)

val append : 'a list -> 'a list -> 'a list = <fun>


Richiede tempo lineare nella lunghezza di `l1`

Rovesciare una lista

Soluzione poco efficiente (perché usa `@`):

In [41]:
let rec rev lis =
    match lis with
    | [] -> []
    | x::lis' -> (rev lis') @ [x] ;;

val rev : 'a list -> 'a list = <fun>


Soluzione più efficiente che usa un parametro `lis2` di accumulazione del risultato (*accumulatore*):

In [42]:
let rev lis =
    let rec rev_accum lis1 lis2 =
        match lis1 with
        | [] -> lis2
        | x::lis1' -> rev_accum lis1' (x::lis2)
    in
        rev_accum lis [] ;;

val rev : 'a list -> 'a list = <fun>


## TODO: un esempio non banale


Vedere https://www.wikihow.it/Calcolare-l%27Area-di-un-Poligono

TODO: Spiegare e costruire passo passo

Soluzione completa:

In [43]:
let poligono = [ (-3,-2); (-1,4); (6,1); (3,10); (-4,9) ] ;;

let area pol = 
    let rec passo1 (x0,y0) lis = 
        match lis with
        | [] -> 1
        | (x,y)::[] -> x*y0
        | (x1,y1)::(x2,y2)::lis' -> x1*y2 + passo1 (x0,y0) ((x2,y2)::lis')
    in
    let rec passo2 (x0,y0) lis =
        match lis with
        | [] -> 1
        | (x,y)::[] -> y*x0
        | (x1,y1)::(x2,y2)::lis' -> y1*x2 + passo2 (x0,y0) ((x2,y2)::lis')
    in
    match pol with
    | [] -> 0.
    | p0::lis -> float_of_int (passo1 p0 pol - passo2 p0 pol) /. 2. ;;
    
area poligono;;

val poligono : (int * int) list =
  [(-3, -2); (-1, 4); (6, 1); (3, 10); (-4, 9)]


val area : (int * int) list -> float = <fun>


- : float = 60.


Soluzione migliorata:

In [44]:
let poligono = [ (-3,-2); (-1,4); (6,1); (3,10); (-4,9) ] ;;

let area pol = 
    let rec calcolo (x0,y0) lis = 
        match lis with
        | [] -> (1,1)
        | (x,y)::[] -> (x*y0 , y*x0)
        | (x1,y1)::(x2,y2)::lis' -> 
            let (ris1,ris2) = calcolo (x0,y0) ((x2,y2)::lis')
            in (ris1 + x1*y2 , ris2 + y1*x2)
    in
    match pol with
    | [] -> 0.
    | p0::lis -> let (ris1,ris2) = calcolo p0 pol
                 in float_of_int (ris1 - ris2) /. 2. ;;
    
area poligono;;

val poligono : (int * int) list =
  [(-3, -2); (-1, 4); (6, 1); (3, 10); (-4, 9)]


val area : (int * int) list -> float = <fun>


- : float = 60.


## Funzioni higher-order su liste

Abbiamo visto che nella programmazione funzionale la ricorsione è l'unico modo con cui possiamo ripetere un calcolo più volte

* Per scandire o processare una lista è inevitabile ricorrere alla ricorsione

* Esistono però degli schemi ricorrenti nelle funzioni che processano liste...

Questi schemi possono essere modellati come utili funzioni higher-order

Vediamo qualche esempio:

In [45]:
let rec contiene_zero lis =
    match lis with
    | [] -> false
    | x::lis' -> if x=0 then true
                 else contiene_zero lis' ;;

val contiene_zero : int list -> bool = <fun>


In [46]:
let rec contiene_positivo lis =
    match lis with
    | [] -> false
    | x::lis' -> if x>0 then true
                 else contiene_positivo lis' ;;

val contiene_positivo : int list -> bool = <fun>


In [47]:
let rec contiene_pari lis =
    match lis with
    | [] -> false
    | x::lis' -> if x mod 2 = 0 then true
                 else contiene_pari lis' ;;

val contiene_pari : int list -> bool = <fun>


Tutte queste funzioni:
* scandiscono la lista (usando la ricorsione)
* valutano una *condizione* su ogni elemento (essere uguale a `x`, essere positivo, essere pari, ...)
* restituiscono `true` se incontrano un elemento in cui la condizione è vera
* restituiscono `false` se arrivano in fondo alla lista

L'unica differenza tra le tre funzioni `contiene_zero`, `contiene_positivo` e `contiene_pari` è nella condizione testata su ogni elemento

**IDEA:** 
* astraiamo il test della condizione come un *predicato* (funzione `XXX -> bool`)
* scriviamo un'unica funzione che prende tale predicato come parametro e verifica se ESISTA un elemento che lo soddisfi

### Exists

Ecco la funzione (higher-order) che rappresenta questo schema

In [48]:
let rec exists p lis =
    match lis with
    | [] -> false
    | x::lis' -> if p x then true
                 else exists p lis' ;;

val exists : ('a -> bool) -> 'a list -> bool = <fun>


ora possiamo ridefinire le funzioni `contiene_zero`, `contiene_positivo` e `contiene_pari` usando la ricorsione in modo implicito (nascosta dentro a `exists`)

In [49]:
let contiene_zero lis = exists (fun x -> x=0) lis ;;
let contiene_positivo lis = exists (fun x -> x>0) lis ;;
let contiene_pari lis = exists (fun x -> x mod 2 = 0) lis ;;

val contiene_zero : int list -> bool = <fun>


val contiene_positivo : int list -> bool = <fun>


val contiene_pari : int list -> bool = <fun>


Anche la funzione `contains`, che verifica se un certo elemento è presente, può essere espressa in termini di `exists`:

In [50]:
let contains x lis = exists (fun y -> x=y) lis ;;

val contains : 'a -> 'a list -> bool = <fun>


In questo caso la funzione `exists` riceve la *chiusura* del predicato
* include il valore corrente di `x`

Vediamo un altro modo "creativo" di definire `contains` con il paradigma funzionale
* usando un'applicazione parziale di funzione

In [51]:
let uguale x y = x=y;;
let contains x lis = exists (uguale x) lis;;

val uguale : 'a -> 'a -> bool = <fun>


val contains : 'a -> 'a list -> bool = <fun>


### Forall

In modo simile possiamo definire una funzione higher-order che testa un predicato su *tutti* gli elementi della lista

In [52]:
let rec forall p lis =
    match lis with
    | [] -> true
    | x::lis' -> if p x then forall p lis'
                 else false ;;

val forall : ('a -> bool) -> 'a list -> bool = <fun>


e possiamo definire le funzioni `tutti_zeri`, `tutti_positivi` e `tutti_pari`

In [53]:
let tutti_zeri lis = forall (fun x -> x=0) lis ;;
let tutti_positivi lis = forall (fun x -> x>0) lis ;;
let tutti_pari lis = forall (fun x -> x mod 2 = 0) lis ;;

val tutti_zeri : int list -> bool = <fun>


val tutti_positivi : int list -> bool = <fun>


val tutti_pari : int list -> bool = <fun>


### Filter

Un'altra operazione frequente sulle liste è quella di selezionare (filtrare) gli elementi secondo una condizione.
* Restituendo la lista degli elementi che la soddisfano

Anche in questo caso, possiamo definire una funzione higher-order che astrae la condizione con un predicato

In [54]:
let rec filter p lis =
    match lis with
    | [] -> []
    | x::lis' -> if p x then x::filter p lis'
                 else filter p lis' ;;

val filter : ('a -> bool) -> 'a list -> 'a list = <fun>


Questa volta la funzione restituisce una lista

Possiamo usare `filter` per definire le funzioni `estrai_zeri`, `estrai_positivi` e `estra_pari`, sempre usando la ricorsione in modo implicito.

In [55]:
let estrai_zeri lis = filter (fun x -> x=0) lis ;;
let estrai_positivi lis = filter (fun x -> x>0) lis ;;
let estrai_pari lis = filter (fun x -> x mod 2 = 0) lis ;;

val estrai_zeri : int list -> int list = <fun>


val estrai_positivi : int list -> int list = <fun>


val estrai_pari : int list -> int list = <fun>


### Map

Altra elaborazione frequente: applicare la stessa operazione a tutti gli elementi
* produce una nuova lista con tanti elementi quanto quella processata
* il tipo degli elementi può essere diverso
* per astrarre sull'operazione abbiamo bisogno di una funzione, non di un predicato

In [56]:
let rec map f lis =
    match lis with
    | [] -> []
    | x::lis' -> f x::map f lis' ;;

val map : ('a -> 'b) -> 'a list -> 'b list = <fun>


Qualche esempio d'uso:

In [57]:
map (fun x -> x+1) [1;2;3] ;;

- : int list = [2; 3; 4]


In [58]:
let primo lis = map (fun (x,y) -> x) lis ;;
primo [ (3,2); (4,7); (9,2)] ;;

val primo : ('a * 'b) list -> 'a list = <fun>


- : int list = [3; 4; 9]


### Fold-right
Le funzioni higher-order viste fino ad ora lavoravano sui singoli elementi della lista in modo indipendente:
* `filter` valuta ogni elemento e sceglie se inserirlo nel risultato (indipendentemente dagli altri)
* `map` applica una funzione ad ogni elemento (indipendentemente dagli altri)
* ...

Spesso si vuole elaborare tutti gli elementi della lista per calcolare un unico risultato

Ad esempio:
* Calcolare la *somma* degli elementi di una lista
* Calcolare *minimo e massimo* di una lista
* *Concatenare tutti gli elementi* di una lista di stringhe

Intuitivamente, queste elaborazioni richiedono di scandire la lista portandosi dietro una o più variabili che memorizzano il *risultato parziale* via via calcolato

Ad esempio, nell'approccio imperativo (in JavaScript e con array...) useremmo un `for`:

```
function somma(a) {
    var s = 0
    for (var i in a)
        s += a[i] 
    return s
}
```
Lo stesso per calcolare minimo e massimo, concatenare tutti gli elementi, ecc...

L'importante è capire:
* che variabili "portarsi dietro" nel ciclo
* come aggiornarle ad ogni iterazione

Anche seguendo un approccio *ricorsivo*, nella scansione di una lista è fondamentale capire come portarsi dietro il risultato parziale e come aggiornalo ad ogni passo

Il risultato parziale non sarà memorizzato in una variabile, ma passato da una chiamata all'altra come parametro o valore di ritorno

In [59]:
let rec somma lis =
    match lis with
    | [] -> 0
    | x::lis' -> x + somma lis' ;;
somma [3;2;4] ;;

val somma : int list -> int = <fun>


- : int = 9


In questo esempio, ogni chiamata a `somma` restituisce la somma della porzione di lista che va dall'elemento corrente fino in fondo
* il risultato parziale è restituito dalla funzione

Vediamo che cosa succede nello *stack*:

![Somma_ric_1](files/images/Somma_ric_1.png)

A cui segue:

![Somma_ric_2](files/images/Somma_ric_2.png)

Quindi:
* gli elementi della lista vengono in realtà sommati dall'ultimo al primo (da *destra*)
* ad ogni passo si applica la funzione/operatore `(+)` che somma due numeri

Cerchiamo di estrarre lo schema ricorsivo su cui si basa la funzione `somma`

```
somma [3;2;4]
3 + somma [2;4]
3 + (2 + somma [4])
3 + (2 + (4 + somma []))
3 + (2 + (4 + 0))
```

Generalizziamo `(+) = f`

```
f 3 (f 2 (f 4 0))
```

Generalizziamo `lis = [x1;x2;...;xN]` e caso base restituisce `a` invece che `0`

```
f x1 (f x2 (... (f xN a)..))
```


La funzione `fold_right` realizza lo schema ricorsivo che abbiamo identificato

In [60]:
let rec fold_right f lis a =
    match lis with
    | [] -> a
    | x::lis' -> f x (fold_right f lis' a) ;;

val fold_right : ('a -> 'b -> 'b) -> 'a list -> 'b -> 'b = <fun>


Prevede i parametri (oltre alla lista `lis`):
* `f`: la funzione da applicare ad ogni passo
* `a`: il risultato corrispondente al caso base (lista vuota `[]`)

Ad ogni passo, applica `f` all'elemento e al risultato ottenuto sul resto della lista

Usiamo `fold_right` per definire `somma` usando la ricorsione in modo implicito:

In [61]:
let somma lis = fold_right (+) lis 0 ;;
somma [3;2;4] ;;

val somma : int list -> int = <fun>


- : int = 9


Altri esempi d'uso di `fold_right`:

In [62]:
let concat lis = fold_right (^) lis "" ;;

concat ["abc"; "def"; "gh"] ;;

val concat : string list -> string = <fun>


- : string = "abcdefgh"


In [63]:
let stringa_piu_lunga lis =
    let f x s =
        if String.length x > String.length s then x else s
    in
        fold_right f lis "" ;;
        
stringa_piu_lunga ["ciao";"hello";"hi"] ;;

val stringa_piu_lunga : string list -> string = <fun>


- : string = "hello"


Calcolare minimo e massimo di una lista
* che cosa è utile portarsi dietro durante la scansione della lista? 
* che funzione si deve applicare ad ogni passo?
* inoltre: qual'è il valore del caso base `[]` ??

Idea: si estrae il primo elemento e lo si usa come caso base

In [64]:
let minimo_massimo lis =
    let f x (min,max) =
        if x<min then (x,max)
        else if x>max then (min,x)
        else (min,max)
    in
        match lis with 
        | [] -> (0,0)
        | x::lis' -> fold_right f lis' (x,x) ;;

minimo_massimo [3;2;4] ;;

val minimo_massimo : int list -> int * int = <fun>


- : int * int = (2, 4)


### TODO: Si restituisce `(0,0)` se lista vuota. La ricorsione parte dal secondo elemento.

### Fold-left

Tornando all'esempio della somma, si può una funzione ricorsiva anche in questo modo:

In [65]:
let rec somma a lis =
    match lis with
    | [] -> a
    | x::lis' -> somma (a+x) lis' ;;
    
somma 0 [3;2;4] ;;

val somma : int -> int list -> int = <fun>


- : int = 9


Il risultato parziale viene:
* *passato come parametro* (inizialmente zero)
* aggiornato man mano che si incontrano nuovi elementi scandendo la lista dall'inizio alla fine (da *sinistra*)

Vediamo che cosa succede nello *stack*:

![Somma_ric_3](files/images/Somma_ric_3.png)

A cui segue:

![Somma_ric_4](files/images/Somma_ric_4.png)

Quindi:
* gli elementi della lista vengono sommati dal primo all'ultimo (da *sinistra*)
* ad ogni passo si applica la funzione/operatore `(+)` che somma due numeri
* il risultato "scende" immutato lungo lo stack (la funzione è *tail recursive*, quindi l'uso dello stack si può ottimizzare...)

Estraiamo lo schema ricorsivo su cui si basa la nuova versione della funzione `somma`

```
somma 0 [3;2;4]
somma (0 + 3) [2;4]
somma ((0 + 3) + 2) [4]
somma (((0 + 3) + 2) + 4) []
(((0 + 3) + 2) + 4)
```

Generalizziamo `(+) = f`

```
f (f (f 0 3) 2) 4
```

Generalizziamo ancora `lis = [x1;x2;...;xN]` e valore iniziale `a` invece che `0`

```
f (f (... (f (f a x1) x2) ...) xN-1) xN
```


La funzione `fold_left` realizza lo schema ricorsivo che abbiamo identificato

In [66]:
let rec fold_left f a lis =
    match lis with
    | [] -> a
    | x::lis' -> fold_left f (f a x) lis' ;;

val fold_left : ('a -> 'b -> 'a) -> 'a -> 'b list -> 'a = <fun>


Prevede i parametri (oltre alla lista `lis`):
* `f`: la funzione da applicare ad ogni passo
* `a`: il valore iniziale da cui partire con il calcolo

Ad ogni passo, richiama ricorsivamente `f` passandogli un valore via via aggiornato

Ora possiamo usare `fold_left` per definire `somma` usando la ricorsione in modo implicito

In [67]:
let somma lis = fold_left (+) 0 lis ;;
somma [3;2;4] ;;

val somma : int list -> int = <fun>


- : int = 9


Altri esempi d'uso di `fold_left` (gli stessi già visti con `fold_right`):

In [68]:
let concat lis = fold_left (^) "" lis ;;

concat ["abc"; "def"; "gh"] ;;

val concat : string list -> string = <fun>


- : string = "abcdefgh"


In [69]:
let stringa_piu_lunga lis =
    let f s x =
        if String.length x > String.length s then x else s
    in
        fold_left f "" lis ;;
        
stringa_piu_lunga ["ciao";"hello";"hi"] ;;

val stringa_piu_lunga : string list -> string = <fun>


- : string = "hello"


Calcolare minimo e massimo di una lista:

In [70]:
let minimo_massimo lis =
    let f (min,max) x =
        if x<min then (x,max)
        else if x>max then (min,x)
        else (min,max)
    in
        match lis with 
        | [] -> (0,0)
        | x::lis' -> fold_left f (x,x) lis' ;;

minimo_massimo [3;2;4] ;;

val minimo_massimo : int list -> int * int = <fun>


- : int * int = (2, 4)


**ATTENZIONE:** rispetto alla versione con `fold_right`, i parametri di `f` sono invertiti e anche quelli di `fold_left` hanno un ordine diverso

### Fold-right VS Fold-left

Ma quindi `fold_right` e `fold_left` sono intercambiabili?
* No!

Innanzitutto:
* `fold_left` è tail recursive (quindi si può ottimizzare l'uso dello stack)
* `fold_right` non lo è (anche se esistono implementazioni tail recursive)

Ma soprattutto, in alcuni casi possono portare a risultati diversi!

Esempio: funzione identità su liste (fa una "copia" della lista)

In [71]:
let id_lista1 lis =
    let f x l = x::l
    in fold_right f lis [];;
    
let id_lista2 lis =
    let f l x = x::l
    in fold_left f [] lis;;

id_lista1 [1;2;3] ;;
id_lista2 [1;2;3] ;;

val id_lista1 : 'a list -> 'a list = <fun>


val id_lista2 : 'a list -> 'a list = <fun>


- : int list = [1; 2; 3]


- : int list = [3; 2; 1]


La versione con `fold_left` ha **ROVESCIATO** la lista
* `::` aggiunge in testa! Per copiare la lista gli elementi gli vanno dati dall'ultimo al primo

## TODO: qualche altro esempio con `fold_right` e `fold_left` ?

## TODO: Le funzioni su liste nel modulo `List`

## TODO: Riprendiamo l'esempio del poligono

Soluzione ancora migliorata

In [72]:
let poligono = [ (-3,-2); (-1,4); (6,1); (3,10); (-4,9) ] ;;

let area pol =
    let f (x1,y1) ((x2,y2),(ris1,ris2)) =
        ((x1,y1),(ris1+x1*y2,ris2+x2*y1))
    in
    let (p,(ris1,ris2)) = List.fold_right f pol (List.hd pol,(0,0))
    in
    (ris1-ris2)/2;;
    
area poligono;;

val poligono : (int * int) list =
  [(-3, -2); (-1, 4); (6, 1); (3, 10); (-4, 9)]


val area : (int * int) list -> int = <fun>


- : int = 60


## TODO: funzioni map, fold (o reduce) in altri linguaggi
Tipo in JavaScript...

## TODO: Discorso sul processamento dei dati
Le funzioni tipo `map`, `fold_left`, ecc... possono essere usate per comporre pipelines di processamento dei dati
* Vedi map-reduce di google