# Un primo sguardo a OCaml

In questa dispensa saranno illustrate alcune caratteristiche di base del linguaggio OCaml, in particolare relative al paradigma di programmazione funzionale, che quello su cui OCaml si basa principalmente. Il linguaggio prevede comunque aspetti di programmazione imperativa e a oggetti che saranno brevemente illustrate.

#### Riferimenti

Questa dispensa si basa in parte su materiale ed esempi di codice tratti da:

- <A href="https://dev.realworldocaml.org/">Real World OCaml</A> (Versione 2), di Yaron Minsky, Anil Madhavapeddy e Jason Hickey

La licenza per l'utilizzo del testo e degli esempi di codice è disponibile nel sito indicato.

A differenza del libro "Real World OCaml", in questa dispensa utilizzeremo la libreria standard di OCaml, e non la più moderna libreria <a href="https://opensource.janestreet.com/base/">Base</a> utilizzata nel libro.

Inoltre, alcuni aspetti del linguaggio possono essere approfonditi consultando il manuale ufficiale di OCaml, disponibile a questo indirizzo:

- <A href="https://ocaml.org/manual/index.html">https://ocaml.org/manual/index.html</A>

## Introduzione a OCaml

Per introdurre OCaml è bene partire dai sui antenati:

**ML (Meta Language)** proposto da Robin Milner nel 1972 e sviluppato negli anni '80

- linguaggio funzionale *fortemente tipato* con avanzate funzionalità di "type inference"
- prevede funzionalità caratteristiche della programmazione funzionale: funzioni come valori, variabili immutabili, polimorfismo, pattern matching, ...
- diventato linguaggio funzionale di riferimento

**Caml (Categorical Abstract Machine Language)** sviluppato negli anni '80/'90 all'INRIA in Francia

- versione di ML dotata di una implementazione particolarmente efficiente 
- introduce la possibilità di definire moduli e fornisce una serie di librerie di programmazione

**OCaml (Objective Caml)** nato nel 1996 all'INRIA in Francia

- estende Caml con funzionalità di programmazione orientata agli oggetti

### Perché NON studiare OCaml

OCaml *NON è* un linguaggio tra i più *popolari*

- su Google Trends si vede che le ricerche di "python", "javascript", "java" sono migliaia di volte più frequenti che quelle di "ocaml"

OCaml *NON è* un linguaggio tra i più *semplici* da imparare, usare e leggere

- i linguaggi maggiormente incentrati sui costrutti della programmazione imperativa solitamente sono più intuitivi

OCaml (probabilmente) *NON sarà* il linguaggio del *futuro*

- è in circolazione da qualche decennio
- esistono dei settori in cui ha successo (dove conta la qualità del codice) ...
- ... ma è difficile immaginare che il suo utilizzo esploderà in futuro

### Perché, invece, È BENE studiare OCaml

OCaml ci consentirà di vedere la *programmazione funzionale realizzata al meglio*

- vedremo bene le caratteristiche (vantaggi e svantaggi) di questo paradigma

Molti *linguaggi "moderni"* stanno incorporando (a volte in malo modo) aspetti di programmazione funzionale presenti in OCaml da *decenni*

- studiare OCaml consentirà di comprendere questi aspetti una volta per tutte

OCaml consente di implementare in modo abbastanza naturale le semantiche statiche e dinamiche dei linguaggi di programmazione

- lo useremo per *sviluppare interpreti* di linguaggi su paradigmi diversi
- vedremo "sotto al cofano" di questi linguaggi

## Un esecutore di OCaml, per cominciare...

Per vedere le varie caratteristiche del linguaggio, utilizziamo un interprete di OCaml (o **interactive toplevel**), quali:

- `ocaml`: l'interprete standard eseguibile da linea di comando dopo l'installazione di OCaml
- `utop`: un interprete con un'interfaccia più avanzata da installare separatamente
- <A HREF="https://try.ocamlpro.com/">https://try.ocamlpro.com/</A>: un interprete online
- *questo stesso documento* (versione Jupyter Notebook): eseguendo gli esempi di codice presenti nel testo

### Come si usa l'interactive toplevel di OCaml
Il toplevel di OCaml esegue un REPL (Read-Eval-Print loop) 

Fornisce una linea di comando in cui è possibile scrivere espressioni (nella sintassi di OCaml)

- l'interprete *compila* e *valuta* immediatamente ogni espressione, fornendone il risultato e una informazione sul suo *tipo* (o un messaggio di errore)
- il risultato dell'espressione può essere legato a un nome, ottenendo una *dichiarazione* (di "variabili", funzioni, ...)
- un'espressione può utilizzare risorse ("variabili", funzioni,...) che siano state dichiarate precedentemente

**Vediamolo all'opera**

Una dichiarazione:

In [1]:
let x = 12;;

val x : int = 12


E un'espressione:

In [2]:
x + 5 ;;

- : int = 15


In questi primissimi esempi ci sono già alcune cose che possono essere osservate. Innanzitutto, la sintassi della dichiarazione con il costrutto `let` è piuttosto comune, e presente in altri linguaggi quali, in particolare, JavaScript. Più precisamente, `let` crea un *binding*, ossia un legame, tra un *nome* e un *valore*. Caratteristica fondamentale della programmazione funzionale è che anche le funzioni sono valori. Quindi `let` potrà essere usato anche per dichiarare funzioni.

La risposta fornita dall'interprete è simile nei due casi. Dopo il simbolo `:` abbiamo il tipo dell'espressione che OCaml ha *inferito* (ossia, OCaml ha dedotto il tipo di quello che sarà il risultato della valutazione dell'espressione stessa). Entrambe le espressioni, `10` e `x+5`, hanno tipo `int`. Vedremo in seguito che OCaml inferisce questa informazione di tipo esaminando la struttura dell'espressione, e non calcolandone il risultato. Inoltre, dopo il simbolo `=` abbiamo il risultato vero e proprio della valutazione dell'espressione.

Quello che cambia, nei due esempi di output forniti dall'interprete, è la prima parte. Nell'esempio di dichiarazione, l'inteprete con `val x` informa di aver creato un nuovo binding per la variabile `x` al valore `10`. Nel secondo esempio, non essendo stato usato il costrutto `let`, l'interprete informa tramite il simbolo `-` di non aver creato alcun binding. Si è limitato ad inferire il tipo dell'espressione e calcolarne il risultato.

Altra cosa da osservare è il fatto che in entrambi gli esempi mostrati si è usato il terminatore `;;` che consente al toplevel di OCaml di capire che si è terminato l'inserimento dell'espressione. Non è sempre necessario inserire questo terminatore. Ad esempio, rimuovendolo da entrambi gli esempi di codice inclusi in questo documento interattivo, il risultato che si ottiene non cambia.

Questo non è vero per altri interpreti di OCaml (ad esempio il toplevel di default `ocaml`) che non valutano l'espressione fintanto che non è stato inserito il terminatore `;;`. Inoltre, anche in questo documento interattivo, quando si volesse inserire più di una espressione in una unica cella di codice, sarebbe necessario usare il terminatore tra un'espressione e l'altra.

## Formato delle variabili
I nomi (o identificatori) delle variabili dichiarate tramite il costrutto `let`:

- possono contenere lettere, numeri e i caratteri `_` e `'`
- devono iniziare con una lettera minuscola o con `_`

Esempi corretti:

In [3]:
let x = 3 + 4 ;;

val x : int = 7


In [4]:
let x_plus_3 = x + 3 ;;

val x_plus_3 : int = 10


In [5]:
let x' = x + 1 ;;

val x' : int = 8


Esempi errati:

In [6]:
let Seven = 3 + 4 ;;

error: compile_error

In [7]:
let 7x = 7 ;;

error: compile_error

In [8]:
let x-plus-3 = x + 3 ;;

error: compile_error

## Tutto è un'espressione
Coerentemente con il paradigma funzionale, che non prevede uno "stato" del programma modificabile, i costrutti fondamentali del linguaggio non sono *comandi*, ma *espressioni*

Le espressioni possono contenere *dichiarazioni* (o meglio "bindings")

## Tipi di base (basic types)
OCaml è un linguaggio *fortemente tipato*. I tipi di dato di base sono i seguenti:

- `int`:     numeri interi
- `float`:   numeri frazionari *floating point* a doppia precisione
- `bool`:    valori di verità (booleani): `true` o `false`
- `char`:    singoli caratteri (racchiusi tra apici: `'a'` )
- `string`:  stringhe (racchiuse tra virgolette: `"abcd"` )
- `unit`:    tipo usato in casi particolari (simile a `void` in altri linguaggi), prevede come unico valore `()`

### Operazioni su `int` e `float`
Le operazioni su numeri frazionari (`float`) si scrivono diversamente da quelle su interi (`int`)

Si scrivono seguite da un punto: `+.` `-.` `*.` `/.`

In [9]:
3 + 5 ;; (*operazione su interi: tipo int*)

- : int = 8


In [10]:
3.2 +. 5.2 ;; (*operazione su frazionari: tipo float *)

- : float = 8.4


Il tipo degli operandi deve essere *coerente* con quello dell'operazione, altrimenti il compilatore segnala un errore

I valori di tipo `float` che hanno la parte frazionaria (dopo la virgola) nulla sono rappresentati da OCaml con niente dopo il punto. Ad esempio, il numero `3.0` viene in realtà rappresentato come `3.`.

### Conversione di tipo tra `int` e `float`

OCaml non prevede conversioni di tipo implicite (ossia, automatiche)

- ad esempio, il valore `3` non può essere mai usato al posto di `3.0`

Le conversioni devono essere esplicitate usando `float_of_int` e `int_of_float`


In [11]:
float_of_int 3 ;;
int_of_float 3.0 ;;

- : float = 3.


- : int = 3


In [12]:
(float_of_int 3) +. 2.4 ;;

- : float = 5.4


### Conversioni di tipo (type cast) nella maggior parte dei linguaggi fortemente tipati

Nella maggior parte dei linguaggi di programmazione fortemente tipati (ad esempio, in C e in Java) il compilatore può effettuare delle conversioni di tipo implicite. In questi linguaggi, ad esempio, è possibile scrivere un'espressione quale `3 + 2.5` assumendo che il compilatore interpreterà automaticamente il valore `3` come se fosse `3.0`. Questa conversione avviene nel momento in cui il compilatore si accorge che l'altro operando dell'operazione di somma è un valore (o un'espressione) di tipo `float`.

Più precisamente, le conversioni implicite consentono di *promuovere* un valore o un'espressione facendole assumere un tipo più *generale*. Ad esempio, il tipo del valore `3` può essere promosso implicitamente da `int` a `float`, mentre il tipo del valore `3.0` non può essere implicitamente declassato da `float` a `int`. Il tipo `int`, infatti, è un tipo meno generale di `float`, in quanto non è in grado di rappresentare la grande maggioranza dei valori tipabili come `float`. Ad esempio, il valore `2.5`, che è tipabile come `float` non ha una rappresentazione esatta tipabile come `int`.

Sempre in linguaggi quali C e Java, è possibile forzare le conversioni da un tipo più generale a uno meno generale utilizzando un *type cast*. Questo avviene, di solito, premettendo al valore a cui applicare la forzatura, il nome del tipo di destinazione racchiuso tra parentesi. Ad esempio, l'espressione `(int) 3.2` in C o in Java forza il compilatore a considerare il valore `3.2` come se fosse di tipo `int`. In questo modo, tale valore potrà essere utilizzato ovunque sia richiesto esplicitamente un valore di tipo `int` (ad esempio, passato a una funzione che preveda un parametro di tale tipo).

Il type cast in questi linguaggi ha due effetti concreti: in primo luogo applica una forzatura nella fase di *type checking* svolta dal compilatore, consentendo, ad esempio, di completare la compilazione; in secondo luogo, fa sì che a tempo di esecuzione un valore debba concretamente essere trasformato. Ad esempio, il valore `3.2` dell'esempio dovrà, a tempo di esecuzione, essere trasformato in un valore intero. Questo solitamente causa una *perdita di precisione*. Nel caso di `(int) 3.2` il risultato concreto che si otterrà (ad esempio in Java) è che il valore `3.2` sarà trasformato nel valore intero `3` tramite un troncamento della parte decimale del numero, che introduce quindi una approssimazione nel calcolo che si sta operando.

### Conversioni di tipo in OCaml

In OCaml non sono previste conversioni di tipo implicite. È possibile effettuare delle conversioni esplicite da `int` a `float` e viceversa utilizzando le funzioni `float_of_int` e `int_of_float` menzionate sopra. I motivi per cui in OCaml si è scelto di proibire le conversioni implicite sono essenzialmente due: il primo è che le conversioni implicite sono spesso la causa di errori di programmazione difficili da scovare; il secondo è che (come vedremo) OCaml fa un uso molto sofisticato delle informazioni sui tipi, per consentire il quale ha la necessità di determinare in modo accurato il tipo di ogni espressione contenuta nel programma. Le conversioni implicite possono introdurre delle ambiguità in tali elaborazioni e quindi non sono contemplate nel linguaggio.



### Operazioni su `bool`
Vediamo la sintassi delle espressioni booleane con qualche esempio:

In [13]:
let x = true ;;

val x : bool = true


In [14]:
x && false ;;
x || false ;;
not x;;     (* not è l'operazione di negazione -- come ! in molti altri linguaggi *)

- : bool = false


- : bool = true


- : bool = false


In [15]:
1 = 2 ;;   (* ATTENZIONE, il confronto si fa con =, non con == ! *)
1 <> 2 ;;  (* mentre per vedere se due espressioni sono diverse si usa <>, non != *)

- : bool = false


- : bool = true


La sintassi degli operatori logici è cambiata nel tempo ed è diversa in diversi "dialetti" del linguaggio ML. In alcuni linguaggi (e anche in alcune vecchie versioni di OCaml), al posto di `&&` e `||` capita di trovare `and` e `or`, oppure `&` e `|`. Se si riscontrano problemi con questi operatori, è bene controllare la documentazione ufficiale del linguaggio (e della versione) che si sta utilizzando.

Inoltre, come in molti altri linguaggi di programmazione, le operazioni logiche `&&` e `||` sono *cortocircuitate*. Questo significa che se nella valutazione di una espressione `e1 && e2` la sotto espressione `e1` risulta essere `false`, dal momento che questo porterà l'intera espressione `e1 && e2` ad essere `false`, l'interprete evita di valutare (inutilmente) `e2`. Analogamente, nella valutazione di una espressione `e1 || e2` la sotto espressione `e1` risulta essere `true`, l'interprete evita di valutare (inutilmente) `e2` dando immediatamente `true` come risultato complessivo.

Questo modo di valutare le operazioni logiche migliora l'efficienza dell'esecuzione del programma e, in alcuni casi, può essere sfruttata per semplificare la scrittura dei programmi.


### Operazioni su `char` e `string`
Anche in questo caso, vediamo alcuni esempi:

In [16]:
let c = 'a' ;;
int_of_char c ;; (* conversione esplicita, esiste anche char_of_int *) 

val c : char = 'a'


- : int = 97


In [17]:
let h = "hello" ;;
let hw = h ^ "world" ;; (* concatenazione con simbolo ^ *)

val h : string = "hello"


val hw : string = "helloworld"


In [18]:
int_of_string "10";; (* conversione esplicita, esistono anche per float, bool *)

- : int = 10


Ulteriori operazioni tramite l'OCaml API (https://ocaml.org/api/index.html)

## I tipi tupla
OCaml prevede diverse tipologie di *tipi strutturati*. Uno tra i più semplici sono i *tipi tupla*.

Una tupla (o ennupla) è una sequenza di valori separati da virgole.

In [19]:
let t = (10,"hello",12.5) ;; 

val t : int * string * float = (10, "hello", 12.5)


Il tipo di una tupla è il *prodotto* dei tipi degli elementi che la compongono

I concetti di tupla e prodotto provengono dalla *teoria degli insiemi*.

Se immaginiamo i tipi come insiemi di valori:

- il tipo tupla corrisponde al loro *prodotto cartesiano*
- una singola tupla è un elemento di tale prodotto cartesiano

Ad esempio, possiamo immaginare che i tipi `int` e `float` corrispondano rispettivamente (in maniera approssimata) agli insiemi dei numeri interi $\mathbb{Z}$ e reali $\mathbb{R}$. Il tipo `int*float` corrisponde all'insieme $\mathbb{Z}\times\mathbb{R} = \{(n,m) | n \in \mathbb{Z}, m \in \mathbb{R}\}$, dove $\times$ è il simbolo che descrive solitamente l'operazione di prodotto cartesiano tra insiemi. Quindi dire che il valore `(3,4.2)` è di tipo `int*float` corrisponde in realtà a dire $(3,4.2) \in \mathbb{Z}\times\mathbb{R}$.

### Esempio: piano cartesiano
Ad esempio, supponiamo di voler rappresentare i punti del piano cartesiano

- sono coppie di numeri reali, ossia elementi di $\mathbb{R} \times \mathbb{R}$

Definiamo un punto in OCaml rappresentato come coppia di `float`

In [20]:
let p = ( 3.0 , 5.0 ) ;;  (* le parentesi in realtà non sono necessarie *)

val p : float * float = (3., 5.)


Ha tipo `float * float`

Una cosa interessante è che possiamo *destrutturare* una tupla, usando `let` in modo particolare per risalire ai singoli elementi:

In [21]:
let (x,y) = p;;
x +. y;;

val x : float = 3.
val y : float = 5.


- : float = 8.


Vedremo che questo tipo di operazioni di destrutturazione fanno parte dei potenti meccanismi di *pattern matching* di OCaml

Nello scrivere `let (x,y) = p` è importante scrivere a sinistra dell'uguale un *pattern* (in questo caso una tupla contenente variabili) che abbia la stessa struttura del valore ottenuto dall'espressione a destra dell'uguale (in questo caso `p`). In altre parole, dal momento che il tipo di `p` è `float * float`, il pattern che specifichiamo nel `let` dovrà essere una tupla con due variabili. Così facendo, `x` sarà legata al primo elemento di `p`, `y` sarà legata al secondo, e così via.

## Funzioni
Sempre in coerenza con il paradigma funzionale, in OCaml le funzioni sono *valori*:

- possiamo ottenere una funzione come risultato della valutazione di un'espressione
- possiamo passare una funzione come parametro ad un'altra funzione
- una funzione può essere restituita come risultato di un'altra funzione
- ... e molto altro (vedremo) ...



### Partendo dal $\lambda$-calcolo (con espressioni su interi)
Il modo "base" di definire una funzione riprende quanto visto nel $\lambda$-calcolo

Ad esempio, la funzione $\lambda x . x + 1$ può essere definita in OCaml come segue:

In [22]:
fun x -> x + 1 ;;

- : int -> int = <fun>


e la sua applicazione $(\lambda x.x + 1) 10$ diventa, letteralmente:

In [23]:
(fun x -> x + 1) 10 ;;

- : int = 11


Ci sono un paio di osservazioni da fare sull'output dell'interprete OCaml. In primo luogo, nell'esempio con la definizione della funzione, l'interprete ha restituito un output simile a quello che avevamo visto negli esempi di espressioni mostrati in precedenza: abbiamo il simbolo `-`, che denota che non è stato effettuato alcun binding (non abbiamo dichiarato una variabile), poi abbiamo il tipo inferito dell'espressione, in questo caso `int -> int`, che descrive una funzione che prende un intero come parametro e restituisce un intero. Infine, dopo il simbolo `=` abbiamo il risultato della valutazione dell'espressione, che è genericamente `<fun>`, non essendo possibile per l'interprete rappresentare in generale i "valori-funzione" in formato testuale.
    
Nel secondo esempio, con l'applicazione della funzione, l'interprete risponde nuovamente con `-` (nessun binding), `int` (il tipo del risultato della valutazione dell'espressione) e `11` (il risultato vero e proprio).
    
Entrambi questi esempi si configurano come vere e proprie espressioni: ne può essere inferito un tipo e possono essere valutate dando come risultato un valore.

### Funzioni (OCaml vs JS)

Lo stesso modo "base" di definire funzioni è presente anche in *JavaScript*, usando il costrutto `function()` per definire una *funzione anonima*

Abbiamo che $\lambda x . x+1$ in JavaScript diventa (attenzione alle parentesi):

`JAVASCRIPT: (function(x) { return(x+1) })`

mentre $(\lambda x . x+1) 10$ in JavaScript diventa (attenzione alle parentesi):

`JAVASCRIPT: (function(x) { return(x+1) }) (10)`

*ANCHE JAVASCRIPT È NATO COME LINGUAGGIO FUNZIONALE!*

Un altro modo "base" per definire funzioni anonime in *JavaScript*

* tramite le *arrow expressions*:

$\lambda x . x + 1$ corrisponde a 

```
JAVASCRIPT: x => x + 1
```

$(\lambda x . x + 1) 10$ corrisponde a 

```
JAVASCRIPT: (x => x + 1) (10)
```

*È CHIARO CHE QUESTE OPERAZIONI SONO ISPIRATE AL $\lambda$-CALCOLO...*

Lo stesso accade in molti altri linguaggi "non funzionali". In Java, ad esempio, da qualche anno sono state introdotte le cosiddette "lambda expressions", che sono un'altra variante dello stesso concetto preso dal $\lambda$-calcolo.

### Funzioni: altri esempi dal $\lambda$-calcolo
Continuando a tenere il $\lambda$-calcolo come riferimento, possiamo vedere qualche altro esempio riformulato in OCaml

$\lambda x. \lambda y. x+y$

In [24]:
fun x -> fun y -> x+y ;;

- : int -> int -> int = <fun>


$\lambda f. \lambda n. f n +1$

In [25]:
fun f -> fun n -> f n + 1 ;;

- : ('a -> int) -> 'a -> int = <fun>


### Un primo assaggio di type inference

Questi esempi ci consentono di fare qualche osservazione su come sia definito il tipo delle funzioni. 

Nel primo esempio, `fun x -> fun y -> x+y` è una funzione che prende `x` e restituisce la funzione `fun y -> x+y`. Quest'ultima è una funzione che prende `y` e restituisce il risultato di `x+y`. Essendo `x` e `y` sommati usando l'operatore `+`, che accetta solo operandi di tipo `int`, il compilatore inferisce che `x` e `y` debbano avere tipo `int`, quindi `fun y -> x+y` deve avere tipo `int -> int` (prende un intero `y` e restituisce un intero ottenuto da `x+y`). Una volta inferito il tipo di `x` e di `fun y -> x+y`, il compilatore può ora inferire anche il tipo dell'intera funzione `fun x -> fun y -> x+y` come segue: `int -> (int -> int)` (la funzione prende un intero `x` e restituisce una funzione da `int` a `int`). Dal momento che l'operatore `->` è associativo a destra, le parentesi nel tipo possono essere rimosse, ottenendo quindi `int -> int -> int`.

Nel secondo esempio, la funzione `fun f -> fun n -> f n + n` viene esaminata in modo analogo alla precedente. Questa volta però il "corpo" della funzione `f n + n` consente di dedurre che `n` è un `int` (perché e operando di `+`), mentre `f` è una funzione, in quanto viene applicata ad `n` (in `f n`). Il fatto che `f` sia applicata al valore intero `n` e il fatto che il risultato di `f n` sia poi usato come operando di `+` consentono di inferire il tipo di `f` come `int -> int`. A questo punto, il tipo della funzione `fun f -> fun n -> f n + n` risulta essere `(int -> int) -> int -> int`. In questo caso le parentesi sono necessarie in quanto il primo `int -> int` descrive il tipo del parametro `f`. 

### Ancora un esempio
Vediamo ancora un esempio, sempre tenendo il $\lambda$-calcolo come riferimento 

$(\lambda f . \lambda n . f n + 1) (\lambda x . 2x) 10$

In [26]:
(fun f -> fun n -> f n + 1)(fun x -> 2 * x) 10 ;;

- : int = 21


Questo è un esempio di funzione *higher-order* (di ordine superiore), ossia una funzione che prende un'altra funzione (`f`) come parametro e la usa nel proprio corpo

* il valore calcolato da OCaml è lo stesso che si ottiene valutando l'espressione del $\lambda$-calcolo tramite la *$\beta$-riduzione*

Richiamiamo innanzitutto le regole della $\beta$-riduzione:

$$
(\lambda x .e_1) e_2 \rightarrow e_1 [x/e_2]
\qquad 
\frac{e_1 \rightarrow e'}{e_1e_2 \rightarrow e'e_2}
\qquad 
\frac{e_2 \rightarrow e'}{e_1e_2 \rightarrow e_1e'}
\qquad 
\frac{e \rightarrow e'}{\lambda x . e \rightarrow \lambda x . e'}
$$

Ne segue che l'espressione $(\lambda f . \lambda n . f n + 1) (\lambda x . 2x) 10$ abbia la seguente semantica:

$$
\begin{array}{lr}
(\lambda f . \lambda n . f n + 1) (\lambda x . 2x) 10  & \mbox{ricordando che } e1 \, e2 \, e3 = (e1 \, e2) \, e3\\
\rightarrow (\lambda n . (\lambda x . 2x) n + 1) 10 &  \\
\rightarrow (\lambda n . 2n + 1) 10 & \\
\rightarrow 20 + 1 = 21
\end{array}
$$

E si ottiene esattamente il risultato calcolato da OCaml.

### Funzioni con più parametri
Il costrutto `fun` può prevedere più di un parametro

In [27]:
(fun x y -> x+y) 3 4 ;; (* equivale a (fun x -> fun y -> x+y) 3 4 *)

- : int = 7


Questo però è *zucchero sintattico*: 

- è solo una semplificazione che evita di scrivere una sequenza di `fun`

In generale, con il termine *zucchero sintattico* (o syntactic sugar) si intende dire che un certo costrutto è stato previsto in un linguaggio di programmazione solo per semplificare la scrittura di certe operazioni. In realtà, le stesse operazioni possono essere scritte usando anche altri costrutti del linguaggio ottenendo comunque lo stesso identico risultato. 

Ad esempio, molti linguaggi di programmazione (come ad esempio C, Java o Javascript) prevedono un costrutto di assegnamento con incremento `+=` che può essere usato in questo modo:

```
JAVASCRIPT: X += 1
```

ma che è solo una semplificazione sintattica dell'operazione di incremento

```
JAVASCRIPT: X = X + 1
```

Nel caso del costrutto `fun` di OCaml abbiamo che

```
(fun x y -> x+y)
```

è zucchero sintattico per

```
(fun x -> fun y -> x+y)
```

## Il $\lambda$-calcolo in OCaml (sintatticamente)
La codifica *sintattica* del $\lambda$-calcolo in OCaml si può formalizzare così: 
$\newcommand{\encode}[1]{[\![#1]\!]}$

**Definizione \[Encoding $\lambda$-calcolo in OCaml\].** Dato un qualunque termine del $\lambda$-calcolo $T$, la corrispondente espressione in OCaml è $[ \! [T] \! ]$, dove $[ \! [\ldots] \! ]$ è la funzione definita ricorsivamente sulla struttura dei $\lambda$-termini come segue:

$$
\begin{array}{rl}
\encode{n} \, = & n\\
\encode{x} \, = & x\\
\encode{T' \, op \, T''} \, = & \encode{T'} \, op \, \encode{T''}\\
\encode{\lambda x. T'} \, = & \mbox{fun } x \mbox{ -> } \encode{T}\\
\encode{T' \, T''}\, = & \encode{T'} \, \encode{T''}\\
\end{array}
$$

Dove $n$ è un qualunque numero intero, $x$ è un qualunque identificatore (nome) e $op$ è un operatore artimetico $(+,-,*,/,...)$

Stiamo considerando un $\lambda$-calcolo che consente anche di includere espressioni su numeri interi. La definizione dell'encoding quindi segue la definizione sintattica di questa variante del formalismo.

La funzione $\encode{...}$ ha come dominio l'insieme delle espressioni (o termini) del $\lambda$-calcolo e come codominio le espressioni OCaml. È una funzione iniettiva (qualunque espressione del $\lambda$-calcolo può essere tradotta) ma non suriettiva (OCaml ha una sintassi molto più ricca del $\lambda$-calcolo).

In realtà $\encode{...}$ è una funzione molto semplice, che traduce letteralmente l'espressione del $\lambda$-calcolo trasformando i vari $\lambda x .$ in `fun x ->` e lasciando tutto il resto sostanzialmente inalterato.

È importante notare che la funzione $\encode{...}$ è definita *ricorsivamente sulla struttura dei $\lambda$-termini*. Questo significa che nella definizione di $\encode{...}$ abbiamo un caso per ogni termine di base ($n$ e $x$) e un caso per ogni operazione ($T' \, op \, T''$, $\lambda x. T'$ e $T' \, T''$. Nei casi che corrispondono a termini di base la funzione fornisce direttamente un risultato (casi base della ricorsione), mentre nei casi corrispondenti a operazioni la funzione viene richiamata ricorsivamente sugli operandi di tale operazione (ad esempio, $T'$ e $T''$ nel caso di $T' \, op \, T''$). Quindi la ricorsione in questo caso è usata per definire il risultato della funzione $\encode{...}$ su una certa espressione sulla base del risultato della stessa funzione $\encode{...}$ applicata a sottoespressioni.

### Il $\lambda$-calcolo in OCaml: esempi

Tanto per vedere che la traduzione è effettivamente banale...

$$
\begin{array}{l}
\encode{\lambda x. \lambda y. x+y} = \\
\mbox{fun x -> }\encode{\lambda y. x+y} = \\
\mbox{fun x -> fun y -> } \encode{x+y} = \\
\mbox{fun x -> fun y -> } \encode{x} \mbox { + } \encode{y} = \\
\mbox{fun x -> fun y -> x + } \encode{y} = \\
\mbox{fun x -> fun y -> x + y}\\
\end{array}
$$

$$
\begin{array}{l}
\encode{\lambda f. \lambda n. f n + 1} = \\
\mbox{fun f -> }\encode{\lambda n. f n + 1} = \\
\mbox{fun f -> fun n -> } \encode{f n + 1} = \\
\mbox{fun f -> fun n -> } \encode{f n} \mbox{ + } \encode{1} = \\
\mbox{fun f -> fun n -> } \encode{f} \encode{n} \mbox{ + } \encode{1} = \\
\mbox{fun f -> fun n -> f n + 1}\\
\end{array}
$$

$$
\begin{array}{l}
\encode{(\lambda f . \lambda n . f n + 1) (\lambda x . 2x) 10} = \\
\encode{(\lambda f . \lambda n . f n + 1) (\lambda x . 2x)} \encode{10} = \\
\encode{(\lambda f . \lambda n . f n + 1) (\lambda x . 2x)} \mbox{10} = \\
\encode{(\lambda f . \lambda n . f n + 1)} \encode{(\lambda x . 2x)} \mbox{10} = \\
\encode{(\lambda f . \lambda n . f n + 1)} \encode{(\lambda x . 2x} \mbox{10} = \\
\encode{(\lambda f . \lambda n . f n + 1)} \mbox{(fun x ->} \encode{2x} \mbox{) 10} = \\
\encode{(\lambda f . \lambda n . f n + 1)} \mbox{(fun x -> 2x) 10} = \\
\mbox{(fun f ->} \encode{\lambda n . f n + 1}\mbox{) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n ->} \encode{f n + 1}\mbox{) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n ->} \encode{f n} + \encode{1} \mbox{) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n ->} \encode{f n} \mbox{+ 1) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n ->} \encode{f} \encode{n} \mbox{+ 1) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n ->} \encode{f} \mbox{n + 1) (fun x -> 2x) 10} = \\
\mbox{(fun f -> fun n -> f n + 1) (fun x -> 2x) 10} \\
\end{array}
$$

## Altro modo (più comune) di definire funzioni: `let`
Le funzioni sono valori, e possono essere usate in una dichiarazione con `let`

In [28]:
let somma = fun x y -> x+y ;;
somma 3 4 ;;

val somma : int -> int -> int = <fun>


- : int = 7


Più semplicemente, si può evitare di scrivere `fun` e `->` (zucchero sintattico)

In [29]:
let somma x y = x+y ;;
somma 3 4;;

val somma : int -> int -> int = <fun>


- : int = 7


*QUESTO È IL MODO PIÙ COMUNE DI DEFINIRE FUNZIONI!*

### Definire funzioni con `function`

Esiste in realtà un altro modo ancora di definire funzioni, che utilizza, al posto del costrutto `fun`, il costrutto `function`

In [30]:
function x -> x + 1 ;;

- : int -> int = <fun>


A differenza di `fun`, le funzioni definite con `function` possono prevedere un unico parametro. A questo livello il costrutto `function` non risultata particolarmente utile. Quando parleremo di *pattern matching* vedremo che questo costrutto può semplificare leggermente la scrittura di alcuni tipi di funzioni.

### Nota: non esiste il `return`

Il corpo di una funzione in OCaml è un'*espressione*

In [31]:
let media x y =
    x +. y /. 2.0

val media : float -> float -> float = <fun>


Al momento della chiamata, l'intero corpo della funzione (l'espressione `base *. altezza /. 2.0`) viene valutato e il valore ottenuto come risultato sarà il risultato della funzione

Il *comando* `return` ha senso nella programmazione imperativa, in cui il corpo di una funzione è una sequenza di comandi

- in quel contesto `return` interrompe l'esecuzione e fornisce l'espressione da valutare nello stato raggiunto per determinare il risultato della funzione

Ad esempio, in JavaScript:

```
function area_triangolo ( x , y ) {
    let somma = x + y;
    return somma / 2;
}
```

il comando `return` interrompe la funzione e fa restituire il risultato dell'espressione `somma / 2` valutata nello stato in cui la variabile `somma` è già stata assegnata

## "Scope" delle dichiarazioni e funzioni ausiliarie 
Una dichiarazione di variabile aggiorna l'ambiente globale gestito dal toplevel di OCaml e diventa utilizzabile da tutte le espressioni successive

In [32]:
let x = 10 ;;
let y = 5 * x ;;

val x : int = 10


val y : int = 50


Il costrutto `let ... in` dichiara variabili il cui *scope* è una sola espressione

In [33]:
let z = 10 in z * z / 2 ;; (* z è utilizzabile solo qui... *)
let w = 5 * z ;;    (* mentre qui no! *)

- : int = 50


error: compile_error

Le dichiarazioni di variabili con scope limitato (variabili locali) è ottenuto in molti altri linguaggi (come JavaScript, C, Java) creando blocchi di comandi `{ ... }` e dichiarando la variabile all'interno del blocco. Il costrutto `let ... in` (dall'inglese, "sia ... in") sottolinea il fatto che lo scope è un'unica espressione (quella dopo `in`) e inoltre conferisce al programma un "sapore" più matematico richiamando il fatto che queste variabili sono in realtà molto simili alle incognite di una espressione algebrica... *Sia $x$ uguale a 10 nell'espressione $x^2/2$...*.

Questo meccanismo può essere usato anche per definire *funzioni ausiliarie*

In [34]:
let f x = 2*x
in
    f (f 10) ;;

- : int = 40


Esempio: soluzione equazioni di secondo grado  

- $ax^2 + bx +c = 0$ con $a,b,c \in \mathbb{R}$
- formula risolutiva: $\frac{-b \pm \sqrt{\Delta}}{2a}$ dove $\Delta = b^2-4ac$

In [78]:
let sol a b c =
    let delta =
        b*.b -. 4.*.a*.c
    in
        ( (-.b +. sqrt delta) /. (2.*.a) , (-.b -. sqrt delta) /. (2.*.a) ) ;; 

val sol : float -> float -> float -> float * float = <fun>


In [36]:
sol 1. (-5.) 6. ;;

- : float * float = (3., 2.)


La funzione `sol` prende i coefficienti $a$, $b$ e $c$ dell'equazione e restituisce una coppia con le due soluzioni

- il discriminante $\Delta$ viene calcolato una volta sola come variabile locale `delta`

Nella funzione `sol` viene utilizzata la funzione `sqrt` è che predefinita in OCaml e restituisce la radice quadrata di un numero (di tipo `float`).

Altra versione più sofisticata...

In [37]:
let sol a b c =
    let delta =
        b*.b -. 4.*.a*.c
    in
    let sol' op =
        ( op (-.b) (sqrt delta) ) /. (2.*.a)
    in
        (sol' (+.) , sol' (-.)) ;;

val sol : float -> float -> float -> float * float = <fun>


In [38]:
sol 1. (-.5.) 6. ;;

- : float * float = (3., 2.)


La funzione ausiliaria `sol'` viene usata per calcolare entrambe le soluzioni:

- il parametro `op` è l'operazione (somma o sottrazione) da usare nei due casi
- `(+.)` e `(-.)` sono le funzioni somma e sottrazione in forma *prefissa*

In [39]:
(+.) 3.5 2.0 ;;

- : float = 5.5


Si usa la terminologia "forma prefissa" per indicare un operatore il cui simbolo viene messo a sinistra di entrambi (se non due) gli operandi, mentre si dice "forma infissa" per indicare un operatore il cui simbolo viene messo in mezzo agli operandi. Per gli operatori aritmetici di OCaml si possono usare entrambe le forme. Quando sono usati in forma prefissa è necessario racchiuderli tra parentesi (altrimenti il compilatore non lo capisce e assume siano usati in forma infissa).

Questa versione della funzione `sol` sfrutta la possibilità di definire funzioni higher order per evitare di scrivere due volte una espressione (per calcolare una delle due soluzioni) che deve essere ripetuta più volte con una piccola variante di esecuzione tra una volta e l'altra. Visto che le due soluzioni si calcolano nella stessa maniera se non per una operazione che una volta è una somma e l'altra una sottrazione, è possibile rendere l'espressione parametrica rispetto a quella singola operazione.

## Funzioni *Curryed*

Il nome della funzione e i vari parametri sono separati da spazi, senza parentesi e virgole (diversamente da molti altri linguaggi)

In [79]:
let somma x y = x+y ;;
somma 3 4 ;;

val somma : int -> int -> int = <fun>


- : int = 7


Le funzioni definite usando la notazione con gli spazi si dicono Curryed

- dal nome del matematico *Haskell Curry*, uno dei padri della programmazione funzionale

In realtà, nulla vieta di usare parentesi e virgole:

In [41]:
let somma (x, y) = x+y ;;
somma (3,4);;

val somma : int * int -> int = <fun>


- : int = 7


ma così stiamo scrivendo una funzione con un unico parametro di tipo `int * int` (una coppia)

- alla chiamata si passa una coppia alla funzione
- la coppia viene *destrutturata* nelle variabili `x` e `y`

La notazione Curryed (cioè senza virgole) è quella comunemente usata per le funzioni in OCaml

Anche la notazione Curryed è in realtà un richiamo al $\lambda$-calcolo, in cui l'applicazione di funzione si scrive $f x$ senza parentesi ne virgole.

## Applicazione parziale di funzione
La notazione Curryed consente di applicare una funzione *parzialmente*, passandole solo una parte dei parametri

In [42]:
let somma x y = x+y ;;

val somma : int -> int -> int = <fun>


Ad esempio, passiamo un solo argomento a `somma`:

In [43]:
somma 10;;

- : int -> int = <fun>


Il risultato è una funzione di tipo `int -> int`...

Per capire meglio, ragioniamoci con il $\lambda$-calcolo.

La funzione `somma` corrisponde a 

$$\lambda x. \lambda y. x+y$$

L'applicazione parziale `somma 10` corrisponde a

$$(\lambda x. \lambda y. x+y) 10$$

Applicando la semantica del $\lambda$-calcolo otteniamo

$$(\lambda x. \lambda y. x+y) 10 = \lambda y. 10+y$$

Quindi il risultato è una funzione che prende un intero `y` e lo somma a `10`!

Torniamo in OCaml. 

Nulla proibisce di scrivere:

In [44]:
let somma_dieci = somma 10 ;;

val somma_dieci : int -> int = <fun>


A questo punto possiamo usare (quante volte vogliamo) la funzione `somma_dieci` passandole il (secondo) valore da sommare 

In [45]:
somma_dieci 5;;

- : int = 15


In [46]:
somma_dieci 10;;

- : int = 20


L'applicazione parziale di funzione è un meccanismo molto potente tipico dei linguaggi di programmazione funzionali. Consente di ottenere infinte funzioni diverse a partire da un'unica definizione. Riferendosi all'esempio della funzione `somma`, è possibile ottenere infinite funzioni diverse (`somma_uno`,`somma_cinque`,`somma_cento`,....) passando un diverso (singolo) parametro alla stessa funzione.

Questo meccanismo non va confuso con la possibilità (presente in molti linguaggi) di definire funzioni con parametri opzionali, o funzioni con parametri a cui è associato un valore di default. In questi casi, infatti, la funzione che applichiamo è sempre la stessa, ma avremo semplicemente la possibilità di evitare di scrivere qualche parametro il cui valore non è particolarmente rilevante.

## Controllo del flusso di esecuzione
La maggior parte dei linguaggi di programmazione ha come costrutti fondamentali per il controllo del flusso di esecuzione del programma:

- un *comando* di scelta condizionale (ad es. `if`)
- un *comando* di iterazione (ad es. `while`)

Questi *comandi* sono legati al <font color=red>paradigma imperativo</font>, la cui operazione fondamentale è *l'assegnamento*

- un `if` consente di scegliere, ad esempio, tra due assegnamenti
- un `while` consente di ripetere un assegnamento più volte

Questi costrutti hanno senso nel paradigma imperativo, in cui si assume uno stato del programma che viene aggiornato passo-passo

### <font color="red">Controllo del flusso di esecuzione in OCaml</font>
In OCaml (nel suo <font color=red>cuore funzionale</font>) i costrutti di base per il controllo del flusso sono:

- una *espressione* di scelta condizionale (`if`)
- la RICORSIONE

Questo perché non esistono operazioni di assegnamento: le variabili, una volta dichiarate, sono *immutabili*, ossia non possono più cambiare valore

- le variabili hanno un ruolo simile a quello delle incognite nelle espressioni algebriche (es: $y = 3 x^2 + 2 x -1$)

Non potendo ri-assegnare variabili, non ha senso eseguire dei cicli

- Si può ripetere un calcolo chiamando più volte la stessa funzione (= ricorsione)

## Espressione di scelta condizionale `if`

In OCaml `if` è un'espressione, e deve sempre prevedere due rami: `then` e `else`

- i due rami dovranno contenere a loro volta *espressioni dello stesso tipo* 
- l'`if` potrà essere usato "a destra" di una dichiarazione

In [47]:
let x = 23 ;;
let y = if x>10 then 1 else 0 ;; 

val x : int = 23


val y : int = 1


L'`if` in OCaml assomiglia all'operatore di scelta condizionale `( _ ? _ : _ )` presente in molti linguaggi di programmazione (quali JavaScript, C e Java):

`JAVASCRIPT: var y = ( x>10 ? 1 : -1 )`



È bene sottolineare di nuovo che i rami `then` e `else` devono sempre essere presenti entrambi, e devono contenere espressioni dello stesso tipo. Se così non fosse, si potrebbe scrivere, ad esempio, la seguente funzione:

```
let f x =
    if x>0 then x
           else "errore"
```

e OCaml non sarebbe in grado di inferirne il tipo (`int -> ???`) in quanto la funzione restituisce a volte l'intero `x` (che è per certo di tipo `int` visto che abbiamo fatto `x>0`) e a volte la stringa `"errore"`.

Un discorso simile vale per la necessità di avere sia il ramo `then` che `else`. Se nell'`if` della funzione `f`, ad esempio, mancasse il ramo `else` la funzione non sarebbe completamente definita... Che cosa restituisce se `x` non è maggiore di zero? Va tenuto conto che non è possibile inserire altre espressioni *dopo* l'`if` (cioè non si può scrivere, prendendo come esempio JavaScript, `if (x>9) return x; ... altro ...`) in quanto in OCaml il corpo della funzione deve essere una unica espressione. Quindi, affinché la funzione sia totale è necessario che gli `if` siano completi.

## Ricorsione

Per definire funzioni ricorsive è necessario utilizzare il costrutto `let rec`

In [48]:
let fact n = 
    if n<=0 then 1 else n * fact (n-1) ;;

error: compile_error

In [49]:
let rec fact n = 
    if n<=0 then 1 else n * fact (n-1);;

val fact : int -> int = <fun>


Il fatto che i costrutti principali per il controllo del flusso siano `if` e ricorsione rende le definizioni di funzione in OCaml concettualmente molto simili a come le stesse funzioni sarebbero definite in termini matematici. Ad esempio, la funzione che calcola il fattoriale, in termini matematici si scrive

$$
fact(n) = 
  \begin{cases} 
    1 & \mbox{se } n \leq 0\\
    n \cdot fact(n-1) & \mbox{altrimenti}
  \end{cases}
$$

che sostanzialmente prevede una scelta tra due casi e la definizione in termini di se stessa (ricorsione) in uno dei due (come nella versione OCaml).

### Perché è necessario aggiungere `rec` ?

Abbiamo visto che la definizione di funzione tramite `let`:

`let f x = x + 1` è in realtà una abbreviazione di `let f = fun x -> x+1`

Quindi l'espressione che definisce la funzione `fun x -> x + 1` non ha visibilità del nome `f` (che è in corso di dichiarazione)

Chiaramente questo crea problemi se la funzione è ricorsiva... 

- e `rec` esplicita il fatto che la funzione dovrà essere ricorsiva.

### Un paio di esempi di funzioni ricorsive
Successione di Fibonacci (restituisce l'n-esimo valore della successione):

In [50]:
let rec fibonacci n =
    if n=0 || n=1 then n
    else fibonacci (n-1) + fibonacci (n-2);;

val fibonacci : int -> int = <fun>


Massimo Comune Divisore con il metodo di Euclide:

In [51]:
let rec mcd n m =
    if m=0 then n else mcd m (n mod m);;

val mcd : int -> int -> int = <fun>


Vedremo esempi più interessanti quanto introdurremo strutture dati e pattern matching...

### Funzioni mutuamente ricorsive (con `and`)

Ogni funzione può richiamare solo funzioni definite precedentemente.

Funzioni *mutuamente ricorsive* vanno definite una dopo l'altra separate da `and`

In [1]:
let rec pari n =
  match n with
    | 0 -> true
    | x -> dispari (x-1)
    
and dispari n =
  match n with
    | 0 -> false
    | x -> pari (x-1) ;;

val pari : int -> bool = <fun>
val dispari : int -> bool = <fun>


In [2]:
pari 6;;
dispari 6;;

- : bool = true


- : bool = false


## Type Inference

Abbiamo già visto che il toplevel di OCaml ci fornisce il tipo di ogni espressione che inseriamo

In [52]:
let raggio = 5.;;
let area_cerchio = raggio**2. *. 3.14 ;;
let testo = "l'area del cerchio è " ^ string_of_float area_cerchio ;;

val raggio : float = 5.


val area_cerchio : float = 78.5


val testo : string = "l'area del cerchio è 78.5"


Il tipo di una espressione viene inferito analizzando:

- i valori inseriti
- gli operatori usati

I valori (letterali) presenti hanno un tipo ben definito, e anche gli operatori hanno dei tipi specifici a cui possono essere applicati (ad esempio, `+` agli `int` e `+.` ai `float`). A partire da queste certezze, il compilatore di OCaml può dedurre il tipo delle variabili utilizzate nell'espressione (ad esempio, in `x+y` le variabili `x` e `y` devono necessariamente avere tipo `int` perché sono operandi di un `+`).

Esaminando l'espressione partendo dai singoli valori e dalle singole variabili e facendo dei passi di deduzione che riguardano via via sottoespressioni sempre più ampie (che corrisponde a "risalire" l'albero di sintassi astratta dell'espressione) il compilatore procede creandosi un elenco di associazioni "variabile -> tipo" che si porta dietro durante l'analisi dell'espressione.

Può accadere che analizzando sottoespressioni diverse il compilatore incontri due volte la stessa variabile. Quando, risalendo nell'albero di sintassi astratta, arriverà a considerare l'espressione completa, dovrà confrontare i tipi delle due istanze della stessa variabile incontrate. Se questi due tipi sono uguali (entrambi `int`) o *unificabili* (uno più generico dell'altro... vedremo più avanti) il compilatore può procedere prendendo il tipo meno generico dei due. Se invece i due tipi sono completamente diversi (come `int` e `float`) allora il compilatore dovrà segnalare un errore di tipo.

Ad esempio, l'espressione `(x+1)-(x+4)` supera il controllo di tipi, perché il compilatore inferisce il tipo `int` per entrambe le istanze di `x`. Invece l'espressione `(x+1)-(x+.4.0)` non supera il controllo in quanto la prima istanza di `x` viene associata al tipo `int` mentre la seconda al tipo `float` (e anche perché il `-` viene applicato a un secondo operando di tipo `float`).

### Type Inference e Funzioni
Nel caso di espressioni che definiscano (o utilizzino) funzioni, inferire il tipo è un po' più complicato, anche se l'approccio rimane lo stesso

Si analizzano:

- i valori inseriti 
- gli operatori usati
- gli argomenti/valori di ritorno delle funzioni

In [53]:
let f x = x+1 ;;

val f : int -> int = <fun>


In [80]:
let y = f 10 ;;

val y : int = 11


Vediamo un esempio un po' più articolato:

In [55]:
let sum_if_true test first second =
    (if test first then first else 0)
    + (if test second then second else 0);;

val sum_if_true : (int -> bool) -> int -> int -> int = <fun>


Il tipo inferito è `(int -> bool) -> int -> int -> int` poiché:

- i due rami dell'`if` devono avere lo stesso tipo (quindi `first` e `second` sono `int` come `0`)
- essendo usata nella guardia di un `if` la funzione `test` deve restituire un `bool`
- il risultato di `+` è sempre di tipo `int`

Questa è una funzione *higher order* che prende una funzione `test` che effettua un controllo sui due parametri `first` e `second` e calcola una somma. I parametri `first` e `second` prendono parte alla somma solo se superano il controllo operato dalla funzione `test` (ossia solo se il risultato di `test` è `true`) altrimenti vengono sostituiti da `0`.

Una funzione che, come `test`, restituisce `true` o `false` come risultato di un controllo svolto sui suoi parametri viene comunemente detta *predicato*. Quindi, in questo esempio possiamo dire che `test` è un predicato che effettua un controllo su `first` e `second`.

Il fatto che `sum_if_true` preveda il predicato `test` come parametro fa sì che tale funzione possa essere utilizzata con predicati diversi a seconda delle necessità. Passando funzioni opportune, si potrà usare `sum_if_true` per sommare solo valori pari, oppure solo valori positivi, o altro...

Vediamo qualche esempio di uso di `sum_if_true`:

In [56]:
sum_if_true (fun x -> x mod 2=0) 3 4;; (* somma se pari -- mod calcola il modulo *)

- : int = 4


In [57]:
sum_if_true (fun x -> x>0) 3 (-4);; (* somma se positivo *)

- : int = 3


In [58]:
let rec potenza_di_due x =
    if x = 1 then true
    else if x < 1 || x mod 2 = 1 then false
         else potenza_di_due (x/2);;
         
sum_if_true potenza_di_due 3 4;; (* somma se potenza di due *)

val potenza_di_due : int -> bool = <fun>


- : int = 4


L'ultimo esempio, `potenza_di_due`, mostra innanzitutto che le funzioni passate come parametro non deve necessariamente essere anonime, ma possono essere qualunque funzione definibile in OCaml. Anche, come in questo caso, una funzione ricorsiva. Nell'esempio specifico, per verificare se un numero è potenza di due, lo dimezza ripetutamente andando ogni volta a vedere se è pari. Non appena si ottiene un numero dispari (`x mod 2 = 1`) o si arriva a zero, allora il numero non è una potenza di due, e si restituisce `false`. Se invece si raggiunge il valore uno sempre ottenendo numeri pari, allora il numero era una potenza di due.

### Type inference e polimorfismo
In certi casi il tipo di una funzione non può essere identificato in modo *concreto* (ossia facendo riferimento ai tipi di base `int`,`float`,... )

In [59]:
let id x = x ;; (* funzione identità *)

val id : 'a -> 'a = <fun>


la funzione `id` è *polimorfa*: si può applicare ad argomenti di tipi diversi

- il risultato avrà per certo lo stesso tipo dell'argomento passato (qualunque sia)

Il costrutto `'a` è una *variabile di tipo*:

- indica che possono essere usati valori di qualunque tipo
- se presente più volte, i valori corrispondenti dovranno avere tutti lo stesso tipo

Qualche esempio d'uso:

In [60]:
id 4 ;;

- : int = 4


In [61]:
id 'a' ;;

- : char = 'a'


In [62]:
id "ciao" ;;

- : string = "ciao"


### Altro esempio di funzione polimorfa
Restituisce il primo argomento se supera il test, altrimenti il secondo

In [63]:
let first_if_true test first second = 
    if test first then first else second ;;

val first_if_true : ('a -> bool) -> 'a -> 'a -> 'a = <fun>


Qualche esempio d'uso:

In [64]:
first_if_true (fun x -> x mod 2 = 0) 3 5;; (* controlla se pari *)

- : int = 5


In [65]:
let lettera c = (c >= 'a' && c <= 'z') || (c >= 'A' && c <= 'Z') ;;

first_if_true lettera 'e' '-';; (* controlla se è lettera dell'alfabeto *)

val lettera : char -> bool = <fun>


- : char = 'e'


### Ancora esempi di funzioni polimorfe
Funzione `maggiore`:

In [66]:
let maggiore x y =
    if x > y then x else y ;;

val maggiore : 'a -> 'a -> 'a = <fun>


In [67]:
maggiore 6 5 ;;

- : int = 6


In [68]:
maggiore 3.5 9.4

- : float = 9.4


In [69]:
maggiore "albero" "gatto";;

- : string = "gatto"


In [70]:
maggiore true false ;;

- : bool = true


Che succede se proviamo ad applicare `maggiore` a due funzioni?

In [71]:
maggiore (fun x -> x) (fun x -> x+1) ;;

error: runtime_error

Viene sollevata un'*eccezione*

- in generale non è possibile confrontare funzioni (è un problema *indecidibile*)
- dal punto di vista dei tipi questo uso di maggiore è corretto; quindi questa espressione supera il controllo dei tipi a tempo di compilazione
- un'eccezione corrisponde a una situazione anomala che si verifica *a tempo di esecuzione*

Dal momento che nella funzione `maggiore` le variabili `x` e `y` non vengono mai usate se non per confrontarle fra loro con `>` (che può essere usato con qualunque tipo di valori), il loro tipo viene inferito come `'a` (ma deve essere lo stesso per entrambe). Quindi in generale la funzione `maggiore` supera il controllo dei tipi e può essere messa in esecuzione.

A tempo di esecuzione, però, l'operazione di confronto `>` solleva un'eccezione quando viene usata per confrontare funzioni. Questo perché in generale **non è possibile confrontare funzioni**... Innanzitutto, non è chiaro che cosa possa significare che una funzione sia "maggiore" di un'altra. In secondo luogo, se anche provassimo a confrontare due funzioni per l'uguaglianza, otterremmo un'eccezione, come in questo esempio:

In [72]:
(fun x -> x) = (fun y -> y);;

error: runtime_error

Questa impossibilità non è dovuta a una debolezza dell'interprete di OCaml, ma al fatto che determinare l'uguaglianza di due funzioni è un **problema indecidibile**. Dire che due funzioni sono uguali (o equivalenti) significa dire che per qualunque possibile combinazione di valori che passiamo alla prima, il risultato che otteniamo è sempre lo stesso che otterremmo passando gli stessi valori alla seconda. (In termini matematici, chiamando le due funzioni $f$ e $g$, dovrebbe valere $\forall x.f(x)=g(x)$).

È un risultato ben noto della teoria della calcolabilità, che se fosse possibile scrivere un algoritmo capace di determinare in generale se due funzioni sono equivalenti, allora sarebbe possibile sfruttarlo per risolvere il *problema della fermata*, che è il più classico tra gli esempi di problemi indecidibili.

Usando le *annotazioni di tipo* è possibile restringere (o eliminare) il polimorfismo:

In [73]:
let maggiore (x : int) (y : int) : int =
    if x > y then x else y ;;

val maggiore : int -> int -> int = <fun>


Così si previene che questa funzione venga usata per confrontare funzioni

E se volessimo usare la funzione `maggiore` solo su valori di tipo `int` o `string`?

Servono due funzioni distinte (con nomi diversi... *no overloading*):

In [74]:
let maggiore_int (x : int) (y : int) : int =
    if x > y then x else y ;;
let maggiore_string (x : string) (y : string) : string =
    if x > y then x else y ;;

val maggiore_int : int -> int -> int = <fun>


val maggiore_string : string -> string -> string = <fun>


Le annotazioni di tipo, oltre ad essere utili in alcuni casi per rendere più comprensibile il codice, e oltre a far sì che il compilatore controlli che il tipo delle variabili e delle funzioni sia esattamente quello che ci aspettiamo, consente anche di "restringere" il tipo inferito per una certa variabile.

In questi esempi, il compilatore inferirebbe tipo `'a` per `x` e `y`, ma con l'annotazione di tipo viene forzato a considerare un tipo più restrittivo (`int` e `string`, rispettivamente nei due casi).

Le due funzioni che andiamo a definire devono avere necessariamente nomi diversi. Non è infatti possibile definire (come accade ad esempio in C# e Java) funzioni che hanno lo stesso nome e che si distinguono solo per il numero o i tipi dei loro parametri (cioè, la loro firma). Vedremo che questa possibilità, presente soprattutto nei linguaggi *object-oriented*, prende il nome di *overloading* in quanto il nome della funzione viene "sovraccaricato" di significati (corrisponde a più di una implementazione).

### Type Inference: OCaml vs TypeScript
Il linguaggio TypeScript ha un sistema di type inference con tipi polimorfi simile a quello di OCaml

Esistono tuttavia alcune differenze importanti...

Innanzitutto, i tipi di base sono diversi:

- In OCaml: `int`,`float`,`bool`,...
- In TypeScript: `number`,`boolean`,`any`,`unknown`,...

In generale: 

- OCaml necessita di inferire con precisione il tipo di ogni espressione
- TypeScript tende a essere *più permissivo* (vedi tipi `any` e `unknown`)

Ad esempio, la funzione identità:

In [75]:
let id x = x ;;

val id : 'a -> 'a = <fun>


In TypeScript si può scrivere usando `any`:

``` 
function id (x: any) : any {
    return x
}
```
però questo disabilita qualunque controllo di tipi sulla funzione `id`

- Usando `any` il compilatore accetterebbe l'espressione `12 * id("hello")`


Inoltre, la soluzione con `any` non tiene conto del fatto che il tipo del risultato è lo stesso di quello del parametro `x` (qualunque esso sia). In generale, agli occhi del compilatore di TypeScript la funzione `id` prende un parametro di qualunque tipo e restituisce un risultato di qualunque tipo (anche diverso dal precedente). In OCaml, invece, dal momento che il tipo inferito è `'a -> 'a`, il compilatore è consapevole che qualunque sia il tipo del parametro passato alla funzione, il risultato che si otterrà sarà dello stesso tipo.

In modo migliore, in TypeScript si possono usare i *Generics*:

```
function id<T> (x: T) : T {
    return x
}
```
in questo modo il compilatore può fare gli adeguati controlli sui tipi

D'altra parte:

- siamo stati costretti a *scrivere esplicitamente* la variabile di tipo `T` nel codice
- mentre OCaml è in grado di *inferire* le variabili di tipo (es. `'a`)

Un altro esempio: la funzione `maggiore` su `int` e `char`. In OCaml servono due funzioni diverse:

In [76]:
let maggiore_int (x : int) (y : int) : int =
    if x > y then x else y ;;
let maggiore_string (x : string) (y : string) : string =
    if x > y then x else y ;;

val maggiore_int : int -> int -> int = <fun>


val maggiore_string : string -> string -> string = <fun>


In TypeScript possiamo scriverne una sola usando il *tipo unione* `number | string`

```
function maggiore ( x : number | string, 
                    y : number | string ) : number | string {
    if (x>y) return x else return y
}
```
ma questo introduce qualche problema...

La funzione `maggiore` in TypeScript con il tipo unione `number | string`:

- può essere applicata ad un numero e una stringa: 
    - `maggiore(3,"hello")`
- anche conoscendo gli argomenti passati alla funzione, il compilatore non può predire esattamente il tipo del risultato: 
    - `maggiore(2,4)/2` causa un errore di tipo a tempo di compilazione

Tutto sommato forse è meglio fare due funzioni diverse...

Vedremo che anche OCaml prevede dei tipi unione, ma con un funzionamento diverso (e dei vincoli sintattici più forti) rispetto a quelli di TypeScript. 

### OCaml vs TypeScript: morale della favola

OCaml è più *rigoroso*: 

- il suo sistema di tipi è concepito per poter determinare precisamente il tipo (anche polimorfo) di ogni espressione
- a tal fine non prevede cose come le conversioni di tipo implicite o tipi "ambigui" (come `any` o `number | string`), che semplificano la vita, ma possono indurre a errori di programmazione difficili da scovare

TypeScript, d'altra parte, cerca *compromessi*:

- per non introdurre troppe limitazioni rispetto a JavaScript, concede un po' di libertà al programmatore
- questo semplifica la programmazione, ma apre alla possibilità che il programmatore poco attento commetta qualche errore evitabile

Da questa discussione NON si vuole trarre la conclusione che il sistema di tipi di uno dei due linguaggi sia migliore rispetto a quello dell'altro. OCaml e TypeScript sono linguaggi concepiti con obiettivi profondamente diversi, ed ognuno fa un uso dei tipi appropriato per i propri scopi.