# Teste, code, mappe, riduzioni

Un problema onnipresente, in informatica come nella vita di tutti i giorni, è la *ricerca* di un elemento in un insieme: un numero in un'agenda, il senso nella vita, un ago in un pagliaio.

Ebbene, diamo il nostro constributo: scriviamo una funzione `appartiene(x, t)`, che ci dica se l'elemento `x` è presente nella sequenza `t`.

Riprendiamo un po' di terminologia: data una sequenza (ad esempio una lista, o una tupla) `l`, si dice, con pregevole sensibilità zoo-anatomica, *testa* (*head*) il suo primo elemento, e *coda* (*tail*) la sequenza *decapitata*, cioè tolto il primo elemento. 

Immaginiamo di avere due funzioni, `head` e `tail`, che agiscono su una generica lista, e ci consentono di ottenerne appunto testa e coda (in Python possono facilmente essere implementate in modo ovvio utilizzando l'operatore `[]`)

Es:

1. `head([1,2,3]) == 1`
2. `tail([1,2,3]) == [2,3]`

Si noti, in particolare, come la testa sia in generale un elemento, mentre la coda sia sempre una sequenza.

Ebbene, con questa innocua operazione, apparentemente solo terminologica, ci è molto più facile ragionare in termine ricorsiva sulle sequenze.


In Python, la definizione di `head` e `tail` è semplice:

In [31]:
def head(t):
    return t[0]

def tail(t):
    return t[1:]

Per esempio, proviamo a scrivere una funzione `appartiene(x, t)`, che ci dica se l'elemento `x` è presente nella sequenza `t`.

Generalizziamo un po': chiediamoci quante volte `x` è presente in `t`, definendo un'appostia funzione `cont(x, t)`.

Possiamo definire `cont(x, t)` ricorsivamente? Per rispondere, proviamo a chiederci: se qualcuno ci dicesse quante volte `x` è presente in `tail(t)`, cioè quanto vale `cont(x, tail(t))`, sapremmo dire quanto vale `cont(x, t)`?

Ma certo: dobbiamo aggiungere `1` a `cont(x, tail(t))` se `head(t) == x`, altrimenti non aggiungiamo niente. Pythonescamente:

`cont(x, t) = cont(x, tail(t)) + 1 if head(t) == x else 0`

Questo vale fino a quando ha senso parlare di testa di `t`, cioè se la lista non è vuota, cioè se la sua lunghezza è `> 0`.

Se `t` è vuota, `x` di certo non è presente neppure una volta:

`len(x) == 0` &rArr; `cont(x, t) == 0`

Siamo pronti per definire `conta(x, t)`:

In [27]:
def conta(x, t):
    return 0 if len(t) == 0 else conta(x, t[1:]) + (1 if x == t[0] else 0)

Proviamo il nostro prodigio:

In [28]:
a = [1,2,3,4,5,2,1]
conta(1,a)

2

In [29]:
conta(10,a)

0

In [30]:
conta(3,a)

1

** Nota *linguistica***: Possiamo semplificare un po' la nostra definizione notando che in Python è definita la somma tra un valore numerico e un valore logico (True/False): quando sommato ad un numero, `True` vale `1`, mentre `False` vale... (indovinate).

In [10]:
def conta(x, t):
    return 0 if len(t) == 0 else conta(x, t[1:]) + (x == t[0])

Tornando alla nostra funzione `appartiene`, dalla quale siamo partiti: la possiamo ora ovviamente definire in termini di `conta`:

In [11]:
def appartiene(x, t):
    return conta(x, t) > 0

In [12]:
appartiene(1, [1,2,3])

True

In [13]:
appartiene(100, [1,2,3])

False

Ora prendiamo in prestito un problema dall'algebra: il prodotto scalare $\vec{a} \cdot \vec{b}$ tra due vettori $a = (a_{0}, a_{1}, ... a_{n})$ e $b = (b_{0}, b_{1}, ... b_{n})$.
Come noto il prodotto scalare $\vec{a} \cdot \vec{b}$ è $\sum_{i=0}^{n}a_{i}\overline{b_{i}}$ = $a_0 \cdot \overline{b_0} + a_1 \cdot \overline{b_1} + \cdots $




Qui, tanto per cambiare, invece di cercare prima la soluzione a un problema più generale, come abbiamo fatto con `appartiene`, consideriamo, per scaldarci e chiarirci le idee, il caso più particolare di prodotto di un vettore $a$ con *sé stesso*. Come anche i sassi sanno, il prodotto di un vettore con sé stesso corrisponde al quadrato della sua *norma euclidea*:

$ \vec{a} \cdot \vec{a} = \|\vec{a}\|^2 = \sum_{i=0}^{n}|a_i|^2$

E la norma euclidea, fatto altrettando noto ai medesimi sassi di cui sopra, generalizza ad uno spazio N-dimensionale il familiare concetto di distanza negli spazi {1,2,3}-dimensionali, ma questa è un'altra storia...

Orbene, dobbiamo elevare al quadrato tutti gli elementi della tupla che rappresenta il vettore, e poi sommarli tra di loro. Come facciamo ad elevarli al quadrato?
Una proposta è definire una funzione `sqt` (SQuare Tuple) che, ricevuta una tupla, ne ritorna una con gli elementi elevati al quadrato. Possiamo esprimere l'operazione ricorsivamente? *Claro que si!*

In [43]:
def sqt(t):
    if len(t) == 0:
        return t
    else:
        return [head(t)**2]+sqt(tail(t))
    

In [44]:
sqt([1,2,3])

[1, 4, 9]

Ok, ora immaginiamo, di trovarci catapultati in un bizzarro universo parallelo dove, invece di valere il teorema di Pitagora e le sue generalizzazioni multidimensionali (cioè in cui la distanza è la norma euclidea), vale un teorema di cuPitagora, e invece di dover elevare al quadrato, di voler elevare al cubo tutti gli elementi di un array:

`cubet` (CUBE Tuple): `[1, 2, 3]` &rarr; `[1, 8, 27]`

Una possibile definizione è banalmente quella di `sqt`, con l'elevamento al cubo invece che al quadrato:

In [46]:
def cubet(t):
    if len(t) == 0:
      return t
    else:
      return [head(t)**3]+cubet(tail(t))

In [47]:
cubet([1,2,3])

[1, 8, 27]

Missione compiuta... però, *dovremmo* sentire un certo disagio... Per definire `cubet` abbiamo praticamente fatto *cut&paste* del codice di `sqt`, e abbiamo cambiato un numero nel ramo di riduzione della ricorsione. Tutto il resto è rimasto invariato...

Ebbene, questo non è un modo *elegante*/*efficiente*/*bello* di fare le cose. Stiamo *ripetendo* del codice, e questo non va bene ([perché? esemplificare bene]). In effetti, nella nostra funzione, stiamo facendo due cose:

1. stiamo "scorrendo" tutti gli elementi della lista
2. per ogni elemento della lista, eleviamo al quadrato, o al cubo
3. il risultato lo "appendiamo" alla lista risultato

Ora, il punto 2 può essere generalizzato: "per ogni elemento della lista, applichiamo all'elemento una funzione f". In questo modo, `sqt` e `cubet` sono quasi "la stessa cosa", e differiscono solo per la funzione applicata.

Possiamo quindi cercare di "estrarre" ciò che c'è di comune in `sqt` e `cubet`: prendere una lista, applicare una certa funzione ad ogni elemento, e raccoliere i risultati in un'altra lista. Questa operazione è così frequente e fondamentale che le si è dato un nome: `map`. Possiamo vedere `map` come una funzione, che prende come argomenti una funzione di trasformazione `f`, una lista `l` fatta dagli elementi `[x0, x1, ...]`, e restituisce la lista `[f(x0), f(x1), ...]`. Scrivere `map` generalizzando `sqt` e `cubet` è un gioco da ragazzi:

In [56]:
def map(f, t):
    if len(t) == 0:
        return t
    else:
        return [f(head(t))]+map(f, tail(t))

Per riottenere `sqt` da `map` ci serve solo di definire una funzione che elevi al quadrato:

In [57]:
def square(x):
    return x**2

Ora, invece di "chiamare" `sqt` possiamo chiamare `map` passando `square` come primo parametro:

In [58]:
map(square, [1, 2, 3])

[1, 4, 9]

Il mapping è un'operazione così frequente che in Python è stata introdotta una forma sintattica apposita, molto comoda ed espressiva, per descriverla: le *list comprehension*.

Eccole, in tutto il loro splendore, spiegate con un esempio:

In [60]:
[square(x) for x in [1, 2, 3]]

[1, 4, 9]

Chiaro come è formata una *comprehension*?

In generale, una comprehension ha la forma:

`[<map expression> for <name> in <sequence expression> if <filter expression>]`

Per prima cosa, l'espressione è racchiusa tra parentesi quadre `[...]`, come una definizione di lista di valori. Quindi c'è un'espressione in un particolare simbolo, in questo caso `x`. Quindi c'è la parola chiave `for`, seguita dal simbolo, e poi `in` e una lista. Il significato è *semplicemente* quello di una `map`: per ogni elemento della lista in fondo, il suo valore viene associato a `x` (il nome è arbitrario, se ne può scegliere uno qualsiasi), quindi viene valutata l'espressione all'inizio (`square(x)` in questo caso), e i valori vengono collezionati in una lista. 

L'espressione all'inizio quindi corrisponde alla funzione che si passa alla `map`.

Una delle cose belle delle comprehension è che si può fare una `map` senza dover definire una funzione apposta (come abbiamo dovuto fare con la `square`): l'espressione all'inizio della comprehension definisce la trasformazione che verrà operata sugli elementi. Così, meraviglia, il quadrato di tutti gli elementi della lista lo possiamo scrivere in questo modo:

In [1]:
[x**2 for x in [1, 2, 3]]

[1, 4, 9]

Se vogliamo definire `sqt` con le nostre nuove conoscenze:

In [2]:
def sqt2(t):
    return [x**2 for x in t]

In realtà con le comprehension si può fare una cosa in più: "filtrare" la lista che viene mappata.

Quando viene valutata un'espressione di questo tipo, l'interprete valuta `<sequence expression>`, che deve essere una sequenza (lista o tupla). A questo punto, per ogni elemento `e` della sequenza:
1. associa il simbolo `<name>` ad `e`
2. valuta `<filter expression>`:
    a. se è falsa, passa al prossimo elemento `e`
    b. se è vera, valuta `<map expression>`, e "colleziona" il risultato
Il valore dell'espressione la sequenza di tutti i valori "collezionati".

Possiamo sfruttare la parte *condizionale* (la condizione dopo l'`if`) per "filtrare", cioè tenere solo i valori che soddisfano una certa condizione.

Per esempio:

In [10]:
[x for x in [10,67,34,23,100] if x < 42]

[10, 34, 23]

Torniamo al problema di moltiplicare (scalarmente) tra di loro due vettori.
Ecco una soluzione basata sull'uso di una `map` (in forma di comprehension).
Te la illustro, tu devi capire "come funziona"...

Per prima cosa, considera questa funzione:

In [11]:
def zip(a, b):
    if len(a) == 0 or len(b) == 0:
        return []
    return [(a[0], b[0])] + zip(a[1:], b[1:]) 

In [12]:
zip([1, 2], [3, 4])

[(1, 3), (2, 4)]

Hai capito come funziona, e cosa fa?

A questo punto, la nostra funzione `prod` che moltiplica due vettori la si può definire così: 

In [13]:
def prod(a, b):
    return [x[0] * x[1] for x in zip(a, b)]

In [14]:
prod([1,2],[3,4])

[3, 8]

# Esercizi

1. Scrivi una funzione `divide` che, dati due numeri `n` e `d`, dica (ritorni) se `n` è divisibile per `d`
2. Scrivi una funzione `divisori` che, dato un numero `n`, ritorni una lista contenente i suoi divisori