# Seconda parte: Dati aggregati
Nella prima parte del corso, abbiamo studiato i processi di calcolo e il ruolo delle procedure nella scrittura di alcuni semplici programmi. Le procedure erano intese come funzioni che operavano su dati numerici, e partendo da semplici operazioni aritmetiche siamo arrivati a definire attraverso diversi livelli di astrazione, delle procedure composte più elaborate, che permettevano di calcolare, ad esempio, l'integrale definito di una funzione qualsiasi.

In questa seconda parte del corso vedremo come costruire delle strutture dati che permettono di aggregare dei dati semplici, come ad esempio, **sequenze di numeri**, **insiemi di numeri**, e **stringhe** (ovvero sequenze di caratteri).

Il motivo per studiare la possibilità di definire dei dati aggregati, o dati composti, è quello di poter definire concetti più astratti su dati aggregati (in gergo si parla di **data abstraction**).

In [1]:
7/6 == 1/2+2/3

False

### Numeri Razionali
Si consideri ad esempio un sistema di calcolo per i numeri razionali. Potremmo definire un operazione `SommaRaz(x,y)` che prende in input due numeri razionali, per esempio $\frac{1}{2}$ e $\frac{2}{3}$, e restituisce la loro somma (nell'esempio, $\frac{7}{6})$. In termini di dati semplice, un numero razionale può essere pensato come una **COPPIA** di due numeri interi: un *numeratore* ed un *denominatore*.

In pratica, potremmo definire un sistema in cui ogni numero razionale viene definito da due numeri interi, e per fare una somma dovremmo scrivere due procedure, una per produrre il numeratore e l'altra per produrre il denominatore. Tuttavia, questo approccio porterebbe in fretta ad un codice difficile da leggere, mantenere e migliorare, anche perchè dovremmo sempre tenere traccia di quale numeratore corrisponde a quale denominatore.

Sarebbe molto meglio se fosse possibile "incollare" insieme il numeratore e il denominatore per ottenere un unico oggetto computazionale, in modo che il nostro programma e le nostre procedure lo possano considerare come un unico **tipo** di dato.

In questo modo, potremmo aumentare la modularità dei nostri programmi. Se possiamo manipolare i numeri razionali direttamente come degli **oggetti** a se stanti, potremmo separare nei nostri programmi il codice che usa i numeri razionali in qualche modo utile, dalla parte di codice che specifica come eseguire le operazioni aritmetiche sui numeri razionali.

L'uso di *dati aggregati* (o *strutture dati*) porterebbe ad un linguaggio ancora più **espressivo** di quello studiato sino ad ora.

**ESEMPIO:** Si consideri l'idea di formare una combinazione lineare $ax + by$. Potremmo scrivere una procedura che prende in input quattro parametri `a,x,b,y` e restituisce il valore `ax + by`. Se gli argomenti sono dei numeri, possiamo scrivere direttamente:

In [2]:
def CombinazioneLineare(a, b, x, y):
    return a*x + b*y 

Supponiamo però che non vogliamo definire una combinazione lineare solo di numeri "semplici", ma vogliamo esprimere una combinazione lineare per qualsiasi tipo di dato per cui sono state definite le funzioni `add` e `mul`, come ad esempio, per i numeri razionali, i numeri complessi, o dei polinomi. In generale potremmo scrivere:

In [3]:
def CombinazioneLineare(a, b, x, y):
    return Add(Mul(a, x), Mul(b, y))

In cui `Add` e `Mul` non le operazioni aritmetiche `+` e `*`, ma procedure più complesse che eseguono l'operazione corretta per qualsiasi tipo di dato che gli passiamo come input. Il punto cruciale è che l'unica cosa che la procedura `CombinazioneLineare` deve sapere a riguardo di `a, b, x, y`, è che le procedure `Add` e `Mul` eseguiranno le operazioni in modo corretto. Dalla prospettiva della procedura `CombinazioneLineare` è irrilevante cosa siano effettivamente `a, b, x, y` e di come siano effettivamente rappresentati in termini di dati primitivi, qualora fossero dei dati composti, quali, ad esempio, numeri razionali, numeri complessi o polinomi.

Per rendere l'idea concreta, vediamo ora come implementare un sistema di procedure che permetta di eseguire le operazioni aritmetiche sui numeri razionali.

### Numeri razionali e data abstraction
L'idea base del *data abstraction* è di strutturare i programmi che devono usare dei dati aggregati in modo tale che questi possono operare direttamente sui *dati astratti*. In pratica, non vogliamo fare nessuna ipotesi su come sono effettivamente memorizzati i dati primitivi. Allo stesso tempo un *dato concreto* è implementato in modo indipendente dai programmi che useranno quel tipo di dati. L'interfaccia tra i dati astratti e i dati concreti sarà costituita da un insieme di procedure, chiamate **selettori** e **costruttori**, che implementano i dati astratti in termini della loro vera rappresentazione "concreta".

Torniamo ai nostri numeri razionali. Vogliamo definire un sistema che sia in grado di sommarli, sottrarli, moltiplicarli e dividerli, e un modo per testare se due numeri razionali sono uguali.

Supponiamo di saper già costruire un numero razionale a partire dal un numeratore e un denominatore (abbiamo il **costruttore**). Supponiamo anche che, dato un numero razionale, siamo in grado di ottenere (selezionare) il suo numeratore o il suo denominatore (abbiamo i **selettori**). Ovvero abbiamo le seguenti procedura:

* `MakeQ(n, d)` che restituisce il numero $\frac{n}{d}$, in cui sia `n` che `d` sono numeri interi.
* `Num(x)` che restituisce il numeratore del numero razionale `x`.
* `Den(x)` che restituisce il denominatore del numero razionale `x`.

Supponendo di avere queste procedure, che definiremo tra poco, noi potremmo già definire le operazioni richieste usando le seguenti relazioni sui numeri razionali:

$$\frac{n_1}{d_1} + \frac{n_2}{d_2} = \frac{n_1 d_2 + n_2 d_1}{d_1 d_2}$$

$$\frac{n_1}{d_1} - \frac{n_2}{d_2} = \frac{n_1 d_2 - n_2 d_1}{d_1 d_2}$$

$$\frac{n_1}{d_1} \cdot \frac{n_2}{d_2} = \frac{n_1 n_2}{d_1 d_2}$$

$$\frac{n_1 / d_1}{n_2 / d_2} = \frac{n_1 d_2}{d_1 n_2}$$

$$\frac{n_1}{d_1} = \frac{n_2}{d_2} \iff n_1 d_2 = n_2 d_1$$

Queste regole possono essere tradotte direttamente nelle procedure seguenti:

In [4]:
def AddQ(x, y):
    return MakeQ(Num(x)*Den(y)+Num(y)*Den(x), Den(x)*Den(y))

def SubQ(x, y):
    return MakeQ(Num(x)*Den(y)-Num(y)*Den(x), Den(x)*Den(y))

def MulQ(x, y):
    return MakeQ(Num(x)*Num(y), Den(x)*Den(y))

def DivQ(x, y):
    return MakeQ(Num(x)*Den(y), Den(x)*Num(y))

def EqualQ(x, y):
    return Num(x)*Den(y) == Num(y)*Den(x)

A questo abbiamo definito le operazioni sui numeri razionali senza aver ancora definito il **tipo** di dati per i numeri razionali. Per farlo abbiamo bisogno in uno strumento che ci permette di unire il numeratore con il denominatore.

### Le coppie (pairs)
Per poter implementare i dati concreti del nostro dato astratto "numero razionale" usiamo le **coppie** di valori:

In [5]:
a = (3,4)

In [6]:
print(a)

(3, 4)


Una coppia è un dato composto dai due dati numerici. Data una coppia di numeri possiamo estrarre il primo e il secondo elemento nel modo seguente:

In [7]:
b, c = a 
# Questo modo viene chiamato "unfolding

In [8]:
print(b)
print(c)

3
4


In [9]:
print(a[0])  # Primo elemento della coppia

3


In [10]:
print(a[1])  # Secondo elemento della coppia

4


Si noti come una coppia sia un oggetto, un dato unico, a cui possiamo dare un nome e che possiamo modificare *come se fosse un dato primitivo*.

Possiamo usare le *coppie* come elemento costitutivo delle procedure che ci mancano per i numeri razionali (costruttore e selettore):

In [12]:
def MakeQ(n, d):
    return (n, d)

def Num(x):
    return x[0]

def Den(x):
    return x[1]

# Per avere un "pretty print"
def PrintQ(x):
    print("%d/%d"%(Num(x), Den(x)))

A questo punto possiamo usare il nostro sistema per eseguire delle operazioni sui numeri razionali:

In [13]:
a = MakeQ(1, 2)
b = MakeQ(2, 3)
PrintQ(AddQ(a, b))

7/6


Vediamo cosa succede sommando due numeri uguali:

In [45]:
PrintQ(AddQ(MakeQ(1,3), MakeQ(1,3)))

6/9


**ESERCIZIO 8.1:** Come visto nell'esempio precedente, il sistema sin qui visto non sfrutta la relazione di equivalenza tra i numeri razionali, e non li riduce quindi ai minimi termini. Modificare la procedura `MakeQ(n,f)` in modo che produca sempre un numero razionale ridotto ai minimi termini.

In [31]:
def MCD(a, b):
    if b > a:
        return MCD(b, a)
    if b == 0:
        return a
    return MCD(b, a%b)

def MakeQ(a, b):
    m = MCD(a, b)
    return (int(a/m), int(b/m))


(1, 2)


**ESERCIZIO 8.2**: Un modo diverso per ridurre un numero razionale ai minimi termini è di calcolare la riduzione solo quando si usano i *selettori*, ovvero quando si usa il numeratore o il denominatore. In questo caso non è necessario modificare il costruttore `MakeQ`, ma è sufficiente modificare i selettori `Num(x)` e `Den(x)`. Mostrare come può essere fatto in Python.

In [35]:
def Num(x):
    return x[0] / MCD(x[0], x[1])

def Den(x):
    return x[1] / MCD(x[0], x[1])

**ESERCIZIO 8.3**: Definire una versione migliore di `MakeQ(n, d)` che gestisce sia i numeri positivi che quelli negativi, e controlli che il denominatori non sia uguale a zero. Il segno dovrebbe essere normalizzato in modo tale che se il numero razionale è positivo, sia il numeratore che il denominatore sono positivi, se il numero razionale è negativo, solo il numeratore è negativo.

In [40]:
def MakeQ(n, d):
    if d == 0:
        return ZeroDivisionError
    sign = int(n*d/(abs(n*d)))
    x = abs(n)
    y = abs(d)
    m = MCD(x, y)
    return (sign*int(x/m), int(y/m))
    
print (MakeQ(-2, 8))

(-1, 4)


**VEDI SLIDES: API**

### Definizione procedurale di "coppia"
Consideriamo per esempio le coppie (pair), che sino ad ora abbiamo considerato come un dato primitivo del linguaggio.

Potremmo avere una definizione interamente procedurale di coppia:

In [41]:
def MakePair(x, y):
    def Select(i):
        if i == 1:
            return x
        if i == 2:
            return y
        print("Errore: in una coppia sono presenti solo due elementi.")
    return Select

In [42]:
a = MakePair(2,3)
print(a(1))
print(a(2))

2
3


A questo punto possiamo cambiare la nostra implementazione di numero razionale, senza dover cambiare le operazioni aritmetiche definite sui numeri razionali:

In [43]:
def MakeQ(n, d):
    return MakePair(n, d)

def Num(x):
    return x(1)

def Den(x):
    return x(2)

In [44]:
PrintQ(AddQ(MakeQ(1,3), MakeQ(1,3)))

6/9


**NOTA:** la possibilità di avere le procedure come elementi primitivi del linguaggio, permette automaticamente la possibilità di definire dei dati aggregati, come abbiamo appena visto. La differenza tra *dati* e *procedure* è sempre più sottile.

## Approfondimento: *Lambda Calculus*
In un linguaggio che può manipolare le procedure come se fossero dei dati, non abbiamo più bisogno di dati primitivi per rappresentare i numeri (almeno se ci limitiamo ai numeri interi non negativi): tutto quello che ci serve è di definire lo zero e l'operazione per aggiungere 1 ad un numero:

In [14]:
def Zero():
    return lambda f: (lambda x: x)

def AddOne(n):
    return lambda f: lambda x: f(n(f)(x))

Questa rappresentazione è dovuta ad [Alonzo Church](https://en.wikipedia.org/wiki/Alonzo_Church), il logico matematico che ha inventato il [*Lambda Calculus*](https://en.wikipedia.org/wiki/Lambda_calculus).

In [26]:
a = Zero()

print ( AddOne(a))

<function AddOne.<locals>.<lambda> at 0x7f1138368d90>
