
# Prova di esame (laboratorio)

La prova avrà una durata massima di due ore e porterà a una valutazione massima di 21 punti. Il voto finale si otterrà per somma del punteggio del test di teoria e della prova di laboratorio. 

La prova consiste in un insieme di quiz proposti attraverso un Jupyter Notebook (non sono ammessi altri strumenti software) da svolgere sui computer del laboratorio (non sono ammessi altri strumenti hardware). Durante la prova si può consultare il libro di testo, le slide usate a lezione, un manuale python (approvato dal docente) oppure le guide in linea suggerite da Jupyter Notebook. Non sono ammessi altri strumenti di consultazione. 



Prima della prova
Specificare la informazioni richieste nelle celle sottostanti e salvare il notebook con il proprio nome.

Durante la prova
Nelle celle markdown, cancellare il testo "YOUR ANSWER HERE" con la propria risposta. Nelle celle codice, rimuovere la linea di codice

raise NotImplementedError()
e sostituirla con la propria implementazione. Dopo ogni cella codice che deve contenere la risposta al quesito, esiste una cella codice con delle asserzioni, ossia delle istruzioni che verificano la correttezza della propria soluzione. (Queste asserzioni saranno usate per valutare la correttezza della risposta data e assegnare un punteggio.) E' possibile eseguire queste celle per verificare che la soluzione proposta sia corretta.


### Temperatura corporea dei castori

Il dataset `beav1.csv` descrive una piccola parte di uno studio sulla dinamica della temperatura a lungo termine del castoro *Castor canadensis* nel Wisconsin centro-settentrionale. La temperatura corporea è stata misurata con la telemetria ogni 10 minuti per quattro femmine, ma vengono utilizzati i dati di un periodo di meno di un giorno per ciascuno dei due animali.

#### Formato
Il dataset ha 114 righe e 4 colonne:
- day: Giorno di osservazione (in giorni dall'inizio del 1990), 12-13 dicembre.
- time: Ora di osservazione, nella forma 0330 per le 3.30.
- temp: Temperatura corporea misurata in gradi Celsius.
- activ: Indicatore di attività 

(Nota: Manca l'osservazione alle 22:20.)

### Caricamento dati 

1. Caricare il file `beav1.csv` in un DataFrame denominato `dataset`.
2. Stampare la stringa `"Il dataset ha ... righe e ... colonne"` sostituendo i puntini con i valori corrispondenti. Utilizzare le f-string.

In [None]:
import pandas as pd

dataset = pd.read_csv('beav1.csv')

print(f'Il dataset ha {dataset.shape[0]} righe e {dataset.shape[1]} colonne')

In [None]:
assert dataset.shape == (114, 4)

### Funzione di conversione 

Definire la funzione `intTimeToString(int_time)` che riceve in input un istante temporale *numerico* tale che le decine e le unità rappresentano i minuti e le cifre rimanenti rappresentano le ore. (Per esempio, il numero intero `1000` rappresenta le ore 10:00; il numero `1230` rappresenta le ore 12:30; il numero `840` rappresenta le ore 8:40; il numero `0` (equivalente a `0000`) rappresenta le ore 0:00). La funzione deve restituire una stringa nel formato *"HH:MM"* essendo *HH* l'ora (sempre con due cifre) e *MM* i minuti (sempre con due cifre).

In [None]:
def intTimeToString(int_time):
    
    return '{0:02}:{1:02}'.format(int_time // 100 , int_time % 100)


print(intTimeToString(2))
print(intTimeToString(2))
print(intTimeToString(2))
print(intTimeToString(2))

In [None]:
assert intTimeToString(1230) == "12:30"

In [None]:
assert intTimeToString(840) == "08:40"
assert intTimeToString(0) == "00:00"
assert intTimeToString(1000) == "10:00"

### Mapping 

1. Creare una lista dalla sequenza dei valori della colonna `time` del dataset. 
2. *utilizzando la funzione `map`*, applicare la funzione `intTimeToString` ai valori della lista
3. Creare la lista `time_strings` con i risultati del mapping

In [None]:
times = list(dataset.time)
time_strings = list(map(intTimeToString , times))

print(times)
print(time_strings)

In [None]:
assert all(isinstance(s, str) for s in time_strings)
assert len(time_strings) == dataset.shape[0]
assert all(':' in s for s in time_strings)

## Manipolazione date 

Utilizzando la libreria `datetime`, eseguire le seguenti operazioni:
1. creare un oggetto di tipo `date` che rappresenti il primo gennaio 1990
2. creare un oggetto di tipo `timedelta` che rappresenti 346 giorni
3. creare una variabile di nome `final_date` che rappresenti la data corrispondente a 346 giorni dopo il primo gennaio del 1990

__utilizzare la documentazione in linea per poter utilizzare le classi richieste__

In [None]:
import datetime as dt

init_date = dt.date(1990 , 1 , 1)
delta = dt.timedelta(days = 346)
final_date = init_date + delta

print(init_date)
print(final_date)

In [None]:
assert final_date.year == 1990
assert final_date.month == 12
assert final_date.day == 13

### Timestamp 

*Utilizzando le comprensioni di lista* creare una lista di nome `timestamps` contenente stringhe ottenute concatenando la rappresentazione in stringa di `final_date` con ciascuna stringa in `time_strings` (separate da una virgola).
Per esempio, il primo elemento di `timestamps` sarà:
```python
'1990-12-13,08:40'
```

In [None]:
timestamps = [str(final_date) + ',' + time for time in time_strings]

timestamps

In [None]:
import re

assert len(timestamps) == len(time_strings)
assert all(re.fullmatch(r"\d{4}-\d{2}-\d{2},\d{2}:\d{2}", s) for s in timestamps)

### Medie 

1. Definire una lista di nome `unique_days` con elementi corrispondenti ai valori distinti della colonna `day` (sono solo due);
2. Definire un dizionario di nome `avg_temp` con chiavi corrispondenti ai valori di `unique_days`; per ciascuna chiave, il valore corrispondente è pari alla media dei valori della colonna `temp` delle righe del `dataset` i cui valori del campo `day` corrispondono alla chiave.

In [None]:
unique_days = list(dataset.day.unique())
avg_temp = dict((day , dataset[dataset.day == day].temp.mean()) for day in unique_days)

print(unique_days)
print(avg_temp)

In [None]:
assert unique_days == [346, 347]

In [None]:
assert all(36.0 < avg_temp[d] < 37.0 for d in avg_temp)

# Espressioni regolari 

1. definire una stringa di nome `seq` corrispondente alla sequenza di valori della colonna `activ` del dataset
2. *Utilizzando le espressioni regolari*, estrarre da `seq` le sequenze che iniziano con `uno 1, continuano con almeno uno `0` e terminano con un altro `1`. Definire la variable `num` che contiene il numero di tali sequenze.

In [None]:
seq = ''.join(str(elem) for elem in dataset.activ)
num = len(re.findall(r'10+1' , seq))

print(seq)
print(num)

In [None]:
assert all(c in {'0','1'} for c in seq)

In [None]:
assert num == 3

### Conversione da binario a decimale 

La stringa seq può rappresentare un numero intero in binario. Scrivere il codice necessario per
convertire il numero in decimale e memorizzarne il valore nella variabile decimal (non usare funzioni
di libreria).

In [None]:
n = len(seq)
decimal = sum([int(seq[i]) * 2 ** (n - 1 - i) for i in range(n)])

decimal

In [None]:
assert decimal > 1000000000000000000