# Esercizio 1
In questo esercizio dovete implementare due funzioni, `estremi(lista)` e `somma_estremi(lista)`.
Entrambe le funzioni operano su liste di numeri interi.
La prima, `estremi(lista)`, ritorna una tupla contenente la posizione del valore minimo e massimo contenute in lista, in quest'ordine.
Potete assumere che ogni numero nella lista è unico (ovvero, i valori massimi e minimi sono unici).

Implementate poi la funzione somma_estremi(lista). Essa trova le posizioni del valore massimo e minimo usando estremi(lista), e ritorna infine la somma di tutti i valori inclusi tra quelle due posizioni, estremi inclusi.
Notate che la posizione del minimo può essere maggiore o minore di quella del massimo.

Esempio1:
`lista = [ 1, 2, 3, 4, 5 ]`. La funzione `estremi(lista)` ritorna (0, 4), ovvero le posizioni di 1 e 5.
La funzione `somma_estremi(lista)` ritorna 15, ovvero 1 + 2 + 3 + 4 + 5

Esempio2:
`lista = [ 3, 8, 2, 0, 6 ]`.La funzione `estremi(lista)` ritorna (3, 1), ovvero le posizioni di 0 e 8.
La funzione `somma_estremi(lista)` ritorna 10, ovvero la somma 8 + 2 + 0


Assunzioni:
* Ogni elemento $i$ di $list$ è un numero intero, $0 \le i \le 1000$
* Ogni elemento $i$ di $list$ è unico
* Ogni lista contiene da 2 a 100 elementi

In [None]:
from typing import List, Tuple
import numpy as np

def estremi(lista : List[int]) -> Tuple[int, int]:
    max_value = max(lista)
    min_value = min(lista)
    return lista.index(min_value), lista.index(max_value)

def somma_estremi(lista : List[int]) -> int:
    min_pos, max_pos = estremi(lista)
    res = 0
    if min_pos < max_pos:
        for i in range(min_pos, max_pos + 1):
            res = res + lista[i]
    else:
        for i in range(max_pos, min_pos + 1):
            res = res + lista[i]
    return res

In [None]:
lista = [ 1, 2, 3, 4, 5 ]
assert estremi(lista) == (0, 4)
assert somma_estremi(lista) == 15

In [None]:
lista = [ 3, 8, 2, 0, 6 ]
assert estremi(lista) == (3, 1)
assert somma_estremi(lista) == 10

# Esercizio 2
In questo esercizio dovete implementare la funzione `miglior_sequenza(nome_file)`. L'input `nome_file` è una stringa che rappresenta il nome di un file. La funzione deve aprire il file e leggerne il contenuto. Ogni riga del file è composta da quattro valori numerici (float) separati da virgola.
Ognuna delle quattro colonne rappresenta una sequenza, la funzione deve calcolare la media di ogni sequenza e ritorna il numero della sequenza che ha la media più alta (un numero compreso tra 0, la prima colonna, e 3, l'ultima).

Potete svolgere l'esercizio senza usare moduli, oppure usando numpy e/o pandas.

Assunzioni:
* Ogni riga del file contiene esattamente 4 numeri, separati da virgola.
* Il file contiene da 1 a 1000 righe
* La colonna con la media più alta è unica

In [3]:
import pandas as pd
import numpy as np

def miglior_sequenza(nome_file : str) -> int:
    df = pd.read_csv(nome_file, sep=',', header=None)
    mean = 0
    pos = 0
    for i in range(4):
        mean1 = np.mean(df[i])
        if mean1 > mean:
            mean = mean1
            pos = i
    return pos


In [4]:
migliore = miglior_sequenza('esempio_es_2.csv')
assert migliore == 2

# Esercizio 3
In questo esercizio dovete implementare la funzione `filtra_parole(parole, minima_frequenza, minima_lunghezza)`. Essa riceve in input un dizionario `parole` che mappa stringhe in interi. Le chiavi del dizionario rappresentano le parole contenute in un testo, mentre i valori del dizionario sono il numero di volte che quella parola è stata usata nel testo.
La funzione `filtra_parole(parole, minima_frequenza, minima_lunghezza)` ritorna una lista di stringhe contenenti le parole di `parole` che sono state usate almeno `minima_frequenza` volte e la cui lunghezza è almeno `minima_lunghezza`. Le parole della lista risultato devono essere ordinate in ordine alfabetico.

Per esempio, dati il dizionario `d = {'cane' : 100, 'coccodrillo' : 5, 'serpente' : 10,  'panda' : 10,}`, `filtra_parole(d, 10, 5)` deve ritornare la lista `['panda', 'serprente']`. Non posso includere ne `'cane'`, perché è troppo corto, ne `coccodrillo`, perché è stata usata troppe poche volte.

* Il dizionario contiene da 1 a 1000 elementi.

In [None]:
from typing import Dict, List
def filtra_parole(parole : Dict[str, int], minima_frequenza : int, minima_lunghezza : int) -> List[str]:
    res = list()
    for key, value in parole.items():
        if len(key) >= minima_lunghezza and value >= minima_frequenza:
            res.append(key)
    res.sort()
    return res

In [None]:
d = {'cane' : 100, 'coccodrillo' : 5, 'serpente' : 10,  'panda' : 10}
res = filtra_parole(d, 10, 5)
print(res)
assert len(res) == 2
assert res[0] == 'panda'
assert res[1] == 'serpente'

# Esercizio 4 - Pandas e Matplotlib
Questo esercizio serve a esplorare alcune delle feature di pandas e matplotlib. Consiglio di svolgere l'esercizio su jupyter-notebook.

## Lettura e scrittura di Dataframe

Come primo step, caricate il file `'dati_climatici.csv'` usando read_csv.

In [None]:
import pandas as pd
clima = pd.read_csv('dati_climatici.csv', sep=';')
clima

Provate a convertire il dataframe in altri formati.

In [None]:
# Stampate clima in formato excel
clima.to_excel('dati_climatici.xlsx')

In [None]:
# Stampate clima in html
clima.to_html('dati_climatici.html')

## Indici e slice
Vogliamo selezionare solo i dati che ci interessano dal dataframe. Potete farlo usando gli indici e lo slicing. Potrebbe essere utile usare l'attributo `.iloc`, che permette di lavorare usando indici numerici (invece che indici ad alto livello, come `'temperatura'`).

In [None]:
# esempio iloc: selezionare prima colonna
clima.iloc[:, 0]

In [None]:
# selezionare solo le righe in cui la temperatura è esattamente 29 gradi
mask = clima.temperatura == 29
print(clima[mask])

In [None]:
# selezionare le prime 5 righe in cui l'evento è sole o pioggia
mask_sole = clima.evento == 'Sole'
mask_pioggia = clima.evento == 'Pioggia'
print(clima[mask_sole | mask_pioggia][:5])

In [None]:
# selezionare le righe in cui la velocità del vento è massima
mask_max = clima.vel_vento == clima.vel_vento.max()
print(clima[mask_max])

In [None]:
# costruite una Series pandas che contiene i dati della colonna temperatura e usa i valori della colonna giorno come etichette.
temperature = pd.Series(clima.temperatura).set_axis(clima.giorno)
temperature

## Statistica
Possiamo applicare alcune (semplici) operazioni statistiche sui nostri dati. con `mean()` e `median()` possiamo calcolare rispettivamente media e mediana.

In [None]:
# stampare media e mediana dei valori vel_vento
print(clima.vel_vento.mean())
print(clima.vel_vento.median())

Possiamo combinare Questi operatori al metodo `groupby`. Questo raccoglie insieme tutte le righe che rispettano un certo parametro. Per esempio, se vogliamo stampare temperatura e velocità vento medie in base all'evento atmosferico, possiamo usare:

In [None]:
# crea 3 righe: Neve, Pioggia, Sole
print(clima.groupby('evento').mean())

In [None]:
# stampate la stessa tabella, ma riportando solo la colonna 'temperatura'
# dove mi conviene tagliare? Direttamente su clima, oppure sul risultato finale?
print(clima.groupby('evento').mean()['temperatura'])

In [None]:
# provate a combinare groupy() con count(), un metodo che ci permette di contare gli elementi
# quanti giorni di Pioggia ci sono in clima?
print(clima.groupby('evento'). count())

## Stampa
Come visto a lezione, possiamo usare pandas per creare grafici. Usiamo `plot()` per fare stampe generiche.

In [None]:
# plot() dell'intero dataframe
clima.plot()

In [None]:
# plot delle sole temperature
clima.temperatura.plot()

In [None]:
# plot delle vel_vento, raggruppate per evento.
# cosa stampo se chiamo plot() su groupby?
clima[['vel_vento', 'evento']].groupby('evento').plot();

Potete creare stampe più specifiche chiamando `plot` come attributo e specificando uno dei suoi metodi. Per esempio, possiamo stampare uno scatterplot nel seguente modo:

In [None]:
clima.plot.scatter(x='temperatura', y='vel_vento');

Potete ispezionare, con metodi d'introspezione, tutti i metodi disponibili in questo modo: 

In [None]:
[ method_name for method_name in dir(clima.plot) if not method_name.startswith("_") ]

Alcuni metodi, come scatterplot, richiedono specifici parametri. Potete trovarli nella documentazione. In Jupyter, potete usare un ? all'inizio di un comando per aprire una finestra con la documentazione

In [None]:
?clima.plot.scatter

In [None]:
# stampate un grafico a torta (pie) contenente il numero di giorni di Sole, Neve e Pioggia.
clima[['temperatura', 'evento']].groupby('evento').count().plot.pie(subplots=True)

In [None]:
# stampate un boxplot (box) con i dati di temperatura e vel_vento
clima[['temperatura', 'vel_vento']].plot.box()

In [None]:
# Extra: Provate a stampare un semplice grafico usando tutti i metodi a disposizione!

# Per approfondire...

Potete approfondire ulteriormente pandas seguendo gli esempi proposti nella documentazione ufficiale, che trovate qui: https://pandas.pydata.org/docs/getting_started/index.html#getting-started. Essi si sviluppano tutti attorno ad un unico dataset (i passeggeri del titanic) e coprono pandas nella sua interezza.

Se servono stampe molto specifiche, possiamo usare direttamente matplotlib.
Il sito di matplotlib offre tutorial specifici per ogni feature, li potete trovare qui: https://matplotlib.org/stable/tutorials/index.html.
Potete anche consultare un "ricettario", con molti casi d'uso comune già implementati, al seguente link: https://matplotlib.org/stable/gallery/index.html