<div class="alert alert-block alert-info" style="background-color: #301E40; border: 0px; -moz-border-radius: 10px; -webkit-border-radius: 10px;">
<br/><br/>
<h1 style="font-size: 45px; color: white; align: center;"><center>
<img src="https://raw.githubusercontent.com/HumbleData/beginners-data-workshop/master/media/humble-data-logo-white-transparent.png" width="250px" /><br/><br/>
Visualizzazione dei dati con matplotlib
</center></h1>
</div>

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Importa pyplot (e pandas) in matplotlib
</h2><br>
</div>

Facendo riferimento alla [documentazione
ufficiale](https://matplotlib.org/gallery/index.html) (si riporta di
seguito una versione tradotta dall'inglese):

`matplotlib.pyplot` è una raccolta di funzioni in stile riga di comando
che fanno sì che Matplotlib funzioni come MATLAB. Ogni funzione pyplot
apporta alcune modifiche a una figura, ad esempio: crea una figura, crea
l'area di un grafico in una figura, traccia alcune linee in un'area di
grafico, aggiunge formattazione al grafico con etichette, ecc.

`pyplot` è destinato principalmente alla creazione di grafici
interattivi e casi semplici di generazione di grafici programmatici.

![](https://miro.medium.com/max/2000/1*swPzVFGpYdijWAmbrydCDw.png)

In [None]:
%matplotlib inline
# questo serve all'interprete ipython per mostrare il grafico in Jupyter

import pandas as pd
import matplotlib.pyplot as plt

### Importa di nuovo il dataframe, leggilo come DataFrame pandas e assegnalo alla variabile df

In [None]:
df = pd.read_csv('../data/Penguins/penguins_clean.csv')

### Rinfreschiamoci la memoria su come erano fatti i dati

In [None]:
df.head()

### Utilizzo di DataFrame.plot() in pandas
L'oggetto DataFrame pandas dispone di un metodo `plot()` che fornisce
grafici elementari di diversi tipi, tra cui: 'line', 'bar', 'hist',
'box' ecc. Puoi anche impostare parametri per controllare il layout e le
etichette del grafico.

`plot()` utilizza `matplotlib.pyplot` in background, il che rende molto
più semplice tracciare i dati in un DataFrame

Troverai molto utile questa pagina (in inglese):
<https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.plot.html>

#### Esempio: diagramma a scatola e baffi

In [None]:
df.plot(kind='box')

Le scale dei nostri dati non si allineano particolarmente bene. Quindi, per un grafico più chiaro, ignoreremo la massa corporea dei pinguini.

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box')

#### Per una presentazione migliore: regoliamo le dimensioni della figura, aggiungiamo il titolo e legenda

In [None]:
df.drop(["body_mass_g"], axis=1).plot(kind='box', figsize=(10,8), title='Grafico su diverse misurazioni di specie di pinguini', legend=True)

#### Creare sottografici

In [None]:
df.plot(kind='box',
        subplots=True, layout=(2,2),
        figsize=(10,8), title='Grafico su diverse misurazioni di specie di pinguini', legend=True)

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Esercizio: confrontare la lunghezza del becco di diverse specie di pinguini
</h2><br>
</div>

Usiamo il diagramma a scatola e baffi per confrontare la lunghezza del becco di diverse specie di pinguini. Abbiamo bisogno che il DataFrame sia leggermente diverso in modo da poter confrontare le diverse specie di pinguini. Vorremmo effettuare il pivoting dei dati in modo che ciascuna colonna indichi la lunghezza del becco di diverse specie di pinguini.

#### Prepara il set di dati

In [None]:
df_pivot = df.pivot(index=None, columns='species', values='bill_length_mm')
# indica al metodo pivot() di creare 'species' come colonne e di utilizzare 'bill_length_mm' come valore

In [None]:
df_pivot.sample(10)

#### Diagramma a scatola e baffi di df_pivot

Ora possiamo usare `plot()` su `df_pivot`. Per creare un diagramma a
scatola e baffi, ricorda di impostare il parametro `kind` su 'box'.
Rendi anche gradevole la presentazione impostando dimensioni adeguate
con `figsize` e un titolo chiaro con `title`. Non dimenticare la legenda
con `legend`.

#### Esercizio aggiuntivo

Sfidati creando il tuo `df_pivot` effettuando il pivoting su una misura
diversa (ad esempio la massa corporea). Prova anche a utilizzare un
istogramma (hist) invece di un diagramma a scatola e baffi. Puoi anche
provare a creare un grafico con 3 sottografici, ciascuno dei quali è un
istogramma di un tipo di pinguino.

Finora non stiamo utilizzando `matplotlib.pyplot` direttamente. Sebbene
sia molto comodo usare `df.plot()`, a volte vorremmo avere più controllo
su ciò che stiamo tracciando e creare grafici più complessi. Nelle
sezioni seguenti utilizzeremo direttamente `matplotlib.pyplot` (che ora
viene importato come `plt`).

### Dividi i dati in 3 tipi

Per creare i seguenti grafici, dobbiamo creare un DataFrame pandas per
ciascuna specie di pinguino.

In [None]:
df['species'].unique()

In [None]:
df_adelie = df[df['species'] == 'Adelie']

In [None]:
df_chinstrap = df[df['species'] == 'Chinstrap']

In [None]:
df_gentoo = df[df['species'] == 'Gentoo']

### Esempio di grafico a dispersione: grafico su lunghezza e larghezza del becco

In [None]:
plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

#### Per una presentazione migliore: regoliamo le dimensioni della figura, aggiungiamo le etichette e la legenda

In [None]:
plt.figure(figsize=(10,8)) # imposta le dimensioni del grafico

plt.scatter(df_adelie['bill_length_mm'], df_adelie['bill_depth_mm'], c='r')
plt.scatter(df_chinstrap['bill_length_mm'], df_chinstrap['bill_depth_mm'], c='g')
plt.scatter(df_gentoo['bill_length_mm'], df_gentoo['bill_depth_mm'], c='b')

ax = plt.gca() #Il metodo gca dice al resto del codice di fare riferimento al grafico che abbiamo creato

ax.set_xlabel('Lunghezza del becco (mm)')
ax.set_ylabel('Larghezza del becco (mm)')
ax.set_title('Lunghezza e larghezza del becco per diverse specie di pinguini')

ax.legend(('adelie', 'chinstrap', 'gentoo'))

### Esercizio sul grafico a dispersione: grafico sulla lunghezza delle ali e sulla massa corporea

Ora tocca a te creare il tuo grafico. Assicurati di aver impostato anche
le etichette e la legenda.

### Esempio di istogramma: grafico sulla lunghezza del becco

In [None]:
plt.figure(figsize=(10,8))

plt.hist(df_adelie['bill_length_mm'], color='r', alpha=.5) # l'alpha imposta la trasparenza del grafico
plt.hist(df_chinstrap['bill_length_mm'], color='g', alpha=.5)
plt.hist(df_gentoo['bill_length_mm'], color='b', alpha=.5)

ax = plt.gca()

ax.set_xlabel('Lunghezza del becco (mm)')
ax.set_title('Istogramma della lunghezza del becco per diverse specie di pinguini')

ax.legend(('adelie', 'chinstrap', 'gentoo'))

### Esercizio sull'istogramma: grafico sulla massa corporea

Ora tocca a te creare il tuo grafico. Assicurati di impostare l'alpha su un valore corretto e di avere le etichette e la legenda corrette.

### Esempio di creazione di sottografici

Creare sottografici solo con `plt` è un po' più complicato. È
considerato un argomento avanzato e richiede una certa comprensione di
quali siano gli elementi costitutivi di un grafico. Non preoccuparti se
riscontri qualche difficoltà, puoi sempre seguire l'esempio e provare in
autonomia per capire meglio cosa sta succedendo.

L'esempio seguente traccia gli istogrammi della Lunghezza del becco e
della Larghezza del becco affiancati.

In [None]:
# Per prima cosa dobbiamo decidere quanti sottografici vogliamo e come sono orientati
# supponiamo di volerli vedere fianco a fianco (cioè 1 riga 2 colonne)

fig, (ax0, ax1) = plt.subplots(nrows=1, ncols=2, figsize=(15,8))

# questo creerà un oggetto figura (che è l'intera area del grafico)
# e 2 assi (che sono i 2 sottografici etichettati ax0 e ax1)

# Ora possiamo inserire i grafici di conseguenza

### per ax0 ###

ax0.hist(df_adelie['bill_length_mm'], color='r', alpha=.5) 
ax0.hist(df_chinstrap['bill_length_mm'], color='g', alpha=.5)
ax0.hist(df_gentoo['bill_length_mm'], color='b', alpha=.5)

ax0.set_xlabel('Lunghezza del becco (mm)')
ax0.set_title('Istogramma della lunghezza del becco per diverse specie di pinguini')

ax0.legend(('adelie', 'chinstrap', 'gentoo'))

### per ax1 ###

ax1.hist(df_adelie['bill_depth_mm'], color='r', alpha=.5) 
ax1.hist(df_chinstrap['bill_depth_mm'], color='g', alpha=.5)
ax1.hist(df_gentoo['bill_depth_mm'], color='b', alpha=.5)

ax1.set_xlabel('Lareghezza del becco (mm)')
ax1.set_title('Istogramma della larghezza del becco per diverse specie di pinguini')

ax1.legend(('adelie', 'chinstrap', 'gentoo'))

plt.show() # dopo aver creato ciò che vogliamo su entrambi gli assi, usa il metodo show() per mostrare i grafici

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Esercizio di creazione di sottografici
</h2><br>
</div>

Crea 2 sottografici, uno sopra l'altro. Entrambi sono grafici a dispersione della lunghezza dell'ala e della massa corporea (per le varie specie di pinguini). Dopo averlo fatto, prova anche altri orientamenti e grafici. Vedi se riesci a posizionare 4 sottografici insieme. Assicurati sempre che la presentazione sia efficace.

<div class="alert alert-block alert-warning" style="padding: 0px; padding-left: 20px; padding-top: 5px;"><h2 style="color: #301E40">
Altro su matplotlib!
</h2><br>
</div>

Scopri altri esempi di istogramma con più set di dati: [https:/
/matplotlib.org/gallery/statistics/histogram_multihist.html#sphx-glr-gallery-statistics-histogram-multihist-py](https://matplotlib.org/gallery/statistics/histogram_multihist.html#sphx-glr-gallery-statistics-histogram-multihist-py)

Esempio: creare un istogramma da un grafico a dispersione e aggiungerlo
ai lati del grafico [https://matplotlib.org/
gallery/lines_bars_and_markers/scatter_hist.html#sphx-glr-gallery-lines-bars-and-markers-scatter-hist-py](https://matplotlib.org/gallery/lines_bars_and_markers/scatter_hist.html#sphx-glr-gallery-lines-bars-and-markers-scatter-hist-py)

C'è molto altro da imparare su matplotlib. È una libreria molto potente.
Puoi sempre imparare altro guardando gli esempi su:
<https://matplotlib.org/gallery/index.html>

Inoltre, se qualche passaggio ti blocca, controlla sempre la
documentazione: [https://matplotlib.org/
api/\_as_gen/matplotlib.pyplot.html#module-matplotlib.pyplot](https://matplotlib.org/api/_as_gen/matplotlib.pyplot.html#module-matplotlib.pyplot)

![](https://media0.giphy.com/media/l3nF8lOW9D0ZElDvG/200.gif)