# Seaborn

<img src="https://seaborn.pydata.org/_images/logo-wide-lightbg.svg" alt="350" width="400" align="left"/>

## Cos'è Seaborn:

Seaborn è una libreria di visualizzazione dati Python basata su matplotlib.

Fornisce un'interfaccia di alto livello per disegnare grafici statistici accattivanti e informativi.

### Import Seaborn

In [None]:
import seaborn as sns
import pandas as pd
import matplotlib.pyplot as plt 

In [None]:
import warnings #ignore warnings
warnings.filterwarnings("ignore")

In [None]:
df = pd.read_csv('titanic/train.csv') #import Titanic dataset
df.head()

## displot:

Questa funzione combina la funzione matplotlib hist (con calcolo automatico di una buona dimensione predefinita del contenitore) con le funzioni seaborn kdeplot() e rugplot().

Può anche adattarsi alle distribuzioni scipy.stats e tracciare il PDF stimato sui dati.

In [None]:
plt.figure(figsize=(12,6))

sns.histplot(df['Age'],kde=True)
plt.show()

## Barplot:
    
Mostra le stime puntuali e gli intervalli di confidenza come barre rettangolari.

Un grafico a barre rappresenta una stima della tendenza centrale per una variabile numerica con l'altezza di ciascun rettangolo e fornisce alcune indicazioni dell'incertezza attorno a tale stima utilizzando le barre di errore. I grafici a barre includono 0 nell'intervallo dell'asse quantitativo e sono una buona scelta quando 0 è un valore significativo per la variabile quantitativa e si desidera effettuare confronti con esso.

In [None]:
plt.figure(figsize=(10,6))
sns.barplot(x="Sex", y="Survived", hue="Pclass", data=df)
plt.show()

## Swarmplot:

Disegna un grafico a dispersione categorico con punti non sovrapposti.

Questa funzione è simile a stripplot(), ma i punti vengono regolati (solo lungo l'asse delle categorie) in modo che non si sovrappongano. Ciò fornisce una migliore rappresentazione della distribuzione dei valori, ma non si adatta bene a un gran numero di osservazioni. Questo stile di trama è talvolta chiamato “sciarme d’api”.

In [None]:
plt.figure(figsize=(10,6))
sns.swarmplot(x="Sex", y="Age", data=df)
plt.show()

## Boxplot:
    
Disegna un box plot per mostrare le distribuzioni rispetto alle categorie.

In [None]:
plt.figure(figsize=(10,6))
sns.boxplot(x="Survived", y="Age", data=df)
plt.show()

## Regplot

Tracciare i dati e un modello di regressione lineare.

In [None]:
plt.figure(figsize=(10, 8))
sns.regplot(x="Age", y="Fare", data=df)
plt.show()

## Heatmap -> Correlation Matrix:

Traccia i dati rettangolari come una matrice codificata a colori.

Una mappa termica di correlazione è una mappa termica che mostra una matrice di correlazione 2D tra due dimensioni discrete, utilizzando celle colorate per rappresentare i dati solitamente da una scala monocromatica

In [None]:
plt.figure(figsize=(10, 8))
sns.heatmap(df.corr(), cmap = "YlGnBu", annot=True, fmt=".2f")
plt.show()