# Seaborn și Matplotlib

* Matplotlib este un pachet Python specializat în vizualizarea datelor.
* Pachetul propune o multitudine de funcții pentru crearea și personalizarea unei mari diversități de grafice 2D și 3D.
* Pyplot esre un modul al lui Matplotlib ce reprezintă o intefață concepută și optimizată pentru vizualizările interactive. Din acest motiv, este foarte utilizat în task-urile de Data Science.

![](https://itom.bitbucket.io/v1-0-14/docs/_images/matplotlib_intro.png)

## Diferite tipuri de grafice
* Histograma: `pyplot.hist(x, bins, ...)`
* Line plot: `pyplot.plot(x, y, linewidth, …)`
* Scatter plot: `pyplot.scatter(x, y, s, c, marker, …)`
* Box plot: `pyplot.boxplot(x, notch, sym, …)`
* Bar chart: `pyplot.bar(x, height, width, …)`
* Pie chart: `pyplot.pie(x, explode, labels, …)`
* Polar chart: `pyplot.polar(theta, r, …)`
* Image: `pyplot.imshow(X, cmap, norm, …)`

### Importul librăriilor: numpy, pandas, matplotlib.pyplot și seaborn

In [None]:
import matplotlib.pyplot as plt 
import seaborn as sns
import numpy as np
import pandas as pd 

### Reprezentați pe același grafic funcțiile sinus și cosinus între $-\frac{\pi}{2}$ și $\frac{3\pi}{2}$. Afișați legenda.

In [None]:
x = np.linspace(-np.pi/2, 3*np.pi/2)

plt.plot(x, np.sin(x), label='sinus', color='blue', linestyle='--', linewidth=2)
plt.plot(x, np.cos(x), label='cosinus', color='red', linestyle='-', linewidth=2)

plt.legend()
plt.show()

### Importați fișierul data_fraud.csv într-un DataFrame (Pandas)

In [None]:
df=pd.read_csv('./Data/data_fraud.csv')
df.head()

### Creati un *scatter plot* al valorilor Numar_tranzactii_ultimele_10_ore versus tipul de tranzacție. Colorați punctele după valoarea lui is_fraud.

Observație: Trebuie create 2 scatterplot-uri pe aceeași figură (câte un grafic pentru fiecare valoare a lui is_fraud). Se va utiliza o mască booleană pentru condiție și se filtrează setul de date.

In [None]:
mask_fraud = (df.is_fraud == 1)

plt.scatter(df.Suma_tranzactie[~mask_fraud], df.Cos_mediu[~mask_fraud], c='indianred', alpha=0.2, label='Fraud')
plt.scatter(df.Suma_tranzactie[mask_fraud], df.Cos_mediu[mask_fraud], c='cornflowerblue', alpha=0.4, label='Not Fraud')
plt.legend();

In [None]:
sns.scatterplot(x = 'Suma_tranzactie', y = 'Cos_mediu', data=df, hue='is_fraud')

### Trasați histograma variabilei Suma_tranzactie cu un număr de bins = 50

In [None]:
plt.hist(df['Suma_tranzactie'], bins=50);

### Trasați diagrama de tip bar pentru a reprezenta numărul de observații asociat fiecărui tip de tranzacție

Observație: Calculați mai întâi numărul de observații pentru fiecare tip de tranzacție.

In [None]:
counts = df.Tip_tranzactie.value_counts()
plt.bar(counts.index.astype('str'), counts);

In [None]:
sns.countplot(x='Tip_tranzactie', data=df)

### Reproduceți diagrama de mai sus separând tranzacțiile frauduloase de cele nefrauduloase în cadrul fiecărui tip de tranzacție

Observație: Utilizați librăria Seaborn.

In [None]:
sns.countplot(x='Tip_tranzactie',data=df, hue='is_fraud')

### Trasați un boxplot pentru variabila 'Suma_tranzactie' raportată la 'is_fraud'

Observație: Utilizați librăria Seaborn.

In [None]:
plt.figure(figsize=(12,8))
sns.boxplot(x='is_fraud', y='Suma_tranzactie',data=df)

### Trasați un boxplot pentru variabila 'Suma_tranzactie' (y-axis) raportată la 'Tip_tranzactie' (x-axis) în funcție de 'is_fraud' (hue)

Observație: Utilizați librăria Seaborn.

In [None]:
plt.figure(figsize=(12,8))
sns.boxplot(x='Tip_tranzactie',y='Suma_tranzactie',data=df, hue='is_fraud')

### Trasați un pairplot pentru setul de date considerat

Observație: Utilizați funcția `pairplot()` din librăria Seaborn.

In [None]:
sns.pairplot(df)