# Seaborn
## Lab 8 TWD 23.11.2020

[https://seaborn.pydata.org/](https://seaborn.pydata.org/)

Za oficjalną stroną seaborna:

> If matplotlib “tries to make easy things easy and hard things possible”, seaborn tries to make a well-defined set of hard things easy too.

Przykłady z [The Ultimate Python Seaborn Tutorial: Gotta Catch ‘Em All](https://elitedatascience.com/python-seaborn-tutorial)



In [1]:
from IPython.display import HTML
HTML('<iframe width="610" height="343" src="https://www.youtube.com/embed/rg6CiPI6h2g" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>')



In [None]:
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns

In [None]:
# opcje wyswietlania
sns.set(rc={'figure.figsize':(12,7)})
sns.set_style("darkgrid")
pd.options.display.max_rows=10
pd.set_option('display.width', 5000) 
pd.set_option('display.max_columns', 60)

In [None]:
import os
os.getcwd()

In [None]:
os.chdir("D:\\Alicja\\TMP\\2021Z-DataVisualizationTechniques\\labs\\data")
os.getcwd()

In [None]:
df = pd.read_csv('Pokemon.csv', index_col=0, sep = ",")
df.head()

## Wykres punktowy

In [None]:
sns.scatterplot(data=df, x='Attack', y='Defense')
plt.show()

In [None]:
sns.scatterplot(data=df, x='Attack', y='Defense', hue="Stage")
plt.show()

In [None]:
sns.scatterplot(data=df, x='Attack', y='Defense', size="Stage")
plt.show()

Dokumentacja https://seaborn.pydata.org/generated/seaborn.scatterplot.html

## Dostosowywanie poprzez matplotlib

In [None]:
sns.scatterplot(x='Attack', y='Defense', data=df,
           hue='Stage')

plt.ylim(None,150)
plt.xlim(-100, None)
plt.show()

## Boxplot

Uwaga, inny format ramki danych niż przy ggplot2. 

In [None]:
df.head()

In [None]:
sns.boxplot(data=df)
plt.show()

In [None]:
stats_df = df.drop(['Total', 'Stage', 'Legendary'], axis=1)
 
sns.boxplot(data=stats_df)
plt.show()

Można też podać format jak w ggplot2

In [None]:
sns.boxplot(data=stats_df, x = "Type 1", y = "Attack")
plt.show()

## Violin plot

In [None]:
sns.violinplot(x='Type 1', y='Attack', data=df)
plt.show()

### Definiowanie palet kolorów

In [None]:
pkmn_type_colors = ['#78C850',  # Grass
                    '#F08030',  # Fire
                    '#6890F0',  # Water
                    '#A8B820',  # Bug
                    '#A8A878',  # Normal
                    '#A040A0',  # Poison
                    '#F8D030',  # Electric
                    '#E0C068',  # Ground
                    '#EE99AC',  # Fairy
                    '#C03028',  # Fighting
                    '#F85888',  # Psychic
                    '#B8A038',  # Rock
                    '#705898',  # Ghost
                    '#98D8D8',  # Ice
                    '#7038F8',  # Dragon
                   ]

sns.violinplot(x='Type 1', y='Attack', data=df, 
               palette=pkmn_type_colors)
plt.show()

## Swarm plot

In [None]:
sns.swarmplot(x='Type 1', y='Attack', data=df, 
              palette=pkmn_type_colors)
plt.show()

## Nakładanie wykesów

In [None]:
sns.violinplot(x='Type 1',
               y='Attack', 
               data=df, 
               inner=None, # usunięcie boxplotów ze środka
               palette=pkmn_type_colors)
 
sns.swarmplot(x='Type 1', 
              y='Attack', 
              data=df, 
              color='black')# Punkty czarne
 
# Tytuł z matplotlib
plt.title('Attack by Type')

## Łączenie wielu statystyk

In [None]:
stats_df.head()

Przejście do postaci długiej

In [None]:
melted_df = pd.melt(stats_df, 
                    id_vars=["Name", "Type 1", "Type 2"], # Zmienne do zatrzymania
                    var_name="Stat") # Nazwa nowej zmiennej
melted_df

In [None]:
sns.boxplot(x='Stat', y='value', data=melted_df, 
              hue='Type 1')
plt.show()

In [None]:
# Powiększamy wykres
plt.figure(figsize=(16,7))
 
sns.boxplot(x='Stat', 
              y='value', 
              data=melted_df, 
              hue='Type 1', 
              palette=pkmn_type_colors) # Dodajemy paletę

# przenosimy legendę
plt.legend(bbox_to_anchor=(1, 1))
plt.show()

In [None]:
# Powiększamy wykres
plt.figure(figsize=(16,7))
 
sns.boxplot(x='Stat', 
              y='value', 
              data=melted_df, 
              hue='Type 1', 
              palette=pkmn_type_colors) # Dodajemy paletę

# przenosimy legendę
# plt.legend(bbox_to_anchor=(1, 1))
plt.legend(bbox_to_anchor=(0, -.3, 1, -.2), ncol=7, mode = "expand", loc='lower left')
plt.show()

## Więcej wizualizacji

### Barplot

In [None]:
df.head()

Zliczanie wystąpień

In [None]:
sns.countplot(x='Type 1', data=df, palette=pkmn_type_colors)

# obrócenie podpisów na osi
plt.xticks(rotation=-45)
plt.show()

Podane wartości

In [None]:
df_counts = df["Type 1"].value_counts().to_frame().reset_index()
df_counts.columns = ["Type 1", "Count"]
df_counts

In [None]:
sns.barplot(data = df_counts, x = "Type 1", y = "Count",
           color = "grey")
plt.xticks(rotation=-45)
plt.show()

### Histogram

In [None]:
sns.displot(data = df, x = "Attack", binwidth=5)
# można te uzyć histplot()
plt.show()

### Wykres gęstości

In [None]:
sns.displot(data = df, x = "Attack", kind="kde")
plt.show()

## Panele

In [None]:
g = sns.catplot(x='Type 1', 
                   y='Attack', 
                   data=df, 
                   hue='Stage',  # kolor
                   col='Stage',  # podział po Stage
                   kind='box') # typ
 
g.set_xticklabels(rotation=-45)
 
plt.show()

In [None]:
g = sns.catplot(x='Type 1', 
                   y='Attack', 
                   data=df, 
                   hue='Stage',  # kolor
                   col='Stage',  # podział po Stage
                   kind='violin') # typ
 
g.set_xticklabels(rotation=-45)
 
plt.show()

## Więcej można znaleźć w galerii

http://seaborn.pydata.org/examples/

# Zadanie
Narysować wykresy dla zbior danych Titanic, zawierającego dane pasażerów.

In [None]:
titanic = sns.load_dataset('titanic')
titanic.head()

### a) histogram dla zmiennej fare (opłata z bilet)

### b) Boxploty wieku w podziale na płeć

### c) Wykresy skrzypcowe dla wieku w podziale na płeć i klasę. Można użyć na przykład kolorów czy podziału na panele.

### d) Wykres słupkowy pokazujący liczbę pasażerów w każdej z trzech klas

### e) Procent osób, które przeżyły (zmienna survived) w każdej z klas 