# seaborn

## 参考資料
- [seaboan](https://seaborn.pydata.org/index.html)

<a name= "what"></a>

## seabornとは
matplotlibのラッパーライブラリー。

グラフデザインが洗練されている他、複数グラフの同時描写など、便利な機能が多数。


## 使い方

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns #snsとするのが一般的
%matplotlib inline

In [None]:
x = np.random.normal(size=100) #ランダムデータをnumpy arrayとして作る

In [None]:
titanic = sns.load_dataset("titanic") ##kaggleで有名な、タイタニック号の生死者データ
tips = sns.load_dataset("tips")  ## お店の食事時間と会計総額とチップの関係のデータ
iris = sns.load_dataset("iris")  ## アヤメの統計データ
df_flights = sns.load_dataset('flights')  ## フライトデータ

### ヒストグラム

In [None]:
sns.distplot(x, kde=False, rug=False, bins=10) 


## 散布図&ヒストグラム

In [None]:
iris.head()

In [None]:
sns.jointplot('sepal_width', 'petal_length', data=iris)


### 相関グラフ

In [None]:
sns.pairplot(iris, hue="species")

### 分布プロット

In [None]:
tips.head()

In [None]:
sns.stripplot(x="day", y="total_bill", data=tips)

### 箱ヒゲプロット

In [None]:
sns.boxplot(x="size", y="tip", data=tips.sort_values(by='size'))


### 棒グラフ

In [None]:
titanic.head()

In [None]:
sns.barplot(x='sex', y='survived', data=titanic, hue='class')

In [None]:
sns.countplot(x='sex', hue='embarked', data=titanic, palette='Greens_d')


### ヒートマップ
年月と乗客数の関係を可視化する

In [None]:
df_flights.head()

In [None]:
df_flights_pivot = pd.pivot_table(data=df_flights, values='passengers', 
                                  columns='year', index='month', aggfunc=np.mean)

In [None]:
df_flights_pivot.head()

In [None]:
plt.figure(figsize=(12, 9)) # matplotlibと組み合わせられる
sns.heatmap(df_flights_pivot)

In [None]:
plt.figure(figsize=(12, 9))
# 数字を入れる
sns.heatmap(df_flights_pivot, annot=True, fmt='g', cmap='Blues')

## 様々な可視化

In [None]:
import numpy as np
import seaborn as sns
import matplotlib.pyplot as plt

sns.set(style="dark")
rs = np.random.RandomState(50)

# プロットの設定
f, axes = plt.subplots(3, 3, figsize=(9, 9), sharex=True, sharey=True)

# サブプロットに描写
for ax, s in zip(axes.flat, np.linspace(0, 3, 10)):

    # cubehelixカラーマップ
    cmap = sns.cubehelix_palette(start=s, light=1, as_cmap=True)

    # カーネル密度推定（kde）プロット
    x, y = rs.randn(2, 50)
    sns.kdeplot(x, y, cmap=cmap, shade=True, cut=5, ax=ax)
    ax.set(xlim=(-3, 3), ylim=(-3, 3))

f.tight_layout()

In [None]:
sns.set()

# データ生成
r = np.linspace(0, 10, num=100)
df = pd.DataFrame({'r': r, 'slow': r, 'medium': 2 * r, 'fast': 4 * r})

# dataframeを変形
df = pd.melt(df, id_vars=['r'], var_name='speed', value_name='theta')

# facegridプロット
g = sns.FacetGrid(df, col="speed", hue="speed",
                  subplot_kws=dict(projection='polar'), size=4.5,
                  sharex=False, sharey=False, despine=False)

g.map(plt.scatter, "theta", "r")

In [None]:
from scipy.stats import kendalltau

sns.set(style="ticks")

rs = np.random.RandomState(11)
x = rs.gamma(2, size=1000)
y = -.5 * x + rs.normal(size=1000)

sns.jointplot(x, y, kind="hex", stat_func=kendalltau, color="#4CB391")

In [None]:
from string import ascii_letters

sns.set(style="white")

# ランダムデータ生成
rs = np.random.RandomState(33)
d = pd.DataFrame(data=rs.normal(size=(100, 26)),
                 columns=list(ascii_letters[:26]))

# 相関を算出
corr = d.corr()

# マスクを作成
mask = np.zeros_like(corr, dtype=np.bool)
mask[np.triu_indices_from(mask)] = True

# matplot.figureを生成
f, ax = plt.subplots(figsize=(11, 9))

# カラーマップ
cmap = sns.diverging_palette(220, 10, as_cmap=True)

# 描画
sns.heatmap(corr, mask=mask, cmap=cmap, vmax=.3,
            square=True, xticklabels=5, yticklabels=5,
            linewidths=.5, cbar_kws={"shrink": .5}, ax=ax)