## 第6章 Bokehでグラフを描画しよう

### 6-7: ヒストグラム

In [1]:
# リスト6.7.1：リスト-ライク・オブジェクトのデータを渡したヒストグラム
from bokeh.charts import Histogram, output_notebook, show
import numpy as np

np.random.seed(0)
data = np.random.normal(100, 10, 10000)  # データセットの作成
output_notebook()
p = Histogram(data, plot_width=600, plot_height=400)
show(p)

In [2]:
# リスト6.7.2：DataFrameを渡したヒストグラム
import os
import pandas as pd

base_url = (
    "https://raw.githubusercontent.com/practical-jupyter/sample-data/master/anime/"
)
anime_master_csv = os.path.join(base_url, "anime_master.csv")
df = pd.read_csv(anime_master_csv)
p = Histogram(df, values="rating", plot_width=600, plot_height=400)
show(p)

In [3]:
# リスト6.7.3：ビン数を設定したヒストグラム
p = Histogram(df, values="rating", plot_width=300, plot_height=200, bins=10)
show(p)

In [4]:
# リスト6.7.4：色分けしたヒストグラム
p = Histogram(df, values="rating", color="type", plot_width=600, plot_height=400)
show(p)

In [5]:
# リスト6.7.6：近似曲線を加えたヒストグラム
import numpy as np
from bokeh.plotting import figure

bins = 100  # binの数
# 平均と標準偏差
mu, sigma = df["rating"].mean(), df["rating"].std()
# 正規化したヒストグラムのデータを集計
hist = np.histogram(df["rating"], normed=True, bins=bins)[0]
# X値のデータを作成
x = np.linspace(np.min(df["rating"]), np.max(df["rating"]), bins)
# 近似的な確率密度関数を使用してY値を生成
y = 1 / (sigma * np.sqrt(2 * np.pi)) * np.exp(-(x - mu) ** 2 / (2 * sigma ** 2))
p = figure(plot_width=600, plot_height=400)
# ヒストグラム
p.vbar(x, top=hist, width=0.05)
# 近似曲線
p.line(x, y, color="red", line_width=4, alpha=0.5)
show(p)