# ヒストグラムの描画


## 1.ライブラリのインポート

今回はPlotly Expressを使って描画していきます。\
（Plotly Expressは2019年の3月に公開された、plotlyの高レベルAPI群で、インタラクティブで複雑な描画を簡単に書けるのが特徴です）
https://plotly.com/python/plotly-express/

以下のセルを実行して、Plotly expressをインポートします。
"as px"としているので、今後は"px"で呼び出すことができます。





In [1]:
import plotly.express as px

## 2.データの準備

今回はplotly_expressで用意されているdata.tipsを使用します。\
tipsの中には

合計消費量（totall_bill）（チップを除く）\
チップ量（tip）\
顧客の性別（sex）\
喫煙の有無（smoker）\
消費した曜日（day）\
消費期間（time）\
食事回数（size）

の、7つのフィールドが含まれています。\
データセットを読み込んで、変数に代入しておきます。

In [2]:
df = px.data.tips()
df.head()

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.5,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4


## 3.散布図を描く
まずはベーシックなヒストグラムを描いてみましょう！\
px.histogram(**使用するデータ, x="横軸に設定したい特徴量"**)

fig=px.histogram()がplotly_express(px)でヒストグラム(histgram)を使いますよという意味です。\
一度変数に代入して、それをshowで表示しています。\
変数は今回は"fig"としていますが、何でも大丈夫です。figure=図を意味しているので良く使われる表現です。




In [13]:
fig = px.histogram(df, 
                   x="total_bill")
fig.show()

こんどは、カウントしたい特徴量を消費した曜日（day）にしてみます。\
そうすると、下図のように、棒と棒の間に隙間ができます。

上図のチップ量は、連続した金額を刻んでカウントしていたのですが、
今回は曜日というカテゴリデータなので、このように表示されます。

In [20]:
fig = px.histogram(df,
                   x="day")
fig.show()

今回は横軸を合計消費量としたもので進めていきましょう。\
**nbins=50**を追加してみましょう。\
棒が細くなりましたね。

nbinsはnumber of binsの略だと解釈できます。\
数字を増やせば区間・階級の数が増え（刻みが細かくなる）、棒の幅が狭まると同時に一つの棒に対するcount数も少なくなります。

デフォルトでは、ビンの数は、この数がビン内の通常のサンプル数に匹敵するように選択されています。この数は、値の範囲と同様にカスタマイズできます。つまり細かく分類されたグラフを作成できたり、粗く分類できたり調整することができます。


In [14]:
fig = px.histogram(df, 
                   x="total_bill",
                   nbins=50)
fig.show()

女性と男性を区別して表示させてみたらどうなるでしょうか？\
**color="sex"**を追加します。

"sex"のカテゴリごとに色分けされて表示されました。\
グラフにカーソルを合わせると性別（系列名）、total_bill（x）、count（y）のデータがホバーされて確認することができます。

また、右にある系列名をクリックすると選択された系列がグラフから一時的に消えます。もう一度クリックで再度表示されます。

In [15]:
fig = px.histogram(df, 
                   x="total_bill", 
                   nbins=50, 
                   color="sex")
fig.show()

こんどは男性女性を、上下に並べて表示してみましょう。\
**facet_row="sex"**と追加すると、行を分けて表示することができます。

facetとは、物事のある一面。切り口のこと。今回の場合はsexという切り口で見てみるというイメージです。

In [18]:
px.histogram(df, 
             x="total_bill",
             nbins=50,
             facet_row="sex")  

さらに喫煙の有無という切り口で見てみましょう。\
**facet_col="smoker"**と追加すると、喫煙の有無によって細分化したものを列に並べて表示することが出来ます。

最後にtitleも追加しておきましょう。

In [19]:
px.histogram(df, 
             x="total_bill",
             nbins=50,
             facet_row="sex",
             facet_col="smoker",
             title="性別,喫煙の有無ごとのチップ金額合計数分布")  

他にも色々試してみたい方は、公式ページをご参照ください。\
https://plotly.com/python/histograms/