棒グラフ、ヒストグラム、箱ひげ図

# ライブラリインポート

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# データ読み込み

In [None]:
df = pd.read_csv('demo3_sjis.csv', encoding='shift_jis') #demo3_sjis.csvファイルを読み込み(Shift-JIS形式)
df.head()                                                #データの確認

# 棒グラフ

In [None]:
df.head() #データの確認

In [None]:
bar_df = df.pivot_table('金額', aggfunc='sum', index='姓') #姓別の合計販売額を集計
bar_df.head()                                             #データの確認

In [None]:
fig = plt.figure()                                        #グラフ描画用オブジェクトを生成

In [None]:
ax = fig.add_subplot(1, 1, 1)                             #グラフの描画位置を指定

In [None]:
bar_df.plot(y='金額', kind='bar', ax=ax)                   #グラフの描写方法(パラメータの設定)と利用データを指定

In [None]:
plt.show()                                                #グラフ描写

# 帯グラフ

### 従業員ごとの都道府県別合計受注金額の差をみる

In [None]:
bar_df = df.pivot_table('金額', aggfunc='sum', index='姓', columns='都道府県') #姓、都道府県別の合計金額を集計
bar_df                                                                      #データの確認

In [None]:
stacked_bar_df = bar_df.div(bar_df.sum(axis=1), axis=0) #各要素を、姓別の合計金額で除算
stacked_bar_df                                          #データの確認

In [None]:
fig = plt.figure()                                      #グラフ描画用オブジェクトを生成

In [None]:
ax = fig.add_subplot(1, 1, 1)                           #グラフの描画位置を指定

In [None]:
stacked_bar_df.plot(kind='bar', ax=ax, stacked=True)    #グラフの描写方法(パラメータの設定)と利用データを指定

In [None]:
plt.legend(bbox_to_anchor=(1.4, 1))                     #詳細な描写設定（bbox_to_anchor:凡例の表示位置の指定）

In [None]:
plt.show()                                              #グラフ描写

# 【参考】ヒストグラム

商談ごとの受注金額の分布をみる

In [None]:
fig = plt.figure(figsize=(6, 3))                        #グラフ描画用オブジェクトを生成(figsize:グラフサイズを指定)

In [None]:
ax = fig.add_subplot(1, 1, 1)                           #グラフの描画位置を指定

In [None]:
#グラフの描写方法(パラメータの設定)と利用データを指定
df.plot(y='金額', kind='hist', bins=50, range=[0,300000], ax=ax) 

In [None]:
plt.show()                                              #グラフ描写

成立と敗退で受注金額の分布に違いがあるかを見る

In [None]:
histdf1 = df.loc[df['フェーズ']=='成立', :]                #「フェーズ」列が「成立」の行を抽出
histdf2 = df.loc[df['フェーズ']=='敗退', :]                #「フェーズ」列が「敗退」の行を抽出

In [None]:
fig = plt.figure(figsize=(6, 3))                        #グラフ描画用オブジェクトを生成(figsize:グラフサイズを指定)

In [None]:
ax = fig.add_subplot(1, 1, 1)                           #グラフの描画位置を指定

In [None]:
#グラフの描写方法(パラメータの設定)と利用データを指定(商談の結果別に色分け)
histdf1.plot(y='金額', kind='hist', bins=40, range=[0,300000], ax=ax)
histdf2.plot(y='金額', kind='hist', bins=40, range=[0,300000], ax=ax)

In [None]:
plt.legend(['成立', '敗退'])                             #詳細な描写設定(ラベルの指定)

In [None]:
plt.show()                                              #グラフ描写

# 【参考】箱ひげ図

In [None]:
df.head()                         #データの確認

金額の分布をみる

In [None]:
fig = plt.figure(figsize=(4, 8))                 #グラフ描画用オブジェクトを生成(figsize:グラフサイズを指定)

In [None]:
ax = fig.add_subplot(1, 1, 1)                    #グラフの描画位置を指定

In [None]:
df.plot(y='金額', kind='box', whis=[5,95], ax=ax) #グラフの描写方法(パラメータの設定)と利用データを指定

In [None]:
plt.show()                                       #グラフ描写

(参考)成立、敗退で受注金額の分布に違いがあるかをみる

In [None]:
fig, axes = plt.subplots(1, 2, figsize=(4,8), sharey=True) #y軸範囲などの設定を共有したグラフ領域を作成

In [None]:
plt.subplots_adjust(wspace=1, hspace=0.5)                  #グラフ領域間に余白を追加

In [None]:
#各グラフ領域に、フェーズごとのデータをもとにした箱ひげ図を作成
for (ax, (key, group)) in zip(axes.flatten(), df.groupby(pd.Grouper('フェーズ'))):
    group.plot(y='金額', ax=ax, kind='box', whis=[5,95])
    ax.set_title(key, fontsize=14)

In [None]:
plt.show()                                                 #グラフ描写