# 第10章　値の分布を表現するグラフ

## 10.1 箱ひげ図、ストリップチャート、バイオリン図

In [1]:
import json

from plotly import graph_objects as go
from plotly import express as px
from plotly.graph_objs.layout import Template
from plotly.express import colors as pcolors
from plotly import data as pdata

# TipsデータセットのDataFrameを読み込み
df = pdata.tips()

df

Unnamed: 0,total_bill,tip,sex,smoker,day,time,size
0,16.99,1.01,Female,No,Sun,Dinner,2
1,10.34,1.66,Male,No,Sun,Dinner,3
2,21.01,3.50,Male,No,Sun,Dinner,3
3,23.68,3.31,Male,No,Sun,Dinner,2
4,24.59,3.61,Female,No,Sun,Dinner,4
...,...,...,...,...,...,...,...
239,29.03,5.92,Male,No,Sat,Dinner,3
240,27.18,2.00,Female,Yes,Sat,Dinner,2
241,22.67,2.00,Male,Yes,Sat,Dinner,2
242,17.82,1.75,Male,No,Sat,Dinner,2


In [2]:
# Traceを作成
trace = go.Box(
    x=df['tip'],    # 分布を表現する変数
    name='Tip'      # Trace名
)   # チップ額の箱ひげ図

# 独自テンプレートを読み込み
with open('custom_white.json') as f:
    custom_white_dict = json.load(f)
    template = Template(custom_white_dict)

# Layoutを作成
layout=go.Layout(
    template=template,
    title='Tip dataset',
    xaxis={'title': 'Payment [dollers]'}
)

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_1.png', width=900, height=450, scale=2)
figure

In [3]:
# Traceを作成
trace = go.Box(
    x=df['tip'],
    boxpoints='suspectedoutliers',  # 著しい外れ値を強調
    name='Tip'
)   # チップ額の箱ひげ図（外れ値強調）

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_2.png', width=900, height=450, scale=2)
figure

In [4]:
# Traceを作成
trace = go.Box(
    x=df['tip'],
    boxpoints='all',            # すべてのマーカーを表示
    jitter=0.,                  # ジッター量（0）
    marker={'opacity': 0.2},    # マーカー設定
    name='Tip'
)   # チップ額の箱ひげ図（すべてのマーカー表示）

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_3.png', width=900, height=450, scale=2)
figure

In [5]:
# 使用する変数
columns = {
    'Tip': 'tip',
    'Total bill': 'total_bill',
}

# Traceのlistを作成
traces = []
for key, value in columns.items():
    trace = go.Box(
        x=df[value],
        boxpoints='all',
        jitter=0.,
        marker={'opacity': 0.5},
        name=key
    )
    traces.append(trace)

# Figureを作成
figure = go.Figure(traces, layout)

# figure.write_image('./figure/out_10_1_4.png', width=900, height=450, scale=2)
figure

In [6]:
# Traceを作成
trace = go.Box(
    y=df['tip'],    # y軸に使用する変数（y軸に量的変数を指定している点に注意）
    x=df['day'],    # x軸に使用する変数
    boxpoints='all',
    jitter=0.,
    marker={'opacity': 0.5}
)

# Layoutを作成
layout = go.Layout(
    template=template,
    title='Tip dataset',
    xaxis={'title': 'Day'},
    yaxis={'title': 'Payment [dollers]'}
)

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_5.png', width=900, height=450, scale=2)
figure

In [7]:
# Traceを作成
trace = go.Violin(
    x=df['tip'],                # 分布を表現する変数
    # points='all',               # すべてのマーカーを表示
    jitter=0.,                  # ジッター量（0.2）
    marker={'opacity': 0.5},    # マーカー設定
    name='Tip'                  # Trace名
)   # チップ額のバイオリン図

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_6.png', width=900, height=450, scale=2)
figure

In [8]:
# Traceを作成
trace = go.Violin(
    x=df['tip'],
    points='all',
    jitter=0.,
    marker={'opacity': 0.5},
    box_visible=True,   # 箱ひげ図表示（表示あり）
    name='Tip'
)   # チップ額のバイオリン図

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_7.png', width=900, height=450, scale=2)
figure

In [9]:
# Traceを作成
trace = go.Box(
    x=df['tip'],                        # 分布を表現する変数
    boxpoints='all',                    # すべてのマーカーを表示
    fillcolor='rgba(0,0,0,0)',          # 箱の塗りつぶし（無色透明）
    line={'color': 'rgba(0,0,0,0)'},    # 箱の線（無色透明）
    hoveron='points',                   # ホバー設定（マーカー）
    pointpos=0,                         # マーカー中心位置（0）
    jitter=0.3,                         # ジッター量（0.3）
    marker={
        'color': pcolors.qualitative.D3[0],
        'opacity': 0.3
    },
    name='Tip'                          # Trace名
)   # チップ額のストリップチャート

# Figureを作成
figure = go.Figure(trace, layout)

# figure.write_image('./figure/out_10_1_8.png', width=900, height=450, scale=2)
figure

In [10]:
# ジッター量のlist
jitters = [0.05, 0.1, 0.2, 0.5]

# Frameのlistを作成
frames = []
steps = []
for jitter in jitters:
    # Traceを作成
    trace = go.Box(
        y=df['tip'],
        x=df['day'],
        boxpoints='all',
        fillcolor='rgba(0,0,0,0)',
        line={'color': 'rgba(0,0,0,0)'},
        pointpos=0,
        marker={
            'color': pcolors.qualitative.D3[0],
            'opacity': 0.5
        },
        jitter=jitter
    )   # チップ額の散布図

    # Frameを作成
    frame = go.Frame(
        data=trace,
        name=jitter
    )
    frames.append(frame)

    # ステップを作成
    step = {
        'args': [
            [jitter],
        ],
        'label': f'jitter {jitter}',
        'method': 'animate'
    }
    steps.append(step)

# スライダーを作成
sliders = [{
    'len': 1.,      # スライダー長さ
    'x': 0.,        # スライダー左位置
    'y': -0.1,      # スライダー縦位置
    'steps': steps
}]

# Layoutを作成
layout = go.Layout(
    template=template,
    title='Tip dataset',
    xaxis={'title': 'Day'},
    yaxis={'title': 'Payment [dollers]'},
    sliders=sliders,  
)

# Figureを作成
figure = go.Figure(
    data=frames[0]['data'],     # 最初に表示するグラフ
    layout=layout,
    frames=frames
)

# figure.write_image('./figure/out_10_1_9.png', width=900, height=450, scale=2)
figure