# Plotly（オブジェクト指向）

Plotlyには高レベルAPIを提供する「Plotly Express」と低レベルAPIを提供する「Graph Objects」の二つのスタイルが存在する。ここでは**Graph Objects**について説明する。

Graph Objectsの方がパラメータが複雑でコード量が多くなるが、細かいグラフ調整が可能である。

## グラフの種類

- 散布図
- バブルチャート
- 棒グラフ
- 積み上げ棒グラフ
- 折れ線グラフ
- 面グラフ
- ツリーマップ
- 100%積み上げグラフ
- 円グラフ
- ヒストグラム
- 箱ひげ図
- バイオリンプロット
- ヒートマップ
- 3次元散布図

## グラフ作成の流れ

1. `plotly.graph_objects.Figure()`で`Figure`（正確には`plotly.graph_objs._figure.Figure`）オブジェクトを作成する。
2. `Figure.add_trace(go.xxx())`でグラフ情報を追加する。
3. `Figure.add_layout(go.Layout())`でグラフのレイアウトを設定する。
4. `Figure.show()`でグラフを表示

## 3. `go.Layout()`によるレイアウトの設定

[plotly.graph_objects.LayoutのAPI](https://plotly.com/python/reference/layout/)

### 主な引数とその説明

| 引数     | 説明                                                       |
| -------- | ---------------------------------------------------------- |
| width    | グラフの幅                                                 |
| height   | グラフの高さ                                               |
| title    | グラフのタイトル                                           |
| xaxis    | X軸の設定を行う。辞書形式で情報を与える。                  |
| yaxis    | Y軸の設定を行う。辞書形式で情報を与える。                  |
| font     | グラフ全体のフォントの設定を行う。辞書形式で情報を与える。 |
| template | グラフに適用するテーマ。                                   |


#### ライブラリのインポート

In [1]:
from plotly import graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

## 散布図(`plotly.graph_objects.Scatter()`)

### 主な引数とその説明

[plotly.graph_objects.ScatterのAPI](https://plotly.com/python/reference/scatter/#scatter)

|    引数    |    説明     |
| ---------- | ----------------------------------------------------------------------------------------- |
| x | 配列。x軸の値になる。|
| y | 配列。y軸の値になる。|
|mode|プロットのモードを変更する。'markers'で散布図、'lines'で折れ線グラフになる。|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|showlegend|凡例に表示する項目かどうかを設定する。|
|stackgroup|複数のプロットを同じグループに設定して、それらの値（y値）を追加する。積み上げ面グラフなどで利用。|
|fillcolor|面グラフの塗りつぶしの際に利用する。|
|fillpattern|面グラフのハッチなどを設定するときに利用する。|
|opacity|マーカーの透明度を設定する。0～1の`float`型。|
|marker|[plotly.graph.objects.scatter.marker](https://plotly.com/python-api-reference/generated/plotly.graph_objects.scatter.marker.html)にしたがう辞書を与えることでマーカーの設定を行える。marker={"color": "blue"}のように利用。|
|hoverinfo|ホバー時に表示される情報を設定する。|
|hobertemplate|ホバー時に表示される情報の文字テンプレートの表示。|

In [2]:
# データの読み込み
scatter_df = pd.read_csv("../data/diabetes.csv")
scatter_df.head()

Unnamed: 0,age,sex,bmi,bp,s1,s2,s3,s4,s5,s6,y
0,59,2,32.1,101.0,157,93.2,38.0,4.0,4.8598,87,151
1,48,1,21.6,87.0,183,103.2,70.0,3.0,3.8918,69,75
2,72,2,30.5,93.0,156,93.6,41.0,4.0,4.6728,85,141
3,24,1,25.3,84.0,198,131.4,40.0,5.0,4.8903,89,206
4,50,1,23.0,101.0,192,125.4,52.0,4.0,4.2905,80,135


In [74]:
fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x=scatter_df["bmi"],
        y=scatter_df["bp"],
        mode="markers",       # scatterではmodeを"markers"にする
        marker=dict(          # マーカーの設定は辞書形式で与える
            color="blue",
            size=7,
            opacity=0.7,
            line=dict(width=1, color="black")  # マーカーの縁
        ),
    )
)


fig.update_layout(
    go.Layout(
        width=700,
        height=500,
        title=dict(text="BMIと血圧の関係", font=dict(size=24)),
        xaxis=dict(
            title="BMI",
            linewidth=2,
            mirror=True,
            ticks="inside",
            ticklen=5,
            tickfont=dict(size=14),
            minor=dict(ticks="inside", ticklen=3),
            range=(15, 45)
        ),
        yaxis=dict(
            title="血圧 [mmHg]",
            linewidth=2,
            mirror=True,
            ticks="inside",
            ticklen=5,
            tickfont=dict(size=14),
            minor=dict(ticks="inside", ticklen=3, nticks=4),
            range=(50, 150)
        ),
        font=dict(size=18, family="sans-serif"),  # フォントの設定
        template="simple_white",
    )
)


fig.show()

## バブルチャート(`seaborn.objcets.Scatter`)

In [72]:
fig = go.Figure()

fig.add_trace(
    go.Scatter(
        x=scatter_df["bmi"],
        y=scatter_df["bp"],
        mode="markers",
        marker=dict(
            size=scatter_df["y"] / 10,
            color=scatter_df["y"],
            colorscale="reds",  # colorbarのカラーマップの設定
            colorbar=dict(
                title="糖尿病の進行度", titlefont=dict(size=12)
            ),  # カラーバーの設定
            showscale=True,
        ),
    )
)


fig.update_layout(
    go.Layout(
        width=700,
        height=500,
        title=dict(text="血圧とBMIおよび糖尿病の進行度の関係", font=dict(size=18)),
        xaxis=dict(
            title="BMI",
            linewidth=2,
            mirror=True,
            ticks="inside",
            ticklen=5,
            minor=dict(ticks="inside", ticklen=3),
            range=(15, 45)
        ),
        yaxis=dict(
            title="血圧 [mmHg]",
            linewidth=2,
            mirror=True,
            ticks="inside",
            ticklen=5,
            minor=dict(ticks="inside", ticklen=3, nticks=4),
            range=(50, 150)
        ),
        font=dict(family="sans-serif", size=14),
        template="simple_white",
    )
)


fig.show()

## 棒グラフ

### 主な引数とその説明

[plotly.graph_objects.BarのAPI](https://plotly.com/python/reference/bar/)

|    引数    |    説明     |
| ---------- | ----------------------------------------------------------------------------------------- |
| x | 配列。x軸の値になる。|
| y | 配列。y軸の値になる。|
|error_x|x軸方向のエラーバー。辞書形式で情報を与える。|
|error_y|y軸方向のエラーバー。辞書形式で情報を与える。|
|orientation|バーの方向。`v`か`h`で設定する。デフォルトは`v`|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|showlegend|凡例に表示する項目かどうかを設定する。|
|opacity|バーの透明度を設定する。0～1の`float`型。|
|hoverinfo|ホバー時に表示される情報を設定する。|
|hobertemplate|ホバー時に表示される情報の文字テンプレートの表示。|
|marker_pattern_shape|バーにハッチパターンを付与する。|
|marker_pattern_size|バーに付与したハッチパターンのサイズ。`int`型。|
|marker_pattern_solidity|バーに付与するハッチパターンのバーに対する割合。0～1の`float`型。|

In [9]:
bar_df = pd.read_csv(
    "../data/city_temperature.csv",
    sep="\t",  # タブ区切りのデータを取得
    index_col=None,
    parse_dates=["date"],  # 文字列から日付データに変換したい列名
    date_format="%Y%m%d",  # 日付データのフォーマット 例) 20111001 -> 2011-10-01
)

bar_df = bar_df.set_index("date")

ny_temp = bar_df["New York"].resample("ME").mean()
ny_temp_std = bar_df["New York"].resample("ME").std()
sf_temp = bar_df["San Francisco"].resample("ME").mean()
sf_temp_std = bar_df["San Francisco"].resample("ME").std()
austin_temp = bar_df["Austin"].resample("ME").mean()
austin_temp_std = bar_df["Austin"].resample("ME").std()


bar_df = pd.DataFrame(
    data={
        "New York": ny_temp,
        "New York(std)": ny_temp_std,
        "San Francisco": sf_temp,
        "San Francisco(std)": sf_temp_std,
        "Austin": austin_temp,
        "Austin(std)": austin_temp_std,
    }
)

bar_df

Unnamed: 0_level_0,New York,New York(std),San Francisco,San Francisco(std),Austin,Austin(std)
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2011-10-31,58.083871,8.035467,59.4,3.093542,68.8,7.152435
2011-11-30,50.843333,4.848866,53.07,3.009313,61.446667,10.707546
2011-12-31,43.174194,6.710885,50.209677,3.895241,50.816129,8.282274
2012-01-31,37.387097,8.267355,50.948387,2.896995,53.083871,7.003337
2012-02-29,40.47931,4.680688,51.124138,2.55422,55.765517,9.28656
2012-03-31,48.067742,7.314888,50.870968,2.982526,64.712903,7.654182
2012-04-30,53.91,5.270958,52.826667,2.69315,71.706667,4.478834
2012-05-31,63.254839,6.058429,52.990323,1.566388,76.564516,4.668586
2012-06-30,70.546667,7.085134,55.233333,1.819688,83.01,3.086494
2012-07-31,77.916129,4.352478,55.509677,1.748972,82.758065,2.602406


In [10]:
fig = go.Figure()

fig.add_trace(
    go.Bar(
        x=bar_df.index,
        y=bar_df["New York"],
        error_y=dict(
            type="data", array=bar_df["New York(std)"], color="black", visible=True
        ),
    ),
)

fig.update_layout(
    go.Layout(
        width=800,
        height=600,
        title=dict(text="NYの気温（月別平均）", font=dict(size=18)),
        xaxis=dict(
            title="Month",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="",
        ),
        yaxis=dict(
            title="Temperature [F]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=3, nticks=2),
            range=(0, 90)
        ),
        font=dict(family="sans-serif", size=14),
        template="simple_white",
    )
)

fig.update_yaxes(showgrid=True, gridcolor="black", griddash="dot", gridwidth=0.5)

fig.show()

In [11]:
fig = go.Figure()
fig.add_trace(
    go.Bar(
        y=bar_df.index,
        x=bar_df["New York"],
        error_x=dict(
            type="data", array=bar_df["New York(std)"], color="black", visible=True
        ),
        orientation="h",
    )
)

fig.update_layout(
    go.Layout(
        title=dict(text="NYの気温（月別平均）", font=dict(size=18)),
        yaxis=dict(
            title="Month",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="",
        ),
        xaxis=dict(
            title="Temperature [F]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=3, nticks=4),
            range=(0, 90)
        ),
        font=dict(family="sans-serif", size=14),
        template="simple_white",
        height=800,
    )
)
fig.update_xaxes(showgrid=True, gridcolor="black", griddash="dot", gridwidth=0.5)

fig.show()

In [13]:
fig = go.Figure()

for i, (mean, std, name) in enumerate(
    zip(
        (ny_temp, sf_temp, austin_temp),
        (ny_temp_std, sf_temp_std, austin_temp_std),
        ("New York", "San Francisco", "Austin"),
    )
):
    fig.add_trace(
        go.Bar(
            x=bar_df.index,
            y=mean,
            error_y=dict(type="data", array=std, color="black", visible=True),
            name=name,
            offsetgroup=i,
        )
    )

fig.update_layout(
    go.Layout(
        width=1200,
        height=800,
        xaxis=dict(
            title="Month",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="",
        ),
        yaxis=dict(
            title="Temperature [F]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=3, nticks=5),
            range=(0, 90)
        ),
        font=dict(family="sans-serif", size=14),
        template="simple_white",
        legend=dict(
            x=0.01, y=0.99,
            bordercolor="black",
            borderwidth=2
        )
    )
)
fig.update_yaxes(showgrid=True, gridcolor="black", griddash="dot", gridwidth=0.5)

fig.show()

## 積み重ね棒グラフ（`plotly.graph_objects.Bar()`）

In [14]:
stacked_bar_df = pd.read_csv("../data/japan_energy.csv", index_col=0)
stacked_bar_df.head()

Unnamed: 0_level_0,石油,石炭,天然ガス,原子力,水力,新エネルギー・地熱等
年度,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1965,3.56,1.87,0.08,0.0,0.75,0.11
1966,4.13,1.92,0.09,0.01,0.77,0.11
1967,5.11,2.29,0.09,0.01,0.67,0.11
1968,5.95,2.42,0.1,0.01,0.72,0.12
1969,7.19,2.59,0.12,0.01,0.73,0.13


In [67]:
hatch_patterns = ["/", "x", "-", "|", "+", "."]
fig = go.Figure()

for i, col in enumerate(stacked_bar_df.columns):
    fig.add_trace(
        go.Bar(
            x=stacked_bar_df.index,
            y=stacked_bar_df[col],
            name=col,
            offsetgroup=0,
            marker_pattern_shape=hatch_patterns[i],  # ハッチを選択
            marker_pattern_size=4,                   # ハッチのサイズ
            marker_pattern_solidity=0.5              # ハッチによって塗りつぶされる面積の割合
        )
    )


fig.update_layout(
    go.Layout(
        width=800, height=600,
        xaxis=dict(
            title="年度",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks=""),
        yaxis=dict(
            title="国内供給量[10<sup>18</sup> J]",  # latexが書けないのでHTML形式で書く
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside"),
            range=(0, 25),
        ),
        title=dict(
            text="日本国内のエネルギー供給量の推移(1973年～2012)", font=dict(size=24)
        ),
        template="simple_white",
        barmode="stack",
        legend=dict(x=0.01, y=0.99, bordercolor="black", borderwidth=2, font=dict(size=14)),
        font=dict(size=18)
    )
)
fig.update_yaxes(showgrid=True, gridcolor="black", griddash="dot", gridwidth=0.5)

fig.show()

## 折れ線グラフ（`plotly.graph_objects.Scatter()`）

In [37]:
# プロット用のデータ取得

plot_df = pd.read_csv(
    "../data/city_temperature.csv",
    sep="\t",  # タブ区切りのデータを取得
    index_col=None,
    parse_dates=["date"],  # 文字列から日付データに変換したい列名
    date_format="%Y%m%d",  # 日付データのフォーマット 例) 20111001 -> 2011-10-01
)

# データの確認
plot_df.head()

Unnamed: 0,date,New York,San Francisco,Austin
0,2011-10-01,63.4,62.7,72.2
1,2011-10-02,58.0,59.9,67.7
2,2011-10-03,53.3,59.1,69.4
3,2011-10-04,55.7,58.8,68.0
4,2011-10-05,64.2,58.7,72.4


In [45]:
fig = go.Figure()

for col in plot_df.columns[1:]:
    fig.add_trace(go.Scatter(x=plot_df["date"], y=plot_df[col], mode="lines", name=col))

fig.update_layout(
    go.Layout(
        height=600,
        xaxis=dict(
            title="Date",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=2),
        ),
        yaxis=dict(
            title="Temperature[F]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=2),
        ),
        yaxis_range=(10, 100),
        title=dict(text="アメリカ3州の気温の変化", font=dict(size=24)),
        legend=dict(x=0.01, y=0.99, bordercolor="black", borderwidth=2),
        template="simple_white",
        font=dict(size=18)
    )
)

fig.show()

In [52]:
fig = make_subplots(rows=3, cols=1, subplot_titles=plot_df.columns[1:])

for i, col in enumerate(plot_df.columns[1:]):
    fig.add_trace(
        go.Scatter(
            x=plot_df["date"],
            y=plot_df[col],
            mode="lines",
            offsetgroup=i,
        ),
        row=i + 1,
        col=1,
    )


fig.update_layout(
    go.Layout(
        height=800,
        width=800,
        template="simple_white",
        showlegend=False,
        title=dict(text="アメリカ3州の気温の変化", font=dict(size=20)),
    )
)

fig.update_xaxes(ticks="inside", minor=dict(ticks="inside", ticklen=2))
fig.update_yaxes(ticks="inside", minor=dict(ticks="inside", ticklen=2))


fig.show()

## 面グラフ（`plotly.graph_objects.Scatter()`）

In [53]:
stacked_area_df = pd.read_csv("../data/japan_energy.csv", index_col=0)
stacked_area_df.head()

Unnamed: 0_level_0,石油,石炭,天然ガス,原子力,水力,新エネルギー・地熱等
年度,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1965,3.56,1.87,0.08,0.0,0.75,0.11
1966,4.13,1.92,0.09,0.01,0.77,0.11
1967,5.11,2.29,0.09,0.01,0.67,0.11
1968,5.95,2.42,0.1,0.01,0.72,0.12
1969,7.19,2.59,0.12,0.01,0.73,0.13


In [66]:
hatch_patterns = ["/", "x", "-", "|", "+", "."]
fig = go.Figure()

for i, col in enumerate(stacked_area_df.columns):
    fig.add_trace(
        go.Scatter(
            x=stacked_area_df.index,
            y=stacked_area_df[col],
            mode="lines",
            stackgroup="on",
            name=col,
            fillpattern=dict(shape=hatch_patterns[i], size=5),
        )
    )

fig.update_layout(
    go.Layout(
        height=600,
        xaxis=dict(
            title="年度",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
        ),
        yaxis=dict(
            title="国内供給量[10<sup>18</sup> J]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=2),
            range=(0, 25)
        ),
        title=dict(
            text="日本国内のエネルギー供給量の推移(1973年～2012年)", font=dict(size=24)
        ),
        template="simple_white",
        legend=dict(x=0.01, y=0.99, bordercolor="black", borderwidth=2, font=dict(size=14)),
        font=dict(size=18)
    )
)

fig.show()

In [65]:
fig = go.Figure()

for i, col in enumerate(stacked_area_df.columns):
    fig.add_trace(
        go.Scatter(
            x=stacked_area_df.index,
            y=stacked_area_df[col],
            mode="lines",
            stackgroup="on",
            name=col,
            groupnorm="percent",  # 百分率で正規化
            fillpattern=dict(shape=hatch_patterns[i], size=5),
        )
    )

fig.update_layout(
    go.Layout(
        height=600,
        xaxis=dict(
            title="年度",
            linecolor="black",
            linewidth=2,
            mirror=True,
        ),
        yaxis=dict(
            title="供給量 [%]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            range=[0, 100],
            ticksuffix="%",
        ),
        title=dict(
            text="日本国内のエネルギー供給量の推移(1973年～2012年)", font=dict(size=24)
        ),
        template="simple_white",
        legend=dict(bordercolor="black", borderwidth=2, font=dict(size=14)),
        font=dict(size=18)
    )
)

fig.show()

## 100%積み重ね棒グラフ（`plotly.graph_objects.Bar()`）

In [56]:
stacked_bar_100_df = pd.read_csv("../data/japan_energy.csv", index_col=0)
# %に変換
stacked_bar_100_df = (
    stacked_bar_100_df.div(stacked_bar_100_df.sum(axis=1), axis=0) * 100
)
stacked_bar_100_df.head()

Unnamed: 0_level_0,石油,石炭,天然ガス,原子力,水力,新エネルギー・地熱等
年度,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1965,55.88697,29.356358,1.255887,0.0,11.77394,1.726845
1966,58.748222,27.311522,1.280228,0.142248,10.953058,1.564723
1967,61.714976,27.657005,1.086957,0.120773,8.091787,1.328502
1968,63.841202,25.965665,1.072961,0.107296,7.725322,1.287554
1969,66.759517,24.048282,1.114206,0.092851,6.778087,1.207057


In [57]:
hatch_patterns = ["/", "x", "-", "|", "+", "."]
fig = go.Figure()

for i, col in enumerate(stacked_bar_df.columns):
    fig.add_trace(
        go.Bar(
            x=stacked_bar_100_df.index,
            y=stacked_bar_100_df[col],
            name=col,
            offsetgroup=0,
            marker_pattern_shape=hatch_patterns[i],
        )
    )

fig.update_traces(
    marker_pattern_size=6,
    # marker_pattern_solidity=0.4
)

fig.update_layout(
    go.Layout(
        xaxis=dict(linecolor="black", mirror=True, ticks=""),
        yaxis=dict(
            title="国内供給量",
            linecolor="black",
            mirror=True,
            ticks="inside",
            range=[0, 100],
            ticksuffix="%",
        ),
        title=dict(
            text="日本国内のエネルギー供給量の推移(1973年～2012)", font=dict(size=20)
        ),
        template="simple_white",
        barmode="stack",
    )
)

fig.show()

## 円グラフ（`plotly.graph_objects.Pie()`）

### 主な引数とその説明

[plotly.graph_objects.PieのAPI](https://plotly.com/python/reference/pie/)

|引数|説明|
|---|---|
|tittle|グラフのタイトル。|
|labels|円グラフのセクターのラベル（凡例）を設定する。関連する値を合計するか、`values`が設定されていない場合は単純に出現回数を下に表示する。|
|values|円グラフのセクターの値を設定する。自動的に百分率に変換してくれる。|
|textinfo|円グラフのセクターに表示する情報を設定する。`label`, `text`, `value`, `percent`を選択でき、複数表示する場合は`label+percent`のように表記する。|
|insidetextorientation|グラフのセクター内のテキストの向きをコントロールする。`auto`, `horizonal`, `radial`, `tangential`が設定できる。|
|pull|扇形を中心から引き出す。引き出す大きさは半径との比率。`list`により引き出す場所とその比率を設定できる。|
|hole|円グラフの中央に穴を空ける。穴の大きさは円グラフの大きさの比率で0～1の`float`型。|
|rotation|グラフのスタート位置を時計の12時方向から何度傾けてスタートするかを指定する。|
|opacity|グラフの透明度。0～1の`float`型。|

In [58]:
pie_df = pd.read_csv("../data/japan_energy.csv", index_col=0)

pie_df.head()

Unnamed: 0_level_0,石油,石炭,天然ガス,原子力,水力,新エネルギー・地熱等
年度,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1965,3.56,1.87,0.08,0.0,0.75,0.11
1966,4.13,1.92,0.09,0.01,0.77,0.11
1967,5.11,2.29,0.09,0.01,0.67,0.11
1968,5.95,2.42,0.1,0.01,0.72,0.12
1969,7.19,2.59,0.12,0.01,0.73,0.13


In [59]:
fig = make_subplots(rows=1, cols=2, specs=[[{"type": "pie"}, {"type": "pie"}]])

for i, year in enumerate((1965, 2012)):
    fig.add_trace(
        go.Pie(
            title=f"{year}年",
            labels=pie_df.columns,
            values=pie_df.loc[year],
            textinfo="label+percent",
            textfont=dict(size=12),
            insidetextorientation="horizontal",
            rotation=0,
            # hole=0.3,
            pull=[0.05 if i == 0 else 0 for i in range(len(pie_df.columns))],
        ),
        row=1,
        col=i + 1,
    )

fig.update_layout(title=dict(text="1965年と2012年のエネルギー比率の変化"))


fig.show()

## ヒストグラム（`plotly.graph_objects.Hist()`）

### 主な引数とその説明

[plotly.graph_objects.HistのAPI](https://plotly.com/python/reference/histogram/)

|引数|説明|
|---|---|
| x | 配列。X軸の値になる。|
| y | 配列。Y軸の値になる。|
|nbinsx|X軸のbinの数|
|nbinsy|Y軸のbinの数|
|orientation|バーの方向。`v`か`h`で設定する。デフォルトは`v`|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|showlegend|凡例に表示する項目かどうかを設定する。|
|opacity|バーの透明度を設定する。0～1の`float`型。|
|hoverinfo|ホバー時に表示される情報を設定する。|
|hobertemplate|ホバー時に表示される情報の文字テンプレートの表示。|


In [75]:
hist_df = pd.read_csv("../data/diamond.csv")
print("cutの種類", len(hist_df["cut"].unique()))

hist_df.head()

cutの種類 5


Unnamed: 0,carat,cut,color,clarity,depth,table,price,x,y,z
0,0.23,Ideal,E,SI2,61.5,55.0,326,3.95,3.98,2.43
1,0.21,Premium,E,SI1,59.8,61.0,326,3.89,3.84,2.31
2,0.23,Good,E,VS1,56.9,65.0,327,4.05,4.07,2.31
3,0.29,Premium,I,VS2,62.4,58.0,334,4.2,4.23,2.63
4,0.31,Good,J,SI2,63.3,58.0,335,4.34,4.35,2.75


In [76]:
fig = make_subplots(rows=3, cols=2, subplot_titles=hist_df["cut"].unique())

for i, cut in enumerate(hist_df["cut"].unique()):
    fig.add_trace(
        go.Histogram(x=hist_df[hist_df["cut"] == cut]["price"], nbinsx=250, name=cut),
        row=i // 2 + 1,
        col=i % 2 + 1,
    )

fig.update_layout(
    go.Layout(
        width=800,
        height=800,
        title=dict(text="ダイアモンドのカットと価格", font=dict(size=20)),
        template="simple_white",
    )
)

fig.update_xaxes(ticks="inside", minor=dict(ticks="inside", ticklen=2), title="price")
fig.update_yaxes(ticks="inside", minor=dict(ticks="inside", ticklen=2), title="count")

fig.show()

In [92]:
fig = go.Figure()

for i, cut in enumerate(hist_df["cut"].unique()):
    fig.add_trace(
        go.Histogram(
            x=hist_df[hist_df["cut"] == cut]["price"], nbinsx=100, name=cut, opacity=0.4
        )
    )

fig.update_layout(
    go.Layout(
        height=600,
        title=dict(text="ダイアモンドのカットと価格", font=dict(size=20)),
        template="simple_white",
        barmode="overlay",
        xaxis=dict(
            ticks="inside",
            linecolor="black",
            linewidth=2,
            mirror=True,
            minor=dict(ticks="inside", ticklen=2),
            title="price",
            range=(0, 20000)
        ),
        yaxis=dict(
            ticks="inside",
            linecolor="black",
            linewidth=2,
            mirror=True,
            minor=dict(ticks="inside", ticklen=2),
            title="count",
            range=(0, 3000)
        ),
        legend=dict(
            traceorder="normal",  # 追加した順番に凡例を表示
            x=0.75,
            y=0.99,
            bordercolor="black",
            borderwidth=2,
            font=dict(size=14)
        ),  # 凡例を中に移動
        font=dict(size=18)
    )
)

fig.show()

## 箱ひげ図（`seaborn.graph_objects.Box()`）

### 主な引数とその説明

[plotly.graph_objects.BoxのAPI](https://plotly.com/python/reference/box/)

|引数|説明|
|---|---|
| x | 配列。X軸の値になる。|
| y | 配列。Y軸の値になる。|
|orientation|バーの方向。"v"か"h"で設定する。デフォルトは"v"|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|boxpoints|ポイントの表示。"all": 全てのポイント記述、"outliers": 外れ値のみ、"suspectedoutliers": 外れ値が表示され、ポイントが強調される。defaltはoutliers。|
|jitter|`boxpoints`が設定されているとき、ポイントを箱の位置からどのように表示するかを決定する。0～1の`float`型。"0"は分布軸に沿って整列。"1"はボックスの幅に等しい幅で分布する。|
|opacity|バーの透明度を設定する。0～1の`float`型。|


In [103]:
box_plot_df = pd.read_csv("../data/iris.csv")
box_plot_df = box_plot_df.melt(
    id_vars="species",
    var_name="feature",
)
box_plot_df.head()

Unnamed: 0,species,feature,value
0,setosa,sepal_length,5.1
1,setosa,sepal_length,4.9
2,setosa,sepal_length,4.7
3,setosa,sepal_length,4.6
4,setosa,sepal_length,5.0


In [143]:
fig = go.Figure()

fig.add_trace(
    go.Box(
        x=box_plot_df["species"],
        y=box_plot_df[box_plot_df["feature"] == "sepal_length"]["value"],
        boxpoints="all",
        jitter=0.3,
    )
)

fig.update_layout(
    go.Layout(
        height=600,
        title=dict(text="Iris Dataset (sepal length)", font=dict(size=20)),
        template="simple_white",
        xaxis=dict(
            title="species",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
        ),
        yaxis=dict(
            title="sepal length [cm]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=2),
        ),
        showlegend=False,
        font=dict(size=18),
    )
)

fig.show()

In [133]:
fig = go.Figure()

for species in box_plot_df["species"].unique():
    fig.add_trace(
        go.Box(
            x=box_plot_df[box_plot_df["species"] == species]["feature"],
            y=box_plot_df[box_plot_df["species"] == species]["value"],
            name=species,
        )
    )


fig.update_layout(
    go.Layout(
        height=600,
        title=dict(text="Iris Dataset", font=dict(size=20)),
        template="simple_white",
        xaxis=dict(
            ticks="inside",
            linecolor="black",
            linewidth=2,
            mirror=True,
            title="feature"
            ),
        yaxis=dict(
            ticks="inside",
            linecolor="black",
            linewidth=2,
            mirror=True,
            minor=dict(ticks="inside", ticklen=2),
            title="[cm]",
            range=(0, 8)
        ),
        boxmode="group",
        legend=dict(
            x=0.8,
            y=0.99,
            title="品種",
            bordercolor="black",
            borderwidth=2,
            font=dict(size=14)
        ),
        font=dict(size=18)
    )
)

fig.show()

## バイオリンプロット（`plotly.graph_objects.Violin()`）

### 主な引数とその説明

[plotly.graph_objects.ViolinのAPI](https://plotly.com/python/reference/box/)

|引数|説明|
|---|---|
| x | 配列。X軸の値になる。|
| y | 配列。Y軸の値になる。|
|orientation|プロットの方向。`v`か`h`で設定する。デフォルトは`v`|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|opacity|バーの透明度を設定する。0～1の`float`型。|
|box_visible|バイオリンプロットの中に箱ひげ図も表示する。|

In [139]:
fig = go.Figure()

fig.add_trace(
    go.Violin(
        x=box_plot_df["species"],
        y=box_plot_df[box_plot_df["feature"] == "sepal_length"]["value"],
        box_visible=True
    )
)

fig.update_layout(
    go.Layout(
        height=600,
        title=dict(text="Iris Dataset (sepal length)", font=dict(size=20)),
        template="simple_white",
        xaxis=dict(
            title="species",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
        ),
        yaxis=dict(
            title="sepal length [cm]",
            linecolor="black",
            linewidth=2,
            mirror=True,
            ticks="inside",
            minor=dict(ticks="inside", ticklen=2),
        ),
        showlegend=False,
        font=dict(size=18)
    )
)

fig.show()

## ヒートマップ（`plotly.graph_objects.Heatmap()`）

### 主な引数とその説明

[plotly.graph_objects.HeatmapのAPI](https://plotly.com/python/reference/heatmap/)

|    引数    |    説明     |
| ---------- | ----------------------------------------------------------------------------------------- |
| x | 配列。X軸のラベルになる。|
| y | 配列。Y軸のラベルになる。|
| z | 配列。値はヒートマップ（カラーマップ）の色に変換される。|
|zmin|カラーマップの最小値。カラーバーもこれに従い最小値を変更する。|
|zmax|カラーマップの最大値。カラーバーもこれに従い最大値を変更する。|
|text|ヒートマップに表示される値。annotationになる。|
|texttemplate|テキストのフォーマットを設定する。|
|textfont|ヒートマップに表示される値のフォントの設定。|


In [67]:
heatmap_df = pd.read_csv("../data/diabetes.csv").corr()
heatmap_df

Unnamed: 0,age,sex,bmi,bp,s1,s2,s3,s4,s5,s6,y
age,1.0,0.173737,0.185085,0.335428,0.260061,0.219243,-0.075181,0.203841,0.270774,0.301731,0.187889
sex,0.173737,1.0,0.088161,0.24101,0.035277,0.142637,-0.37909,0.332115,0.149916,0.208133,0.043062
bmi,0.185085,0.088161,1.0,0.395411,0.249777,0.26117,-0.366811,0.413807,0.446157,0.38868,0.58645
bp,0.335428,0.24101,0.395411,1.0,0.242464,0.185548,-0.178762,0.25765,0.39348,0.39043,0.441482
s1,0.260061,0.035277,0.249777,0.242464,1.0,0.896663,0.051519,0.542207,0.515503,0.325717,0.212022
s2,0.219243,0.142637,0.26117,0.185548,0.896663,1.0,-0.196455,0.659817,0.318357,0.2906,0.174054
s3,-0.075181,-0.37909,-0.366811,-0.178762,0.051519,-0.196455,1.0,-0.738493,-0.398577,-0.273697,-0.394789
s4,0.203841,0.332115,0.413807,0.25765,0.542207,0.659817,-0.738493,1.0,0.617859,0.417212,0.430453
s5,0.270774,0.149916,0.446157,0.39348,0.515503,0.318357,-0.398577,0.617859,1.0,0.464669,0.565883
s6,0.301731,0.208133,0.38868,0.39043,0.325717,0.2906,-0.273697,0.417212,0.464669,1.0,0.382483


In [68]:
fig = go.Figure()

fig.add_trace(
    go.Heatmap(
        z=np.flip(heatmap_df.values, axis=0),
        x=heatmap_df.index,
        y=heatmap_df.columns[::-1],
        zmin=-1,
        zmax=1,
        text=heatmap_df.values,
        texttemplate="%{text:.2f}",
        textfont=dict(size=14),
    )
)

fig.update_layout(width=800, height=800, font=dict(size=20))

fig.show()

## 3次元散布図（`plotly.graph_objects.Scatter3d()`）

### 主な引数とその説明

[plotly.graph_objects.Scatter3dのAPI](https://plotly.com/python/reference/scatter3d/)

|    引数    |    説明     |
| ---------- | ----------------------------------------------------------------------------------------- |
| x | 配列。X軸の値になる。|
| y | 配列。Y軸の値になる。|
| z | 配列。Z軸の値になる。|
|mode|プロットのモードを変更する。`markers`にすると散布図、`lines`にすると折れ線グラフになる。|
|name|トレース名を設定する。凡例として表示する場合にも利用する。|
|showlegend|凡例に表示する項目かどうかを設定する。|
|stackgroup|複数のプロットを同じグループに設定して、それらの値（y値）を追加する。積み上げ面グラフなどで利用。|
|fillcolor|面グラフの塗りつぶしの際に利用する。|
|fillpattern|面グラフのハッチなどを設定するときに利用する。|
|opacity|マーカーの透明度を設定する。0～1の`float`型。|
|marker|[plotly.graph.objects.scatter.marker](https://plotly.com/python-api-reference/generated/plotly.graph_objects.scatter.marker.html)にしたがう辞書を与えることでマーカーの設定を行える。marker={"color": "blue"}のように利用。|
|hoverinfo|ホバー時に表示される情報を設定する。|
|hobertemplate|ホバー時に表示される情報の文字テンプレートの表示。|

In [69]:
scatter_3d_df = pd.read_csv("./../data/diabetes.csv")
scatter_3d_df.head()

Unnamed: 0,age,sex,bmi,bp,s1,s2,s3,s4,s5,s6,y
0,59,2,32.1,101.0,157,93.2,38.0,4.0,4.8598,87,151
1,48,1,21.6,87.0,183,103.2,70.0,3.0,3.8918,69,75
2,72,2,30.5,93.0,156,93.6,41.0,4.0,4.6728,85,141
3,24,1,25.3,84.0,198,131.4,40.0,5.0,4.8903,89,206
4,50,1,23.0,101.0,192,125.4,52.0,4.0,4.2905,80,135


In [70]:
fig = go.Figure()

fig.add_trace(
    go.Scatter3d(
        x=scatter_3d_df["bmi"],
        y=scatter_3d_df["bp"],
        z=scatter_3d_df["age"],
        mode="markers",
        marker=dict(
            size=scatter_3d_df["y"] / 20,
            color=scatter_3d_df["y"],
            colorscale="rainbow",
            colorbar=dict(title="糖尿病の進行度"),
            showscale=True,
        ),
    )
)

fig.update_layout(
    go.Layout(
        title=dict(text="Iris Dataset", font=dict(size=20)),
        template="simple_white",
        showlegend=False,
        scene=dict(aspectmode="cube"),
    ),
)

fig.update_scenes(
    zaxis=dict(
        mirror=True,
        ticks="inside",
        tickfont=dict(color="black", size=12),
        title=dict(text="age", font=dict(color="black", size=10)),
    ),
    xaxis=dict(
        mirror=True,
        ticks="inside",
        tickfont=dict(color="black", size=12),
        title=dict(text="BMI", font=dict(color="black", size=10)),
    ),
    yaxis=dict(
        mirror=True,
        tickfont=dict(color="black", size=12),
        title=dict(text="Blood Pressure", font=dict(color="black", size=10)),
    ),
)

fig.show()