# Phenotype Grapher

In [None]:
# デフォルトで以下は読み込まれているのでナシでもOK
# %matplotlib inline
# import matplotlib.pyplot as plt
# import numpy as np
# import pandas as pd

In [None]:
df = pd.read_csv("./sample_data.csv", index_col=0).T
# なお，データはHozumi et al.とNakamura et al.から取ってきているので悪しからず

# n数をリストにしておく
df_total = list(df.sum())

df.T # データにおかしなところが無いか最終チェック

In [None]:
# 割合に変換
df2 = df.div(df.sum()).T
df2 = df2 * 100
df2

In [None]:
# 図を作る前に，サイズの調整

graph_width = 15 # グラフエリアの横幅
graph_height = 12 # グラフエリアの高さ

figsize = (graph_width, graph_height) # まとめただけなので気にしないで

xlabel_fontsize = 45 # x軸ラベルの文字の大きさ
ylabel_fontsize = 14 # y軸ラベルの文字の大きさ
legend_fontsize = 40 # 凡例の文字の大きさ
total_num_fontsize = 40 # N数表示の文字の大きさ

# 凡例の位置は，7系統以上だと上に置いたほうが分かり易い気がする
# 一方で6系統以下だと上に置くと詰まりすぎるので横に置こう

legend_loc_morethan7 = (0.03,1.2) # 7系統以上の時の凡例の位置
legend_loc_lessthan6 = (1, 0.2) # 6系統以下の時の凡例の位置

# 棒グラフの幅を設定
bar_width = 0.7

# y軸に制限をかける場合はここをいじる
# 基本は(0, 100)で良いはず
ylim = (0, 100)

# フォントの整備
import matplotlib as mpl
mpl.rcParams['font.family'] = 'Source Sans Pro' # 好みのフォントを使おう

# 使えるフォントの確認は以下から
# import matplotlib.font_manager
# print([f.name for f in matplotlib.font_manager.fontManager.ttflist])

# 以下からやっとグラフの作成に取り掛かるよ

# 積み上げ棒グラフの作成
ax = df2.plot(kind="bar", stacked=True, width=bar_width, figsize=figsize, ylim=ylim, fontsize=xlabel_fontsize, color=['white', 'grey', 'orangered', 'black'], edgecolor='black')
ax.set_ylabel("Frequency (%)", fontsize=10/3*ylabel_fontsize)

# グラフの囲み線の内，上と右の部分を削除
plt.gca().spines['right'].set_visible(False)
plt.gca().spines['top'].set_visible(False)

# 横軸ラベルを傾け，haでずれを寄せる
ax.set_xticklabels(ax.xaxis.get_majorticklabels(), rotation=45, ha="right")

# 目盛りが鬱陶しいので白色にしておく
# lengthは適宜変えよう
plt.gca().xaxis.set_tick_params(length=20, color="white")

# fig legendを設定
if len(df_total) > 6:
    plt.legend(loc=legend_loc_morethan7, fontsize=legend_fontsize, ncol=4, frameon=False)
else:
    plt.legend(loc=legend_loc_lessthan6, fontsize=legend_fontsize, ncol=1, frameon=False)

# n数を置く
n_loc = {"x": 0, "y": 110}
plt.text(x=-0.5, y=n_loc["y"], s="n =", fontsize=total_num_fontsize, ha='right')
for total_num, x in zip(df_total, range(len(df_total))):
    if pd.isnull(total_num):
        plt.text(x = x - n_loc["x"], y = n_loc["y"], s = "0", fontsize = total_num_fontsize, ha = "center")
    else:
        plt.text(x = x - n_loc["x"], y = n_loc["y"], s = str(int(total_num)), fontsize = total_num_fontsize, ha = "center")


# プロット
plt.show()