pd.DataFrmaeから1年単位の折れ線グラフを描く関数

In [None]:
# 1年単位で折れ線グラフを並べて描く関数
def plot_year_linegraph(df, y, fig_x=18, label=None, loc="upper left", title=None, sharey=True):
    
    '''
    1年単位で折れ線グラフを描く関数
    縦の長さは年数に応じてよしなにやる
    
    df(pd.DataFrame): プロットしたいデータフレーム、datetime型のindexとintのyear列が入っている必要がある
    y(str): 描画したい変数名
    figsize(tuple): 全ての年を合わせたグラフの大きさ
    label(str): ラベル
    loc(str): ラベルの配置場所
    title(str): タイトル
    sharey(bool): y軸を揃えるかどうか
    '''
    

    from datetime import datetime, date, timedelta
    from matplotlib.dates import DateFormatter, MonthLocator
    import matplotlib.ticker as ticker
    
    df = df.sort_index()
    years = np.sort(df.year.unique())

    fig, axes = plt.subplots(nrows=years.shape[0], ncols=1, sharey=sharey, figsize=(fig_x, years.shape[0]*3))
    for i, year in enumerate(years):
        df_selected = df[df.year == year]
        axes[i].plot(df_selected.index, df_selected[y], label=label)
    
        # 表示形式の設定
        mformat = DateFormatter("%m月")
        axes[i].xaxis.set_major_formatter(mformat)
    
        # 区切りの設定
        mlocator = MonthLocator()
        axes[i].xaxis.set_major_locator(mlocator)
    
        # 上限下限の設定
        datemin = date(year, 1, 1)
        datemax = date(year + 1, 1, 1)
        axes[i].set_xlim(datemin, datemax)
    
        # ラベルの設定
        if label != None:
            axes[i].legend(loc=loc)
        
    # タイトルの設定
    if title != None:
        fig.suptitle(title)
    
    plt.show()
    return 

In [None]:
# 1年単位で折れ線グラフを同時に描く関数
def plot_year_linegraph_multi_layer(df, y, ymin=None, ymax=None, figsize=(18, 8), title=None, alpha=1):
    '''
    1年単位で折れ線グラフを重ねて描く関数
    
    df(pd.DataFrame): プロットしたいデータフレーム、datetime型のindexとintのyear列が入っている必要がある
    y(str): 描画したい変数名
    ymin(int): yの最小値
    ymax(int): yの最大値、範囲を指定したいときはymin, ymax両方指定する
    figsize(tuple): 全ての年を合わせたグラフの大きさ
    title(str): タイトル
    alpha(float): 線の濃さ
    '''
    
    from datetime import datetime, date, timedelta
    from matplotlib.dates import DateFormatter, MonthLocator
    import matplotlib.ticker as ticker
    import pandas as pd
    import numpy as np
    

    df = df.sort_index()
    years = np.sort(df["year"].unique())

    fig = plt.figure(figsize=(18, 8))
    ax = fig.add_subplot(111)
    for i, year in enumerate(years):
        df_selected = df[df["year"] == year]
        ax.plot(df_selected.index - timedelta(days=365 * i), df_selected[y], label=year, alpha=alpha)
        
        # ylimの設定
        if  ymin!= None and ymax != None:
            ax.set_ylim(ymin, ymax)

    # タイトルの設定
    if title != None:
        ax.set_title(title)
    
    # 表示形式の設定
    mformatter = DateFormatter("%m月")
    ax.xaxis.set_major_formatter(mformatter)
    
    # 区切りの設定
    mlocator = MonthLocator()
    ax.xaxis.set_major_locator(mlocator)

    # ラベルの設定
    ax.legend()

    plt.show()
    return

In [None]:
# 標準化をする自作関数
def zscore(x, axis=None):
    '''
    np.arrayを標準化(平均0, 標準偏差1にする)関数
    np.arrayを入力してnp.arrayを返す
    
    x(np.array): 標準化するデータ
    axis(0 or 1): 標準化する軸、Noneはデータ全体、0は行方向、1は列方向に正規化する
    '''
    
    x_mean = np.mean(x, axis=axis, keepdims=True)
    x_std = np.std(x, axis=axis, keepdims=True) # keepdimsは返り値を(1, 1)のarrayにするかfloatにするか選ぶ
    zscore = (x - x_mean) / x_std
    return zscore