In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
sns.set(font='IPAexGothic')
import japanize_matplotlib
import glob
import pickle

In [2]:
#企業コードを書いたexcelファイルを読み込む
companies_df = pd.read_excel('code.xlsx', index_col=0, header=0)
#企業コードをリスト化
code_list = companies_df.index.to_list()
companies_df

Unnamed: 0_level_0,企業名
銘柄コード,Unnamed: 1_level_1
3402,東レ
3405,クラレ
3407,旭化成
4004,レゾナック
4005,住友化学
4021,日産化学
4042,東ソー
4063,信越化学工業
4088,エアウォーター
4091,日本酸素


In [3]:
# 読み込むファイル名を指定
filename = 'df_dict.pkl'

# バイナリモードでファイルを開き、オブジェクトを読み込む
with open(filename, 'rb') as file:
    df_dict = pickle.load(file)

In [4]:
#PERトレンドグラフ(5年分)を作成
years = [2019, 2020, 2021, 2022, 2023]

# code_list 内の各企業コードに対して処理を実行
for target in code_list:
    # companies_df に企業コードが存在しなければスキップ
    if str(target) not in df_dict.keys():
        continue
    
    # グラフの作成開始
    fig, ax1 = plt.subplots(figsize=(10, 6))

    # companies_df から企業名を取得（インデックスが整数であることを前提）
    company_name = companies_df.loc[int(target), '企業名']

    # 第1の y 軸を設定：売上総利益率のプロット
    color1 = 'tab:blue'
    ax1.set_xlabel('年度', fontsize=14)
    ax1.set_ylabel('売上総利益率（粗利率）[%]', color=color1, fontsize=14)
    ax1.plot(df_dict[str(target)]['決算年度'][:-1],
             df_dict[str(target)]['売上総利益率'][:-1],
             color=color1, marker='o', label='売上総利益率')
    ax1.tick_params(axis='y', labelcolor=color1, labelsize=12)

    # x 軸の目盛りを指定の年に設定
    ax1.set_xticks(years)
    ax1.set_xticklabels([str(year) for year in years], fontsize=12)

    # 第2の y 軸を設定：PER（会予）のプロット
    ax2 = ax1.twinx()  # 共有 x 軸の第2 y 軸を作成
    color2 = 'tab:red'
    ax2.set_ylabel('PER（会予）', color=color2, fontsize=14)
    ax2.plot(df_dict[str(target)]['決算年度'][:-1],
             df_dict[str(target)]['PER（会予）'][:-1],
             color=color2, marker='s', label='PER（会予）')
    ax2.tick_params(axis='y', labelcolor=color2, labelsize=12)

    # グラフタイトルを設定
    plt.title(f'{str(target)} {company_name}', fontsize=16)
    plt.grid(False)
    fig.tight_layout()

    # グラフをPNGファイルとして保存
    plt.savefig(f'./graph/trend/5year_trend_{str(target)}.png', dpi=150, facecolor='white')
    plt.close()  # 次のループのために現在の図を閉じる

In [8]:
index_to_label = {
    0: 'result_df_2023',
    1: 'result_df_2022',
    2: 'result_df_2021',
    3: 'result_df_2020',
    4: 'result_df_2019',
    5: 'result_df_5mean'
}

In [10]:
# 各結果データフレームを格納するための辞書
results = {}

# 各インデックスに対する処理を行う
for idx, df_name in index_to_label.items():
    records = []

    for code in code_list:
        # companies_df に企業コードが存在しなければスキップ
        if str(code) not in df_dict.keys():
            continue
        # 現在の企業コードに対応するデータフレームの idx 行目を取得
        row = df_dict[str(code)].iloc[idx]

        # 必要な値を抽出
        gross_profit_rate = row['売上総利益率']
        per_value = row['PER（会予）']

        # 辞書形式で記録を保存
        records.append({
            'code': code,
            '売上総利益率': gross_profit_rate,
            'PER（会予）': per_value
        })

    # リストからデータフレームを作成し、'code' をインデックスに設定
    df_temp = pd.DataFrame(records).set_index('code')

    # インデックスを企業名に変換
    df_temp.index = df_temp.index.map(companies_df['企業名'])

    # 'PER（会予）' 列を数値型に変換
    df_temp['PER（会予）'] = pd.to_numeric(df_temp['PER（会予）'], errors='coerce')

    # 作成したデータフレームを辞書に保存
    results[df_name] = df_temp

In [11]:
for df in results.values():   
    # NaN を含む行をすべて削除
    df.dropna(inplace=True)
    
    # 'PER（会予）' が 70 以上の行を削除
    if 'PER（会予）' in df.columns:
        condition = df['PER（会予）'] >= 70
        df.drop(df[condition].index, inplace=True)

In [14]:
# results 辞書内の各データフレームについて処理
for key, df in results.items():
    # 新しい図を作成
    plt.figure(figsize=(10, 8))

    # 散布図を作成：x軸に 'PER（会予）', y軸に '売上総利益率'
    plt.scatter(df['PER（会予）'], df['売上総利益率'], s=100)

    # 各点に企業名を注釈として追加
    for company, row in df.iterrows():
        # 数値が NaN でないことを確認してから注釈を追加
        if pd.notna(row['PER（会予）']) and pd.notna(row['売上総利益率']):
            plt.annotate(company, 
                         (row['PER（会予）'], row['売上総利益率']),
                         textcoords="offset points",  
                         xytext=(5,5),               
                         ha='left',                  
                         fontsize=14)

    # 軸ラベルを設定
    plt.xlabel('PER（会予）', fontsize=16)
    plt.ylabel('売上総利益率（粗利率）[%]', fontsize=16)

    # メモリラベルのフォントサイズを設定
    plt.tick_params(axis='both', which='major', labelsize=14)

    # グリッドを表示
    plt.grid(True)

    # 余白を自動調整
    plt.tight_layout()

    # キーに基づいて注釈テキストを設定（例：result_df_2023 → "2023年度のデータです"）
    # キーから年度情報を抽出
    if '5mean' in key:
        note = '注: データは5年平均です'
    else:
        # 例: 'result_df_2023' から '2023年度のデータです' を生成
        year = key.replace('result_df_', '')
        note = f'注: {year}年度のデータです'

    # グラフ下部に注釈を追加
    plt.figtext(0.8, 0.01, note, wrap=True, 
                horizontalalignment='center', fontsize=12, color='gray')

    # ファイル名をキーに基づいて決定し、PNG ファイルとして保存
    filename = f'./graph/PER/arari_PER_{key}.png'
    plt.savefig(filename, dpi=150, facecolor='white')
    plt.close()  # 次の図のために現在の図を閉じる

In [15]:
results['result_df_2023'].corr()

Unnamed: 0,売上総利益率,PER（会予）
売上総利益率,1.0,0.29621
PER（会予）,0.29621,1.0


In [16]:
results['result_df_5mean'].corr()

Unnamed: 0,売上総利益率,PER（会予）
売上総利益率,1.0,0.304426
PER（会予）,0.304426,1.0
