## 📊 分析の流れ
<details>
<summary><b>目次</b></summary>

1. **データ読み込み**
1. **欠損値処理**
    - 欠損列処理  
    - 欠損値処理  
    - 異常値処理  
1. **集計**
1. **データ出力**
</details>

In [1]:
import yaml
import os
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
import src.config as cfg
import src.data_loader as dl

## 📥 設定値の読み込み
yamlファイルから設定を読み込みます。また、プレースホルダやゼロをチェックします。


In [3]:
# 設定読み込み
settings = cfg.load_settings("setting.yaml")
#display(settings)

## 🔍 欠損列処理
4つファイルの列が各年度で同じかを目視で確認しておきます。
問題がある場合は処理します。
<details><summary><b>結果</b></summary>
すべてのファイルで同じ列が登録されています。問題ありません。

- fy-balance-sheet.csv
- fy-cash-flow-statement.csv
- fy-profit-and-loss.csv
- fy-stock-dividend.csv
</details>


In [4]:
dl.load_yearly_header(settings["data_path"], settings["years"], settings["files"])

年： 2010   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2011   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2012   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2013   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2014   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2015   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2016   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2017   ファイル名: fy-balance-sheet.csv   列 ['コード', '年度', '総資産', '純資産', '株主資本', '利益剰余金', '短期借入金', '長期借入金', 'BPS', '自己資本比率']
年： 2018   ファイル名: fy-bala

## 📥 欠損値表現のチェック
プレースホルダやゼロをチェックし、NaNのデータを特定します。  
NaNのデータは、setting.yamlの`na_values`で指定します。

```python


In [None]:
# nan_valuesに""だけ指定し、他のプレースホルダをチェックする"
df = dl.load_yearly_data(settings["data_path"], settings["years"], settings["files"], na_values=[""])
#display(all_df)
counts = []
for filename in df:
    for col in df[filename]:
        #print(col)
        ser = df[filename][col].fillna('')
        counts.append(
            (filename, col,
            (ser == '-').sum(),
            (ser == '0').sum(),
            (ser == '—').sum(),
            ser.str.contains('[A-Za-z]', na=False).sum())
            )
placeholder_counts = pd.DataFrame(counts, columns=["filename","col","ハイフン半角","ゼロ","ハイフン全角","alphabet"])
#display(placeholder_counts)


## 📥 データ読み込み

In [None]:
all_df = dl.load_yearly_data(settings["data_path"], settings["years"], settings["files"], settings["na_values"])
#display(all_df[files[0]].head(1000))

## 🧹 欠損値処理
ここでは、後の分析・スクリーニングの処理を適切に設計するため、欠損値の傾向を確認します。  
⚠️ **注意※** csvファイルには欠損値に"-"が入っているため、NaNに置き換えて読み込みます。
<details><summary><b>分析内容</b></summary>

- 列ごとの欠損値の数・割合を確認する
- 年ごとの欠損率の傾向を確認
- 全企業の平均欠損率の分布から特徴を詳細分析
<br>
</details>
<details><summary><b>結果と考察</b></summary>

- fy-balance-sheet.csv
- fy-cash-flow-statement.csv
- fy-profit-and-loss.csv
- fy-stock-dividend.csv
</details>


### ４つのファイル結合

In [None]:
all_df = {}
missing_year_df = {}
for filename in files:
    if filename not in missing_year_df:
        all_df[filename] = pd.DataFrame()
        missing_year_df[filename] = pd.DataFrame()
    for year in years:
        file_path = os.path.join(base_path, str(year), filename)
        if os.path.exists(file_path):
            df = pd.read_csv(file_path,header=1,na_values=["-","0"])
            all_df[filename] = pd.concat([all_df[filename], df], ignore_index=True) # 全データ結合
            # 各年の欠損率を計算
            missing_rate = df.isnull().mean().to_frame(name="missing_rate")
            missing_rate["year"] = year
            missing_rate = missing_rate.reset_index().rename(columns={"index": "column_name"})
            missing_year_df[filename] = pd.concat([missing_year_df[filename], missing_rate], ignore_index=True)
#最新年に登録されている企業コードのみ抽出
latest_year = max(years)
file_path = os.path.join(base_path, str(latest_year), files[0])
df = pd.read_csv(file_path,header=1,na_values=["-","0"])
codes = df["コード"].to_list()
# 企業コードでフィルタリング
for filename in all_df:
    all_df[filename] = all_df[filename].loc[all_df[filename]["コード"].isin(codes)] # 企業コードのデータ抽出
#display(all_df)

### 列ごとの欠損値の割合を確認する

In [None]:

missing_column_df = {}
for filename in files:
    if filename not in missing_column_df:
        missing_column_df[filename] = pd.DataFrame()
    missing_column_df[filename] = all_df[filename].isna().mean()
    fig = px.bar(missing_column_df[filename], x=missing_column_df[filename].index,
                    y=missing_column_df[filename].values)
    fig.show()

### 年ごとの欠損率の傾向を確認（折れ線グラフ）

In [None]:
# 各カラムの欠損率推移を折れ線グラフで表示
for filename in files:
    fig = px.line(
        missing_year_df[filename],  # 最初のファイルのデータを使用
        x="year",
        y="missing_rate",
        color="column_name",   # 列ごとに色分け
        markers=True,
        title="各列の欠損率の推移"
    )
    fig.show()

### 年ごとの欠損率の傾向を確認（折れ線グラフ）

In [None]:
# 年ごとの欠損率の傾向を確認（ヒートマップ）

for filename in missing_year_df:
    pivot_table = missing_year_df[filename].pivot(index="column_name", columns="year", values="missing_rate")
    fig = go.Figure(data=go.Heatmap(
        z=pivot_table.values,
        x=pivot_table.columns,
        y=pivot_table.index,
        colorscale="Viridis",
        colorbar=dict(title="Missing Rate")
    ))
    fig.update_layout(
        title=f"{filename} の欠損率ヒートマップ",
        xaxis_title="Year",
        yaxis_title="Column Name"
    )
    fig.show()

### 欠損率の詳細分析

In [None]:
# コードごとに平均欠損率を計算する
missing_score = {}
for filename in files:
    # コードごとに欠損率を計算
    missing_score[filename] = pd.DataFrame()
    missing_score[filename] = (
        all_df[filename]
        .groupby("コード")
        .agg(lambda x: x.isnull().mean())  # 各列ごとの欠損率
        .mean(axis=1)                      # 列平均
        .reset_index(name="平均欠損率")
    )
    #pd.set_option('display.max_rows', None)
    #display(missing_score[filename].info())

In [None]:
# 分析 fy-balance-sheet.csv
target_file = files[0]

fig = px.histogram(
    missing_score[target_file],  # 最初のファイルのデータを使用
    x="平均欠損率",
    nbins=50,
    title="全企業の欠損率分布"+files[0],
    labels={"平均欠損率": "平均欠損率"}
)
#fig.show()
# 特定範囲の欠損率を持つコードを抽出
threshold_low = 0.215
threshold_high= 0.225
filtered_codes = missing_score[target_file][
    (missing_score[target_file]["平均欠損率"] >= threshold_low) &
    (missing_score[target_file]["平均欠損率"] < threshold_high)
]
#display(filtered_codes)
# 列別欠損率
df_by_code = all_df[target_file].set_index("コード") # 企業コードを index にする
codes = filtered_codes["コード"].tolist() # 企業コードをリスト化
subset = df_by_code.loc[df_by_code.index.isin(codes)] # 企業コードのデータ抽出
#print(df_by_code)
col_missing = subset.isnull().mean().sort_values(ascending=False) # 列別欠損率
#display(col_missing)

#年次別の欠損率推移確認
df = all_df[target_file]
year_all = (
    df.groupby('年度')[['短期借入金', '長期借入金']].apply(lambda d: d.isnull().mean())
    .apply(lambda d: d)
    .reset_index()
)
# 欠損率の推移を可視化
fig = px.line(
    year_all,
    x="年度",
    y=["短期借入金", "長期借入金"],  # 複数列を同時に表示
    markers=True,
    title="各列の欠損率の推移"
)
#fig.show()
# 各企業の年次ごとの欠損率を計算し、"常時欠損" と "変化あり" を分類
status = {}
code_groups = subset.groupby("コード")
for code, g in code_groups:
    rate_by_year = g[['短期借入金','長期借入金']].isnull().mean(axis=1)  # 年行ごとの欠損率
    if rate_by_year.nunique() == 1 and rate_by_year.iloc[0] == 1.0:
        status[code] = 'always_missing'
    else:
        status[code] = 'variable'
pd.Series(status).value_counts()
# variable の一部を表示して具体的な年次パターンを確認
#for code, st in list(status.items())[:100]:
    #if st == 'variable':
        #print(code)
        #display(code_groups.get_group(code)[['年度','短期借入金','長期借入金']].head(20))
# 業種に偏りがあるか確認
codes = filtered_codes["コード"].tolist()
p = os.path.join(base_path, files_reference[0])
df = pd.read_csv(p,header=0,na_values=[])
# 全体データ
df_all = df.copy()
df_all["区分"] = "全体"
# subsetデータ
df_sub = df[df["コード"].isin(codes)].copy()
df_sub["区分"] = "抽出subset"
# 結合
df_combined = pd.concat([df_all, df_sub])
# Plotly Expressで可視化
fig = px.histogram(
    df_combined,
    x="33業種区分",
    color="区分",
    barmode="group",
    histnorm="percent",  # ← 割合表示
    title="33業種区分別の構成比比較（全体 vs 抽出subset）"
)
#fig.show()


In [None]:
# 時価総額に偏りがあるか確認
# 時価総額の推定モデル：推定時価総額 = (PER * EPS) * (自己資本 / BPS) * (ROE / 10 + 営業CFマージン)
# 4つのファイルを結合
df_combined = pd.DataFrame()
for filename in files:
    df=all_df[filename]
    df_combined = pd.concat([df_combined, df], axis=0)
#display(df_combined)
df = df_combined[["コード","年度","純利益","EPS","株主資本","BPS","ROE","営業CFマージン"]].copy()
def combine_nonnull(series):
    #そのグループ内で最初に非NaNの値を返す
    return series.dropna().iloc[0] if series.notna().any() else np.nan

# 「コード」「年度」でグループ化して統合
df_merged = (
    df.groupby(["コード", "年度"], as_index=False)
      .agg(combine_nonnull)
      .sort_values(["コード", "年度"])
      .reset_index(drop=True)
)
#display(df_merged.head(1000))

In [None]:
df_merged["推定時価総額"] = (
    (df_merged["純利益"] * df_merged["EPS"]) *
    (df_merged["株主資本"] / df_merged["BPS"]) *
    (df_merged["ROE"] / 10 + df_merged["営業CFマージン"])
)
#display(df_merged.head(1000))
df_all = df_merged.copy()
df_all["区分"] = "全体"
# subsetデータ
codes = filtered_codes["コード"].tolist()
df_sub = df_merged[df_merged["コード"].isin(codes)].copy()
df_sub["区分"] = "抽出subset"
# 結合
df_combined = pd.concat([df_all, df_sub])
# Plotly Expressで可視化
fig = px.histogram(
    df_combined,
    x="推定時価総額",
    color="区分",
    barmode="group",
    title="推定時価総額別の構成比比較（全体 vs 抽出subset）"
)
fig.show()

# OLD --- IGNORE ---

In [None]:
# IR bankのデータから必要なデータを吸い上げる
import pandas as pd
import myLibStandard as myLib
myLib.set_DisplayOption()

# BSから必要なデータを取得
dfBalanceSheet = pd.DataFrame()
dl = ["fy-balance-sheet", "fy-cash-flow-statement", "fy-profit-and-loss", "fy-stock-dividend"]
for folder in range(2010, 2026):
    df = pd.read_csv(myLib.pathDataDomesticData + str(folder) + "/fy-balance-sheet.csv",\
    header=1, index_col=["コード", "年度"], dtype={"コード":"str"})
    dfBalanceSheet = pd.concat([dfBalanceSheet, df], axis=0, join="outer")
dfBalanceSheet = dfBalanceSheet.sort_index()
dfBalanceSheet = dfBalanceSheet.loc[~dfBalanceSheet.index.duplicated("last")]

# PLから必要なデータを取得
dfProftLoss = pd.DataFrame()
for folder in range(2010, 2026):
    df = pd.read_csv(myLib.pathDataDomesticData + str(folder) + "/" + "fy-profit-and-loss.csv",\
    header=1, index_col=["コード", "年度"], dtype={"コード":"str"})
    dfProftLoss = pd.concat([dfProftLoss, df], axis=0, join="outer")
dfProftLoss = dfProftLoss.sort_index()
dfProftLoss = dfProftLoss.loc[~dfProftLoss.index.duplicated("last")]

# SDから必要なデータを取得
dfStockDividend = pd.DataFrame()
for folder in range(2010, 2026):
    df = pd.read_csv(myLib.pathDataDomesticData + str(folder) + "/" + "fy-stock-dividend.csv",\
    header=1, index_col=["コード", "年度"], dtype={"コード":"str"})
    dfStockDividend = pd.concat([dfStockDividend, df], axis=0, join="outer")
dfStockDividend = dfStockDividend.loc[~dfStockDividend.index.duplicated("last")]
dfStockDividend = dfStockDividend.sort_index(level=["コード"])
#display(dfStockDividend)

dfAll = pd.concat([dfBalanceSheet, dfProftLoss], axis=1, join="outer")
dfAll = pd.concat([dfAll, dfStockDividend], axis=1, join="outer")
dfAll = dfAll.sort_index()
#display(dfAll.head(1000))
dfAll.to_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv")


In [None]:
# データがないセルを"-"からnullに変換する
import pandas as pd
import math
import myLibStandard as myLib
myLib.set_DisplayOption()

dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv",index_col=["コード", "年度"], dtype="str")
dfAll = dfAll.sort_index()
for column in dfAll:
    dfAll[column] = dfAll[column].replace("-", math.nan)
    dfAll[column] = dfAll[column].replace(0, math.nan)

dfAll.to_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv")


In [None]:
# データが0の場合はNANにする（ゼロ割り算エラーを避けるため）
import pandas as pd
import math
import myLibStandard as myLib
myLib.set_DisplayOption()
dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv", dtype={"コード":"str"})

for i in dfAll.index:
    if dfAll.loc[i, "EPS"] == 0:
        dfAll.loc[i, "EPS"] = math.nan
    if dfAll.loc[i, "BPS"] == 0:
        dfAll.loc[i, "BPS"] = math.nan
dfAll = dfAll.set_index(["コード", "年度"])
#display(dfAll.head(1000))
dfAll.to_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv")

##### 銘柄名や業種を取得

In [None]:
# シンボルリスト取得、保存
from stocksymbol import StockSymbol
api_key = '63ed951b-b643-48b1-bfe7-90c7a4f96349'
ss = StockSymbol(api_key)
symbol_list_japan = ss.get_symbol_list(market="Japan") # "us" or "america" will also work
df = symbol_list_japan
df = pd.DataFrame(df)
df.to_csv(myLib.pathDataSummaryDomesticData + "symbol.csv")

In [None]:
# Code一覧から銘柄の情報を取得し、登録する。ないものはデータから削除する
import pandas as pd
import myLibStandard as myLib
import warnings
#warnings.simplefilter('ignore')
myLib.set_DisplayOption()

dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "IR_Bank_Data.csv",index_col=["コード", "年度"], dtype={"コード":str})
dfCode = pd.read_csv(myLib.pathDataSummaryDomesticData + "CodeData.csv",usecols=["コード", "銘柄名", "市場・商品区分", "33業種区分"],\
index_col=["コード"], dtype=str)
dfAll["銘柄"] = None
dfAll["市場"] = None
dfAll["業種"] = None
dfAll = dfAll.sort_index()
dlCode = dfAll.groupby(level='コード').size().index.tolist()
dlDelCode = []
for code in dlCode:
    try:
        dfAll.loc[(code,), "銘柄"] = dfCode.loc[code, "銘柄名"]
        dfAll.loc[(code,), "市場"] = dfCode.loc[code, "市場・商品区分"]
        dfAll.loc[(code,), "業種"] = dfCode.loc[code, "33業種区分"]
    except KeyError:
        dlDelCode.append(code)

dfAll = dfAll.reset_index("年度")
for dl in dlDelCode:
    dfAll = dfAll.drop(dl,axis=0)
dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DataPreprocessing.csv")

##### 銘柄のテーマ情報を取得し登録する

In [None]:
# テーマ情報をCSVからとってきてテーマフラグを立てる
import pandas as pd
import myLibStandard as myLib
import warnings
myLib.set_DisplayOption()

dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "DataPreprocessing.csv",index_col="コード", dtype={"コード":str})

def get_ThemeList(filname):
    df = pd.read_csv(myLib.pathDataDomesticData + filname, index_col="コード", dtype={"コード":str})
    return df

dlname = ["DOE採用銘柄", "円高メリット", "減配なし", "親子上場", "累進配当"]
for name in dlname:
    dfTheme = get_ThemeList(name + ".csv")
    for code in dfTheme.index:
        if code in dfAll.index:
            dfAll.loc[code, name] = 1

dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DataPreprocessing.csv")


## 分析値の計算、追加

##### データの登録（PER, PBR, MIX係数, 簡易理論株価, 安全域, 時価総額, 配当利回り, 資産価値を含めたPERを登録する）

In [None]:
# PER, PBR, 簡易理論株価, 安全域, 配当利回り, MIX係数, 時価総額, を登録する (※長時間)
import pandas as pd
import math
import datetime
import calendar
from yahooquery import Ticker
import myLibStandard as myLib
import warnings
warnings.simplefilter('ignore', FutureWarning)
myLib.set_DisplayOption()

#dfSymbol = pd.read_csv(myLib.pathDataSummaryDomesticData + "symbol.csv", dtype={"symbol":str})
dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "DataPreprocessing.csv",index_col=["コード", "年度"], dtype={"コード":"str"})
#dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv",index_col=["コード", "年度"], dtype={"コード":str})

dfAll["PER"] = math.nan
dfAll["PBR"] = math.nan
dfAll["簡易理論株価"] = math.nan
dfAll["安全域"] = math.nan
dfAll["配当利回り"] = math.nan
dfAll["MIX係数"] = math.nan
dfAll["時価総額"] = math.nan
dfAll["株価"] = math.nan
dfAll["営業利益率"] = math.nan
dfAll["経常利益率"] = math.nan
dfAll["純利益率"] = math.nan
dfAll["配当将来期待"] = round(dfAll["ROE"] - dfAll["純資産配当率"] ,1)

def get_StockValue(symbol):
    yqData = Ticker(symbol+".T")
    stockValue = yqData.history(start="2010-03-01")
    stockValue = stockValue.reset_index(level=["date",'symbol'])
    stockValue["date"] = stockValue["date"].apply(lambda x: pd.to_datetime(x).tz_localize(None))
    stockValue["date"] = pd.to_datetime(stockValue["date"])
    stockValue = stockValue.set_index("date")
    stockValue = stockValue["close"].resample("D").ffill()
    return stockValue
    #return pd.Series()

dfAll = dfAll.sort_index()
dlCode = dfAll.groupby(level='コード').size().index.tolist()
i=0
for code in dlCode:
    if (i>=0) and (i<5000):
        print(code)
        dsStock = get_StockValue(str(code))
        for date in dfAll.loc[(code,)].index:
            dtDate = datetime.datetime.strptime(date, '%Y/%m')
            dtDate = datetime.date(dtDate.year, dtDate.month, calendar.monthrange(dtDate.year, dtDate.month)[1])
            try:
                stockValue = dsStock.loc[dtDate.strftime("%Y-%m-%d")]
            except KeyError:
                stockValue = math.nan
            eps = float(dfAll.loc[(code, date), "EPS"])
            bps = float(dfAll.loc[(code, date), "BPS"])
            if eps < 0:
                dfAll.loc[(code, date), "PER"] = math.nan
            else:
                dfAll.loc[(code, date), "PER"] = round(stockValue / eps, 2)
            dfAll.loc[(code, date), "簡易理論株価"] = round(bps + eps * 10,2)
            dfAll.loc[(code, date), "PBR"] = round(stockValue / bps, 2)
            dfAll.loc[(code, date), "配当利回り"] = round(float(dfAll.loc[(code, date), "一株配当"] / stockValue *100),2)
            dfAll.loc[(code, date), "安全域"] = round(dfAll.loc[(code, date), "簡易理論株価"] / stockValue, 2)
            dfAll.loc[(code, date), "MIX係数"] = dfAll.loc[(code, date), "PER"] * dfAll.loc[(code, date), "PBR"]
            dfAll.loc[(code, date), "時価総額"] = dfAll.loc[(code, date), "PER"] * dfAll.loc[(code, date), "純利益"]
            dfAll.loc[(code, date), "株価"] = stockValue
            dfAll.loc[(code, date), "営業利益率"] = round(dfAll.loc[(code, date), "営業利益"] / dfAll.loc[(code, date), "売上高"] * 100 ,2)
            dfAll.loc[(code, date), "経常利益率"] = round(dfAll.loc[(code, date), "経常利益"] / dfAll.loc[(code, date), "売上高"] * 100 ,2)
            dfAll.loc[(code, date), "純利益率"] = round(dfAll.loc[(code, date), "純利益"] / dfAll.loc[(code, date), "売上高"] * 100 ,2)
    i+=1
    if i%10==0:
        print(code,i)
        dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv")
dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv")

In [None]:
# 資産価値を含めたPERを登録する (※長時間)
import pandas as pd
import math
import datetime
import calendar
from yahooquery import Ticker
import yfinance as yf
import myLibStandard as myLib
import warnings
#warnings.simplefilter('ignore', FutureWarning)
myLib.set_DisplayOption()

#dfSymbol = pd.read_csv(myLib.pathDataSummaryDomesticData + "symbol.csv", dtype={"symbol":"str"})
dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv",index_col=["コード", "年度"], dtype={"コード":"str"})
dfAll["資産価値を含めたPER"] = math.nan

dfAll = dfAll.sort_index()
dlCode = dfAll.groupby(level='コード').size().index.tolist()
#display(dlCode)
i=0
for code in dlCode:
    if (i>=0) & (i<=5000):
        print(code)
        try:
            balance_sheet = Ticker(code+".T").balance_sheet().reset_index().set_index("asOfDate")
        except AttributeError:
            balance_sheet = Ticker(code+".T").balance_sheet()
        #display(balance_sheet)
        if type(balance_sheet) != str:
            for date in balance_sheet.index:
                dtDate = datetime.date(date.year,date.month,1)
                strDate = datetime.date.strftime(dtDate, "%Y/%m")
                try:
                    CurrentAssets = balance_sheet.loc[date, "CurrentAssets"]
                except KeyError:
                    CurrentAssets = math.nan
                try:
                    NetDebt = balance_sheet.loc[date, "NetDebt"]
                except KeyError:
                    NetDebt = balance_sheet.loc[date, "TotalAssets"] - balance_sheet.loc[date, "StockholdersEquity"]
                try:
                    AvailableForSaleSecurities = balance_sheet.loc[date, "AvailableForSaleSecurities"]
                except KeyError:
                    AvailableForSaleSecurities = math.nan
                netCash = CurrentAssets + NetDebt * 0.7 -AvailableForSaleSecurities
                #print(netCash)
                #print(date)
                #display(dfAll.loc[(code, )].index)
                try:
                    dfAll.loc[(code, strDate), "資産価値を含めたPER"] = round(\
                    (dfAll.loc[(code, strDate), "時価総額"] - netCash) / dfAll.loc[(code, strDate), "純利益"], 2)
                except KeyError:
                    dfAll.loc[(code, strDate),:] = math.nan
                    dfAll.loc[(code, strDate), "資産価値を含めたPER"] = round(\
                    (dfAll.loc[(code, strDate), "時価総額"] - netCash) / dfAll.loc[(code, strDate), "純利益"], 2)
                #print(code, strDate, dfAll.loc[(code, strDate), "資産価値を含めたPER"])
    i+=1
    if i%10==0:
        print(i)
        dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv")
        #break
dfAll.to_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv")

## 最新日付のファイルの準備

In [None]:
# 最新日付のみのデータフレームを作成する（※中時間）
import pandas as pd
import myLibStandard as myLib
myLib.set_DisplayOption()

dfAll = pd.read_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTable.csv",parse_dates=[1],index_col=["コード", "年度"], dtype={"コード":str})
dfAll = dfAll.sort_index()
dlCode = dfAll.groupby(level='コード').size().index.tolist()
dfMaxDate = pd.DataFrame()
for code in dlCode:
    maxDate = dfAll.loc[(code,)].index.max()
    #display(dfAll.loc[(code,maxDate)])
    #print(code)
    if maxDate.year >= 2024:
        ds = dfAll.loc[(code,maxDate)].to_frame().T
        dfMaxDate = pd.concat([dfMaxDate,ds],axis=0)
dfMaxDate.index.names = ["コード", "年度"]
dfMaxDate.to_csv(myLib.pathDataSummaryDomesticData + "DomesticDataTableMaxDate.csv")