In [5]:
import os
import pandas as pd

# キーワードリストを読み込む
keywords_df = pd.read_csv('output/Value/Keywords1.csv', encoding='utf-8-sig')
keywords_list = keywords_df['KW'].tolist()

# データを格納するリストを作成
data = []

# CSVファイルが入っているフォルダを指定
folder_path = 'output/Value/Centrality'

# フォルダ内のCSVファイルを全て取得
csv_files = [f for f in os.listdir(folder_path) if f.endswith('.csv')]

# 各CSVファイルを処理
for file in csv_files:
    file_path = os.path.join(folder_path, file)
    df = pd.read_csv(file_path)
    
    # ファイル名から企業コード、銘柄名、リンク件数を抽出
    parts = file.split('_')
    if len(parts) >= 4:
        company_code = parts[0]
        stock_name = parts[1]
    
        # 各Nodeについて順位付けを実施
        for centrality in ['Degree Centrality', 'Betweenness Centrality', 'Closeness Centrality', 'Eigenvector Centrality']:
            df[f'Rank_{centrality}'] = df[centrality].rank(ascending=False, method='min')
        
        # キーワードリストに含まれるNodeのレコードを抽出
        filtered_df = df[df['Node'].isin(keywords_list)]
        
        # 必要な情報をリストに追加
        for _, row in filtered_df.iterrows():
            data.append({
                '企業コード': company_code,
                '銘柄名': stock_name,
                'Node': row['Node'],
                'Degree Centrality': row['Degree Centrality'],
                'Betweenness Centrality': row['Betweenness Centrality'],
                'Closeness Centrality': row['Closeness Centrality'],
                'Eigenvector Centrality': row['Eigenvector Centrality'],
                'Rank_Degree Centrality': row['Rank_Degree Centrality'],
                'Rank_Betweenness Centrality': row['Rank_Betweenness Centrality'],
                'Rank_Closeness Centrality': row['Rank_Closeness Centrality'],
                'Rank_Eigenvector Centrality': row['Rank_Eigenvector Centrality'],
                'Community': row['Community']
            })

# リストからデータフレームを作成
output_df = pd.DataFrame(data, columns=[
    '企業コード', '銘柄名', 'Node', 'Degree Centrality', 'Betweenness Centrality', 
    'Closeness Centrality', 'Eigenvector Centrality',
    'Rank_Degree Centrality', 'Rank_Betweenness Centrality', 
    'Rank_Closeness Centrality', 'Rank_Eigenvector Centrality', 'Community'
])

# 結果をCSVファイルに保存
output_df.to_csv('output/Value/aggregated_centralities_value.csv', index=False, encoding='utf-8-sig')
