In [None]:
# 異なるcsvのデータをマージするコード
# source_dir_patternのデータをtarget_dir_patternのデータにマージする．
# TitileをKeyにしてScore_initとMember_initをマージする．
# 最後にデータフレームをdefualt_columnsの順番に並び替える．

In [None]:
import pandas as pd
import glob
import os

In [None]:
source_dir_pattern = '*.csv'
target_dir_pattern = '*.csv'

In [None]:
source_files = {os.path.basename(f): f for f in glob.glob(source_dir_pattern)}
print(f"ソースディレクトリから {len(source_files)} 個のファイルを見つけました。")

target_files = {os.path.basename(f): f for f in glob.glob(target_dir_pattern)}
print(f"ターゲットディレクトリから {len(target_files)} 個のファイルを見つけました。")

common_filenames = sorted(list(set(source_files.keys()) & set(target_files.keys())))

for filename in common_filenames:
    print(f"{filename} の処理中...")

    source_filepath = source_files[filename]
    target_filepath = target_files[filename]

    df_source = pd.read_csv(source_filepath)
    df_target = pd.read_csv(target_filepath)
    
    df_source_subset = df_source[['Title', 'Score_init', 'Member_init']]
    
    merged_df = pd.merge(
        df_target,
        df_source_subset,
        on='Title',
        how='left',
        suffixes=('_original', '_new')
    )
    
    merged_df['Score_init'] = merged_df['Score_init_new'].fillna(merged_df['Score_init_original'])
    merged_df['Member_init'] = merged_df['Member_init_new'].fillna(merged_df['Member_init_original'])
    
    df_target = merged_df.drop(columns=['Score_init_original', 'Member_init_original', 'Score_init_new', 'Member_init_new'], errors='ignore')
    
    default_columns = ['Year', 'Season', 'Category', 'Title', 'URL', 'Score_init', 'Member_init', 
                                       'Genre', 'Studio', 'Source', 'Demographic', 
                                       'Japanese_title', 'English_title', 'Synonyms','Adaptation', 'Adaptation_URL', 'Theme']
    
    df_target = df_target[default_columns]
    
    df_target.to_csv(target_filepath, index=False)

print("\n--- 処理が完了しました ---")