2 つの CSV ファイルを読み込み、各ルールにおける precision（適合率）と recall（再現率）を計算


In [1]:
import pandas as pd

In [2]:
# CSVファイルの読み込み
gemini_df = pd.read_csv('../data/test/sampling_check_by_gemini.csv')
human_df = pd.read_csv('../data/test/sampling_check_by_gemini.csv')

In [13]:
# 評価結果を格納する辞書
metrics = {}

# 対象となるルールを抽出（rule1 ~ rule33）
rules = [f'rule{i}' for i in range(1, 34)]

# 各ルールについて計算
for rule in rules:
    # True Positives (TP): Geminiと人間判定が両方 "yes"
    tp = ((gemini_df[rule] == 'yes') & (human_df[rule] == 'yes')).sum()
    
    # False Positives (FP): Geminiが "yes" だが、人間判定が "no"
    fp = ((gemini_df[rule] == 'yes') & (human_df[rule] == 'no')).sum()
    
    # False Negatives (FN): Geminiが "no" だが、人間判定が "yes"
    fn = ((gemini_df[rule] == 'no') & (human_df[rule] == 'yes')).sum()
    
    # Precision（適合率）
    precision = tp / (tp + fp) if (tp + fp) > 0 else 0
    
    # Recall（再現率）
    recall = tp / (tp + fn) if (tp + fn) > 0 else 0
    
    # 辞書に結果を保存
    metrics[rule] = {'Precision': precision, 'Recall': recall}

# 結果をDataFrameに変換して表示
metrics_df = pd.DataFrame(metrics).T
metrics_df.index.name = 'Rule'
metrics_df.reset_index(inplace=True)

# 表示
metrics_df


Unnamed: 0,Rule,Precision,Recall
0,rule1,1.0,1.0
1,rule2,0.0,0.0
2,rule3,0.0,0.0
3,rule4,1.0,1.0
4,rule5,1.0,1.0
5,rule6,1.0,1.0
6,rule7,1.0,1.0
7,rule8,1.0,1.0
8,rule9,1.0,1.0
9,rule10,1.0,1.0
