In [6]:
import pandas as pd
import os

# 모델과 데이터 리스트
models = ["train_gap/Gemma_gap", "train_gap/LLaMA_gap", "train_gap/GPT_gap"]

data_paths = ["gap-test_one_300.csv",
              "gap-test_one_90.csv",
              "gap-test_one_distance.csv",
              "gap-test_one_number.csv",
                "gap-test_npe_300.csv", 
                "gap-test_npe_90.csv",
                "gap-test_npe_distance.csv", 
               "gap-test.csv", 
               "wsc.csv"]


# 현재 작업 디렉토리 가져오기
base_path = os.path.join(os.getcwd(), "output")

# 결과 저장용 리스트 (선택적)
results = []

# 모든 모델과 데이터 조합 순회
for model in models:
    for data_path in data_paths:
        file_path = os.path.join(base_path, model, data_path)
        
        # 파일이 존재하는지 확인
        if not os.path.exists(file_path):
            print(f"File not found: {file_path}")
            continue  # 다음으로 넘어감
        
        # CSV 파일 읽기
        df = pd.read_csv(file_path)
        
        # 'correct' 컬럼이 문자열로 되어 있으면 boolean으로 변환 (필요시)
        if df['correct'].dtype == object:
            df['correct'] = df['correct'].map({'True': True, 'False': False})
        
        # 'correct' 컬럼이 True인 행의 수 계산
        num_correct = df['correct'].sum()
        
        # 전체 데이터 수
        total = len(df)
        
        # Accuracy 계산
        accuracy = round((num_correct / total) * 100, 2) if total > 0 else 0
        accuracy = str(accuracy)+"%"
        
        # 결과 저장 (선택)
        results.append({
            'Model': model,
            'Dataset': data_path,
            'Total': total,
            'Correct': num_correct,
            'Accuracy': accuracy
        })
    results.append({'Model': '', 'Dataset': '', 'Total': '', 'Correct': '', 'Accuracy': ''})

# 선택적으로 DataFrame으로 결과를 보고 싶다면 아래 코드 사용
result_df = pd.DataFrame(results)
print("\nSummary of all results:")
print(result_df)

# CSV로 저장 (선택적)
result_df.to_csv('./output/accuracy_results.csv', index=False)


File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/Gemma_gap/gap-test_one_90.csv
File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/Gemma_gap/gap-test_npe_90.csv
File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/LLaMA_gap/gap-test_one_90.csv
File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/LLaMA_gap/gap-test_npe_90.csv
File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/GPT_gap/gap-test_one_90.csv
File not found: /jsm0707/LLM_Anaphoric-One-and-NPE/output/train_gap/GPT_gap/gap-test_npe_90.csv

Summary of all results:
                  Model                    Dataset Total Correct Accuracy
0   train_gap/Gemma_gap       gap-test_one_300.csv  2300    1933   84.04%
1   train_gap/Gemma_gap  gap-test_one_distance.csv  2154    1810   84.03%
2   train_gap/Gemma_gap    gap-test_one_number.csv  2143    1788   83.43%
3   train_gap/Gemma_gap       gap-test_npe_300.csv  2300    1934   84.09%
4   train_gap/Gemma_g