# Korean LLM Evaluation Results - Radar Chart Visualization

이 노트북은 한국어 LLM 평가 결과를 레이더 차트로 시각화합니다.

지원하는 데이터셋:
- CLIcK (Cultural and Linguistic Intelligence in Korean)
- KMMLU (Korean Massive Multi-task Language Understanding)
- HAERAE Bench
- HRM8K (HAE-RAE Math 8K)
- KoBALT (Korean Benchmark for Advanced Linguistic Tasks)
- KorMedMCQA (Korean Medical Multiple-Choice Question Answering)

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from math import pi
import glob
import os
import importlib
from utils import radar_chart_generator
importlib.reload(radar_chart_generator)
from utils.radar_chart_generator import RadarChartGenerator

# 설정
TOP_N = 10  # 상위 N개 모델만 표시 (None이면 모든 모델)

# 한글 폰트 설정
plt.rcParams['font.family'] = 'DejaVu Sans'
plt.rcParams['axes.unicode_minus'] = False

## 1. 레이더 차트 생성기 초기화

In [None]:
# 결과 파일이 있는 디렉토리 설정
generator = RadarChartGenerator(results_dir="./results")

# 사용 가능한 결과 파일 확인
result_files = glob.glob("./results/*.csv")
print("Available result files:")
for file in result_files:
    print(f"  - {os.path.basename(file)}")

## 2. CLIcK 데이터셋 레이더 차트

In [None]:
# CLIcK 결과 읽기
click_results = generator.read_dataset_results("CLIcK")
print(f"Found {len(click_results)} models for CLIcK dataset")

if click_results:
    # 데이터 처리
    processed_click = generator.process_click_results(click_results)
    
    # 레이더 차트 생성
    generator.create_radar_chart(
        processed_click, 
        "CLIcK Performance by Category",
        "./charts/CLIcK_radar_chart.png",
        top_n=TOP_N
    )
else:
    print("No CLIcK results found")

## 3. KMMLU 데이터셋 레이더 차트

In [None]:
# KMMLU 결과 읽기
kmmlu_results = generator.read_dataset_results("KMMLU")
print(f"Found {len(kmmlu_results)} models for KMMLU dataset")

if kmmlu_results:
    # 데이터 처리
    processed_kmmlu = generator.process_kmmlu_results(kmmlu_results)
    
    # 레이더 차트 생성
    generator.create_radar_chart(
        processed_kmmlu, 
        "KMMLU Performance by Supercategory",
        "./charts/KMMLU_radar_chart.png",
        top_n=TOP_N
    )
else:
    print("No KMMLU results found")

## 4. HAERAE 데이터셋 레이더 차트

In [None]:
# HAERAE 결과 읽기
haerae_results = generator.read_dataset_results("HAERAE")
print(f"Found {len(haerae_results)} models for HAERAE dataset")

if haerae_results:
    # 데이터 처리
    processed_haerae = generator.process_haerae_results(haerae_results)
    
    # 레이더 차트 생성
    generator.create_radar_chart(
        processed_haerae, 
        "HAERAE Performance by Category",
        "./charts/HAERAE_radar_chart.png",
        top_n=TOP_N
    )
else:
    print("No HAERAE results found")

## 5. 모든 데이터셋 레이더 차트 일괄 생성

In [None]:
# 모든 데이터셋에 대해 레이더 차트 생성
datasets = ['CLIcK', 'KMMLU', 'KMMLU-HARD', 'HAERAE', 'HRM8K', 'KoBALT', 'KorMedMCQA']
generator.generate_all_charts(datasets, top_n=TOP_N)