In [None]:
import os
import matplotlib.pyplot as plt
import matplotlib.font_manager as fm
import pandas as pd
from PIL import Image

font_path = "./font/NanumGothic.otf"
font_prop = fm.FontProperties(fname=font_path)
plt.rcParams['font.family'] = font_prop.get_name()
plt.rcParams['axes.unicode_minus'] = False

# 17개 클래스별 대표 이미지 시각화
def visualize_train_classes(train_csv_path, train_img_dir, num_samples=2):
    # CSV 파일 읽기
    train_df = pd.read_csv(train_csv_path)
    
    # 클래스 이름 정의
    class_names = {
        0: "계좌번호(손글씨)", 1: "임신출산 진료비 지급 신청서", 2: "자동차 계기판", 3: "입퇴원 확인서", 4: "진단서", 
        5: "운전면허증", 6: "진료비영수증", 7: "통원/진료 확인서", 8: "주민등록증", 9: "여권", 
        10: "진료비 납입 확인서", 11: "약제비 영수증", 12: "처방전", 13: "이력서", 14: "소견서", 
        15: "자동차 등록증", 16: "자동차 번호판"
    }
    
    # 클래스별로 이미지 선택
    class_images = {}
    for class_id in range(17):
        class_df = train_df[train_df['target'] == class_id]
        selected_images = class_df['ID'].sample(num_samples).tolist()
        class_images[class_id] = selected_images
    
    # 이미지 시각화
    fig, axes = plt.subplots(4, 5, figsize=(20, 16))
    axes = axes.ravel()
    
    for idx, (class_id, image_list) in enumerate(class_images.items()):
        if idx < 17:  # 17개 클래스만 표시
            img_path = os.path.join(train_img_dir, image_list[0])
            img = Image.open(img_path)
            axes[idx].imshow(img)
            class_name = class_names[class_id]
            axes[idx].set_title(f"Class {class_id}: {class_name}", fontsize=10, fontproperties=font_prop)
            axes[idx].axis('off')
    
    plt.tight_layout()
    plt.axis('off')
    plt.show()

train_csv_path = 'data/train.csv'
train_img_dir = 'data/train/'

visualize_train_classes(train_csv_path, train_img_dir)