# MCQ (Multiple Choice Question) 평가 튜토리얼

## MCQDataset

이 튜토리얼에서는 MCQDataset Class에 대해서 배울 것입니다.

### MCQDataset의 주요 기능
- 여러가지 데이터 쉬운 데이터 조작 함수 제공
- 파일 입출력 함수 제공
- huggingface 통합

In [1]:
from typing import List
from langmetrics.llmtestcase import MCQTestCase
from langmetrics.llmdataset import MCQDataset

## MCQDatset 기본 사용법
### 3.1 데이터셋 생성
MCQDatset은 MCQTestCase 객체들의 리스트로 생성할 수 있습니다.

In [2]:
# 여러 테스트 케이스로 데이터셋 생성
test_cases = [
    MCQTestCase(
        input="대한민국의 수도는?",
        choices=["서울", "부산", "대구", "인천"],
        expected_output="서울"
    ),
    MCQTestCase(
        input="1 + 1 = ?",
        choices=["1", "2", "3", "4"],
        expected_output="2"
    )
]

dataset = MCQDataset(test_cases=test_cases)

### 3.2 기본 Datset 작업

Dataset Class는 대부분의 파이썬 리스트 기능들이 구현되어 있습니다. 또한 Dataframe의 몇몇 기능 또한 추가되어 편리하게 사용할 수 있습니다.

In [3]:
# 데이터셋 크기 확인
print(f"데이터셋 크기: {len(dataset)}")

# 특정 문제 접근
first_question = dataset[0]

# 데이터셋 순회
for question in dataset:
    print(f"문제: {question.input}")
    print(f"선택지: {question.choices}")

데이터셋 크기: 2
문제: 대한민국의 수도는?
선택지: ['서울', '부산', '대구', '인천']
문제: 1 + 1 = ?
선택지: ['1', '2', '3', '4']


### 3.2 데이터 추가

In [4]:
# 단일 문제 추가
new_question = MCQTestCase(
    input="Python은 인터프리터 언어인가요?",
    choices=["예", "아니오"],
    expected_output="예"
)
dataset.append(new_question)

In [5]:
print(len(dataset))

3


In [6]:
# 테스트케이스 여러개 추가
new_testcases: List[MCQTestCase] = [
    MCQTestCase(
        input="What is 2 + 2?",
        choices=["3", "4", "5", "6"],
        expected_output="B"
    ),
    MCQTestCase(
        input="Which planet is known as the Red Planet?",
        choices=["Venus", "Mars", "Jupiter", "Saturn"],
        expected_output="B"
    )
]
dataset.extend(new_testcases)

In [7]:
print(len(dataset))

5


In [8]:
# MCQDataset 테스트케이스 여러개 추가
new_testcases = MCQDataset(new_testcases)
dataset.extend(new_testcases)

In [9]:
print(len(dataset))

7


### 3.3 데이터 조작

데이터 조작을 위하여 다음 함수들을 제공합니다.

- `filter`: 조건에 맞는 테스트 케이스만 선택
- `map`: 각 테스트 케이스를 변환
- `split`: 훈련/테스트 세트로 분할
- `sample`: 무작위 샘플링

In [10]:
# 추론이 있는 문제만 필터링
filtered = dataset.filter(lambda x: x.reasoning is not None)

# print(filtered)

# 모든 문제에 추론 추가
def add_default_reasoning(case):
    if case.reasoning is None:
        case.reasoning = "기본 추론"
    return case

transformed = dataset.map(add_default_reasoning)

In [11]:
print(transformed)

[MCQTestCase(input='대한민국의 수도는?', choices=['서울', '부산', '대구', '인천'], expected_output='서울', output=None, reasoning='기본 추론'), MCQTestCase(input='1 + 1 = ?', choices=['1', '2', '3', '4'], expected_output='2', output=None, reasoning='기본 추론'), MCQTestCase(input='Python은 인터프리터 언어인가요?', choices=['예', '아니오'], expected_output='예', output=None, reasoning='기본 추론'), MCQTestCase(input='What is 2 + 2?', choices=['3', '4', '5', '6'], expected_output='B', output=None, reasoning='기본 추론'), MCQTestCase(input='Which planet is known as the Red Planet?', choices=['Venus', 'Mars', 'Jupiter', 'Saturn'], expected_output='B', output=None, reasoning='기본 추론'), MCQTestCase(input='What is 2 + 2?', choices=['3', '4', '5', '6'], expected_output='B', output=None, reasoning='기본 추론'), MCQTestCase(input='Which planet is known as the Red Planet?', choices=['Venus', 'Mars', 'Jupiter', 'Saturn'], expected_output='B', output=None, reasoning='기본 추론')]


데이터셋의 테스트 케이스들을 리스트 형태로 변환하고 싶다면 `to_list`와 `list`를 사용할 수 있습니다. 
`to_list`는 `dict_format` 인자를 사용하여 테스트 케이스를 dictionary 형태로 변환 시킬 수 있습니다.

### 3.4 데이터셋 분할 및 샘플링

데이터셋 분할과 sampling을 위하여 다음 함수들을 사용할 수 있습니다.

In [None]:
# 80% 훈련, 20% 테스트로 분할
train_set, test_set = dataset.split(test_size=0.2)

In [None]:
# 특정 개수만큼 샘플링
sampled = dataset.sample(n=5)

# 비율로 샘플링
sampled = dataset.sample(frac=0.3)

## 4. 파일 입출력
### 4.1 Json 형식

In [None]:
# JSON으로 저장
dataset.to_json("questions.json")

# JSON에서 로드
loaded_dataset = MCQDataset.from_json("questions.json")

### 4.2 csv 형식

In [19]:
# # CSV로 저장
# dataset.to_csv("questions.csv")

# # CSV에서 로드
# loaded_dataset = MCQDataset.from_csv("questions.csv")

### 5.3 DataFrame 변환

In [None]:
# DataFrame으로 변환
df = dataset.to_dataframe()

### 5.4 Huggingface 통합

In [None]:
# Hugging Face Hub에 업로드
dataset.push_to_hub(
    repo_id="username/mcq-dataset",
    private=True
)

# Hugging Face Hub에서 로드
dataset = MCQDataset.from_huggingface_hub("username/mcq-dataset")
