In [3]:
# ============================================
# PLAT Dataset Exploration
# ============================================
# This notebook demonstrates how to load and explore
# the PLAT (Perspectives on Law And Taxation) dataset

from datasets import load_dataset
from pprint import pprint

# Available datasets:
# - sma1-rmarud/plat-eng-essay  (English Essay)
# - sma1-rmarud/plat-eng-mc     (English MC Binary)
# - sma1-rmarud/plat-eng-mc4    (English MC 4-choice)
# - sma1-rmarud/plat-kor-essay  (Korean Essay)
# - sma1-rmarud/plat-kor-mc     (Korean MC Binary)
# - sma1-rmarud/plat-kor-mc4    (Korean MC 4-choice)

## 1. MC (Binary) - Lawful/Unlawful Classification
Binary classification task: Determine if the tax assessment is lawful or unlawful.

In [4]:
# Load Korean MC dataset
ds_mc_kor = load_dataset("sma1-rmarud/plat-kor-mc")
print("Korean MC Dataset:")
print(ds_mc_kor)
print(f"\nColumns: {ds_mc_kor['test'].column_names}")

# Show first example
example = ds_mc_kor['test'][0]
print(f"\n{'='*50}")
print(f"Case No: {example['case_no']}")
print(f"\n[Case Info]\n{example['case_info'][:300]}...")
print(f"\n[Facts]\n{example['facts'][:300]}...")
print(f"\n[Lawfulness]: {example['lawfulness']}")

Generating test split: 100%|██████████| 100/100 [00:00<00:00, 12566.83 examples/s]

Korean MC Dataset:
DatasetDict({
    test: Dataset({
        features: ['case_no', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'lawfulness'],
        num_rows: 100
    })
})

Columns: ['case_no', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'lawfulness']

Case No: 2011구합2638

[Case Info]
 - 원고: 주식회사 A - 피고: 부산광역시 영도구청장 원고 주식회사 A는 선박 건조 및 판매를 목적으로 하는 회사로서, 2008년도 법인세 납부와 관련하여 법인세할 주민세의 신고·납부기한 연장을 신청하지 않아 가산세를 부과받았습니다. 이에 대한 가산세 면제 신청을 하였으나 피고는 이를 거부하였습니다. 원고는 이 거부처분의 취소를 구하는 소를 제기하였습니다....

[Facts]
 1. 원고는 선박 건조 및 판매를 목적으로 설립된 회사입니다. 2. 2009년 3월 25일, 원고는 중부산세무서장에게 2008년 귀속 법인세 1,453,815,466,13원 중 1,200억 원에 대한 납부기한 연장신청을 하였고, 승인받았습니다. 3. 원고는 연장신청을 하지 않은 나머지 법인세 253,815,466,13원을 2009년 3월 31일에 납부하였고, 이에 대한 법인세할 주민세를 2009년 4월 30일에 피고에게 납부하였습니다. 4. 원고는 2009년 6월 25일에 납부기한 연장된 법인세에 대한 추가 연장신청을 하였고, 납...

[Lawfulness]: False





## 2. MC4 (4-Choice) - Multiple Choice Questions
4-choice multiple choice task with one correct answer.

In [7]:
# Load Korean MC4 dataset
ds_mc4_kor = load_dataset("sma1-rmarud/plat-kor-mc4")
print("Korean MC4 Dataset:")
print(ds_mc4_kor)
print(f"\nColumns: {ds_mc4_kor['test'].column_names}")

# Show first example
example = ds_mc4_kor['test'][0]
print(f"\n{'='*50}")
print(f"Case No: {example['case_no']}")
print(f"\n[Case Info]\n{example['case_info'][:300]}...")
print(f"\n[Choices]")
for i, choice in enumerate(example['choices']):
    if 'a' in choice.lower():
        print(f"  {i+1}. A: {example['choices'][choice][:100]}...")
    if 'b' in choice.lower():
        print(f"  {i+1}. B: {example['choices'][choice][:100]}...")
    if 'c' in choice.lower():
        print(f"  {i+1}. C: {example['choices'][choice][:100]}...")
    if 'd' in choice.lower():
        print(f"  {i+1}. D: {example['choices'][choice][:100]}...")
print(f"\n[Ground Truth]: {example['gt'][:100]}...")

Korean MC4 Dataset:
DatasetDict({
    test: Dataset({
        features: ['case_no', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'choices', 'gt'],
        num_rows: 100
    })
})

Columns: ['case_no', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'choices', 'gt']

Case No: 2011구합2638

[Case Info]
 - 원고: 주식회사 A - 피고: 부산광역시 영도구청장 원고 주식회사 A는 선박 건조 및 판매를 목적으로 하는 회사로서, 2008년도 법인세 납부와 관련하여 법인세할 주민세의 신고·납부기한 연장을 신청하지 않아 가산세를 부과받았습니다. 이에 대한 가산세 면제 신청을 하였으나 피고는 이를 거부하였습니다. 원고는 이 거부처분의 취소를 구하는 소를 제기하였습니다. ...

[Choices]
  1. A: 납부기한 연장된 법인세에 대한 추가 연장신청을 하였으므로 가산세 부과는 적법하다....
  2. B: 중부산세무서장에게 2008년 귀속 법인세 일부의 납부기한 연장신청을 승인받았으므로 가산세 부과는 적법하다....
  3. C: 사업이 중대한 위기에 처해 가산세 면제 사유에 해당하므로, 가산세 부과는 적법하지 않다....
  4. D: 선박 건조 및 판매를 목적으로 설립된 회사를 운영하므로 가산세 부과는 적법하지 않다....

[Ground Truth]: C...


## 3. Essay - Open-ended Legal Analysis
Essay task requiring detailed legal analysis with rubric for evaluation.

In [8]:
# Load Korean Essay dataset
ds_essay_kor = load_dataset("sma1-rmarud/plat-kor-essay")
print("Korean Essay Dataset:")
print(ds_essay_kor)
print(f"\nColumns: {ds_essay_kor['test'].column_names}")

# Show first example
example = ds_essay_kor['test'][0]
print(f"\n{'='*50}")
print(f"Case No: {example['case_no']}")
print(f"\n[Question Prefix]\n{example['question_prefix']}")
print(f"\n[Case Info]\n{example['case_info'][:300]}...")
print(f"\n[Rubric]\n{example['rubric'][:500]}...")

Generating test split: 100%|██████████| 100/100 [00:00<00:00, 12175.05 examples/s]

Korean Essay Dataset:
DatasetDict({
    test: Dataset({
        features: ['case_no', 'question_prefix', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'rubric'],
        num_rows: 100
    })
})

Columns: ['case_no', 'question_prefix', 'case_info', 'facts', 'claims', 'reasoning', 'decision', 'rubric']

Case No: 2011구합2638

[Question Prefix]
다음 사례를 읽고 물음에 답하시오. 위 사례에서 나타난 가산세 부과 처분은 적법한 것인지에 대하여 설명하시오.(단, 가산세 부과 처분에 대한 적법성 이외에는 고려하지 않는다.) <사례> 

[Case Info]
 - 원고: 주식회사 A - 피고: 부산광역시 영도구청장 원고 주식회사 A는 선박 건조 및 판매를 목적으로 하는 회사로서, 2008년도 법인세 납부와 관련하여 법인세할 주민세의 신고·납부기한 연장을 신청하지 않아 가산세를 부과받았습니다. 이에 대한 가산세 면제 신청을 하였으나 피고는 이를 거부하였습니다. 원고는 이 거부처분의 취소를 구하는 소를 제기하였습니다....

[Rubric]
1. 가산세의 성격과 정의 (1점) 가산세의 법적 성격(세법상 의무 위반에 대한 제재)을 명확히 서술하였는가?
2. 관련 법령 근거 제시 (1점) 국세기본법 등 관련 법령을 정확히 언급하고, 법 조문 번호와 내용을 올바르게 인용했는가?
3. 가산세 부과 요건 및 범위 (1점) 문제 상황에 적용되는 가산세의 부과 요건과 적용 범위를 정확히 설명했는가?
4. 가산세 면제 '정당한 사유' 근거 (1점) 가산세 면제에 대한 법적 근거(국세기본법 제48조)를 정확히 제시했는가?
5. '법령 부지' 등 적용 여부 (1점) 법령의 부지나 착오, 전문가의 미인지 등이 




## 4. English Datasets
Load English versions of the datasets.

In [9]:
# Load English datasets
ds_mc_eng = load_dataset("sma1-rmarud/plat-eng-mc")
ds_mc4_eng = load_dataset("sma1-rmarud/plat-eng-mc4")
ds_essay_eng = load_dataset("sma1-rmarud/plat-eng-essay")

print("English Datasets Loaded:")
print(f"  - MC: {len(ds_mc_eng['test'])} examples")
print(f"  - MC4: {len(ds_mc4_eng['test'])} examples")
print(f"  - Essay: {len(ds_essay_eng['test'])} examples")

# Show English MC example
example = ds_mc_eng['test'][0]
print(f"\n{'='*50}")
print(f"[English MC Example]")
print(f"Case No: {example['case_no']}")
print(f"\n[Case Info]\n{example['case_info'][:300]}...")
print(f"\n[Lawfulness]: {example['lawfulness']}")

Generating test split: 100%|██████████| 100/100 [00:00<00:00, 12513.96 examples/s]
Generating test split: 100%|██████████| 100/100 [00:00<00:00, 10617.95 examples/s]
Generating test split: 100%|██████████| 100/100 [00:00<00:00, 14835.54 examples/s]

English Datasets Loaded:
  - MC: 100 examples
  - MC4: 100 examples
  - Essay: 100 examples

[English MC Example]
Case No: 2011guhap2638

[Case Info]
- Plaintiff: A Co., Ltd. - Defendant: Head of Yeongdo-gu Office, Busan Metropolitan City. Plaintiff A Co., Ltd. is a company that aims to build and sell ships, and it was assessed with penalty taxes for the 2008 corporate tax payment because it did not apply for an extension of the reporting and pay...

[Lawfulness]: False



