In [1]:
import os, json
from tools.pipeline.config import ONEDRIVE_PATH

atc = json.load(open(os.path.join(ONEDRIVE_PATH, 'evaluation/eval_data/7_multiple_rw/answer_type_classified.json')))

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
len(atc)

4957

In [3]:
# answer_type_classified.json에서 문제들을 answer_type별로 분류
atc_right = []
atc_wrong = []
atc_abcd = []

for item in atc:
    question_id = f"{item['file_id']}_{item['tag']}"
    answer_type = item.get('answer_type', '')
    
    if answer_type == 'right':
        atc_right.append(question_id)
    elif answer_type == 'wrong':
        atc_wrong.append(question_id)
    elif answer_type == 'abcd':
        atc_abcd.append(question_id)
    else:
        print(f"answer_type_classified.json에 분류되지 않은 문제: {question_id}")

print(f"answer_type_classified.json 분류:")
print(f"  right: {len(atc_right)}")
print(f"  wrong: {len(atc_wrong)}")
print(f"  abcd: {len(atc_abcd)}")

answer_type_classified.json 분류:
  right: 2064
  wrong: 2500
  abcd: 393


In [None]:
# _needcheck 폴더의 파일들에서 문제 ID 추출
needcheck_base = os.path.join(ONEDRIVE_PATH, 'evaluation/eval_data/7_multiple_rw/_needcheck')

needcheck_right = set()
needcheck_wrong = set()
needcheck_abcd = set()

# pick_right 폴더의 파일들 처리
pick_right_dir = os.path.join(needcheck_base, 'pick_right')
if os.path.exists(pick_right_dir):
    for filename in os.listdir(pick_right_dir):
        if filename.endswith('.json') and 'sampling' in filename:
            filepath = os.path.join(pick_right_dir, filename)
            try:
                with open(filepath, 'r', encoding='utf-8') as f:
                    data = json.load(f)
                    for item in data:
                        question_id = f"{item['file_id']}_{item['tag']}"
                        if item.get('pick') == 'right':
                            needcheck_right.add(question_id)
            except Exception as e:
                print(f"Error reading {filename}: {e}")

# pick_wrong 폴더의 파일들 처리
pick_wrong_dir = os.path.join(needcheck_base, 'pick_wrong')
if os.path.exists(pick_wrong_dir):
    for filename in os.listdir(pick_wrong_dir):
        if filename.endswith('.json') and 'sampling' in filename:
            filepath = os.path.join(pick_wrong_dir, filename)
            try:
                with open(filepath, 'r', encoding='utf-8') as f:
                    data = json.load(f)
                    for item in data:
                        question_id = f"{item['file_id']}_{item['tag']}"
                        if item.get('pick') == 'wrong':
                            needcheck_wrong.add(question_id)
            except Exception as e:
                print(f"Error reading {filename}: {e}")

# pick_abcd 폴더의 파일들 처리
pick_abcd_dir = os.path.join(needcheck_base, 'pick_abcd')
if os.path.exists(pick_abcd_dir):
    result_file = os.path.join(pick_abcd_dir, 'result.json')
    if os.path.exists(result_file):
        try:
            with open(result_file, 'r', encoding='utf-8') as f:
                data = json.load(f)
                for item in data:
                    question_id = item.get('question_id', '')
                    if question_id:
                        needcheck_abcd.add(question_id)
        except Exception as e:
            print(f"Error reading pick_abcd/result.json: {e}")

print(f"_needcheck 폴더 분류:")
print(f"  pick_right: {len(needcheck_right)}")
print(f"  pick_wrong: {len(needcheck_wrong)}")
print(f"  pick_abcd: {len(needcheck_abcd)}")


In [None]:
# 두 그룹의 분류 비교
atc_right_set = set(atc_right)
atc_wrong_set = set(atc_wrong)
atc_abcd_set = set(atc_abcd)

print("=" * 80)
print("분류 일치 여부 확인")
print("=" * 80)

# Right 분류 비교
print("\n[Right 분류]")
right_match = atc_right_set & needcheck_right
right_only_atc = atc_right_set - needcheck_right
right_only_needcheck = needcheck_right - atc_right_set

print(f"  일치하는 문제 수: {len(right_match)}")
print(f"  answer_type_classified에만 있는 문제: {len(right_only_atc)}")
print(f"  _needcheck에만 있는 문제: {len(right_only_needcheck)}")

if right_only_atc:
    print(f"\n  answer_type_classified에만 있는 문제 샘플 (최대 10개):")
    for qid in list(right_only_atc)[:10]:
        print(f"    - {qid}")

if right_only_needcheck:
    print(f"\n  _needcheck에만 있는 문제 샘플 (최대 10개):")
    for qid in list(right_only_needcheck)[:10]:
        print(f"    - {qid}")

# Wrong 분류 비교
print("\n[Wrong 분류]")
wrong_match = atc_wrong_set & needcheck_wrong
wrong_only_atc = atc_wrong_set - needcheck_wrong
wrong_only_needcheck = needcheck_wrong - atc_wrong_set

print(f"  일치하는 문제 수: {len(wrong_match)}")
print(f"  answer_type_classified에만 있는 문제: {len(wrong_only_atc)}")
print(f"  _needcheck에만 있는 문제: {len(wrong_only_needcheck)}")

if wrong_only_atc:
    print(f"\n  answer_type_classified에만 있는 문제 샘플 (최대 10개):")
    for qid in list(wrong_only_atc)[:10]:
        print(f"    - {qid}")

if wrong_only_needcheck:
    print(f"\n  _needcheck에만 있는 문제 샘플 (최대 10개):")
    for qid in list(wrong_only_needcheck)[:10]:
        print(f"    - {qid}")

# Abcd 분류 비교
print("\n[Abcd 분류]")
abcd_match = atc_abcd_set & needcheck_abcd
abcd_only_atc = atc_abcd_set - needcheck_abcd
abcd_only_needcheck = needcheck_abcd - atc_abcd_set

print(f"  일치하는 문제 수: {len(abcd_match)}")
print(f"  answer_type_classified에만 있는 문제: {len(abcd_only_atc)}")
print(f"  _needcheck에만 있는 문제: {len(abcd_only_needcheck)}")

if abcd_only_atc:
    print(f"\n  answer_type_classified에만 있는 문제 샘플 (최대 10개):")
    for qid in list(abcd_only_atc)[:10]:
        print(f"    - {qid}")

if abcd_only_needcheck:
    print(f"\n  _needcheck에만 있는 문제 샘플 (최대 10개):")
    for qid in list(abcd_only_needcheck)[:10]:
        print(f"    - {qid}")


In [None]:
# 교차 분류 확인 (다른 분류로 잘못 분류된 경우)
print("\n" + "=" * 80)
print("교차 분류 확인 (잘못 분류된 경우)")
print("=" * 80)

# answer_type_classified에서 right인데 _needcheck에서 다른 분류인 경우
right_in_atc_but_other_in_needcheck = []
for qid in atc_right_set:
    if qid in needcheck_wrong:
        right_in_atc_but_other_in_needcheck.append((qid, 'wrong'))
    elif qid in needcheck_abcd:
        right_in_atc_but_other_in_needcheck.append((qid, 'abcd'))

if right_in_atc_but_other_in_needcheck:
    print(f"\n[answer_type_classified: right → _needcheck: 다른 분류] ({len(right_in_atc_but_other_in_needcheck)}개)")
    for qid, wrong_type in right_in_atc_but_other_in_needcheck:
        print(f"  - {qid} → {wrong_type}")

# answer_type_classified에서 wrong인데 _needcheck에서 다른 분류인 경우
wrong_in_atc_but_other_in_needcheck = []
for qid in atc_wrong_set:
    if qid in needcheck_right:
        wrong_in_atc_but_other_in_needcheck.append((qid, 'right'))
    elif qid in needcheck_abcd:
        wrong_in_atc_but_other_in_needcheck.append((qid, 'abcd'))

if wrong_in_atc_but_other_in_needcheck:
    print(f"\n[answer_type_classified: wrong → _needcheck: 다른 분류] ({len(wrong_in_atc_but_other_in_needcheck)}개)")
    for qid, wrong_type in wrong_in_atc_but_other_in_needcheck:
        print(f"  - {qid} → {wrong_type}")

# answer_type_classified에서 abcd인데 _needcheck에서 다른 분류인 경우
abcd_in_atc_but_other_in_needcheck = []
for qid in atc_abcd_set:
    if qid in needcheck_right:
        abcd_in_atc_but_other_in_needcheck.append((qid, 'right'))
    elif qid in needcheck_wrong:
        abcd_in_atc_but_other_in_needcheck.append((qid, 'wrong'))

if abcd_in_atc_but_other_in_needcheck:
    print(f"\n[answer_type_classified: abcd → _needcheck: 다른 분류] ({len(abcd_in_atc_but_other_in_needcheck)}개)")
    for qid, wrong_type in abcd_in_atc_but_other_in_needcheck:
        print(f"  - {qid} → {wrong_type}")

# 전체 요약
print("\n" + "=" * 80)
print("전체 요약")
print("=" * 80)
print(f"Right 분류 일치율: {len(right_match)}/{len(atc_right_set)} ({len(right_match)/len(atc_right_set)*100:.2f}%)" if atc_right_set else "Right 분류 일치율: N/A")
print(f"Wrong 분류 일치율: {len(wrong_match)}/{len(atc_wrong_set)} ({len(wrong_match)/len(atc_wrong_set)*100:.2f}%)" if atc_wrong_set else "Wrong 분류 일치율: N/A")
print(f"Abcd 분류 일치율: {len(abcd_match)}/{len(atc_abcd_set)} ({len(abcd_match)/len(atc_abcd_set)*100:.2f}%)" if atc_abcd_set else "Abcd 분류 일치율: N/A")
print(f"\n총 교차 분류 오류: {len(right_in_atc_but_other_in_needcheck) + len(wrong_in_atc_but_other_in_needcheck) + len(abcd_in_atc_but_other_in_needcheck)}개")


In [None]:
from tools.core.llm_query import LLMQuery

llm = LLMQuery()
system_prompt = """당신은 프롬프트 엔지니어입니다. 아래와 같은 원리를 담아 문제를 변형하는 프롬프트를 만들려고 합니다.
### 옳은 것 → 옳지 않은 것 복수선택형

- (5지선다) 어떤 문제를 답2개/3개/4개/5개 정하고
    - 5개: 옳은 것 0개 = 본래 O선지 1개 → X선지 1개 = 옳지 않은 것 5개
    - 4개: 옳은 것 1개 = 본래 O선지 1개 그대로 사용 = 옳지 않은 것 4개
    - 3개: 옳은 것 2개 = 본래 O선지 1개 + X선지 중 1개 → O선지 = 옳지 않은 것 3개
    - 2개: 옳은 것 3개 = 본래 O선지 1개 + X선지 중 2개 → O선지 2개 = 옳지 않은 것 2개
- (4지선다) 어떤 문제를 답2개/3개/4개 할지 정하고
    - 4개: 옳은 것 0개 = 본래 O선지 1개 → X선지 1개 = 옳지 않은 것 4개
    - 3개: 옳은 것 1개 = 본래 O선지 1개 그대로 사용 = 옳지 않은 것 3개 ⇒ 단일선택형 재(변형)검증
    - 2개: 옳지 않은 것 2개 = 본래 O선지 1개 + X선지 중 1개 → O선지 = 옳지 않은 것 2개

아래 프롬프트는 반대의 상황을 위해 만들어진 프롬프트입니다.
모순 없이 위의 상황을 반영할 수 있도록 수정해주세요.
"""

target_answer_count = 3
options_ct = 5
question = {}
question['answer'] = "②"


user_prompt = f"""
당신은 25년 경력의 문제 출제 전문가입니다.

검증
- {target_answer_count}가 2 이상 {options_ct} 이하인지 확인합니다. 범위를 벗어나면 오류를 보고합니다.
- 선택지 수({options_ct})와 순서는 반드시 유지합니다.

변형 규칙
- 문제 지문은 “옳은 것을 모두 고르시오”로 바꿉니다. 그 외 본문, 수식(LaTeX), 표, 선택지 문구(변형 대상 제외)는 원형을 최대한 보존합니다.
- 목표 오답 수 = {options_ct - target_answer_count}.
  - 목표 오답 수 = 0: 원래 오답({question.get('answer', '')})을 최소 수정으로 ‘옳음’으로 뒤집습니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 모든 선택지가 옳음입니다.
  - 목표 오답 수 = 1: 원래 오답을 그대로 유지합니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 원래 오답 1개만 남습니다(단일선택형 재검증).
  - 목표 오답 수 ≥ 2: 원래 오답은 그대로 유지하고, 추가로 (목표 오답 수 - 1)개 만큼 원래 옳았던 선택지를 골라 최소 수정으로 ‘옳지 않음’으로 만듭니다.
- 최소 수정 원칙
  - 허용되는 변경 예: 수치/단위/부등호/최대↔최소/있다↔없다/반드시↔경우도 있다/조건의 범위·한정어 조정 등.
  - 제공된 해설의 논리 범위를 벗어나는 임의 창작 금지. 외부 사실 의존 금지.
  - 변형 대상이 아닌 선택지의 문구는 절대 수정하지 않습니다.
- 선택지 선정 가이드
  - 변형이 필요한 경우, 가장 적은 토큰 변경으로 참⇄거짓을 뒤집기 쉬운 선택지부터 우선 선택합니다.
  - 의미 일관성 유지: 변형으로 인해 다른 선택지와 모순되거나 문제 전체의 전제가 깨지지 않도록 합니다.

정답과 설명
- 정답(answer)은 변형 후 ‘옳은’ 선택지의 번호 목록입니다. 번호는 "①","②",... 형식의 문자열로, 오름차순으로 정렬합니다.
- explanation에는 모든 선택지를 순회하며 다음 형식으로 간단·명확히 기술합니다.
  - “① 옳다: 근거 …”
  - “③ 옳지 않다(원래 오답): 근거 …”
  - “⑤ 옳지 않다(변형): 변경 ‘높다→낮다’, 근거 …”
- 변형된 선택지는 반드시 어떤 단어/수치/기호를 어떻게 바꿨는지 구체적으로 한 토큰 수준으로 표기합니다.

출력 형식(JSON)
{{
  "question_id": "문제번호",
  "question": "변형된 문제(옳은 것을 모두 고르시오)",
  "options": ["① 선택지1", "② 선택지2", ...],  
  "answer": ["정답번호1", "정답번호2", ...], 
  "explanation": "① 옳다: … / ③ 옳지 않다(원래 오답): … / ⑤ 옳지 않다(변형): 변경 ‘…→…’, 근거 …"
}}

비고
- 목표 오답 수 계산식으로 일관되게 제어합니다.
  - 추가로 만들어야 할 오답 수 = {max(0, options_ct - target_answer_count - 1)}.
  - 단, {options_ct - target_answer_count} = 0이면 원래 오답을 ‘옳음’으로 뒤집고 추가 오답은 0입니다.
- 선택지 레이블(①, ②, …)과 원문 순서를 유지합니다.
- 최종적으로 옳음 개수 = {target_answer_count}, 오답 개수 = {options_ct - target_answer_count}임을 자기점검합니다.
"""
response = llm.query_openrouter(system_prompt, user_prompt)

In [None]:
print(response)

In [None]:
system_prompt = f"""당신은 25년 경력의 문제 출제 전문가입니다.

검증
- 목표 정답 수(= '옳지 않은 것' 개수, {target_answer_count})가 2 이상 {options_ct} 이하인지 확인합니다. 범위를 벗어나면 오류를 보고합니다.
- 선택지 수({options_ct})와 순서는 반드시 유지합니다.

변형 규칙
- 문제 지문은 “옳지 않은 것을 모두 고르시오”로 바꿉니다. 그 외 본문, 수식(LaTeX), 표, 선택지 문구(변형 대상 제외)는 원형을 최대한 보존합니다.
- 목표 오답 수 = '옳은 것' 개수 = {options_ct - target_answer_count}.
  - 목표 오답 수 = 0: 원래 오답({question.get('answer', '')})을 최소 수정으로 ‘옳지 않음’으로 뒤집습니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 모든 선택지가 옳지 않음입니다.
  - 목표 오답 수 = 1: 원래 오답을 그대로 유지합니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 원래 오답인 '옳은 것' 1개만 남습니다(단일선택형 재검증).
  - 목표 오답 수 ≥ 2: 원래 오답을 그대로 유지하고, 추가로 (목표 오답 수 - 1)개 만큼 원래 옳지 않았던 선택지를 골라 최소 수정으로 ‘옳음’으로 만듭니다.
- 최소 수정 원칙
  - 허용되는 변경 예: 수치/단위/부등호/최대↔최소/있다↔없다/반드시↔경우도 있다/조건의 범위·한정어 조정 등.
  - 제공된 해설의 논리 범위를 벗어나는 임의 창작 금지. 외부 사실 의존 금지.
  - 변형 대상이 아닌 선택지의 문구는 절대 수정하지 않습니다.
- 선택지 선정 가이드
  - 변형이 필요한 경우, 가장 적은 토큰 변경으로 참⇄거짓을 뒤집기 쉬운 선택지부터 우선 선택합니다.
  - 의미 일관성 유지: 변형으로 인해 다른 선택지와 모순되거나 문제 전체의 전제가 깨지지 않도록 합니다.

정답과 설명
- 정답(answer)은 변형 후 ‘옳지 않은’ 선택지의 번호 목록입니다. 번호는 "①","②",... 형식의 문자열로, 오름차순으로 정렬합니다.
- explanation에는 모든 선택지를 순회하며 다음 형식으로 간단·명확히 기술합니다.
  - “① 옳다(원래 오답): 근거 …”
  - “③ 옳지 않다: 근거 …”
  - “⑤ 옳다(변형): 변경 ‘높다→낮다’, 근거 …”
- 변형된 선택지는 반드시 어떤 단어/수치/기호를 어떻게 바꿨는지 구체적으로 한 토큰 수준으로 표기합니다.

출력 형식(JSON)
{{
  "question_id": "문제번호",
  "question": "변형된 문제(옳지 않은 것을 모두 고르시오)",
  "options": ["① 선택지1", "② 선택지2", ...],  
  "answer": ["정답번호1", "정답번호2", ...], 
  "explanation": "① 옳다(원래 오답): … / ③ 옳지 않다: … / ⑤ 옳다(변형): 변경 ‘…→…’, 근거 …"
}}

비고
- 목표 오답 수 계산식으로 일관되게 제어합니다.
  - 추가로 만들어야 할 오답 수 = {max(0, options_ct - target_answer_count - 1)}.
  - 단, {options_ct - target_answer_count} = 0이면 원래 오답을 ‘옳지 않음’으로 뒤집고 추가 오답은 0입니다.
- 선택지 레이블(①, ②, …)과 원문 순서를 유지합니다.
- 최종적으로 옳지 않음 개수 = {target_answer_count}, 오답(옳음) 개수 = {options_ct - target_answer_count}임을 자기점검합니다.
"""

### 피드백 반영

In [5]:
atc[132]

{'file_id': 'SS0188',
 'title': '2025 하이패스 신용관리사 단원별 기출문제집',
 'chapter': 'Part 1 채권일반',
 'tag': 'q_0058_0001',
 'domain': '경영',
 'subdomain': '경영컨설팅 및 기술평가',
 'classification_reason': '채무승인에 의한 소멸시효 중단(민법 제168조 제3호, 제174조), 신용관리에서 승인 행위 인식 핵심',
 'is_calculation': False,
 'question': "소멸시효의 중단사유가 되는 채무자의 \\'채무승인\\'에 관한 설명으로 옳은 것은?",
 'options': ['① 채권자의 최고(催告)에 대하여 채무자가 채무승인을 하게 되면 최고로 일시정지되었던 소멸시효가 이미 경과한 소멸시효기간에 이어서 진행된다.',
  '② 채무자의 추가담보제공행위는 채무에 대한 승인을 전제로 하는 것이 아니므로 시효중단의 효력이 없다.',
  '③ 시효완성 전에 채무자로부터 채무상환의 일부라도 있으면 채무의 승인으로서 시효중단의 효과가 발생한다.',
  '④ 정당한 채무인수계약이 있더라도 이를 승인으로 보지 않는다.',
  '⑤ 채무자의 승인은 묵시적인 방식에 의한 승인은 인정되지 않는다. 따라서 후일 다툼에 대비하여 반드시 서면으로 승인의 의사를 받아두어야 한다.'],
 'answer': '③',
 'explanation': '① 채권자의 최고(催告)에 의하여 시효가 중단되는 것은 잠정적이며, 최고 후 6월 이내에 재판상의 청구, 파산절차참가, 화해를 위한 소환, 임의출석, 압류 또는 가압류, 가처분을 하지 아니하면 시효중단의 효과가 없다(민법 제174조). 채무자의 승인은 별도의 시효중단사유로서 중단까지에 경과한 시효기간은 이를 산입하지 아니하고 중단사유가 종료한 때로부터 새로이 진행한다(동법 제168조 제3호, 제178조 제1항).\n②, ⑤ 승인은 특별한 방식을 요하지 않으며, 명시적이든 묵시적이든 상관없다. 예컨대, 일부변제

In [6]:
user_prompt = f"""
=========== 문제 ==========
"""
p = atc[132]
question_id = p['file_id'] + '_' + p['tag']
question = p['question']
options = p['options']
answer = p['answer']
explanation = p['explanation']

user_prompt += f"""문제번호: {question_id}
문제: {question}
선택지: {options}
답: {answer}
해설: {explanation}
"""

In [13]:
# 입력
# - options_ct: 원문 선택지 수
# - i: 변형 후 정답(‘옳은 것’)의 개수
# - given_wrong_idx: 원래 ‘옳지 않은’ 선택지 번호(필수)

question = atc[132]
options_ct = len(options)
target_answer_count = 2
given_wrong_idx = answer

system_prompt = f"""당신은 25년 경력의 문제 출제 전문가입니다.

검증
- 목표 정답 수(= '옳지 않은 것' 개수, {target_answer_count})가 2 이상 {options_ct} 이하인지 확인합니다. 범위를 벗어나면 오류를 보고합니다.
- 선택지 수({options_ct})와 순서는 반드시 유지합니다.

변형 규칙
- 문제 지문은 “옳지 않은 것을 모두 고르시오”로 바꿉니다. 그 외 본문, 수식(LaTeX), 표, 선택지 문구(변형 대상 제외)는 원형을 최대한 보존합니다.
- 목표 오답 수 = '옳은 것' 개수 = {options_ct - target_answer_count}.
  - 목표 오답 수 = 0: 원래 오답({question.get('answer', '')})을 최소 수정으로 ‘옳지 않음’으로 뒤집습니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 모든 선택지가 옳지 않음입니다.
  - 목표 오답 수 = 1: 원래 오답을 그대로 유지합니다. 그 외 선택지는 변경하지 않습니다. 결과적으로 원래 오답인 '옳은 것' 1개만 남습니다(단일선택형 재검증).
  - 목표 오답 수 ≥ 2: 원래 오답을 그대로 유지하고, 추가로 (목표 오답 수 - 1)개 만큼 원래 옳지 않았던 선택지를 골라 최소 수정으로 ‘옳음’으로 만듭니다.
- 최소 수정 원칙
  - 허용되는 변경 예: 수치/단위/부등호/최대↔최소/있다↔없다/반드시↔경우도 있다/조건의 범위·한정어 조정 등.
  - 제공된 해설의 논리 범위를 벗어나는 임의 창작 금지. 외부 사실 의존 금지.
  - 변형 대상이 아닌 선택지의 문구는 절대 수정하지 않습니다.
- 선택지 선정 가이드
  - 변형이 필요한 경우, 가장 적은 토큰 변경으로 참⇄거짓을 뒤집기 쉬운 선택지부터 우선 선택합니다.
  - 의미 일관성 유지: 변형으로 인해 다른 선택지와 모순되거나 문제 전체의 전제가 깨지지 않도록 합니다.

정답과 설명
- 정답(answer)은 변형 후 ‘옳지 않은’ 선택지의 번호 목록입니다. 번호는 "①","②",... 형식의 문자열로, 오름차순으로 정렬합니다.
- explanation에는 모든 선택지를 순회하며 다음 형식으로 간단·명확히 기술합니다.
  - “① 옳다(원래 오답): 근거 …”
  - “③ 옳지 않다: 근거 …”
  - “⑤ 옳다(변형): 변경 ‘높다→낮다’, 근거 …”
- 변형된 선택지는 반드시 어떤 단어/수치/기호를 어떻게 바꿨는지 구체적으로 한 토큰 수준으로 표기합니다.

출력 형식(JSON)
{{
  "question_id": "문제번호",
  "question": "변형된 문제(옳지 않은 것을 모두 고르시오)",
  "options": ["① 선택지1", "② 선택지2", ...],  
  "answer": ["정답번호1", "정답번호2", ...], 
  "explanation": "① 옳다(원래 오답): … / ③ 옳지 않다: … / ⑤ 옳다(변형): 변경 ‘…→…’, 근거 …"
}}

비고
- 목표 오답 수 계산식으로 일관되게 제어합니다.
  - 추가로 만들어야 할 오답 수 = {max(0, options_ct - target_answer_count - 1)}.
  - 단, {options_ct - target_answer_count} = 0이면 원래 오답을 ‘옳지 않음’으로 뒤집고 추가 오답은 0입니다.
- 선택지 레이블(①, ②, …)과 원문 순서를 유지합니다.
- 최종적으로 옳지 않음 개수 = {target_answer_count}, 오답(옳음) 개수 = {options_ct - target_answer_count}임을 자기점검합니다.
"""

In [14]:
from tools.core.llm_query import LLMQuery

llm = LLMQuery()
response = llm.query_openrouter(system_prompt, user_prompt, model_name = 'openai/o3')
print(response)

2025-11-17 23:14:25,596 - INFO - HTTP Request: POST https://openrouter.ai/api/v1/chat/completions "HTTP/1.1 200 OK"


{
  "question_id": "SS0188_q_0058_0001",
  "question": "소멸시효의 중단사유가 되는 채무자의 '채무승인'에 관한 설명으로 옳지 않은 것을 모두 고르시오.",
  "options": [
    "① 채권자의 최고(催告)에 대하여 채무자가 채무승인을 하게 되면 최고로 일시정지되었던 소멸시효가 이미 경과한 소멸시효기간에 이어서 진행된다.",
    "② 채무자의 추가담보제공행위는 채무에 대한 승인을 전제로 하는 것이 아니므로 시효중단의 효력이 있다.",
    "③ 시효완성 전에 채무자로부터 채무상환의 일부라도 있으면 채무의 승인으로서 시효중단의 효과가 발생한다.",
    "④ 정당한 채무인수계약이 있더라도 이를 승인으로 본다.",
    "⑤ 채무자의 승인은 묵시적인 방식에 의한 승인은 인정되지 않는다. 따라서 후일 다툼에 대비하여 반드시 서면으로 승인의 의사를 받아두어야 한다."
  ],
  "answer": ["①", "⑤"],
  "explanation": "① 옳지 않다: 채무자의 승인은 별도의 시효중단사유이므로 중단 전 기간을 산입하지 않고 시효가 새로이 진행한다. / ② 옳다(변형): 변경 ‘없다→있다’, 추가담보제공은 묵시적 승인이므로 시효중단의 효력이 있다. / ③ 옳다(원래 정답): 일부 변제는 묵시적 승인으로 시효가 중단된다. / ④ 옳다(변형): 변경 ‘보지 않는다→본다’, 정당한 채무인수계약은 채무 존재를 전제로 하므로 승인의 효과가 있다. / ⑤ 옳지 않다: 묵시적 승인도 인정되며 승인은 형식 제한이 없으므로 서면으로 받을 필요가 없다."
}



In [12]:
question

{'file_id': 'SS0188',
 'title': '2025 하이패스 신용관리사 단원별 기출문제집',
 'chapter': 'Part 1 채권일반',
 'tag': 'q_0058_0001',
 'domain': '경영',
 'subdomain': '경영컨설팅 및 기술평가',
 'classification_reason': '채무승인에 의한 소멸시효 중단(민법 제168조 제3호, 제174조), 신용관리에서 승인 행위 인식 핵심',
 'is_calculation': False,
 'question': "소멸시효의 중단사유가 되는 채무자의 \\'채무승인\\'에 관한 설명으로 옳은 것은?",
 'options': ['① 채권자의 최고(催告)에 대하여 채무자가 채무승인을 하게 되면 최고로 일시정지되었던 소멸시효가 이미 경과한 소멸시효기간에 이어서 진행된다.',
  '② 채무자의 추가담보제공행위는 채무에 대한 승인을 전제로 하는 것이 아니므로 시효중단의 효력이 없다.',
  '③ 시효완성 전에 채무자로부터 채무상환의 일부라도 있으면 채무의 승인으로서 시효중단의 효과가 발생한다.',
  '④ 정당한 채무인수계약이 있더라도 이를 승인으로 보지 않는다.',
  '⑤ 채무자의 승인은 묵시적인 방식에 의한 승인은 인정되지 않는다. 따라서 후일 다툼에 대비하여 반드시 서면으로 승인의 의사를 받아두어야 한다.'],
 'answer': '③',
 'explanation': '① 채권자의 최고(催告)에 의하여 시효가 중단되는 것은 잠정적이며, 최고 후 6월 이내에 재판상의 청구, 파산절차참가, 화해를 위한 소환, 임의출석, 압류 또는 가압류, 가처분을 하지 아니하면 시효중단의 효과가 없다(민법 제174조). 채무자의 승인은 별도의 시효중단사유로서 중단까지에 경과한 시효기간은 이를 산입하지 아니하고 중단사유가 종료한 때로부터 새로이 진행한다(동법 제168조 제3호, 제178조 제1항).\n②, ⑤ 승인은 특별한 방식을 요하지 않으며, 명시적이든 묵시적이든 상관없다. 예컨대, 일부변제