In [1]:
"""
카테고리 분류용 Llama-DNA 8B 모델 로드 & 추론 스크립트
- GPU + bitsandbytes(nf4) 지원 시: 4-bit 양자화 로드
- 그 외 환경(Windows CPU 등): 일반 float32/bfloat16 로드
"""

import os
import difflib
import random
import warnings

import torch
from transformers import AutoTokenizer, AutoModelForCausalLM
from utils.config import settings

# (선택) tqdm IProgress 경고 끄기
warnings.filterwarnings("ignore", category=UserWarning, module="tqdm")

# ---------------------------------------------------------------------
# 1. 하드웨어 & 라이브러리 호환성 감지
# ---------------------------------------------------------------------
USE_4BIT = False
bnb_config = None
try:
    # bitsandbytes & GPU 가 모두 준비된 경우에만 4-bit 사용
    from transformers import BitsAndBytesConfig
    import bitsandbytes as bnb

    if torch.cuda.is_available():  # GPU 존재
        # GPU compute capability(예: (8,0))가 7.x 이상이면 안전
        major_cc, _ = torch.cuda.get_device_capability(0)
        if major_cc >= 7:
            USE_4BIT = True
except (ImportError, RuntimeError, AttributeError, ValueError):
    # bitsandbytes 미설치 또는 CPU-only -> 4bit 비활성
    USE_4BIT = False

if USE_4BIT:
    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16   # bf16 계산
    )

# ---------------------------------------------------------------------
# 2. 모델 및 토크나이저 로드
# ---------------------------------------------------------------------
MODEL_NAME = settings.classifier_model_name

tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, force_download=False)

model_kwargs = {
    "device_map": "auto" if torch.cuda.is_available() else {"": "cpu"}
}
if bnb_config is not None:
    model_kwargs["quantization_config"] = bnb_config

model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    force_download=False,
    **model_kwargs
)

# ---------------------------------------------------------------------
# 3. 카테고리 정의
# ---------------------------------------------------------------------
categories = {
    0: "졸업요건",
    1: "학교 공지사항",
    2: "학사일정",
    3: "식단 안내",
    4: "통학/셔틀 버스"
}

# 예시 문장(간단한 룰-베이스 fallback용)
category_examples = {
    0: "졸업 요건, 졸업 학점, 졸업 논문, 졸업 자격, 유예 신청",
    1: "학교 공지사항, 안내문, 휴강 안내, 장학금 공지, 긴급 알림",
    2: "수강 신청, 시험 기간, 성적 발표, 개강일, 종강일, 학사 일정",
    3: "학식, 학생 식당, 식단표, 오늘 메뉴, 급식 시간",
    4: "셔틀버스, 통학버스, 버스 시간표, 노선, 정류장 위치"
}

# ---------------------------------------------------------------------
# 4. 분류 함수
# ---------------------------------------------------------------------
def classify_query(user_query: str):
    """
    • LLM + 프롬프트를 이용해 5개 카테고리 중 하나 예측
    • 파싱 실패 시 간단한 문자열 유사도로 fallback
    • 절대 실패하지 않음 (항상 0~4 반환)
    """
    prompt = f"""다음은 사용자 질문과 관련된 카테고리 목록입니다:
0: 졸업요건
1: 학교 공지사항
2: 학사일정
3: 식단 안내
4: 통학/셔틀 버스

사용자 질문: "{user_query}"
위 질문은 어떤 카테고리에 가장 적합한가요? 숫자 레이블(0~4)만 답하세요.

카테고리 번호:"""

    inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
    outputs = model.generate(
        **inputs,
        max_new_tokens=3,
        eos_token_id=tokenizer.eos_token_id,
        pad_token_id=tokenizer.pad_token_id,
        do_sample=False
    )
    response_text = tokenizer.decode(
        outputs[0][inputs.input_ids.shape[1]:],
        skip_special_tokens=True
    ).strip()

    # 숫자 파싱 시도
    digits = ''.join(filter(str.isdigit, response_text))
    if digits:
        label = int(digits[0])
        if label in categories:
            return label, categories[label]

    # ----------------- fallback: 문자열 유사도 -----------------
    best_score, best_label = 0.0, 0
    for label, example in category_examples.items():
        score = difflib.SequenceMatcher(None, user_query, example).ratio()
        if score > best_score:
            best_score, best_label = score, label

    return best_label, categories[best_label]

# ---------------------------------------------------------------------
# 5. 사용 예시
# ---------------------------------------------------------------------
if __name__ == "__main__":
    q = "오늘 학식 뭐 나와?"
    lbl, lbl_txt = classify_query(q)
    print(f"입력: {q}\n예측: {lbl} ({lbl_txt})")


Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]

The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.


입력: 오늘 학식 뭐 나와?
예측: 3 (식단 안내)


In [2]:
import json
from pathlib import Path
from tqdm import tqdm

# data/question directory relative to this notebook
base_dir = Path('../data/question') if Path('../data/question').exists() else Path('data/question')
output_dir = Path('../outputs') if Path('../outputs').exists() else Path('outputs')
output_dir.mkdir(parents=True, exist_ok=True)

for path in base_dir.glob('*.json'):
    with path.open('r', encoding='utf-8') as f:
        questions_data = json.load(f)
    results = []
    for item in tqdm(questions_data, desc=path.name):
        question = item['question']
        label, _ = classify_query(question)  # VARCO 모델 사용
        results.append({'question': question, 'label': label})
    out_file = output_dir / f"{path.stem}_output.json"
    with out_file.open('w', encoding='utf-8') as f:
        json.dump(results, f, ensure_ascii=False, indent=2)
    print(f'✅ {out_file} 저장 완료')


randomized_korean_questions_result.json:   0%|                                      | 0/104 [00:00<?, ?it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
randomized_korean_questions_result.json:   1%|▎                             | 1/104 [00:00<00:41,  2.46it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
randomized_korean_questions_result.json:   2%|▌                             | 2/104 [00:00<00:36,  2.78it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
randomized_korean_questions_result.json:   3%|▊                             | 3/104 [00:01<00:32,  3.08it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFO

✅ ../outputs/randomized_korean_questions_result_output.json 저장 완료


classifier_questions_only_result.json:   0%|                                        | 0/147 [00:00<?, ?it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
classifier_questions_only_result.json:   1%|▏                               | 1/147 [00:00<00:42,  3.42it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
classifier_questions_only_result.json:   1%|▍                               | 2/147 [00:00<00:42,  3.45it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFORMERS_VERBOSITY=info` for more details.
classifier_questions_only_result.json:   2%|▋                               | 3/147 [00:00<00:43,  3.31it/s]The following generation flags are not valid and may be ignored: ['temperature', 'top_p', 'top_k']. Set `TRANSFO

✅ ../outputs/classifier_questions_only_result_output.json 저장 완료





In [None]:
from src.answers import academic_calendar_answer,shuttle_bus_answer,graduation_req_answer,meals_answer,notices_answer,
    
from src.retrieval.rag_pipeline import HybridRetriever, AnswerGenerator
ANSWER_HANDLERS = {
    0: graduation_req_answer.generate_answer,
    1: notices_answer.generate_answer,
    2: academic_calendar_answer.generate_answer,
    3: meals_answer.generate_answer,
    4: shuttle_bus_answer.generate_answer,
}
def generate_response(question: str) -> str:
    label, _ = classify_query(question)
    handler = ANSWER_HANDLERS.get(label)
    if handler:
        return handler(question)
    retriever = HybridRetriever()
    docs = retriever.retrieve(question)
    generator = AnswerGenerator()
    return ''.join(generator.generate(question, docs))
   

   
sample_question = '오늘 학식 뭐 나와?'
print(generate_response(sample_question))

In [None]:
import time
import json
from pathlib import Path
import shutil
from IPython.display import display, clear_output
from datetime import datetime

# --- 1. 경로 설정 ---
# 웹 UI가 질문을 저장하는 폴더 (입력)
QUESTION_DIR = Path('question')

# 분류된 답변을 저장하는 폴더 (출력)
ANSWER_DIR = Path('answer')

# 처리가 완료된 질문을 옮길 폴더
PROCESSED_DIR = QUESTION_DIR / 'processed'

# 오류 발생 시 질문을 옮길 폴더
ERROR_DIR = QUESTION_DIR / 'error'

# 폴더가 없는 경우 생성
QUESTION_DIR.mkdir(exist_ok=True)
ANSWER_DIR.mkdir(exist_ok=True)
PROCESSED_DIR.mkdir(exist_ok=True)
ERROR_DIR.mkdir(exist_ok=True)


print(f"'{QUESTION_DIR}' 폴더를 실시간으로 감지합니다...")
print("노트북 셀을 중단(Interrupt)하면 감지가 종료됩니다.")

# --- 2. 실시간 감지 및 처리 루프 ---
try:
    while True:
        # question 폴더에서 아직 처리되지 않은 질문 파일 목록을 가져옴
        # 파일 이름이 'q_'로 시작하는 json 파일만 대상으로 함
        question_files = list(QUESTION_DIR.glob('q_*.json'))

        # 처리할 파일이 없으면 5초 대기 후 다시 확인
        if not question_files:
            time.sleep(5)
            continue

        # 새로운 질문 파일을 하나씩 처리
        for q_path in question_files:
            try:
                # 1. 질문 파일 읽기
                with q_path.open('r', encoding='utf-8') as f:
                    q_data = json.load(f)
                
                question_text = q_data.get('text', '')
                question_id = q_data.get('question_id', q_path.stem)

                # 2. 질문 분류 (기존에 정의된 classify_query 함수 사용)
                label, label_text = classify_query(question_text)

                # 3. 답변 파일 생성
                # 웹 UI가 질문(q_id)에 맞는 답변(a_id)을 찾을 수 있도록 파일 이름을 맞춤
                answer_id = question_id.replace('q_', 'a_')
                answer_path = ANSWER_DIR / f"{answer_id}.json"
                
                answer_data = {
                    'question_id': question_id,
                    'original_question': question_text,
                    'label': label,
                    'label_text': label_text,
                    'classified_at': datetime.now().isoformat()
                }

                # 답변 파일을 JSON 형식으로 저장
                with answer_path.open('w', encoding='utf-8') as f:
                    json.dump(answer_data, f, ensure_ascii=False, indent=2)

                # 4. 처리 완료된 질문 파일을 processed 폴더로 이동
                shutil.move(str(q_path), PROCESSED_DIR / q_path.name)
                
                # 5. 노트북에 처리 로그 출력
                clear_output(wait=True) # 이전 출력 지우기
                print(f"'{QUESTION_DIR}' 폴더를 실시간으로 감지합니다...")
                print("노트북 셀을 중단(Interrupt)하면 감지가 종료됩니다.\n")
                print(f"[{datetime.now().strftime('%Y-%m-%d %H:%M:%S')}] 처리 완료:")
                print(f"  - 질문 ID: {question_id}")
                print(f"  - 내   용: \"{question_text}\"")
                print(f"  - 분   류: {label} ({label_text})")
                print(f"  - 답변 파일: {answer_path}\n")
                print("다음 질문을 기다립니다...")

            except Exception as e:
                print(f"파일 처리 중 오류 발생: {q_path.name}, 오류: {e}")
                # 오류 발생 시 해당 파일을 error 폴더로 이동
                shutil.move(str(q_path), ERROR_DIR / q_path.name)

# 사용자가 직접 셀 실행을 중단할 경우 (KeyboardInterrupt) 루프 종료
except KeyboardInterrupt:
    print("\n실시간 분류 프로세스를 중단합니다.")

'question' 폴더를 실시간으로 감지합니다...
노트북 셀을 중단(Interrupt)하면 감지가 종료됩니다.
