In [1]:
import os
import torch
import nbimporter
from transformers import GPT2LMHeadModel, AutoTokenizer
from utils import generate

import warnings
warnings.filterwarnings("ignore", category=FutureWarning)

def load_model(model_path, tokenizer_name):
    tokenizer = AutoTokenizer.from_pretrained(tokenizer_name)
    model = GPT2LMHeadModel.from_pretrained(model_path)
    return tokenizer, model

if __name__ == "__main__":
    import warnings
    warnings.filterwarnings("ignore", category=FutureWarning)

    # 모델과 토크나이저 설정
    model_name = "skt/kogpt2-base-v2"
    model_path = "C:/Users/NM333-68/LLM/KoGPT2/best_model"

    # 경로가 올바른지 확인
    if not os.path.exists(model_path):
        raise ValueError(f"Model path {model_path} does not exist.")

    # 모델 및 토크나이저 로드
    tokenizer, model = load_model(model_path, model_name)

    # 디바이스 설정
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)

    # 사용자 입력 받기 및 문장 생성
    category = input("카테고리를 입력하세요 (예: 일상 대화, 주문, 요청, 건강, 교육): ")
    words_input = input("단어들을 입력하세요 (예: 나, 밥, 먹다): ")
    words = [word.strip() for word in words_input.split(',')]

    # 문장 생성
    generated_sentences = generate(category, words, tokenizer, model, device, num=5, max_length=50)
    
    # 생성된 문장 출력
    print(f"카테고리: {category}, 단어들: {', '.join(words)} => 생성된 문장들:")
    for sentence in generated_sentences:
        print(f"- {sentence}")

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


카테고리를 입력하세요 (예: 일상 대화, 주문, 요청, 건강, 교육):  요청
단어들을 입력하세요 (예: 나, 밥, 먹다):  나, 물


카테고리: 요청, 단어들: 나, 물 => 생성된 문장들:
- 요청: 나 물 좀 주세요, 부디 허락해 주시기 바랍니다.
- 요청: 나 물 좀 주시겠어요? 정말 부탁드립니다.
- 요청: 나 물 좀 주시면 정말 감사하겠습니다.
- 요청: 나 물 좀 주시면 정말 고맙겠습니다.
- 요청: 나 물 한 잔 주실 수 있우리 이 음식 맛있게 먹었어.
