In [None]:
from transformers import ElectraTokenizer, ElectraForQuestionAnswering
import torch

# 한국어 Electra 모델과 토크나이저 불러오기
model_name = "monologg/koelectra-base-v3-finetuned-korquad"
tokenizer = ElectraTokenizer.from_pretrained(model_name)
model = ElectraForQuestionAnswering.from_pretrained(model_name)


qst_lst = ['날씨는 어떻게 알 수 있어?', '날씨 정보 알고 싶은데 알려줘', '카카오톡은 어떻게 하는거야?', '메시지는 어떻게 보내?',
          '주차장 위치를 물어보고 싶은데 방법 좀 알려줘', '주차장 기능은 어떻게 쓰는거야?', '현재 시간은 뭐라고 물어봐야해?', '시간 알려주는 기능 좀 알려줘',
          '현재 온도는 어떻게 알 수 있어?', '현재 온도 알 수 있는 방법 좀 알려줘', '현재 습도 알려주는 기능은 뭐야?', '습도 사용법 좀 알려줘']

for i in range(len(qst_lst)):
    # 예시 질문과 맥락
    question = qst_lst[i]
    context = """
    날씨 정보에 대해서 알고 싶으면 1이다.
    
    날씨 정보는 1이다.
    
    카카오톡에 대해서 알고 싶으면2이다.
    
    메세지에 대해서 알고 싶으면 2이다.
    
    주차장에 대해서 알고 싶으면 3이다.
    
    시간에 대해서 알고 싶으면 4이다.
    
    온도에 대해서 알고 싶으면 5이다.
    
    습도에 대해서 알고 싶으면 6이다.
    """

    # 직접 모델 사용
    inputs = tokenizer(question, context, return_tensors="pt")
    outputs = model(**inputs)
    answer_start_scores = outputs.start_logits
    answer_end_scores = outputs.end_logits

    # argmax를 이용해 context에서 응답의 시작일 확률이 가장 높은 토큰의 위치를 반환
    answer_start = torch.argmax(answer_start_scores)
    # argmax를 이용해 context에서 응답의 끝일 확률이 가장 높은 토큰의 위치를 반환
    answer_end = torch.argmax(answer_end_scores) + 1

    # 토큰화 결과로부터 input_ids만 추출
    input_ids = inputs["input_ids"].tolist()[0]

    # input_ids에서 응답에 해당하는 id를 가져와 토큰으로 변환하고 다시 문자열로 변환
    answer_tokens = tokenizer.convert_ids_to_tokens(input_ids[answer_start:answer_end])
    answer = tokenizer.convert_tokens_to_string(answer_tokens)

    # 스코어 출력
    print("질문:", question)
    print("응답:", answer)
    print("시작 위치 스코어:", float(torch.max(answer_start_scores)))
    print("끝 위치 스코어:", float(torch.max(answer_end_scores)))

질문: 날씨는 어떻게 알 수 있어?
응답: 카카오톡
시작 위치 스코어: 3.109203815460205
끝 위치 스코어: 0.6005146503448486
