In [4]:
from pydantic import BaseModel, Field

In [5]:
from transformers import PreTrainedTokenizerFast, GPT2LMHeadModel
from pydantic import BaseModel, Field

tokenizer = PreTrainedTokenizerFast.from_pretrained("skt/kogpt2-base-v2",
  bos_token='</s>', eos_token='</s>', unk_token='<unk>',
  pad_token='<pad>', mask_token='<mask>') 


import torch

model = GPT2LMHeadModel.from_pretrained('skt/kogpt2-base-v2')

class Input(BaseModel):
    text: str = Field(
    title = '문장을 입력해주세요',
    max_length = 128
    )
    max_length: int = Field(
    128,
    ge = 5,
    le = 128
    )
    repetition_penalty: float = Field(
    2.0,
    ge = 0.0,
    le = 2.0
    )
        
class Output(BaseModel):
    generated_text: str
        
def generate_text(input: Input) -> Output:

    input_ids = tokenizer.encode(input.text)
    gen_ids = model.generate(torch.tensor([input_ids]),
        max_length=input.max_length,
        repetition_penalty=input.repetition_penalty,
        pad_token_id=tokenizer.pad_token_id,
        eos_token_id=tokenizer.eos_token_id,
        bos_token_id=tokenizer.bos_token_id,
        use_cache=True)

    generated = tokenizer.decode(gen_ids[0,:].tolist())

    return Output(generated_text=generated)

In [2]:
text = '멘탈이 나갔으면'
input_ids = tokenizer.encode(text)
gen_ids = model.generate(torch.tensor([input_ids]),
    max_length=128,
    repetition_penalty=2.0,
    pad_token_id=tokenizer.pad_token_id,
    eos_token_id=tokenizer.eos_token_id,
    bos_token_id=tokenizer.bos_token_id,
    use_cache=True)

generated = tokenizer.decode(gen_ids[0,:].tolist())

print(generated)

멘탈이 나갔으면 좋겠다”고 말했다.
한편 이날 행사에는 박원순 서울시장, 김황식 국무총리, 이낙연 국무총리 등 정부 주요 인사와 시민, 학생 등이 참석했다.</d> 서울중앙지검 특수1부(부장검사 이원석)는 지난해 11월부터 올 1월까지 전국경제인연합회(전경련) 사무실 등을 압수수색하고 관련자 10여명을 소환조사했다고 2일 밝혔다.
검찰은 전경련의 자금관리 담당 임원들을 상대로 회장단 회의록과 회계장부, 컴퓨터 하드디스크를 확보했다.
또 회원사들로부터 회삿돈으로 받은 돈의 사용처를 추적하는 한편 전·현직 임직원들의


In [3]:
text = '언제까지 그렇게 살텐가'
input_ids = tokenizer.encode(text)
gen_ids = model.generate(torch.tensor([input_ids]),
    max_length=128,
    repetition_penalty=2.0,
    pad_token_id=tokenizer.pad_token_id,
    eos_token_id=tokenizer.eos_token_id,
    bos_token_id=tokenizer.bos_token_id,
    use_cache=True)

generated = tokenizer.decode(gen_ids[0,:].tolist())

print(generated)

언제까지 그렇게 살텐가?"
"그럼, 그건 내가 알아서 할게요. 아빠는 내일 아침 일찍 일어나서 우리 집에 오셔야 해요! 그리고 오늘은 제가 저녁을 먹으러 갈 거예요, 엄마."
아이는 울음을 터뜨렸다.
엄마는 아이를 안고 집으로 돌아왔다.
그리고 엄마가 돌아오기 전에 다시 한 번 아이의 얼굴을 보았다.
이제 아이는 눈을 뜨고 있었다.
눈물이 핑 돌았다.
아이에게 눈물은 없었다.
하지만 아이와 함께 있는 시간은 점점 더 길어졌다.
어느새 아이가 잠들어 버렸다.
나는 이불을 뒤집어쓰고 방문을 열었다.
방문이 열리자마자 나는 문 앞에 서서 기다릴
