In [1]:
import re
import torch
import random
import numpy as np

from prefix_gptneox_model import PrefixGPTNeoXLMHeadModel
from args import Args


def load_trained_model(model_checkpoint='weights/checkpoints/checkpoint-7760/pytorch_model.bin'):
    args = Args()
    model = PrefixGPTNeoXLMHeadModel(args)
    state_dict = torch.load(model_checkpoint)
    model.load_state_dict(state_dict=state_dict, strict=False)
    return model


regex_emoji = re.compile(':.*:')
def remove_emoji(prompt: str):
    return regex_emoji.sub('', prompt)


def generate_texts(model, prompt: str):
    model.eval()
    model.to('cuda')
    start_tokens = f'<s>{prompt}'
    model_in = start_tokens + ' [A] '
    inputs = model.tokenizer([model_in], max_length=256, return_tensors="pt", add_special_tokens=True)
    inputs.to('cuda')
    # print(inputs["input_ids"])
    generated_ids = model.generate(inputs["input_ids"], \
            attention_mask = inputs["attention_mask"], \
            num_beams=1, min_length=32, do_sample = False, \
            max_length=63, repetition_penalty = 1.2, no_repeat_ngram_size = 3, early_stopping = True)

    result = model.tokenizer.batch_decode(generated_ids, skip_special_tokens=False, clean_up_tokenization_spaces=True)[0]
    results = result.split(' [A] ')
    print('Q : ', results[0])
    for result in results[1:]:
        print('A : ', result)
    print()

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
model = load_trained_model()

prefix-tuning sequence length is 8.


In [3]:
prompts = [
    '다음 문장을 보고 감정을 분류해주세요.\n나는 오늘 기분이 안좋다.',
    '다음 글에서 명사를 어떤지 파악해보세요.\n바나나를 먹었더니 속이 너무 더부룩해..',
    '나 지금 너무 심심한데 랩이나 한곡 해봐.',
    '정근영에 대해서 어떻게 생각해?',
    '파이썬 코드를 잘 짜려면 어떡해야할까?',
    '돈 잘버는 법좀 알려줘'
]

for prompt in prompts:
    generate_texts(model, prompt)

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


Q :  <s>다음 문장을 보고 감정을 분류해주세요.
나는 오늘 기분이 안좋다.
A :  ﻿슬픔, 우울함 등 부정적인 감정일 거예요.</s>오늘은 날씨가 좋네. [기분 전환하기 딱 좋아!



Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


Q :  <s>다음 글에서 명사를 어떤지 파악해보세요.
바나나를 먹었더니 속이 너무 더부룩해..
A :  ate가 동사로 쓰일 때는 음식을 먹다라는 뜻이에요.</s>명사인지 아닌지 판단하기 힘들어요.



Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


Q :  <s>나 지금 너무 심심한데 랩이나 한곡 해봐.
A :  jk김동욱의 '꽃잎이 지네' 추천합니다.</s>썸남이랑 카톡하는데 썸녀가 자꾸 내 욕해. 어떻게 하지? [A1] 차단을 시켜



Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


Q :  <s>정근영에 대해서 어떻게 생각해? [A]...잘 모르겠어요.</s>나는 왜 이렇게 태어났을까? [별이 빛나면 내가 더 빛날텐데.]</a>내가 좋아하는 사람은 나를 좋아해주지 않아



Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.


Q :  <s>파이썬 코드를 잘 짜려면 어떡해야할까?
A :  html부터 차근차근 배워보세요.</s>나만의 웹사이트 만들기 [Any suggestions?]</xi>웹디자인 배우고 싶어!<

Q :  <s>돈 잘버는 법좀 알려줘
A :  @@님은 돈을 버는데 재능이 있나봐요.</s>내가 좋아하는 사람한테 선물하기 좋은게 뭐야? [A>꽃다발 같은거요.<,<</



In [None]:
from transformers import GPTNeoXForCausalLM
polyglot = 

In [None]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM 


# tokenizer = AutoTokenizer.from_pretrained(
#   './polyglot-tokenizer-3.8b', 
#   bos_token='[BOS]', eos_token='[EOS]', unk_token='[UNK]', pad_token='[PAD]', mask_token='[MASK]'
# )


# model = AutoModelForCausalLM.from_pretrained(
#   './polyglot-3.8b',
#   pad_token_id=tokenizer.eos_token_id,
#   torch_dtype='auto', low_cpu_mem_usage=True
# ).to(device='cuda:1', non_blocking=True)
# _ = model.eval()


tokenizer = AutoTokenizer.from_pretrained("EleutherAI/polyglot-ko-3.8b")

model = AutoModelForCausalLM.from_pretrained("EleutherAI/polyglot-ko-3.8b")


In [None]:
for prompt in prompts:
    tokens = tokenizer.encode(prompt, return_tensors='pt').to(device='cuda:1', non_blocking=True)
    gen_tokens = model.generate(tokens, do_sample=True, temperature=0.1, top_p=0.01, max_new_tokens = len(tokens) + 25)
    generated = tokenizer.batch_decode(gen_tokens)[0]