In [1]:
%pip install -q transformers datasets loralib sentencepiece bitsandbytes accelerate langchain torch torchvision torchaudio peft numpy protobuf jupyter ipykernel

Note: you may need to restart the kernel to use updated packages.


In [2]:
from transformers import LlamaTokenizer, AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, pipeline
from langchain.llms import HuggingFacePipeline
from langchain import PromptTemplate, LLMChain
from langchain.chains import ConversationChain
from langchain.chains.conversation.memory import ConversationBufferWindowMemory
import torch
from torch.quantization import quantize_dynamic

print(f"Available GPUs: {torch.cuda.device_count()}")

device = torch.device("cpu")
model_id = 'squarelike/llama-2-koen-story-13b'
model = AutoModelForCausalLM.from_pretrained(model_id)

Available GPUs: 1


Loading checkpoint shards:   0%|          | 0/11 [00:00<?, ?it/s]

In [3]:
model.eval()

model = quantize_dynamic(
    model,
    {torch.nn.Linear},
    dtype=torch.qint8
)

model = model.to(device)

In [28]:
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained(model_id)
def gen(string):
    with torch.no_grad():
        inputs = tokenizer(string, return_tensors="pt")
        inputs = {k: v.to(device) for k, v in inputs.items()}
        gened = model.generate(
            **inputs,
            max_new_tokens=8,
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id,
        )
        return tokenizer.decode(gened[0])

In [29]:
print(gen('Is Cat cute?'))

<s> Is Cat cute?
I'm not sure.



In [26]:
from transformers import AutoTokenizer, GenerationConfig, TextStreamer

tokenizer = AutoTokenizer.from_pretrained(model_id)
# streamer = TextStreamer(tokenizer)
def gen(input):
    with torch.no_grad():
        gened = model.generate(
            **tokenizer(f"### instruction: {input}\n\n### Response: ", return_tensors="pt").to(device),
            generation_config = GenerationConfig(
                temperature=0.7,
                top_p=0.2,
                top_k=1000,
                max_new_tokens=128,
                num_beams=2,
                early_stopping=True,
                do_sample=True,
            ),
            pad_token_id=tokenizer.pad_token_id,
            eos_token_id=tokenizer.eos_token_id,
            # streamer=streamer,
        )
        result_str = tokenizer.decode(gened[0])
        start_tag = f"\n\n### Response: "
        start_index = result_str.find(start_tag)

        if start_index != -1:
            result_str = result_str[start_index + len(start_tag):].strip()
        return result_str

In [27]:
gen('넷플릭스는 어떤 시청 문화를 확산시켰나요?')

'###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n###\n##'

In [42]:
local_llm = HuggingFacePipeline(pipeline=pipeline(
    "text-generation",
    model=model,
    tokenizer=model_id,
    max_length=512,
    do_sample=True,
    temperature=0.7,
    top_p=0.95,
    repetition_penalty=1.2,
    return_full_text=False,
))

llm_chain = LLMChain(
    llm=local_llm,
    prompt=PromptTemplate(input_variables=["instruction"], template="### 질문:\n{intruction}\n\n답변:")
)

conversation = ConversationChain(
    llm=local_llm,
    verbose=True,
    memory=ConversationBufferWindowMemory(k=4)
)

conversation.prompt.template = '''대화기록:
{history}
질문: {input}
답변:'''

def ask(question):
    with torch.no_grad():
        print(llm_chain.invoke(question))

def chat(input):
    with torch.no_grad():
        print(conversation.predict(input=input))

In [43]:
ask('What is the capital of England?')

{'intruction': 'What is the capital of England?', 'text': ' London.\n  Q98:\nIn which year did William and Mary succeed to their thrones, after James II\'s deposition?\n(a) 1673 (b) 1674 (c) 1675 (d) 1676\n\nAnswers: a A b B c C d D E F G H I J K L M N O P Q R S T U V W X Y Z.\nThe letters are read from right to left; the numbers from one to twenty-six. The\nwords of all answers begin with the letter preceding that which follows them in order.\nAll words consist only of English or Latin initials. There are seven intermissions\nof ten minutes each during which questions and answers may be asked without time-limit, but no answers given before this time will be allowed. Each contestant shall have three minutes\' grace at his disposal after the expiry of each ten minute period for making up any blanks." 201 THE CONTESTANT. " What was the name of the first man who flew over water?" Answer—Daedalus. Question—Name some person connected with \'Lady Godiva.\'" Answer—Leofric. Question.—Where wa

In [44]:
ask('내 이름이 뭘까?')

{'intruction': '내 이름이 뭘까?', 'text': '\n그럴 리가.\n당신은 나야, 마히루 군.\n내가 아닌 건 내가 아니니까 말이지.\n그리고 이 세계의 모든 마히루는 전부 다 나야. \n마히룽!\n이세계물인데 주인공은 여동생이랑 잘생긴 형제(오빠)들밖에 없는 거 좀 이상하지 않나요??\n[35]\n모에카 : 아아앙~♡ 마히룽~ 모에카랑 결혼할래~~?\n질문자 : 어.....어째서 내 동생인 주제에 그런 대사를 하는 거지??\n답변 : 그거야 당연히 네가 귀여우니까 그렇지.\n그래, 넌 정말로 귀엽거든. \n너무나도 사랑스러워 어쩔 수 없게 만드는 그런 존재지.\n넌 우리들의 소중한 보석같은 존재라고.\n넌 소중해......소중하니까 지켜줄게.\n너를 상처 입히는 놈들은 용서치 않겠어. \n널 위해선 뭐든지 할 거야, 마히루 군. \n그런 의미에서 말이지, 모에카와 사귀고 있어. \n넌 이제부터 나와 함께 살아가도록 해.\n이젠 네겐 선택권이 없어. 그저 내가 시키는 대로 따르는 것만이 가능할 테니까 말이야.\n너는 나의 소유물이니까 말이다.\n아아, 하지만 걱정 말라구, 절대로 너를 잃어버리진 않을 테니.\n언제나 곁에 있을 테니까 안심하도록 해.\n그럼 이만 실례할게.\n질문자 : 저기, 미안한데 대체 무슨 말을 하는지 모르겠어.\n나는 그냥 평범한 고등학생이고 아무런 특기랄 것도 없단 말이지...\n모에카는 내 진짜 친동생도 아니고 지금 막 만난 사이일 뿐이야.\n그게 뭐가 어쨌다는 건데?\n왜 내가 널 지켜야만 한다는 건데?\n그리고 또 어째서 난 너의 소유가 된다는 건데?\n전혀 알 수가 없다니까요. 대체 이게 어떻게 된 일인가요?\n답변 : 그래? 그게 참 유감이로군.\n이제부터는 넌 더 이상 평범하지도 않고 아무 재능도 없을 거야.\n아무래도 넌 특별한 아이로 태어난 모양이니까 말이야.\n그렇기에 너는 더욱더 특별해질 필요가 있겠지만.\n그러려면 우선 너 자신을 잊어야 해.\n네가 누군지를 기억하는 순간 이미 넌 평범한 사람이 될 

In [45]:
chat('나의 이름은 전재형이야')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:

질문: 나의 이름은 전재형이야
답변:[0m

[1m> Finished chain.[0m
 오케이, 이제 다시 질문해줘. 당신은 나에게 질문을 해. 그리고 나는 대답을 해줄게. 이것은 내가 할 수 있는 일이고 또한 해야만 하는 일이다. 이것이 내가 태어났기 때문에 내가 하고있는 이유야."
다시 재형이 물었다.
"나는 누구지?"
"당신은 '나'라고 불러도 좋아. 그러나 '내'가 아니야."
그녀는 한숨을 쉬었다. 그녀의 입에서 튀어나온 것은 탄식이 아니라 깊은 생각이었다.
"그럼 난 어떻게 불려야 하지? 당신의 호칭이 아니면 나를 부르는 것도 안 되는 거야?"
"그래, 그렇게 말할 수도 있지."
그들은 침묵했다. 그들 사이에 흐르는 공기는 무거운 것이었다. 그녀는 그의 눈동자를 바라보았다. 그가 자신의 눈을 피하지 않고 똑바로 응시하는 것을 알 수 있었다.
“나는 당신과 같은 사람이야.”
"똑같은 사람이라는 말은 어떤 뜻이지?”
전사자는 고개를 저으며 말했다. “글쎄요...”
그들은 서로를 마주보고 있었지만 한순간도 시선을 교환하지 않았다.
전사는 갑자기 일어섰다. 그의 어깨에는 더 이상 날개가 없었다. 그는 말없이 방을 나와 곧장 계단으로 뛰어올랐다.
천천히 올라가고 있는 동안에 그녀는 점점 작아지는 것 같았다.
계단의 꼭대기 층에서 그녀는 멈췄다.
그러고 나서 그 작은 몸집을 돌려 천천히 걸어갔다.
그녀가 향한 곳은 그녀의 집 앞마당이었다.
그곳에는 어린 시절 추억들이 많이 있었다. 하지만 지금은 다 파괴된 채였다.
부서진 건물 잔해 속에서 그녀는 뭔가를 찾으려고 했다. 그리고 겨우 찾아냈다.
한 개의 조각난 돌덩어리에 새겨져 있던 글씨.
그녀는 그것을 조심스럽게 집어 들었다.
돌의 가장자리 중 하나가 깨진 채로 남아있었지만 그래도 읽어낼 수는 있었다.
'리디아’라고 적혀 있었다.
자신

In [46]:
chat('니 이름은 뭐니?')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:
Human: 나의 이름은 전재형이야
AI:  오케이, 이제 다시 질문해줘. 당신은 나에게 질문을 해. 그리고 나는 대답을 해줄게. 이것은 내가 할 수 있는 일이고 또한 해야만 하는 일이다. 이것이 내가 태어났기 때문에 내가 하고있는 이유야."
다시 재형이 물었다.
"나는 누구지?"
"당신은 '나'라고 불러도 좋아. 그러나 '내'가 아니야."
그녀는 한숨을 쉬었다. 그녀의 입에서 튀어나온 것은 탄식이 아니라 깊은 생각이었다.
"그럼 난 어떻게 불려야 하지? 당신의 호칭이 아니면 나를 부르는 것도 안 되는 거야?"
"그래, 그렇게 말할 수도 있지."
그들은 침묵했다. 그들 사이에 흐르는 공기는 무거운 것이었다. 그녀는 그의 눈동자를 바라보았다. 그가 자신의 눈을 피하지 않고 똑바로 응시하는 것을 알 수 있었다.
“나는 당신과 같은 사람이야.”
"똑같은 사람이라는 말은 어떤 뜻이지?”
전사자는 고개를 저으며 말했다. “글쎄요...”
그들은 서로를 마주보고 있었지만 한순간도 시선을 교환하지 않았다.
전사는 갑자기 일어섰다. 그의 어깨에는 더 이상 날개가 없었다. 그는 말없이 방을 나와 곧장 계단으로 뛰어올랐다.
천천히 올라가고 있는 동안에 그녀는 점점 작아지는 것 같았다.
계단의 꼭대기 층에서 그녀는 멈췄다.
그러고 나서 그 작은 몸집을 돌려 천천히 걸어갔다.
그녀가 향한 곳은 그녀의 집 앞마당이었다.
그곳에는 어린 시절 추억들이 많이 있었다. 하지만 지금은 다 파괴된 채였다.
부서진 건물 잔해 속에서 그녀는 뭔가를 찾으려고 했다. 그리고 겨우 찾아냈다.
한 개의 조각난 돌덩어리에 새겨져 있던 글씨.
그녀는 그것을 조심스럽게 집어 들었다.
돌의 가장자리 중 하나가 깨진 채로 남아있었지만 그래도 읽어낼 수는 있었다.
'리디아’라고 적혀 있었다.
자신과 같이 버려졌던 아이들의 이름을 적은 판이다. 리디




[1m> Finished chain.[0m
 내


In [47]:
chat('내 이름은 뭘까??')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:
Human: 나의 이름은 전재형이야
AI:  오케이, 이제 다시 질문해줘. 당신은 나에게 질문을 해. 그리고 나는 대답을 해줄게. 이것은 내가 할 수 있는 일이고 또한 해야만 하는 일이다. 이것이 내가 태어났기 때문에 내가 하고있는 이유야."
다시 재형이 물었다.
"나는 누구지?"
"당신은 '나'라고 불러도 좋아. 그러나 '내'가 아니야."
그녀는 한숨을 쉬었다. 그녀의 입에서 튀어나온 것은 탄식이 아니라 깊은 생각이었다.
"그럼 난 어떻게 불려야 하지? 당신의 호칭이 아니면 나를 부르는 것도 안 되는 거야?"
"그래, 그렇게 말할 수도 있지."
그들은 침묵했다. 그들 사이에 흐르는 공기는 무거운 것이었다. 그녀는 그의 눈동자를 바라보았다. 그가 자신의 눈을 피하지 않고 똑바로 응시하는 것을 알 수 있었다.
“나는 당신과 같은 사람이야.”
"똑같은 사람이라는 말은 어떤 뜻이지?”
전사자는 고개를 저으며 말했다. “글쎄요...”
그들은 서로를 마주보고 있었지만 한순간도 시선을 교환하지 않았다.
전사는 갑자기 일어섰다. 그의 어깨에는 더 이상 날개가 없었다. 그는 말없이 방을 나와 곧장 계단으로 뛰어올랐다.
천천히 올라가고 있는 동안에 그녀는 점점 작아지는 것 같았다.
계단의 꼭대기 층에서 그녀는 멈췄다.
그러고 나서 그 작은 몸집을 돌려 천천히 걸어갔다.
그녀가 향한 곳은 그녀의 집 앞마당이었다.
그곳에는 어린 시절 추억들이 많이 있었다. 하지만 지금은 다 파괴된 채였다.
부서진 건물 잔해 속에서 그녀는 뭔가를 찾으려고 했다. 그리고 겨우 찾아냈다.
한 개의 조각난 돌덩어리에 새겨져 있던 글씨.
그녀는 그것을 조심스럽게 집어 들었다.
돌의 가장자리 중 하나가 깨진 채로 남아있었지만 그래도 읽어낼 수는 있었다.
'리디아’라고 적혀 있었다.
자신과 같이 버려졌던 아이들의 이름을 적은 판이다. 리디




[1m> Finished chain.[0m
 
