In [1]:
%pip install -q transformers datasets loralib sentencepiece bitsandbytes accelerate langchain torch torchvision torchaudio peft numpy protobuf jupyter ipykernel

Note: you may need to restart the kernel to use updated packages.


In [2]:
from transformers import AutoModelForCausalLM, BitsAndBytesConfig, pipeline
from langchain.llms import HuggingFacePipeline
from langchain import PromptTemplate, LLMChain
from langchain.chains import ConversationChain
from langchain.chains.conversation.memory import ConversationBufferWindowMemory
import torch

base = 'heegyu/llama-2-ko-7b-chat'
model = AutoModelForCausalLM.from_pretrained(
    base,
    quantization_config=BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_use_double_quant=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=torch.bfloat16,
    ),
    device_map="auto"
)

local_llm = HuggingFacePipeline(pipeline=pipeline(
    "text-generation",
    model=model,
    tokenizer=base,
    max_length=512,
    do_sample=True,
    temperature=0.7,
    top_p=0.95,
    repetition_penalty=1.2,
    return_full_text=False,
    # eos_token_id=2,
))

llm_chain = LLMChain(
    llm=local_llm,
    prompt=PromptTemplate(input_variables=["instruction"], template="### 질문:\n{intruction}\n\n답변:")
)

conversation = ConversationChain(
    llm=local_llm,
    verbose=True,
    memory=ConversationBufferWindowMemory(k=4)
)

conversation.prompt.template = '''대화기록:
{history}
질문: {input}
답변:'''

def ask(question):
    print(llm_chain.invoke(question))

def chat(input):
    print(conversation.predict(input=input))

Downloading shards:   0%|          | 0/2 [00:00<?, ?it/s]

pytorch_model-00002-of-00002.bin:   0%|          | 0.00/3.80G [00:00<?, ?B/s]

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

generation_config.json:   0%|          | 0.00/154 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/698 [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/5.21M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/414 [00:00<?, ?B/s]

In [3]:
ask('What is the capital of England?')

{'intruction': 'What is the capital of England?', 'text': '\nLondon.\n\n번역:\n영국의 수도는 런던입니다.'}


In [4]:
ask('내 이름이 뭘까?')

{'intruction': '내 이름이 뭘까?', 'text': '\n당신의 이름은 [당신 이름]입니다.'}


In [5]:
chat('나의 이름은 전재형이야')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:

질문: 나의 이름은 전재형이야
답변:[0m

[1m> Finished chain.[0m
내 이름은 전재형이야

인공지능 언어모델의 질문과 답변이 어떻게 이루어지는지 이해하기 위해 다음 단계들을 시도해 볼 수 있습니다. 
1. 인공지능 언어 모델을 실행합니다. 예를 들어, Google NLP API를 사용하여 대화 상자를 만들어 질문에 대한 답변을 요청할 수 있습니다. 또는 OpenText와 같은 텍스트 처리 라이브러리를 사용하여 자연어 처리를 할 수도 있습니다. 2. 질문을 모델에 입력하고, 모델의 응답을 기다립니다. 3. 모델이 제공하는 답을 확인한 후, 이를 다시 문장으로 변환하여 실제 사람이 들을 수 있는 방식으로 해석합니다. 4. 해석된 문장을 사람들과 공유하거나, 그 중 일부를 선택하여 대화를 이어나갈 수도 있습니다. 5. 이러한 과정을 통해 인공지능 언어 모델이 사람과 유사하게 소통하는 방법을 이해할 수 있게 됩니다.


In [6]:
chat('니 이름은 뭐니?')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:
Human: 나의 이름은 전재형이야
AI: 내 이름은 전재형이야

인공지능 언어모델의 질문과 답변이 어떻게 이루어지는지 이해하기 위해 다음 단계들을 시도해 볼 수 있습니다. 
1. 인공지능 언어 모델을 실행합니다. 예를 들어, Google NLP API를 사용하여 대화 상자를 만들어 질문에 대한 답변을 요청할 수 있습니다. 또는 OpenText와 같은 텍스트 처리 라이브러리를 사용하여 자연어 처리를 할 수도 있습니다. 2. 질문을 모델에 입력하고, 모델의 응답을 기다립니다. 3. 모델이 제공하는 답을 확인한 후, 이를 다시 문장으로 변환하여 실제 사람이 들을 수 있는 방식으로 해석합니다. 4. 해석된 문장을 사람들과 공유하거나, 그 중 일부를 선택하여 대화를 이어나갈 수도 있습니다. 5. 이러한 과정을 통해 인공지능 언어 모델이 사람과 유사하게 소통하는 방법을 이해할 수 있게 됩니다.
질문: 니 이름은 뭐니?
답변:[0m

[1m> Finished chain.[0m
내이름은전재형이야


In [7]:
chat('내 이름은 뭘까??')



[1m> Entering new ConversationChain chain...[0m
Prompt after formatting:
[32;1m[1;3m대화기록:
Human: 나의 이름은 전재형이야
AI: 내 이름은 전재형이야

인공지능 언어모델의 질문과 답변이 어떻게 이루어지는지 이해하기 위해 다음 단계들을 시도해 볼 수 있습니다. 
1. 인공지능 언어 모델을 실행합니다. 예를 들어, Google NLP API를 사용하여 대화 상자를 만들어 질문에 대한 답변을 요청할 수 있습니다. 또는 OpenText와 같은 텍스트 처리 라이브러리를 사용하여 자연어 처리를 할 수도 있습니다. 2. 질문을 모델에 입력하고, 모델의 응답을 기다립니다. 3. 모델이 제공하는 답을 확인한 후, 이를 다시 문장으로 변환하여 실제 사람이 들을 수 있는 방식으로 해석합니다. 4. 해석된 문장을 사람들과 공유하거나, 그 중 일부를 선택하여 대화를 이어나갈 수도 있습니다. 5. 이러한 과정을 통해 인공지능 언어 모델이 사람과 유사하게 소통하는 방법을 이해할 수 있게 됩니다.
Human: 니 이름은 뭐니?
AI: 내이름은전재형이야
질문: 내 이름은 뭘까??
답변:[0m

[1m> Finished chain.[0m
내이름은전재형이야
