In [2]:
from langchain_huggingface import HuggingFacePipeline
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

model_id = "skt/kogpt2-base-v2"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id)

text_gen = pipeline(
    task= "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_length=100,
    truncation=True,
    do_sample=True,
    temperature=0.7,
    device = -1
)

llm = HuggingFacePipeline(pipeline=text_gen)
prompt = "산 속에 토끼 한 마리가 살고 있었습니다. 그러던 어느 날"
response = llm.invoke(prompt)
print(response)



Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


산 속에 토끼 한 마리가 살고 있었습니다. 그러던 어느 날 토끼가 토끼와 함께 마을로 들어왔습니다. 토끼는 그곳에서 토끼를 잡아먹은 뒤 마을을 떠나는 꿈을 꿨습니다. 그런데 토끼는 마을로 돌아온 뒤 토끼를 붙잡아 마을 밖으로 내쫓고 말았습니다.


In [3]:
# langchain 만 사용
from langchain_huggingface import HuggingFacePipeline
model_id = "skt/kogpt2-base-v2"
model_opt = {
    "do_sample": True,
    "temperature": 0.7,
}
pipeline_opt = {
    "max_length": 100,
    "truncation": True,
}

llm = HuggingFacePipeline.from_model_id(
    task = "text-generation",
    model_id=model_id,
    model_kwargs=model_opt,
    pipeline_kwargs=pipeline_opt,
    device = -1
)

prompt = "산 속에 토끼 한 마리가 살고 있었습니다. 그러던 어느 날"

response = llm.invoke(prompt)
print(response)

Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


산 속에 토끼 한 마리가 살고 있었습니다. 그러던 어느 날 토끼를 발견했습니다. 토끼는 '저 괴물이 이쪽 저쪽 저쪽 저쪽을 왔다 갔다 하는 줄 알고 저를 찾아왔어요. 그래서 그 괴물이 저쪽


In [4]:
#[Q&A]
from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline
from langchain_huggingface import HuggingFacePipeline

model_id = "monologg/koelectra-base-v3-finetuned-korquad"
tokenizer = AutoTokenizer.from_pretrained(model_id)
tokenizer_opt = {
    "max_length": 512,
    "truncation": True,
}
model = AutoModelForQuestionAnswering.from_pretrained(model_id)

qa_pipeline = pipeline(
    task="question-answering",
    model=model,
    tokenizer=tokenizer,
    tokenizer_kwargs=tokenizer_opt,
    device=-1
)
question = "세종대왕은 어떤 업적을 남겼나요?"
context = (
    "세종대왕은 조선의 네 번쨰 왕으로, 한글을 창제하고 과학, 음악, 농업 등 다양한 분야에서 업적을 남겼습니다."
    "그능 집현저을 설치하고 학문을 장려하였으며, 측우기와 해시계 등의 과학 기구 개발을 지원했습니다."
)

response = qa_pipeline(question=question, context=context)
print(response['answer'])


Device set to use cpu


한글을 창제하고 과학, 음악, 농업


In [5]:
# prompt template 사용
from langchain_huggingface import HuggingFacePipeline
from langchain_core.prompts import PromptTemplate

model_id = "skt/kogpt2-base-v2"
model_opt = {
    "do_sample": True,
    "temperature": 0.7,
}
pipeline_opt = {
    "max_length": 100,
    "truncation": True,
}
llm = HuggingFacePipeline.from_model_id(
    task = "text-generation",
    model_id=model_id,
    model_kwargs=model_opt,
    pipeline_kwargs=pipeline_opt,
    device = -1
)

template = "산 속에 {animal} 한 마리가 살고 있었습니다. 그러던 어느 날"
prompt = PromptTemplate.from_template(template)

chain = prompt | llm
response = chain.invoke({"animal": "토끼"})
print(response)



Device set to use cpu
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


산 속에 토끼 한 마리가 살고 있었습니다. 그러던 어느 날 토끼가 나타나서 토끼에게 다가가서 꼼짝도 하지 않고 있습니다. 그런데 그 토끼가 어딘가로 사라져버렸습니다. 어딘가로 사라져버린 토끼는 왜 토끼를 찾아왔을
