In [12]:
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.prompts.chat import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)

import torch


In [13]:
from transformers import pipeline, AutoTokenizer, AutoModelForCausalLM

# 모델과 토크나이저를 명시적으로 로드
model_name = "LGAI-EXAONE/EXAONE-3.0-7.8B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True)

# 파이프라인 생성 및 설정
pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device="cuda"
)


Loading checkpoint shards:   0%|          | 0/7 [00:00<?, ?it/s]

KeyboardInterrupt: 

In [11]:

# 입력 텍스트 설정
input_text = """p-축구M인천 ,qN 35c운드 r&Q{영`
위 문장은 축구 관련 기사 제목을 노이징한거야. 원래 제목을  추론해줘.
"""

# 텍스트 생성 시 세부 옵션 지정
output = pipe(
    input_text,
    max_length=100,          # 생성할 텍스트의 최대 길이
    temperature=0.7,        # 다양성 조절 (0.7은 적절한 온도)
    top_k=50,               # 상위 50개의 후보에서 선택
    top_p=0.9,              # 상위 90% 누적 확률에서 선택
    num_return_sequences=1,  # 반환할 응답의 수
    truncation=True  # 텍스트가 max_length를 넘으면 잘라냄
)

print(output)


[{'generated_text': 'p-축구M인천 ,qN 35c운드 r&Q{영`\n위 문장은 축구 관련 기사 제목을 노이징한거야. 원래 제목을  추론해줘.\n\n문장: "M인천, 35라운드에서 승리를 거두며 상위권 진입을 노리고 있다."\n\n추론된 원래 제목:\n"M인천, 35라운드에서 승리하며 상위권 진입 희망"\n\n설명'}]


LangChain에서 Hugging Face 모델을 연결하기 위해, 먼저 Transformers 라이브러리로 모델을 로드한 뒤 pipeline 객체를 생성합니다.

In [2]:
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

# Load the tokenizer and model
tokenizer = AutoTokenizer.from_pretrained("skt/kogpt2-base-v2")
model = AutoModelForCausalLM.from_pretrained("skt/kogpt2-base-v2")



In [3]:

# Define a function for generating a response
def generate_response(prompt, max_length=50):
    # Tokenize the input
    inputs = tokenizer.encode(prompt, return_tensors="pt")
    
    # Generate a response
    outputs = model.generate(inputs, max_length=max_length, num_return_sequences=1, pad_token_id=tokenizer.eos_token_id)
    
    # Decode and return the response
    response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return response

# Example prompt
prompt = "안녕하세요! 오늘 날씨는 어때요?"
response = generate_response(prompt)
print(response)

안녕하세요! 오늘 날씨는 어때요?"
"아니. 오늘은 날씨가 좋아서 좋았어. 오늘은 날씨가 좋아서 좋았어. 오늘은 날씨가 좋아서 좋았어. 오늘은 날씨가 좋아서 좋
