## GPT (Generative Pre-trained TGransformer)
* Transformer
    * 시퀀스-투-시퀀스(sequence-to-sequence) : 임의의 시퀀스를 해당 시퀀스와 속성이 다른 시퀀스로 변환하는 작업. 예: 영어 → 한국어 번역 혹은 필리핀 앞바다의 한 달치 기온 데이터를 가지고 앞으로 1주일간 하루 단위로 태풍이 발생할지를 맞히는 과제(기온의 시퀀스 → 태풍 발생 여부의 시퀀스)
    * Transformer는 2017년 구글이 제안한 시퀀스-투-시퀀스(sequence-to-sequence) 모델
* LLM (a Large Language Model)
    * 언어 모델 : 이전 단어들을 바탕으로 다음에 나올 단어나 문장을 예측하는 모델
* 종류
    * GPT-1 : 117M 파라미터. 최초로 발표된 GPT 모델
    * GPT-2 : 117M ~ 1.5B 파라미터
    * GPT-3 : 125M ~ 175B 파라미터
    * DistilGPT2 : 82M 파라미터. GPT-2 모델의 경량화 버전
    * GPT-Neo : 125M ~ 2.7B 파라미터
    *
<img src="img.jpg">

* https://ratsgo.github.io/nlpbook/docs/language_model/bert_gpt/
* https://www.youtube.com/watch?v=Zx2MHdRgAIc


In [23]:
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM

In [24]:
print(f"PyTorch version: {torch.__version__}")
print(f"Is MPS (Metal Performance Shader) built? {torch.backends.mps.is_built()}")
print(f"Is MPS available? {torch.backends.mps.is_available()}")
device = "mps" if torch.backends.mps.is_available() else "cpu"
print(f"Using device: {device}")

PyTorch version: 2.0.0
Is MPS (Metal Performance Shader) built? True
Is MPS available? True
Using device: mps


In [25]:
model_name = "EleutherAI/gpt-neo-2.7B"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name).to("cuda")

def generate_response(input_text):
    # 토큰화
    input_ids = tokenizer.encode(input_text, return_tensors="pt").to("cuda")
    # 모델 예측
    output = model.generate(
        input_ids,
        do_sample=True,
        max_length=1000,
        top_p=0.92,
        top_k=0,
        temperature=1.0,
        pad_token_id=tokenizer.eos_token_id,
    )
    # 출력 텍스트 생성
    response_text = tokenizer.decode(output[0], skip_special_tokens=True)
    return response_text

In [26]:
input_text = "안녕하세요! 오늘 날씨가 좋네요."
response_text = generate_response(input_text)
print(response_text)

KeyboardInterrupt: 