In [5]:
from transformers import BertLMHeadModel,AutoModelForTokenClassification, AutoTokenizer, AutoModelForCausalLM

# 1. 모델과 토크나이저 로드
model_path = 'huawei-noah/TinyBERT_General_4L_312D'
model = BertLMHeadModel.from_pretrained(model_path, is_decoder=True)
tokenizer = AutoTokenizer.from_pretrained(model_path)

# 2. 모델을 float16으로 변환
model.half()  # 또는 model.to(dtype=torch.float16)

# 3. 입력 텍스트 토큰화
inputs = tokenizer("Hello, world!", return_tensors="pt")

# 4. 모델에 입력 데이터를 전달하여 예측 수행
outputs = model(**inputs)

Some weights of BertForTokenClassification were not initialized from the model checkpoint at huawei-noah/TinyBERT_General_4L_312D and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.


TokenClassifierOutput(loss=None, logits=tensor([[[-0.0158, -0.1300],
         [ 0.0681, -0.0086],
         [-0.0717,  0.0491],
         [-0.0216, -0.0343],
         [-0.1367,  0.0560],
         [ 0.0097,  0.1245]]], dtype=torch.float16), hidden_states=None, attentions=None)


In [8]:
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 1. 모델과 토크나이저 로드
model_name = "heegyu/kogpt-j-base"  # 또는 다른 한국어 GPT 모델
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 2. 입력 텍스트 설정
input_text = "안녕하세요, 오늘 날씨는 어떤가요?"

# 3. 입력 텍스트 토큰화
inputs = tokenizer(input_text, return_tensors="pt")

# 4. 모델에 입력 데이터를 전달하여 예측 수행 (텍스트 생성)
with torch.no_grad():
    outputs = model.generate(
        inputs['input_ids'], 
        max_length=50,          # 생성할 최대 토큰 수
        do_sample=True,         # 샘플링 방식 사용 (랜덤성 부여)
        top_k=50,               # 상위 50개의 후보 중에서 선택
        top_p=0.95,             # 누적 확률이 0.95 이하가 될 때까지 후보 고려
        eos_token_id=tokenizer.eos_token_id,
        early_stopping=True     # EOS 토큰이 나오면 조기 종료
    )

# 5. 생성된 텍스트 디코딩 및 출력
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("모델 응답:", generated_text)

config.json:   0%|          | 0.00/872 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/667M [00:00<?, ?B/s]

Some weights of the model checkpoint at heegyu/kogpt-j-base were not used when initializing GPTJForCausalLM: ['transformer.h.0.attn.bias', 'transformer.h.0.attn.masked_bias', 'transformer.h.1.attn.bias', 'transformer.h.1.attn.masked_bias', 'transformer.h.10.attn.bias', 'transformer.h.10.attn.masked_bias', 'transformer.h.11.attn.bias', 'transformer.h.11.attn.masked_bias', 'transformer.h.2.attn.bias', 'transformer.h.2.attn.masked_bias', 'transformer.h.3.attn.bias', 'transformer.h.3.attn.masked_bias', 'transformer.h.4.attn.bias', 'transformer.h.4.attn.masked_bias', 'transformer.h.5.attn.bias', 'transformer.h.5.attn.masked_bias', 'transformer.h.6.attn.bias', 'transformer.h.6.attn.masked_bias', 'transformer.h.7.attn.bias', 'transformer.h.7.attn.masked_bias', 'transformer.h.8.attn.bias', 'transformer.h.8.attn.masked_bias', 'transformer.h.9.attn.bias', 'transformer.h.9.attn.masked_bias']
- This IS expected if you are initializing GPTJForCausalLM from the checkpoint of a model trained on anoth

tokenizer_config.json:   0%|          | 0.00/790 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.27M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/925k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/3.07M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/96.0 [00:00<?, ?B/s]



모델 응답: 안녕하세요, 오늘 날씨는 어떤가요?
네, 날씨는 계속 흐리네요. 바람이 불어서요. 저도 날씨가 좀 안 좋을 때가 있어요. 이번 주에는 날씨 이야기를 좀 더 해보도록 하겠습니다.
네, 날씨가 좀 더 좋아지긴 했는데 날씨는 좀 변화가 좀 있는
