# Qwen2.5-7B-Instruct 같은 모델을 AutoModelForCausalLM으로 로드

In [1]:
# 1. 필요한 라이브러리 임포트
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# 2. 모델 이름 지정
model_name = "Qwen/Qwen3-4B-Instruct-2507"

# 3. 토크나이저 로드
print("토크나이저 로딩 중...")
tokenizer = AutoTokenizer.from_pretrained(model_name)

# 4. 모델 로드 (GPU 사용)
print("모델 로딩 중... (1-2분 소요)")
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,  # 메모리 절약
    device_map="auto"  # GPU에 자동 배치
)

print("✅ 모델 로드 완료!")

# 5. 간단한 테스트
prompt = "한국의 수도는 어디인가요?"

# 토크나이저로 텍스트 → 숫자 변환
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)

# 텍스트 생성
print("\n생성 중...")
outputs = model.generate(
    **inputs,
    max_new_tokens=100,
    temperature=0.9
)

# 숫자 → 텍스트 변환
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(f"\n응답:\n{response}")

  from .autonotebook import tqdm as notebook_tqdm


토크나이저 로딩 중...
모델 로딩 중... (1-2분 소요)


`torch_dtype` is deprecated! Use `dtype` instead!
Fetching 3 files: 100%|██████████| 3/3 [01:05<00:00, 21.68s/it]
Loading checkpoint shards: 100%|██████████| 3/3 [00:02<00:00,  1.15it/s]


✅ 모델 로드 완료!

생성 중...

응답:
한국의 수도는 어디인가요? 한국의 수도는 **서울**입니다.  

서울은 한국의 정치, 경제, 문화, 교육 중심지로, 대한민국의 행정 중심지이자 최대 도시입니다. 서울은 1946년 1월 16일, 서울을 수도로 지정하여 현재까지 이어져 왔습니다.  

또한, 서울은 국제적인 도시로서 세계 여러 나라와의 교류를 활발히


In [7]:
# 방법 1: encode → decode로 확인
text = "한국의 수도는 어디인가요?"

# 토큰 ID로 변환
token_ids = tokenizer.encode(text)
print("토큰 ID:", token_ids)

# 각 토큰을 문자열로 확인
tokens = [tokenizer.decode([token_id]) for token_id in token_ids]
print("토큰:", tokens)

# 방법 2: convert_ids_to_tokens 사용 (내부 표현)
internal_tokens = tokenizer.convert_ids_to_tokens(token_ids)
print("내부 토큰:", internal_tokens)

토큰 ID: [23573, 124785, 20401, 134013, 16560, 139740, 31328, 19969, 35711, 30]
토큰: ['한', '국', '의', ' 수도', '는', ' 어디', '인', '가', '요', '?']
내부 토큰: ['íķľ', 'êµŃ', 'ìĿĺ', 'ĠìĪĺëıĦ', 'ëĬĶ', 'Ġìĸ´ëĶĶ', 'ìĿ¸', 'ê°Ģ', 'ìļĶ', '?']
