In [None]:
# 1) 현재 커널의 파이썬 인터프리터 경로 확인 (노트북이 .venv 커널을 사용 중인지 확인)
import sys
print('Python executable:', sys.executable)
print('Platform:', sys.platform)

In [None]:
# 2) 필요한 패키지 설치(필요하면 커널을 재시작하세요).
import sys
!{sys.executable} -m pip install --upgrade pip setuptools wheel
!{sys.executable} -m pip install mlx-lm transformers accelerate datasets peft safetensors
print('Install commands finished. If large packages failed, please run them in a terminal with GPU-enabled environment.')

## 3) 데이터 준비
아래는 `datasets` 라이브러리에서 샘플 텍스트를 불러와 토큰화하는 예시입니다. 실제 데이터셋으로 교체하세요.

In [None]:
from datasets import load_dataset
dataset = load_dataset('wikitext', 'wikitext-2-raw-v1', split='train[:1%]')
print(dataset[0])

In [None]:
# 4) 모델/토크나이저 로드(모델 이름을 실제 Gemma 2 24B 식별자로 바꾸세요)
model_name = 'YOUR_GEMMA_2_24B_MODEL_ID'  # 예: 'gemma-2-24b' (실제 repo id 사용)
from transformers import AutoTokenizer, AutoModelForCausalLM
tokenizer = AutoTokenizer.from_pretrained(model_name, use_fast=True)
# 대형 모델은 device_map='auto' 또는 accelerate 환경을 권장합니다.
try:
    model = AutoModelForCausalLM.from_pretrained(model_name, device_map='auto', trust_remote_code=True)
    print('Model loaded (device_map=auto).')
except Exception as e:
    print('모델 로드 실패:', e)
    print('참고: 24B 모델 로드에는 특수한 하드웨어/라이브러리(bsb, f16 등)가 필요합니다.')

## 5) LoRA(PEFT) 예시 설정
아래는 `peft`를 사용해 LoRA를 적용하는 간단한 예시 템플릿입니다. 하이퍼파라미터는 필요에 따라 조정하세요.

In [None]:
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training
import torch

# 이 단계는 모델 타입과 환경에 따라 달라질 수 있습니다.
try:
    # 메모리 절약을 위해 kbit/training용 준비 (옵션)
    model = prepare_model_for_kbit_training(model)
    lora_config = LoraConfig(r=8, lora_alpha=32, target_modules=['q_proj','v_proj'], lora_dropout=0.1, bias='none')
    model = get_peft_model(model, lora_config)
    print('LoRA 적용 완료')
except Exception as e:
    print('LoRA 적용 중 오류:', e)
    print('대형 모델 환경에서는 추가 설정이 필요합니다.')

## 6) 간단한 학습 루프(Trainer 사용 템플릿)
아래는 `transformers.Trainer`를 이용한 아주 기본적인 템플릿입니다. 실제 대형 모델은 `accelerate`와 분산/혼합정밀도 설정이 필요합니다.

In [None]:
from transformers import Trainer, TrainingArguments, DataCollatorForLanguageModeling

# 토크나이즈 함수
def tokenize_fn(examples):
    return tokenizer(examples['text'], truncation=True, max_length=512)

tok_ds = dataset.map(tokenize_fn, batched=True, remove_columns=dataset.column_names)
data_collator = DataCollatorForLanguageModeling(tokenizer=tokenizer, mlm=False)

training_args = TrainingArguments(
    output_dir='checkpoints',
    per_device_train_batch_size=1,
    gradient_accumulation_steps=8,
    num_train_epochs=1,
    fp16=True,
    optim='adamw_torch',
    logging_steps=10,
    save_strategy='epoch'
)

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tok_ds,
    data_collator=data_collator,
)

# 실제 실행은 환경(다중 GPU, bfloat16/FP16, bitsandbytes 등)에 따라 매우 달라집니다.
# 아래는 실행 템플릿입니다 (주석처리 상태로 둡니다).
# trainer.train()
print('Trainer 준비 완료 — 실제 학습은 환경을 확인한 후 `trainer.train()`을 호출하세요.')

---
### 노트
- 실제 `Gemma 2 24B` 또는 동급 모델을 미세조정하려면 멀티-GPU, FSDP 또는 모델 병렬화, bitsandbytes, 적절한 `torch`/`cuda`/`accelerate` 설정이 필요합니다.
- 이 노트북은 템플릿이며, 모델 리포지토리 이름(`model_name`)과 하드웨어에 맞게 수정해야 합니다.
- 원하시면 제가 이 템플릿을 기반으로 `accelerate config` 파일 생성과 `run` 스크립트까지 만들어 드립니다.