In [8]:
# 필요한 라이브러리 설치 및 임포트
# !pip install transformers==4.35.0 datasets bitsandbytes accelerate
# !uv pip install transformers==4.35.0 datasets bitsandbytes accelerate

In [None]:
from datasets import load_dataset
from transformers import TrainingArguments
import pandas as pd

# 샘플 데이터셋 생성
sample_data = {
    'text': [
        '안녕하세요. 오늘 날씨가 정말 좋네요.',
        '머신러닝을 공부하는 것은 흥미롭습니다.',
        '파이썬 프로그래밍은 데이터 과학에 유용합니다.',
        '자연어 처리는 AI의 중요한 분야입니다.',
        '딥러닝 모델 훈련에는 많은 데이터가 필요합니다.'
    ]
}

# CSV 파일 생성 및 데이터셋 로드
df = pd.DataFrame(sample_data)
csv_path = './finetune_data.csv'
df.to_csv(csv_path, index=False)

tune_data = load_dataset("csv", data_files=csv_path)
print(f"데이터셋 로드 완료: {len(tune_data['train'])} 샘플")

# 하이퍼파라미터 설정
optim = "paged_adamw_32bit"
learning_rate = 3e-4
weight_decay = 0.01
lr_scheduler_type = 'cosine'
warmup_ratio = 0.03
gradient_accumulation_steps = 4
fp16 = True  # bf16 대신 fp16 사용
gradient_checkpointing = True

# TrainingArguments 설정
training_args = TrainingArguments(
    output_dir='./results',
    num_train_epochs=3,
    per_device_train_batch_size=4,
    gradient_accumulation_steps=gradient_accumulation_steps,
    learning_rate=learning_rate,
    weight_decay=weight_decay,
    warmup_ratio=warmup_ratio,
    lr_scheduler_type=lr_scheduler_type,
    optim=optim,
    fp16=fp16,  # GPU 환경이 아닐 때 bf16 대신 fp16 사용
    gradient_checkpointing=gradient_checkpointing,
    logging_steps=10,
    save_steps=100,
    report_to="none"
)

print("TrainingArguments 설정 완료!")
print(f"학습률: {learning_rate}, 옵티마이저: {optim}")
print(f"Gradient 누적: {gradient_accumulation_steps}단계, BF16: {bf16}, Checkpointing: {gradient_checkpointing}")

Generating train split: 0 examples [00:00, ? examples/s]

데이터셋 로드 완료: 5 샘플
TrainingArguments 설정 완료!
학습률: 0.0003, 옵티마이저: paged_adamw_32bit
Gradient 누적: 4단계, BF16: True, Checkpointing: True
