# Phase 1: 환경 구성 체크

## 목표
- Python 환경 확인
- GPU 사용 가능 여부 확인
- 필수 라이브러리 설치 및 테스트
- Hugging Face 기본 사용법 익히기

## 1. 기본 환경 체크

In [1]:
import sys
import platform

print(f"Python 버전: {sys.version}")
print(f"운영체제: {platform.system()} {platform.release()}")

Python 버전: 3.13.2 (main, Feb  4 2025, 14:51:09) [Clang 16.0.0 (clang-1600.0.26.6)]
운영체제: Darwin 25.0.0


## 2. PyTorch & GPU 확인

In [2]:
import torch

print(f"PyTorch 버전: {torch.__version__}")
print(f"CUDA 사용 가능: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"GPU 이름: {torch.cuda.get_device_name(0)}")
    print(f"GPU 메모리: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")
else:
    print("⚠️ GPU를 사용할 수 없습니다. CPU로 진행하거나 Colab을 사용하세요.")

PyTorch 버전: 2.9.0
CUDA 사용 가능: False
⚠️ GPU를 사용할 수 없습니다. CPU로 진행하거나 Colab을 사용하세요.


## 3. 필수 라이브러리 확인

In [None]:
# 라이브러리 import 테스트
try:
    import transformers
    import datasets
    import peft
    import bitsandbytes
    import accelerate
    
    print("✅ 모든 필수 라이브러리가 설치되었습니다!")
    print(f"transformers: {transformers.__version__}")
    print(f"datasets: {datasets.__version__}")
    print(f"peft: {peft.__version__}")
    print(f"accelerate: {accelerate.__version__}")
    
except ImportError as e:
    print(f"❌ 라이브러리 설치 필요: {e}")
    print("\n설치 명령어:")
    print("pip install -r requirements.txt")

## 4. 간단한 모델 로딩 테스트 (작은 모델)

본격적인 학습 전에 작은 모델로 테스트

In [None]:
from transformers import AutoTokenizer, AutoModelForCausalLM

# 작은 테스트 모델 (약 250MB)
model_name = "skt/kogpt2-base-v2"

print("모델 로딩 중...")
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

print(f"✅ 모델 로딩 성공!")
print(f"파라미터 수: {model.num_parameters():,}")

## 5. 간단한 텍스트 생성 테스트

In [None]:
# 간단한 생성 테스트
text = "인공지능은"
inputs = tokenizer(text, return_tensors="pt")

outputs = model.generate(
    **inputs,
    max_length=50,
    num_return_sequences=1,
    temperature=0.8,
    do_sample=True
)

generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(f"입력: {text}")
print(f"생성: {generated_text}")

## ✅ Phase 1 체크리스트

- [ ] Python 3.8+ 설치 확인
- [ ] GPU 사용 가능 (또는 Colab 준비)
- [ ] 필수 라이브러리 설치 완료
- [ ] 간단한 모델 로딩/생성 성공

## 다음 단계
Phase 2에서는 실제로 사용할 데이터를 준비합니다!