# 00. PyTorch 환경 설정 및 기본 라이브러리

## 목표
- Python 환경에 PyTorch 및 필수 라이브러리 설치
- 각 라이브러리의 역할과 용도 이해
- GPU 사용 가능 여부 확인

---

## 1. 필수 라이브러리 목록

### 핵심 라이브러리
1. **PyTorch** - 딥러닝 프레임워크
2. **NumPy** - 수치 연산
3. **Pandas** - 데이터 처리
4. **Matplotlib** - 시각화 (기본)
5. **Seaborn** - 시각화 (고급)

### 추가 라이브러리 (고급)
- **torchvision** - 컴퓨터 비전용 데이터셋 및 모델
- **torchaudio** - 오디오 처리
- **transformers** (Hugging Face) - NLP 모델
- **tensorboard** - 학습 과정 시각화
- **scikit-learn** - 전통적 ML 알고리즘, 전처리
- **tqdm** - Progress bar
- **wandb** - 실험 관리 (Weights & Biases)

## 2. PyTorch 설치

### CPU 버전
```bash
pip install torch torchvision torchaudio
```

### GPU 버전 (CUDA 사용 가능한 경우)
```bash
# CUDA 11.8
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

# CUDA 12.1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
```

**공식 사이트**에서 자신의 환경에 맞는 명령어 확인:
https://pytorch.org/get-started/locally/

In [None]:
# PyTorch import 및 버전 확인
import torch
import torchvision

print("=== PyTorch 정보 ===")
print(f"PyTorch version: {torch.__version__}")
print(f"TorchVision version: {torchvision.__version__}")
print(f"\nCUDA available: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"GPU device: {torch.cuda.get_device_name(0)}")
    print(f"Number of GPUs: {torch.cuda.device_count()}")
else:
    print("CPU만 사용 가능합니다.")

## 3. 기본 라이브러리 import 및 용도

### 3.1 NumPy
- **용도**: 다차원 배열 연산
- **PyTorch와 관계**: Tensor ↔ NumPy array 변환 가능
- **주요 사용**: 데이터 전처리, 수학 연산

In [None]:
import numpy as np

print(f"NumPy version: {np.__version__}")

# NumPy array 생성
arr = np.array([[1, 2, 3], [4, 5, 6]])
print(f"\nNumPy array:\n{arr}")
print(f"dtype: {arr.dtype}, shape: {arr.shape}")

# PyTorch Tensor로 변환
tensor = torch.from_numpy(arr)
print(f"\nPyTorch Tensor:\n{tensor}")
print(f"dtype: {tensor.dtype}, shape: {tensor.shape}")

# Tensor에서 NumPy로
back_to_numpy = tensor.numpy()
print(f"\nBack to NumPy:\n{back_to_numpy}")

### 3.2 Pandas
- **용도**: 테이블 형식 데이터 처리 (CSV, Excel 등)
- **주요 사용**: 데이터 로딩, 전처리, EDA (탐색적 데이터 분석)

In [None]:
import pandas as pd

print(f"Pandas version: {pd.__version__}")

# DataFrame 생성
data = {
    'feature1': [1.2, 2.3, 3.1, 4.5],
    'feature2': [5.0, 6.1, 7.2, 8.3],
    'label': [0, 1, 0, 1]
}
df = pd.DataFrame(data)
print("\nDataFrame:")
print(df)

# DataFrame에서 NumPy array로
X = df[['feature1', 'feature2']].values
y = df['label'].values

print(f"\nX shape: {X.shape}, y shape: {y.shape}")

# PyTorch Tensor로 변환
X_tensor = torch.tensor(X, dtype=torch.float32)
y_tensor = torch.tensor(y, dtype=torch.long)

print(f"X_tensor shape: {X_tensor.shape}")
print(f"y_tensor shape: {y_tensor.shape}")

### 3.3 Matplotlib & Seaborn
- **Matplotlib**: 기본 플로팅 라이브러리
- **Seaborn**: Matplotlib 기반, 통계 시각화에 특화
- **주요 사용**: 데이터 분포, 학습 곡선, 결과 시각화

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

print(f"Matplotlib version: {plt.matplotlib.__version__}")
print(f"Seaborn version: {sns.__version__}")

# Seaborn 스타일 설정
sns.set_style('whitegrid')

# 샘플 데이터
np.random.seed(42)
data1 = np.random.randn(100)
data2 = np.random.randn(100) + 1

# Matplotlib
fig, axes = plt.subplots(1, 2, figsize=(12, 4))

# Matplotlib 기본 플롯
axes[0].hist(data1, bins=20, alpha=0.7, label='Data 1', color='blue')
axes[0].hist(data2, bins=20, alpha=0.7, label='Data 2', color='red')
axes[0].set_xlabel('Value')
axes[0].set_ylabel('Frequency')
axes[0].set_title('Matplotlib Histogram')
axes[0].legend()

# Seaborn 플롯
sns.kdeplot(data1, ax=axes[1], label='Data 1', shade=True)
sns.kdeplot(data2, ax=axes[1], label='Data 2', shade=True)
axes[1].set_xlabel('Value')
axes[1].set_ylabel('Density')
axes[1].set_title('Seaborn KDE Plot')
axes[1].legend()

plt.tight_layout()
plt.show()

print("\n시각화 라이브러리 설정 완료!")

## 4. PyTorch 특화 라이브러리

### 4.1 TorchVision
- **용도**: 컴퓨터 비전
- **포함**: 
  - 데이터셋 (MNIST, CIFAR, ImageNet 등)
  - Pre-trained 모델 (ResNet, VGG, etc.)
  - 이미지 변환 (transforms)

In [None]:
from torchvision import datasets, transforms, models

print("=== TorchVision ===")

# 이미지 변환 정의
transform = transforms.Compose([
    transforms.ToTensor(),  # PIL Image → Tensor
    transforms.Normalize((0.5,), (0.5,))  # 정규화
])

print("Transform pipeline:")
print(transform)

# Pre-trained 모델 목록
print("\nPre-trained models 예시:")
print("- ResNet: models.resnet18(pretrained=True)")
print("- VGG: models.vgg16(pretrained=True)")
print("- EfficientNet: models.efficientnet_b0(pretrained=True)")

### 4.2 기타 유용한 라이브러리

In [None]:
# tqdm - Progress bar
from tqdm import tqdm
import time

print("=== tqdm 예제 ===")
for i in tqdm(range(50), desc="Processing"):
    time.sleep(0.02)

print("\n완료!")

In [None]:
# scikit-learn - 전처리, 평가 메트릭
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, confusion_matrix

print("=== scikit-learn ===")
print("주요 모듈:")
print("- train_test_split: 데이터 분할")
print("- StandardScaler: 표준화")
print("- accuracy_score, f1_score: 평가 메트릭")
print("- confusion_matrix: 혼동 행렬")

## 5. GPU 설정 및 Device 관리

PyTorch에서 **GPU를 사용**하려면 `.to(device)` 또는 `.cuda()`를 사용합니다.

In [None]:
# Device 설정 (GPU 있으면 GPU, 없으면 CPU)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(f"Using device: {device}")

# Tensor를 device로 이동
x = torch.randn(3, 3)
print(f"\nOriginal tensor device: {x.device}")

x_gpu = x.to(device)
print(f"After .to(device): {x_gpu.device}")

# GPU 메모리 확인 (GPU 있을 경우에만)
if torch.cuda.is_available():
    print(f"\nGPU memory allocated: {torch.cuda.memory_allocated() / 1024**2:.2f} MB")
    print(f"GPU memory reserved: {torch.cuda.memory_reserved() / 1024**2:.2f} MB")

## 6. 환경 설정 체크리스트

### ✅ 설치 확인
- [ ] PyTorch
- [ ] TorchVision
- [ ] NumPy
- [ ] Pandas
- [ ] Matplotlib
- [ ] Seaborn
- [ ] tqdm
- [ ] scikit-learn

### ✅ GPU 설정 (선택)
- [ ] CUDA 설치 확인
- [ ] `torch.cuda.is_available()` True 확인
- [ ] GPU 메모리 확인

### ✅ 다음 단계
- [ ] PyTorch Tensor 기초 (01_pytorch_basics.ipynb)
- [ ] Autograd 및 Gradient (02_autograd_and_gradients.ipynb)

## 7. 유용한 명령어 모음

```bash
# 가상환경 생성 (권장)
python -m venv pytorch_env
source pytorch_env/bin/activate  # Linux/Mac
pytorch_env\Scripts\activate  # Windows

# Requirements 파일로 일괄 설치
pip install -r requirements.txt

# Jupyter Notebook 설치
pip install jupyter notebook

# 설치된 패키지 확인
pip list

# CUDA 버전 확인 (Linux)
nvidia-smi
```

## 8. requirements.txt 예제

```txt
torch>=2.0.0
torchvision>=0.15.0
numpy>=1.24.0
pandas>=2.0.0
matplotlib>=3.7.0
seaborn>=0.12.0
scikit-learn>=1.3.0
tqdm>=4.65.0
jupyter>=1.0.0
notebook>=7.0.0
tensorboard>=2.13.0
```