픽셀의 이해부터 멀티모달 AI까지 — 19챕터 93섹션 A-to-Z 튜토리얼
flowchart LR
P1["Part 1\n기초\nCh1-4"] --> P2["Part 2\n핵심\nCh5-9"] --> P3["Part 3\n고급\nCh10-14"] --> P4["Part 4\n전문가\nCh15-18"] --> P5["Part 5\n실무\nCh19"]
style P1 fill:#4CAF50,color:#fff
style P2 fill:#2196F3,color:#fff
style P3 fill:#FF9800,color:#fff
style P4 fill:#9C27B0,color:#fff
style P5 fill:#F44336,color:#fff
Ch1. 이미지의 이해 — 픽셀, 색상 공간, 이미지 포맷
Ch2. 전통적 컴퓨터 비전 — OpenCV, 필터, 에지/특징점 검출
Ch3. 딥러닝 기초 — 신경망, 활성화 함수, 역전파, PyTorch
Ch4. CNN 핵심 개념 — 합성곱, 풀링, 정규화
- 01. 합성곱 연산 · 02. 풀링 · 03. 배치 정규화 · 04. 정규화 기법
Ch5. CNN 아키텍처의 진화 — LeNet → ResNet → EfficientNet → ConvNeXt
- 01. LeNet과 AlexNet · 02. VGG와 GoogLeNet · 03. ResNet · 04. DenseNet과 SENet · 05. EfficientNet · 06. ConvNeXt
Ch6. 이미지 분류 실전 — MNIST, CIFAR-10, 전이 학습
Ch7. 객체 탐지 — R-CNN, YOLO, DETR
Ch8. 이미지 분할 — FCN, U-Net, Mask R-CNN, SAM
Ch9. Vision Transformer — Attention, ViT, Swin Transformer
Ch10. Vision-Language 모델 — CLIP, BLIP, LLaVA, GPT-4V
Ch11. 생성 모델 기초 — VAE, GAN
Ch12. Diffusion 모델 — DDPM, DDIM, Latent Diffusion
Ch13. Stable Diffusion 심화 — SD 아키텍처, SDXL, FLUX
Ch14. 생성 AI 실전 — LoRA, ControlNet, ComfyUI
Ch15. 비디오 생성 — AnimateDiff, SVD, Sora
Ch16. 3D 컴퓨터 비전 — 깊이 추정, 포인트 클라우드, SLAM
Ch17. Neural Rendering — NeRF, 3D Gaussian Splatting
Ch18. 멀티모달 AI 최전선 — World Models, Embodied AI
Ch19. 배포와 최적화 — 양자화, ONNX, 엣지 배포
Resources: 필수 논문 · 주요 데이터셋 · 개발 도구
기술 스택: PyTorch · OpenCV · torchvision · HuggingFace Transformers/Diffusers · ONNX · TensorRT
MIT License