컴퓨터 비전 마스터 가이드

픽셀의 이해부터 멀티모달 AI까지 — 19챕터 93섹션 A-to-Z 튜토리얼

학습 로드맵

flowchart LR
    P1["Part 1\n기초\nCh1-4"] --> P2["Part 2\n핵심\nCh5-9"] --> P3["Part 3\n고급\nCh10-14"] --> P4["Part 4\n전문가\nCh15-18"] --> P5["Part 5\n실무\nCh19"]

    style P1 fill:#4CAF50,color:#fff
    style P2 fill:#2196F3,color:#fff
    style P3 fill:#FF9800,color:#fff
    style P4 fill:#9C27B0,color:#fff
    style P5 fill:#F44336,color:#fff

Part 1: 기초 (Ch1-4)

Ch1. 이미지의 이해 — 픽셀, 색상 공간, 이미지 포맷

01. 이미지란 무엇인가 · 02. 색상 공간 · 03. 이미지 형식과 압축

Ch2. 전통적 컴퓨터 비전 — OpenCV, 필터, 에지/특징점 검출

01. OpenCV 시작하기 · 02. 필터와 커널 · 03. 에지 검출 · 04. 특징점 검출 · 05. 형태학적 연산

Ch3. 딥러닝 기초 — 신경망, 활성화 함수, 역전파, PyTorch

01. 신경망의 구조 · 02. 활성화 함수 · 03. 역전파 · 04. 손실 함수와 옵티마이저 · 05. PyTorch 기초

Ch4. CNN 핵심 개념 — 합성곱, 풀링, 정규화

01. 합성곱 연산 · 02. 풀링 · 03. 배치 정규화 · 04. 정규화 기법

Part 2: 핵심 (Ch5-9)

Ch5. CNN 아키텍처의 진화 — LeNet → ResNet → EfficientNet → ConvNeXt

01. LeNet과 AlexNet · 02. VGG와 GoogLeNet · 03. ResNet · 04. DenseNet과 SENet · 05. EfficientNet · 06. ConvNeXt

Ch6. 이미지 분류 실전 — MNIST, CIFAR-10, 전이 학습

01. MNIST · 02. CIFAR-10 · 03. 전이 학습 · 04. 파인 튜닝 · 05. 데이터 증강

Ch7. 객체 탐지 — R-CNN, YOLO, DETR

01. 탐지 기초 · 02. R-CNN 계열 · 03. YOLO · 04. Anchor-Free · 05. DETR

Ch8. 이미지 분할 — FCN, U-Net, Mask R-CNN, SAM

01. 시맨틱 세그멘테이션 · 02. 인스턴스 세그멘테이션 · 03. 파놉틱 세그멘테이션 · 04. SAM

Ch9. Vision Transformer — Attention, ViT, Swin Transformer

01. 어텐션 메커니즘 · 02. Transformer 아키텍처 · 03. ViT · 04. Swin Transformer · 05. 하이브리드 모델

Part 3: 고급 (Ch10-14)

Ch10. Vision-Language 모델 — CLIP, BLIP, LLaVA, GPT-4V

01. 멀티모달 학습 · 02. CLIP · 03. BLIP · 04. LLaVA · 05. GPT-4V와 Gemini

Ch11. 생성 모델 기초 — VAE, GAN

01. 생성 모델 개론 · 02. VAE · 03. GAN 기초 · 04. GAN 변형 · 05. GAN 응용

Ch12. Diffusion 모델 — DDPM, DDIM, Latent Diffusion

01. Diffusion 이론 · 02. DDPM · 03. DDIM · 04. U-Net · 05. CFG · 06. Latent Diffusion

Ch13. Stable Diffusion 심화 — SD 아키텍처, SDXL, FLUX

01. SD 아키텍처 · 02. SD 1.5 vs SDXL · 03. 프롬프트 엔지니어링 · 04. 샘플러 · 05. FLUX · 06. SD3

Ch14. 생성 AI 실전 — LoRA, ControlNet, ComfyUI

01. LoRA · 02. DreamBooth · 03. ControlNet · 04. IP-Adapter · 05. ComfyUI · 06. 인페인팅

Part 4: 전문가 (Ch15-18)

Ch15. 비디오 생성 — AnimateDiff, SVD, Sora

01. 비디오 Diffusion · 02. AnimateDiff · 03. SVD · 04. Sora

Ch16. 3D 컴퓨터 비전 — 깊이 추정, 포인트 클라우드, SLAM

01. 깊이 추정 · 02. 포인트 클라우드 · 03. 카메라 기하학 · 04. SLAM · 05. 3D 복원

Ch17. Neural Rendering — NeRF, 3D Gaussian Splatting

01. NeRF 기초 · 02. NeRF 변형 · 03. 3DGS 기초 · 04. 3DGS 심화 · 05. Text-to-3D

Ch18. 멀티모달 AI 최전선 — World Models, Embodied AI

01. 통합 멀티모달 · 02. World Models · 03. Embodied AI · 04. 미래 연구 방향

Part 5: 실무 (Ch19)

Ch19. 배포와 최적화 — 양자화, ONNX, 엣지 배포

01. 모델 최적화 · 02. ONNX와 TensorRT · 03. 엣지 배포 · 04. CV MLOps · 05. 모델 서빙

Resources: 필수 논문 · 주요 데이터셋 · 개발 도구

기술 스택: PyTorch · OpenCV · torchvision · HuggingFace Transformers/Diffusers · ONNX · TensorRT

라이선스

MIT License

Name		Name	Last commit message	Last commit date
Latest commit History 30 Commits
01-foundations		01-foundations
02-classical-cv		02-classical-cv
03-deep-learning-basics		03-deep-learning-basics
04-cnn-fundamentals		04-cnn-fundamentals
05-cnn-architectures		05-cnn-architectures
06-image-classification		06-image-classification
07-object-detection		07-object-detection
08-segmentation		08-segmentation
09-vision-transformer		09-vision-transformer
10-vision-language		10-vision-language
11-generative-basics		11-generative-basics
12-diffusion-models		12-diffusion-models
13-stable-diffusion		13-stable-diffusion
14-generative-practice		14-generative-practice
15-video-generation		15-video-generation
16-3d-vision		16-3d-vision
17-neural-rendering		17-neural-rendering
18-multimodal-frontier		18-multimodal-frontier
19-deployment		19-deployment
resources		resources
.gitignore		.gitignore
CLAUDE.md		CLAUDE.md
LICENSE		LICENSE
PRIVACY.md		PRIVACY.md
README.md		README.md
manifest.json		manifest.json

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

컴퓨터 비전 마스터 가이드

학습 로드맵

Part 1: 기초 (Ch1-4)

Part 2: 핵심 (Ch5-9)

Part 3: 고급 (Ch10-14)

Part 4: 전문가 (Ch15-18)

Part 5: 실무 (Ch19)

라이선스

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

컴퓨터 비전 마스터 가이드

학습 로드맵

Part 1: 기초 (Ch1-4)

Part 2: 핵심 (Ch5-9)

Part 3: 고급 (Ch10-14)

Part 4: 전문가 (Ch15-18)

Part 5: 실무 (Ch19)

라이선스

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages