Skip to content

jsonpassion/forge-tutorial-vision

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

30 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

컴퓨터 비전 마스터 가이드

픽셀의 이해부터 멀티모달 AI까지 — 19챕터 93섹션 A-to-Z 튜토리얼

학습 로드맵

flowchart LR
    P1["Part 1\n기초\nCh1-4"] --> P2["Part 2\n핵심\nCh5-9"] --> P3["Part 3\n고급\nCh10-14"] --> P4["Part 4\n전문가\nCh15-18"] --> P5["Part 5\n실무\nCh19"]

    style P1 fill:#4CAF50,color:#fff
    style P2 fill:#2196F3,color:#fff
    style P3 fill:#FF9800,color:#fff
    style P4 fill:#9C27B0,color:#fff
    style P5 fill:#F44336,color:#fff
Loading

Part 1: 기초 (Ch1-4)

Ch1. 이미지의 이해 — 픽셀, 색상 공간, 이미지 포맷

Ch2. 전통적 컴퓨터 비전 — OpenCV, 필터, 에지/특징점 검출

Ch3. 딥러닝 기초 — 신경망, 활성화 함수, 역전파, PyTorch

Ch4. CNN 핵심 개념 — 합성곱, 풀링, 정규화

Part 2: 핵심 (Ch5-9)

Ch5. CNN 아키텍처의 진화 — LeNet → ResNet → EfficientNet → ConvNeXt

Ch6. 이미지 분류 실전 — MNIST, CIFAR-10, 전이 학습

Ch7. 객체 탐지 — R-CNN, YOLO, DETR

Ch8. 이미지 분할 — FCN, U-Net, Mask R-CNN, SAM

Ch9. Vision Transformer — Attention, ViT, Swin Transformer

Part 3: 고급 (Ch10-14)

Ch10. Vision-Language 모델 — CLIP, BLIP, LLaVA, GPT-4V

Ch11. 생성 모델 기초 — VAE, GAN

Ch12. Diffusion 모델 — DDPM, DDIM, Latent Diffusion

Ch13. Stable Diffusion 심화 — SD 아키텍처, SDXL, FLUX

Ch14. 생성 AI 실전 — LoRA, ControlNet, ComfyUI

Part 4: 전문가 (Ch15-18)

Ch15. 비디오 생성 — AnimateDiff, SVD, Sora

Ch16. 3D 컴퓨터 비전 — 깊이 추정, 포인트 클라우드, SLAM

Ch17. Neural Rendering — NeRF, 3D Gaussian Splatting

Ch18. 멀티모달 AI 최전선 — World Models, Embodied AI

Part 5: 실무 (Ch19)

Ch19. 배포와 최적화 — 양자화, ONNX, 엣지 배포


Resources: 필수 논문 · 주요 데이터셋 · 개발 도구

기술 스택: PyTorch · OpenCV · torchvision · HuggingFace Transformers/Diffusers · ONNX · TensorRT

라이선스

MIT License

About

cv-tutorial-content

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors