-
Notifications
You must be signed in to change notification settings - Fork 0
Home
"기록은 최고의 복습이다."
Vision AI와 LLM을 활용한 프로덕션 서비스 개발에서의 기술적 선택, 실험 과정, 트러블슈팅 기록을 남깁니다.
단순히 "무엇을 했다"보다 "왜 그렇게 판단했는가"를 중심으로 작성합니다.
Deepvisions | AI Engineer (2026.03 ~ 재직중)
드론·CCTV·엣지 디바이스 기반 Vision AI 파이프라인을 담당하고 있습니다. 아래 정리된 프로젝트 중 포도밭 (송이 탐지·수확량 예측), 야생동물 RPi 엣지 배포, CCTV 자전거 / 공회전 / 후미등 분류는 모두 Deepvisions 재직 중 진행한 작업입니다. OnTheTop은 카카오테크부트캠프 (2025) 과정 중 진행한 별도 프로젝트입니다.
아래 기술들이 실제 프로젝트에서 어떻게 활용되는지 OnTheTop 프로젝트에서 확인하세요.
| 기술 | 역할 | 프로젝트 |
|---|---|---|
| Blip | 사용자 업로드 이미지 분석 & 캡셔닝 | OnTheTop |
| Grounding DINO | 자동으로 객체 위치/종류 감지 | OnTheTop |
| SAM2 | 감지된 객체의 정밀 마스크 생성 | OnTheTop |
| SDXL & Inpainting | 사용자 이미지에 새로운 아이템 생성 & 합성 | OnTheTop |
| YOLO, SAHI | 드론 이미지에서 소규모 객체 탐지 | 포도밭 병해충 탐지 |
| SAM3 | Foundation segmentation 모델 검증 & mask 라벨링 | SAM3 vs YOLO 비교 |
| YOLO11n + ncnn FP16 | 라즈베리파이 4 엣지 실시간 추론 (5종 야생동물) | 야생동물 탐지 - RPi 엣지 배포 |
| picamera2 + OpenCV | RPi 카메라 실시간 캡처 + bbox annotation | 야생동물 탐지 - RPi 엣지 배포 |
| YOLO11 + ByteTrack | CCTV 부감 시점 차량·사람·자전거 검출/추적 | CCTV 자전거 경로 & 공회전 탐지 |
| EfficientNet-B0 | 차량 후미등 ON/OFF 이진 분류 (공회전 보조 신호) | 후미등 분류기 3 모델 비교 |
| 시간축 상태기계 | CCTV 부감 시점에서 운전자 탑승 추정 (BoardingTracker) | 공회전 탐지 파이프라인 |
정렬 기준: 시작일 최신순. 종료된 프로젝트는 가장 아래.
2026.05 ~ 진행중 | @ Deepvisions | 📊 상세 기록
✨ 캠퍼스 CCTV 4대 위에 두 가지 컴퓨터비전 시스템을 같은 파이프라인 백본으로 올리는 풀스택 추론·통합 파이프라인
핵심 질문:
- COCO 가중치가 부감 CCTV 시점에서 어디까지 통하고 어디서 무너지는가
- 차내 운전자가 안 보이는 부감 시점에서 "탑승" 신호를 어떻게 만들어내는가
- 학습 안 해도 되는 모듈과 합성 데이터가 유일한 모듈을 어떻게 분리하는가
- 4 카메라 오프라인 batch 흐름에서 세션을 어떻게 잘라야 의미가 보존되는가
관련 문서 바로가기:
추천 읽기 순서:
- CCTV 자전거 경로 & 공회전 탐지 (메인) ← 전체 흐름·의사결정
- 공회전 탐지 파이프라인 ← boarding 상태기계 + idle 로직
- 후미등 분류기 3 모델 비교 ← 3 모델 병렬 학습 + 도메인 갭
2026.04 ~ 진행중 | @ Deepvisions | 📊 상세 기록
✨ 포도밭 침입 야생동물(노루·멧돼지·오소리·너구리·조류) 5종 multi-class fine-tune → 라즈베리파이 4 엣지 실시간 검출까지 가져가는 풀스택 ML 배포
아래 포도밭 병해충/수확량 예측과 같은 도메인(스마트 포도밭)이지만, 포트폴리오상 드론 정밀 탐지와 엣지 디바이스 실시간 운용이 별개 기술 스택이라 분리 기록.
핵심 질문:
- CPU-only 라즈베리파이 4에서 5종 multi-class YOLO를 5 FPS 이상 실시간으로 돌릴 수 있는가
- ncnn / ONNX / TFLite / TensorRT 중 ARM 환경에 진짜 맞는 백엔드는 어떤 것인가
- INT8 양자화를 시도했을 때 어디서 무엇이 무너지고 어떻게 진단해야 하는가
- 정확도와 FPS의 trade-off에서 deployment 결정 기준은 무엇인가
관련 문서 바로가기:
- 야생동물 탐지 — RPi 엣지 배포 (메인)
- 5종 multi-class 학습 변천사
- RPi 4 추론 백엔드 비교 (torch / ONNX / ncnn)
- INT8 양자화 진단
- 카메라 실시간 검출 MVP
추천 읽기 순서:
- 야생동물 탐지 — RPi 엣지 배포 (메인) ← 전체 흐름·의사결정 결산 문서
- 5종 multi-class 학습 변천사
- RPi 4 추론 백엔드 비교
- INT8 양자화 진단
- 카메라 실시간 검출 MVP ← 학습 mAP가 현장에서 어떻게 드러나는지
2026.03 ~ 진행중 | @ Deepvisions | 📊 상세 기록
✨ 드론 이미지에서 작은 객체를 정확히 탐지하는 Small Object Detection 기술 연구 → GSD calibration + Segmentation 기반 수확량 예측으로 확장 중
핵심 질문:
- 드론 이미지에서 포도송이를 얼마나 안정적으로 찾을 수 있는가
- YOLO와 Grounding DINO 중 어떤 접근이 현재 데이터에 더 맞는가
- small object 환경에서 어떤 실험 순서가 가장 현실적인가
- 면적 → 무게 환산 모델은 어떤 형식 (×1 / ×1.5 / 회귀)이 맞는가
관련 문서 바로가기:
- 포도 수확량 예측 프로젝트
- YOLO Model Comparison Summary
- YOLO Baseline Top3 비교 요약
- Grounding DINO vs YOLO Top3 비교 요약
- SAM3 vs Fine-tuned YOLO on Drone Imagery
- 드론 포도송이 탐지 — 학습 변천사 (Progression)
- 드론 포도 수확량 예측 — 파이프라인 (2026-05)
- 수확량 close-up test_data 4장 + 3-Model 비교 (2026-05-19)
추천 읽기 순서 (최신 → 과거):
- 수확량 close-up test_data + 3-Model 비교 (2026-05-19) ← 최신: 면적-무게 모델 검증, 회귀 한계 명시
- 드론 포도 수확량 예측 — 파이프라인 (2026-05) ← Yield 단계로 확장
- 드론 포도송이 탐지 — 학습 변천사 (Progression) ← Detection 단계 결산
- SAM3 vs Fine-tuned YOLO on Drone Imagery
- Grounding DINO vs YOLO Top3 비교 요약
- YOLO Baseline Top3 비교 요약
- YOLO Model Comparison Summary
- 포도 수확량 예측 프로젝트 ← 초기 문제 정의
2025.03 ~ 2025.08 | 카카오테크부트캠프 생성형 AI과정 | ✅ 종료 | 📊 상세 기록 | 🔧 AI 개발 타임라인
✨ 사용자 책상 이미지 → AI 분석 → 어울리는 아이템 자동 생성 → 바로 구매까지의 E2E 파이프라인
- Stable Diffusion XL + SAM 기반 image generation pipeline
- 객체 인식 → 프롬프트 생성 → 인페인팅 → API serving
- Live:
onthe-top.com(서비스 종료)
- 문제 → 솔루션: "이 문제를 왜 풀어야 했는가"부터 시작
- 기술 선택의 근거: "왜 이 모델을 선택했나" 명시
- 실험 & 검증: 실패와 성공 모두 기록
- 공유 철학: 내 시행착오가 다른 개발자의 자산이 되기를
- GitHub: @ehdwo0427
- Email: ehdwo0427@naver.com
- 포트폴리오: 포트폴리오
Deepvisions | AI Engineer 2026.03 ~ 재직중
2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호
2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)
2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측
- 프로젝트 메인
- 관련 연구 종합 + 한계 (2026-05) ← 최신
- 수확량 close-up 4장 + 3-Model (2026-05-19)
- 드론 포도 수확량 예측 — 파이프라인 (2026-05)
- 드론 포도송이 탐지 — 학습 변천사 (2026-04)
- SAM3 vs Fine-tuned YOLO
- Grounding DINO vs YOLO Top3 비교 요약
- YOLO Baseline Top3 비교 요약
- YOLO Model Comparison Summary
- 포도 탐지를 위한 데이터 수집
- 포도 수확량 측정을 위한 Object Detection
2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스
- Name: Woody (이동재)
- Focus: Vision AI, LLM Integration, Backend Engineering
- GitHub: @ehdwo0427
- Email: ehdwo0427@naver.com
- 포트폴리오 : 포트폴리오