Skip to content
ehdwo0427 edited this page May 7, 2026 · 26 revisions

👋 Woody's AI Backend Engineering Log

"기록은 최고의 복습이다."

Vision AI와 LLM을 활용한 프로덕션 서비스 개발에서의 기술적 선택, 실험 과정, 트러블슈팅 기록을 남깁니다.
단순히 "무엇을 했다"보다 "왜 그렇게 판단했는가"를 중심으로 작성합니다.


📖 AI 기술 적용 사례

아래 기술들이 실제 프로젝트에서 어떻게 활용되는지 OnTheTop 프로젝트에서 확인하세요.

기술 역할 프로젝트
Blip 사용자 업로드 이미지 분석 & 캡셔닝 OnTheTop
Grounding DINO 자동으로 객체 위치/종류 감지 OnTheTop
SAM2 감지된 객체의 정밀 마스크 생성 OnTheTop
SDXL & Inpainting 사용자 이미지에 새로운 아이템 생성 & 합성 OnTheTop
YOLO, SAHI 드론 이미지에서 소규모 객체 탐지 포도밭 병해충 탐지
SAM3 Foundation segmentation 모델 검증 & mask 라벨링 SAM3 vs YOLO 비교
YOLO11n + ncnn FP16 라즈베리파이 4 엣지 실시간 추론 (5종 야생동물) 야생동물 탐지 - RPi 엣지 배포
picamera2 + OpenCV RPi 카메라 실시간 캡처 + bbox annotation 야생동물 탐지 - RPi 엣지 배포

🧩 프로젝트 경험

🍇 포도밭 병해충 탐지 및 수확량 예측

2026.03 ~ 진행중 | 📊 상세 기록

✨ 드론 이미지에서 작은 객체를 정확히 탐지하는 Small Object Detection 기술 연구

핵심 질문:

  • 드론 이미지에서 포도송이를 얼마나 안정적으로 찾을 수 있는가
  • YOLO와 Grounding DINO 중 어떤 접근이 현재 데이터에 더 맞는가
  • small object 환경에서 어떤 실험 순서가 가장 현실적인가

관련 문서 바로가기:

추천 읽기 순서:

  1. 포도 수확량 예측 프로젝트
  2. YOLO Model Comparison Summary
  3. YOLO Baseline Top3 비교 요약
  4. Grounding DINO vs YOLO Top3 비교 요약
  5. SAM3 vs Fine-tuned YOLO on Drone Imagery
  6. 드론 포도송이 탐지 — 학습 변천사 (Progression)현재까지의 모든 단계가 한 흐름으로 정리된 결산 문서

🦌 야생동물 탐지 — Raspberry Pi 4 엣지 배포

2026.04 ~ 진행중 | 📊 상세 기록

✨ 포도밭 침입 야생동물(노루·멧돼지·오소리·너구리·조류) 5종 multi-class fine-tune → 라즈베리파이 4 엣지 실시간 검출까지 가져가는 풀스택 ML 배포

위의 포도밭 병해충 탐지와 같은 도메인(스마트 포도밭)이지만, 포트폴리오상 드론 정밀 탐지엣지 디바이스 실시간 운용이 별개 기술 스택이라 분리 기록.

핵심 질문:

  • CPU-only 라즈베리파이 4에서 5종 multi-class YOLO를 5 FPS 이상 실시간으로 돌릴 수 있는가
  • ncnn / ONNX / TFLite / TensorRT 중 ARM 환경에 진짜 맞는 백엔드는 어떤 것인가
  • INT8 양자화를 시도했을 때 어디서 무엇이 무너지고 어떻게 진단해야 하는가
  • 정확도와 FPS의 trade-off에서 deployment 결정 기준은 무엇인가

관련 문서 바로가기:

추천 읽기 순서:

  1. 야생동물 탐지 — RPi 엣지 배포 (메인)전체 흐름·의사결정 결산 문서
  2. 5종 multi-class 학습 변천사
  3. RPi 4 추론 백엔드 비교
  4. INT8 양자화 진단
  5. 카메라 실시간 검출 MVP학습 mAP가 현장에서 어떻게 드러나는지

🏠 OnTheTop | 데스크테리어 AI 추천 서비스

2025.03 ~ 2025.08 |📊 상세 기록 | 🔧 AI 개발 타임라인

✨ 사용자 책상 이미지 → AI 분석 → 어울리는 아이템 자동 생성 → 바로 구매까지의 E2E 파이프라인


📚 이 Wiki의 철학

  • 문제 → 솔루션: "이 문제를 왜 풀어야 했는가"부터 시작
  • 기술 선택의 근거: "왜 이 모델을 선택했나" 명시
  • 실험 & 검증: 실패와 성공 모두 기록
  • 공유 철학: 내 시행착오가 다른 개발자의 자산이 되기를

📫 Contact

Woody's AI Backend Engineering Log


💼 About

Deepvisions | AI Engineer 2026.03 ~ 재직중


🚀 Projects (최신순)

CCTV 자전거 경로 & 공회전 탐지 — 한동대학교 리빙랩

2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호

야생동물 탐지 — RPi 엣지 배포

2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)

포도밭 병해충 탐지 및 수확량 예측

2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측


📦 종료된 프로젝트

OnTheTop

2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스


AI Notes


About

Clone this wiki locally