-
Notifications
You must be signed in to change notification settings - Fork 0
OTT AI Wiki new
ehdwo0427 edited this page Apr 3, 2026
·
1 revision
📖 프로젝트 소개로 돌아가기 | 🏠 Wiki 홈으로
프로젝트 진행 중 모델 선정부터 성능 최적화까지의 AI 기술 결정 과정을 기록합니다.
| 기간 | 주요 작업 |
|---|---|
| 04/14 | DeepSeek Janus pro 7b 성능 테스트 |
| 04/15 | API 설계 |
| 04/16 | HiDeream 모델 성능 테스트 |
| 04/17 | Naver Shopping API 설계 |
| 04/21 | CNN 모델 성능 점검 |
| 04/22 | SDXL LoRA 테스트 |
| 04/27 | LoRA 예비 테스트 |
| 04/29 | 3종 LoRA 비교 테스트 |
| 05/01 | CNN Local 테스트 |
| 05/02 | SAM 2.1 테스트 |
| 05/03 | img2txt-GPT-4o-SDXL |
| 05/06 | 프롬프트 엔지니어링 |
| 05/11 | 트러블슈팅 & 버전업 |
| 05/15 | Grounding DINO + SAM2 |
| 05/19 | SDXL Inpainting + SAM2 |
| 05/21 | SDXL-SAM 호환성 |
| 05/22 | 마스크 품질 최적화 |
| 05/23 | Grounding DINO 성능 |
| 05/26 | v2 파이프라인 테스트 |
| 05/28 | v2 성능 벤치마킹 |
| 06/02 | 마스킹 이슈 해결 |
| 06/05 | 테마별 이미지 생성 |
| 06/22 | LoRA 메모리 관리 |
| 단계 | 주제 | 내용 |
|---|---|---|
| 1️⃣ | 모델 API 설계 | FastAPI 기반 추론 엔드포인트 설계 |
| 2️⃣ | 성능 최적화 | 응답시간, 메모리, TPS 개선 |
| 3️⃣ | 서비스 모듈화 | 마이크로서비스 아키텍처 |
| 4️⃣ | LangChain 파이프라인 | Blip → GPT → SDXL 연계 |
| 5️⃣ | RAG 구현 | 벡터 DB 기반 검색 |
| 6️⃣ | 최종 통합 | 전체 파이프라인 통합 |
| 단계 | 기간 | 목표 |
|---|---|---|
| M1 | 4/28 ~ 5/16 | ✅ E2E 파이프라인 완성 • VGG16 Desk Classifier • Blip → GPT 4o → SDXL 연계 • SDXL LoRA 커스텀 학습 • 성능: 5분 → 30초 단축 • FastAPI 비동기 처리 |
| M2 | 5/19 ~ 6/9 | ✅ 프로덕션 배포 • Docker 컨테이너화 • SAM2 Inpainting 도입 • 응답시간 & TPS 벤치마크 • 프롬프트 고도화 • 상품 추천 최적화 |
| M3 | 6/9 ~ 7/7 | ✅ 개인화 강화 • 요일별 테마 생성 • 물품 위치 감지 • 프롬프트 커스터마이징 • Classifier 고도화 |
| M4 | 7/7 ~ 7/18 | ✅ 안정성 강화 • 부하 테스트 • 동시성 처리 검증 • 메모리 최적화 • 에러 핸들링 |
| M5 | 최종 | ✅ 성과 정리 • 모델 정확도 • 응답속도 & TPS • 비용 분석 • 기술 선택 근거 |
Blip → 정확한 이미지 설명으로 프롬프트의 기초 제공 Grounding DINO → 개방형 어휘(open-vocabulary) 객체 인식 SAM2 → 픽셀 단위 정밀 세그멘테이션 SDXL Inpainting → 배경 보존하며 자연스러운 합성
- 모델 로드: 5분 → 30초 (모델 프리로딩)
- 메모리 관리: LoRA 동적 로드/언로드
- 응답 구조: 비동기 처리 + 요청 큐
- GPU 모니터링: 실시간 메모리 & 이용률 추적
더 자세한 내용은 각 링크의 Wiki 페이지를 참고하세요!
Deepvisions | AI Engineer 2026.03 ~ 재직중
2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호
2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)
2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측
- 프로젝트 메인
- 관련 연구 종합 + 한계 (2026-05) ← 최신
- 수확량 close-up 4장 + 3-Model (2026-05-19)
- 드론 포도 수확량 예측 — 파이프라인 (2026-05)
- 드론 포도송이 탐지 — 학습 변천사 (2026-04)
- SAM3 vs Fine-tuned YOLO
- Grounding DINO vs YOLO Top3 비교 요약
- YOLO Baseline Top3 비교 요약
- YOLO Model Comparison Summary
- 포도 탐지를 위한 데이터 수집
- 포도 수확량 측정을 위한 Object Detection
2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스
- Name: Woody (이동재)
- Focus: Vision AI, LLM Integration, Backend Engineering
- GitHub: @ehdwo0427
- Email: ehdwo0427@naver.com
- 포트폴리오 : 포트폴리오