Skip to content

AI_SDXL SAM

ehdwo0427 edited this page Aug 4, 2025 · 2 revisions

상위 문서로 이동 : AI Wiki

현황

  • V1은 원본 이미지와 괴리감이 있음

  • 우리의 서비스는 나의 desk를 꾸며주는 컨셉이며 내 desk에 없던 Item을 추천해줬다면 그 Item의 상품 정보도 return하여 실제 똑같이 꾸밀 수 있도록 하는 것

  • 따라서 V2의 목표는 원본 이미지를 어느 정도 유지하면서 깔끔한 Desk Setup의 느낌을 주는 것

V2 목표

  • 원본 이미지를 유지하면서 깔끔한 Desk Setup 만들기

파이프라인

  • 원본 이미지에서 mask 출력 → mask 바탕으로 유지할 부분, 생성 부분 선택 → 이미지 생성

  • mask 이미지 예시
    inpainting_background_mask-3

GPT와 개발 중인 모델 비교

  • 원본 이미지
    test3

  • GPT 생성 이미지
    ChatGPT Image 2025년 5월 20일 오후 03_18_54

  • 현재 모델 진행 상황
    inpainted_result-29


도달한 부분

  • GPT처럼 주요한 부분 Monitor, Laptop, Keyboard, Mouse 등은 살리고 나머지 부분만 수정한 것

  • 즉, 느낌은 맞고 Flow는 어느정도 맞는 부분으로 예상 됨


부족한 부분

  • 유지하는 부분 끝처리 미숙
GPT 개발 중인 모델
GPT_detail1 service_detail1

  • 유지하는 부분 합성한 듯 한 어색함
GPT 개발 중인 모델
GPT_detail2 service_detail2
  • 전반적으로 디테일이 뭉개짐

앞으로 해야할 일

  • GPT생성 이미지로 Fine tuning하는 DeepSeek 전략 (팀원 전부)

    • 디테일의 개선이 있다고 사료됨
  • 끝처리 미숙은 Mask 부분에서 문제가 있다고 판단됨

    • blurr 처리 및 mask 영역 부분의 수치를 변경해보며 계속 판단 예정 GPT_detail3

    • 끝 부분이 blurr처럼 흐려지는게 mask처리 부분에 blurr 기법이 들어 간 것으로 판단됨

Woody's AI Backend Engineering Log


💼 About

Deepvisions | AI Engineer 2026.03 ~ 재직중


🚀 Projects (최신순)

CCTV 자전거 경로 & 공회전 탐지 — 한동대학교 리빙랩

2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호

야생동물 탐지 — RPi 엣지 배포

2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)

포도밭 병해충 탐지 및 수확량 예측

2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측


📦 종료된 프로젝트

OnTheTop

2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스


AI Notes


About

Clone this wiki locally