Skip to content

Grape Yield Research Synthesis 2026 05

ehdwo0427 edited this page Jun 15, 2026 · 2 revisions

🍇 포도 수확량 예측 — 관련 연구 종합 (2026-05)

우리 PoC와 비슷한 연구 / 다른 연구 / 빌릴 수 있는 것 / 착각하면 안 되는 것을 한 페이지에 정리.

이전 페이지: Drone-Yield-Prediction-Closeup-Test-2026-05-19 (4장 close-up + 3-Model 비교) 본 페이지: 학계/산업 자료 종합 + occlusion 한계 + 우리 한계 평가


0. 우리 현재 위치 (요약)

항목 현 상태
단계 PoC (개념 증명), production 아님
촬영 방식 사람이 close-up handheld (드론은 다음 단계)
GT 송이 수 4 사진 / 6 송이 (머루 A=327g, B=204g, C=400g berry-only)
모델 스택 SAM3 text/box + YOLO (v8m / 11m) → mask
Reference 흰 보드 16cm short → GSD (mm/px) → mask cm²
무게 식 w = 11.74 × A^0.78 (4점 fit, overfit 인정)
다음 reference 드론 환경에선 트렐리스 기둥 80mm 지름
다음 GT 목표 30~50+ 송이 (1-2개월)

1. 우리와 비슷한 연구 (close-up + mask area → weight 계열)

1-1. 핵심 비교표

# 연구 한 줄 요약 비슷한 점 다른 점 / 한계 우리가 가져올 것
A1 Diago et al. 2012 (Sensors, PMC3571822) 필드 RGB 70장 → 포도 픽셀 ↔ 수확량 R²=0.76 지상 RGB, 픽셀 → 무게 단일 품종(Tempranillo), 10그루, GSD 없음 (픽셀만) "픽셀-수확량 R² 현실 상한 0.76" 정량 baseline
A2 Victorino et al. 2022 (Horticulturae, 8(3):233) 4품종 192송이 RGB → area+perim+berry n+berry area 4변수 → R²=0.91 handheld RGB, 송이 단위 회귀, 다품종 일반화 N=192 (우리×48), 4-feature 중 berry-level 2개는 우리 mask로 추출 곤란 (1) cultivar dependency 명시 → 머루만 fit하면 이식 X
(2) area+perim 2-feature만으로도 일정 수준
A3 Aquino et al. 2020 (CEA 168:105108) 단일 송이 RGB → visible berry 검출 → n → weight, R²=0.89 "calibration-free" handheld close-up, 단일 view, 작은 보정 berry counting 기반 (우리는 berry mask 어려움) cross-check 식: w ≈ n_visible × ⟨berry_area⟩ × c_occ
A4 Quiñones et al. 2025 (GCNet) (PMC11856392) iPhone, 4각도(0/90/180/270°) + occlusion correction → R²=0.96 실내 close-up, 다각도, 단일 view 한계 인정 berry-level occlusion correction, GrapeSet 2160장 (1) 4각도 SOP 그대로 차용
(2) correction factor 도입 아이디어
A5 Íñiguez et al. 2021 (OENO One 55(1)) 페놀로지 단계별 area-yield 회귀 close-up RGB, 단일 view 다단계 시계열 a/b 가 시기별로 변동 → 머루 성숙도 라벨 분리 필요
A6 Victorino et al. 2024 (OENO One 9309) Cabernet, 관수 조건별 형태 → 무게 단일 view bunch weight 관수 covariate covariate 없는 단순 모델은 30%+ 오차 가능 경고
A7 YOLO-SAM AgriScan 2025 (Sensors 25(24):7678) YOLOv11 + SAM2, 딸기 정확히 우리 스택과 동형 작물 다름 YOLO few-shot SOP — 30~50장으로 학습 시작
A8 YOLOv11 + SAM2 canopy (CEA 2025) mask → cm² 추정 mask area → 물리량 weight 아님 mask cm² → 물리 단위 환산 검증 절차
A9 SAM3 vs YOLO 2025 (arXiv:2512.11884) SAM3 zero-shot vs YOLO fine-tune SAM3 사용 정당화 zero-shot은 텍스처 약하면 fail 우리 hybrid 선택 인용 가능
A11 Strawberry weight ML (Agronomy 12(10):2487) 픽셀 → 무게, LR ≥ SVR, acc >85% 단일 과일, 단순 LR 딸기, 단일과 "N 작을 때 LR이 SVR보다 낫다" — 머루 4점에 복잡 모델 금지 정당화
A12 Wang et al. 2017 apple sizing (CEA) 체커보드 10거리 fit → pixel→mm, acc 84.8% reference-object calibration 단일과 사과 거리-픽셀 회귀 SOP → 보드 → 기둥 80mm 전환 검증 절차

honest 상한: 단일 view handheld bunch area → weight 회귀의 검증된 best R² = 0.91 (N=192, 4품종). 우리 N=4는 어떤 metric이든 통계적으로 무의미.

1-2. 우리에게 가장 가까운 4개

GCNet (A4)   ──── 4각도 close-up + occlusion correction        ← SOP 차용 1순위
Victorino    ──── 단일 view 4-feature, multi-cultivar          ← cultivar caveat
Aquino       ──── berry counting fallback                       ← cross-check
YOLO-SAM      ──── YOLO+SAM2 동형 스택                          ← 학습 SOP

2. 우리와 명백히 다른 셋업 (그래도 빌릴 수 있는 것)

셋업 대표 왜 우리한테 안 맞나 그래도 가져올 것
UAV photogrammetry point cloud Pinheiro 2021 (PMC8125571), R²=0.82 우리는 close-up PoC, point cloud 없음 드론 단계에서 80mm 기둥 reference → 픽셀 회귀 그대로 차용 가능
Multi-view SfM / NeRF / 3DGS AgriNeRF 2024 (arXiv:2409.15487) 1샷 PoC에 과함 "단일 view 한계 → 보정계수" 정당화 인용
Indoor controlled bench GCNet 우리는 야외/노지 4각도 회전 SOP만 차용
Ground robot (VineRobot) 다양 우리는 handheld 거리 일정 유지 (1m 권장) SOP
cGAN 가림 복원 Kierdorf 2022 (PMC8990779) <150 berry/패치 한정 berry 보일 때 데이터 증강 옵션

3. Occlusion 한계 — 우리도 영향 받는다

사용자 관찰: "occlusion이 생각보다 많다" → 학계 수치와 정확히 일치.

3-1. Occlusion 유형 (vineyard close-up)

유형 우리 close-up 빈도 영향
Leaf occlusion (잎) 야외에서 매우 높음 송이 mask 면적 ↓ → 무게 ↓
Inter-cluster occlusion (송이끼리 겹침) IMG_8106 (ABC합) 같은 경우 high mask 합쳐짐 → 송이 수 X, 합계 area는 ✓
Trellis/branch occlusion 나무 setup에서 발생 mask 일부 잘림
Frame edge crop close-up에서 흔함 mask 일부 누락 → 무게 under-estimate
Self-occlusion (3D 회전) 거의 100% berry-level bunch-level에선 상대적 minor

3-2. 정량적 영향 (논문 보고)

보고 수치 출처
Berry-level 가시성 평균 19%만 보임 (~81% 가림) Mohimont 2024, Quiñones 2025 재인용
Bunch-level 가림 ≥ 50% phenological stage 따라 빈번 Victorino 2022
잎 부분 제거 시 오차 27% Nuske 2014, JFR
잎 완전 제거 시 3–11% Nuske 2014
YOLO + occlusion-aware bunch count 13.3% 오차 Mohimont 계열
UAV nadir-only full canopy R² 거의 0 (잎 제거 후 0.77+) Pinheiro 2021

3-3. 해결 접근법

접근 효과 우리 PoC 적용 가능성
Multi-view (다각도 close-up) 가장 검증됨 ✅ 즉시 (4각도 SOP — GCNet)
SfM 3D association double-counting 방지 ⚠ Phase 3 (production)
NeRF / 3DGS 가려진 영역 view synthesis ❌ overkill
Statistical canopy correction prior harvest data 필요 ⚠ 머루 prior 없음
Berry counting × correction factor MAE 10% 감소 (GCNet) ⚠ 머루 berry 7-10mm, 해상도 의존
Amodal segmentation modal+amodal mask 동시 출력 ⚠ R&D 필요
Occlusion-aware loss 학습 시 weighting ⚠ 학습 데이터 필요

3-4. 정직한 ceiling

metric 의미
단일 view drone yield MAPE (block-level) 8–13% best case
단일 view drone yield (vine-level) 13–27% 일반적
단일 view close-up bunch (검증 R²) 0.91 (N=192) honest 상한
Multi-view 효과 R² 0.3대 → 0.77+ nadir+oblique 결합

"berry 19%만 보인다"는 occlusion ceiling은 모델 크기로 못 뚫는다. 다각도 촬영이 정공법.


4. Allometric weight 수식 정리

모델 일반 b 범위 우리 적용
Power law (우리 채택) w = a · A^b 0.75 – 1.5 b=0.78 — 범위 내 (비물리적 X), 단 N=4 fit
구 부피 w = ρ · π/6 · D³ ≈ a · D³ ρ ≈ 1.05 g/cm³ (berry) 송이는 구 아님 → over-estimate 경향
Berry count × mean w = n_visible · ⟨w_berry⟩ · c_occ c_occ ≈ 1.5–3 berry 작아서 어렵지만 cross-check
L × W² w = k · L · W² 변동 큼 quick sanity
Allometric log log w = log a + b · log A b 0.75–1.5 LOOCV로 b CI 보고 권장

우리 b = 0.78 해석

  • 물리적으로 가능한 값 (일반 fruit allometric 범위 내).
  • 하지만 N=4 fit → bootstrap CI가 [−∞, ∞] 가까이 나올 수 있음.
  • berry-only GT(C=400g) 1점 섞임 → 평균 b가 낮게 fit됐을 가능성.
  • berry-only vs whole-cluster GT 절대 섞지 말 것.

5. Calibration object — 보드 → ChArUco → 기둥 80mm

객체 자동 검출 정확도 SAM/YOLO 호환 비고
흰 보드 16cm (현재) 쉬움 ±2~5% SAM3 text "white board" 양호 평면 깊이차로 5~10% 추가 오차
ChArUco A4 (권장 중간 단계) 매우 쉬움 (cv2.aruco) ±0.5% OpenCV 직접 $15, 라미네이팅, 자동 pose
체커보드 쉬움 ±0.3% OpenCV 전체 보드 보여야
트렐리스 기둥 80mm (드론용) 보통 ±5~10% SAM3 text "metal pole" 양호 거리·기울기 의존, 별도 calibration
와이어 어려움 ±10~15% SAM 약함 추천 X
동전 쉬움 ±1% YOLO 학습 쉬움 한국 동전 정합 라이브러리

권장 전환 경로

[PoC]    흰 보드 16cm          (현재)
   ↓
[중간]   ChArUco A4 라미네이트  ($15, ±0.5% 자동)
   ↓
[드론]   기둥 80mm + ChArUco 1회 보정 후 기둥 폭 회귀

Apple sizing 84.8% (Wang 2017)이 알려주는 것: GSD 15% 오차 → bunch weight 30%+ 오차 증폭. reference 정확도가 가장 큰 error source.


6. 공개 데이터셋 (활용 가능 자료)

데이터셋 라이선스 송이/이미지 라벨 Close-up? 품종
WGISD (Embrapa, Zenodo) CC BY-NC-SA 4.0 300장 / 4,432 클러스터 (mask 2,020) bbox + binary mask ✅ 1~2m handheld Chardonnay, Cabernet Franc/Sauvignon, Sauvignon Blanc, Syrah
AgML grape (GitHub) 데이터셋별 다양 (126~448) COCO bbox + semantic ground + 합성 + 야간 혼합
Casado-García 2023 (Agronomy 13(8):1995) 논문 확인 instance mask + 성숙도 mask close-up 다수
GrapeCS-ML (Liu 2020) 비상업 4,000+ / 18품종 bbox + 색 클래스 handheld 다수
GrapeSet (GCNet, PMC11856392) 논문 확인 2,160 (10 cluster × 4각도 × foliage) mask + weight GT 실내 close-up iPhone Blue/Green/Purple
Roboflow Universe "grape" CC BY 4.0 다수 5~5,000 bbox 위주 close-up dominant 혼합
한국 RDA / AI Hub 제한적 캠벨얼리/거봉/홍주 등 bbox+분류 위주 노지/시설 한국 품종

⚠ 머루 전용 데이터셋

  • 공개된 머루 instance mask + weight 데이터셋 = 없음
  • → 우리가 30-50 송이 GT 수집하면 새 baseline 데이터셋 가능성 (학계 기여 잠재력 있음)

7. 머루(Vitis coignetiae) 특이성

항목 머루 V. vinifera (캠벨얼리 등) 출처
송이 크기 큼 ("large clusters") 다양 Wikipedia
Berry 크기 작음 (~7-10mm) 캠벨얼리 ~18mm 위 + 표본
Berry 색 crimson / black-purple, 큰 보라색 씨 품종별
송이 무게 분포 통계 공개 학술자료 없음 캠벨얼리 표준 ≥351g, 적정 350-450g (KGEA)
우리 GT A=327g, B=204g, C=400g 캠벨얼리 적정 범위와 부분 겹침
Mask + weight 공개 없음 RDA 일부 (bbox 위주)

함의:

  • 머루 berry가 작다 → Aquino식 berry counting은 close-up 해상도(4K~12MP) 충족 시 가능
  • 송이 무게 통계 부재 → 30-50 GT가 사실상 신규 baseline 구축

8. 정직한 평가 metric — N 작을 때

Metric 언제 한계
LOOCV N ≤ 30 표준 작은 N에서 c-statistic 0 쪽 bias (Sci. Adv. 2024) — a, b CI도 함께 보고
Bootstrap 95% CI (B=2000) 계수 신뢰구간 N=4에선 거의 의미 없음 → N≥10 이전엔 CI만 보고, 해석 금지
Bayesian credible interval prior 안정화 prior: b ~ Normal(1.0, 0.3), a ~ LogNormal — prior 선택 정당화 필요
MAPE / MAE in grams 사업적 해석 grape industry 표준 ±10%
Calibration plot + residual 모델 형태 진단 시각적 honest
Cultivar-stratified test A2 cultivar dependency 대응 "범용 모델 아님" 명시

논문 reviewer 단골 reject 사유

  1. "N too small, no test split" → LOOCV + bootstrap CI + 명시적 PoC 한정
  2. "Single view, occlusion ignored" → GCNet 인용 + 다각도 4샷 SOP
  3. "Single cultivar" → Victorino 인용하며 cultivar-specific 명시
  4. "Reference object plane ≠ object plane" → ChArUco PnP 거리 보정
  5. "berry-only vs whole-cluster 혼용" → label scheme 분리

표준 PoC disclaimer (영문 예시)

"These results are reported as a proof-of-concept feasibility study on a single cultivar (Vitis coignetiae) with N=4 ground-truth bunches. Coefficients are not intended for production use; the goal is to establish whether mask-area-based regression is dimensionally consistent prior to scaling ground-truth collection to N≥30 across multiple cultivars and phenological stages."


9. 우리 PoC에 즉시 도입 가능한 5가지

  1. 흰 보드 → ChArUco A4(15cm×20cm) 라미네이트 전환

    • cv2.aruco 자동 pose, ±0.5%, 비용 $15
    • 평면 깊이차 보정까지 자동 — 현재 5-10% GSD 오차 즉시 감소
    • 참고: A12 apple sizing
  2. GCNet 4각도 프로토콜

    • 송이 1개당 0°/90°/180°/270° = 4샷 → 면적 평균 또는 max
    • 단일-view occlusion 보정 (학계 검증)
    • 참고: A4 GCNet
  3. 이중 모델 보고

    • (a) 우리 power law w = a · A^b
    • (b) Aquino식 w = n_visible · ⟨w_berry⟩ · c
    • 두 추정 mean ± diff 보고 → 단일 모델 의존 회피
    • 참고: A3 Aquino
  4. LOOCV + Bayesian credible interval

    • prior b ~ Normal(1.0, 0.3) → N=4~30 구간 honest 보고
    • R² / p-value 단독 사용 금지
  5. 머루 GT 수집 SOP 표준화

    • 흰 백드롭 + ChArUco + 4각도 + 전자저울(±1g)
    • berry-only / whole-cluster / stem 분리 라벨
    • 성숙도 단계 라벨
    • → 30-50점 모이면 공개 가능한 신규 데이터셋 잠재력

10. 착각하지 말아야 할 3가지

  1. "R²=0.91이 우리 목표"는 위험

    • Victorino A2는 N=192, 4품종, 4-feature, train/test split
    • 우리 N=4는 R² 어떤 값이든 통계적으로 무의미
    • bootstrap CI가 [−∞, ∞] 가까이 나올 가능성 농후
    • 회귀계수보다는 "dimensionally consistent" 정도까지만 주장
  2. 흰 보드 평면 ≠ 송이 평면

    • 보드를 송이 옆에 들고 찍어도 깊이차 5-15cm 발생
    • GSD 5-10% 오차 → 면적 제곱 → 무게 10-20% 오차
    • ChArUco PnP pose로 깊이 보정 안 하면 "정확함"은 환상
    • IMG_8106의 0.6% 오차도 사실은 우연 (보드 절반 가려진 상태)
  3. 머루 b=0.78을 다른 상황에 그대로 쓰는 순간 망함

    • A2: cultivar dependency 명시
    • A5: 성숙도 stage 변동
    • A6: 관수 condition 변동
    • 모델은 "머루 × 흰 보드 × 1m × 12MP × 성숙기 close-up" 4중 조건부 함수
    • 드론 전환 시 b 처음부터 재학습 (재사용 금지)

11. Phase별 적용 로드맵

[Phase 1.x — 지금 ~ 1개월]
  ✅ 흰 보드 SOP → ChArUco 전환 (1주)
  ✅ 4각도 촬영 SOP 적용 (즉시)
  ✅ 이중 모델 보고 (Power + Aquino) (1-2주)
  ✅ LOOCV + Bayesian CI 코드 (1주)
  ⚠ 머루 GT 30-50점 추가 수집 (1-2개월)

[Phase 2 — 수확기]
  ⚠ 머루 GT 50-100점 → power law 재학습
  ⚠ bucket classifier (S/M/L/XL) 전환
  ⚠ Occlusion-level 라벨 (visible / partial / heavy)
  ⚠ Frame edge crop 자동 필터

[Phase 3 — 드론 production]
  ⚠ 기둥 80mm reference + post detector (T1)
  ⚠ Multi-view (nadir + oblique 또는 row 양쪽 통로)
  ⚠ SfM bunch association (double-counting 방지)

12. 핵심 출처 정리

Grape close-up 회귀 (우리와 비슷)

SAM/YOLO 스택

Occlusion

Calibration / sizing

Allometric / Weight

데이터셋

평가 metric

머루 / 한국 grape


13. 한 줄 요약

우리 close-up PoC는 학계 standard와 같은 길에 서 있음 (handheld RGB + segmentation + area→weight). 다만 N=4, 단일 품종, 단일 view, 평면 정렬 미검증 4중 한계로 "PoC 이상"으로 주장하면 안 됨. 즉시 도입 가능한 5가지 (ChArUco + 4각도 + 이중 모델 + LOOCV + GT SOP) 적용 후 30-50 GT 수집이 정공법.


📎 후속 작업

Woody's AI Backend Engineering Log


💼 About

Deepvisions | AI Engineer 2026.03 ~ 재직중


🚀 Projects (최신순)

CCTV 자전거 경로 & 공회전 탐지 — 한동대학교 리빙랩

2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호

야생동물 탐지 — RPi 엣지 배포

2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)

포도밭 병해충 탐지 및 수확량 예측

2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측


📦 종료된 프로젝트

OnTheTop

2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스


AI Notes


About

Clone this wiki locally