-
Notifications
You must be signed in to change notification settings - Fork 0
Grape Yield Research Synthesis 2026 05
우리 PoC와 비슷한 연구 / 다른 연구 / 빌릴 수 있는 것 / 착각하면 안 되는 것을 한 페이지에 정리.
이전 페이지: Drone-Yield-Prediction-Closeup-Test-2026-05-19 (4장 close-up + 3-Model 비교) 본 페이지: 학계/산업 자료 종합 + occlusion 한계 + 우리 한계 평가
| 항목 | 현 상태 |
|---|---|
| 단계 | PoC (개념 증명), production 아님 |
| 촬영 방식 | 사람이 close-up handheld (드론은 다음 단계) |
| GT 송이 수 | 4 사진 / 6 송이 (머루 A=327g, B=204g, C=400g berry-only) |
| 모델 스택 | SAM3 text/box + YOLO (v8m / 11m) → mask |
| Reference | 흰 보드 16cm short → GSD (mm/px) → mask cm² |
| 무게 식 | w = 11.74 × A^0.78 (4점 fit, overfit 인정) |
| 다음 reference | 드론 환경에선 트렐리스 기둥 80mm 지름 |
| 다음 GT 목표 | 30~50+ 송이 (1-2개월) |
| # | 연구 | 한 줄 요약 | 비슷한 점 | 다른 점 / 한계 | 우리가 가져올 것 |
|---|---|---|---|---|---|
| A1 | Diago et al. 2012 (Sensors, PMC3571822) | 필드 RGB 70장 → 포도 픽셀 ↔ 수확량 R²=0.76 | 지상 RGB, 픽셀 → 무게 | 단일 품종(Tempranillo), 10그루, GSD 없음 (픽셀만) | "픽셀-수확량 R² 현실 상한 0.76" 정량 baseline |
| A2 | Victorino et al. 2022 (Horticulturae, 8(3):233) | 4품종 192송이 RGB → area+perim+berry n+berry area 4변수 → R²=0.91 | handheld RGB, 송이 단위 회귀, 다품종 일반화 | N=192 (우리×48), 4-feature 중 berry-level 2개는 우리 mask로 추출 곤란 |
(1) cultivar dependency 명시 → 머루만 fit하면 이식 X (2) area+perim 2-feature만으로도 일정 수준 |
| A3 | Aquino et al. 2020 (CEA 168:105108) | 단일 송이 RGB → visible berry 검출 → n → weight, R²=0.89 "calibration-free" | handheld close-up, 단일 view, 작은 보정 | berry counting 기반 (우리는 berry mask 어려움) | cross-check 식: w ≈ n_visible × ⟨berry_area⟩ × c_occ
|
| A4 | Quiñones et al. 2025 (GCNet) (PMC11856392) | iPhone, 4각도(0/90/180/270°) + occlusion correction → R²=0.96 | 실내 close-up, 다각도, 단일 view 한계 인정 | berry-level occlusion correction, GrapeSet 2160장 |
(1) 4각도 SOP 그대로 차용 (2) correction factor 도입 아이디어 |
| A5 | Íñiguez et al. 2021 (OENO One 55(1)) | 페놀로지 단계별 area-yield 회귀 | close-up RGB, 단일 view | 다단계 시계열 | a/b 가 시기별로 변동 → 머루 성숙도 라벨 분리 필요 |
| A6 | Victorino et al. 2024 (OENO One 9309) | Cabernet, 관수 조건별 형태 → 무게 | 단일 view bunch weight | 관수 covariate | covariate 없는 단순 모델은 30%+ 오차 가능 경고 |
| A7 | YOLO-SAM AgriScan 2025 (Sensors 25(24):7678) | YOLOv11 + SAM2, 딸기 | 정확히 우리 스택과 동형 | 작물 다름 | YOLO few-shot SOP — 30~50장으로 학습 시작 |
| A8 | YOLOv11 + SAM2 canopy (CEA 2025) | mask → cm² 추정 | mask area → 물리량 | weight 아님 | mask cm² → 물리 단위 환산 검증 절차 |
| A9 | SAM3 vs YOLO 2025 (arXiv:2512.11884) | SAM3 zero-shot vs YOLO fine-tune | SAM3 사용 정당화 | zero-shot은 텍스처 약하면 fail | 우리 hybrid 선택 인용 가능 |
| A11 | Strawberry weight ML (Agronomy 12(10):2487) | 픽셀 → 무게, LR ≥ SVR, acc >85% | 단일 과일, 단순 LR | 딸기, 단일과 | "N 작을 때 LR이 SVR보다 낫다" — 머루 4점에 복잡 모델 금지 정당화 |
| A12 | Wang et al. 2017 apple sizing (CEA) | 체커보드 10거리 fit → pixel→mm, acc 84.8% | reference-object calibration | 단일과 사과 | 거리-픽셀 회귀 SOP → 보드 → 기둥 80mm 전환 검증 절차 |
honest 상한: 단일 view handheld bunch area → weight 회귀의 검증된 best R² = 0.91 (N=192, 4품종). 우리 N=4는 어떤 metric이든 통계적으로 무의미.
GCNet (A4) ──── 4각도 close-up + occlusion correction ← SOP 차용 1순위
Victorino ──── 단일 view 4-feature, multi-cultivar ← cultivar caveat
Aquino ──── berry counting fallback ← cross-check
YOLO-SAM ──── YOLO+SAM2 동형 스택 ← 학습 SOP
| 셋업 | 대표 | 왜 우리한테 안 맞나 | 그래도 가져올 것 |
|---|---|---|---|
| UAV photogrammetry point cloud | Pinheiro 2021 (PMC8125571), R²=0.82 | 우리는 close-up PoC, point cloud 없음 | 드론 단계에서 80mm 기둥 reference → 픽셀 회귀 그대로 차용 가능 |
| Multi-view SfM / NeRF / 3DGS | AgriNeRF 2024 (arXiv:2409.15487) | 1샷 PoC에 과함 | "단일 view 한계 → 보정계수" 정당화 인용 |
| Indoor controlled bench | GCNet | 우리는 야외/노지 | 4각도 회전 SOP만 차용 |
| Ground robot (VineRobot) | 다양 | 우리는 handheld | 거리 일정 유지 (1m 권장) SOP |
| cGAN 가림 복원 | Kierdorf 2022 (PMC8990779) | <150 berry/패치 한정 | berry 보일 때 데이터 증강 옵션 |
사용자 관찰: "occlusion이 생각보다 많다" → 학계 수치와 정확히 일치.
| 유형 | 우리 close-up 빈도 | 영향 |
|---|---|---|
| Leaf occlusion (잎) | 야외에서 매우 높음 | 송이 mask 면적 ↓ → 무게 ↓ |
| Inter-cluster occlusion (송이끼리 겹침) | IMG_8106 (ABC합) 같은 경우 high | mask 합쳐짐 → 송이 수 X, 합계 area는 ✓ |
| Trellis/branch occlusion | 나무 setup에서 발생 | mask 일부 잘림 |
| Frame edge crop | close-up에서 흔함 | mask 일부 누락 → 무게 under-estimate |
| Self-occlusion (3D 회전) | 거의 100% berry-level | bunch-level에선 상대적 minor |
| 보고 | 수치 | 출처 |
|---|---|---|
| Berry-level 가시성 | 평균 19%만 보임 (~81% 가림) | Mohimont 2024, Quiñones 2025 재인용 |
| Bunch-level 가림 ≥ 50% | phenological stage 따라 빈번 | Victorino 2022 |
| 잎 부분 제거 시 오차 | 27% | Nuske 2014, JFR |
| 잎 완전 제거 시 | 3–11% | Nuske 2014 |
| YOLO + occlusion-aware | bunch count 13.3% 오차 | Mohimont 계열 |
| UAV nadir-only | full canopy R² 거의 0 (잎 제거 후 0.77+) | Pinheiro 2021 |
| 접근 | 효과 | 우리 PoC 적용 가능성 |
|---|---|---|
| Multi-view (다각도 close-up) | 가장 검증됨 | ✅ 즉시 (4각도 SOP — GCNet) |
| SfM 3D association | double-counting 방지 | ⚠ Phase 3 (production) |
| NeRF / 3DGS | 가려진 영역 view synthesis | ❌ overkill |
| Statistical canopy correction | prior harvest data 필요 | ⚠ 머루 prior 없음 |
| Berry counting × correction factor | MAE 10% 감소 (GCNet) | ⚠ 머루 berry 7-10mm, 해상도 의존 |
| Amodal segmentation | modal+amodal mask 동시 출력 | ⚠ R&D 필요 |
| Occlusion-aware loss | 학습 시 weighting | ⚠ 학습 데이터 필요 |
| metric | 값 | 의미 |
|---|---|---|
| 단일 view drone yield MAPE (block-level) | 8–13% | best case |
| 단일 view drone yield (vine-level) | 13–27% | 일반적 |
| 단일 view close-up bunch (검증 R²) | 0.91 (N=192) | honest 상한 |
| Multi-view 효과 | R² 0.3대 → 0.77+ | nadir+oblique 결합 |
→ "berry 19%만 보인다"는 occlusion ceiling은 모델 크기로 못 뚫는다. 다각도 촬영이 정공법.
| 모델 | 식 | 일반 b 범위 | 우리 적용 |
|---|---|---|---|
| Power law (우리 채택) | w = a · A^b | 0.75 – 1.5 | b=0.78 — 범위 내 (비물리적 X), 단 N=4 fit |
| 구 부피 | w = ρ · π/6 · D³ ≈ a · D³ | ρ ≈ 1.05 g/cm³ (berry) | 송이는 구 아님 → over-estimate 경향 |
| Berry count × mean | w = n_visible · ⟨w_berry⟩ · c_occ | c_occ ≈ 1.5–3 | berry 작아서 어렵지만 cross-check |
| L × W² | w = k · L · W² | 변동 큼 | quick sanity |
| Allometric log | log w = log a + b · log A | b 0.75–1.5 | LOOCV로 b CI 보고 권장 |
- 물리적으로 가능한 값 (일반 fruit allometric 범위 내).
- 하지만 N=4 fit → bootstrap CI가 [−∞, ∞] 가까이 나올 수 있음.
- berry-only GT(C=400g) 1점 섞임 → 평균 b가 낮게 fit됐을 가능성.
- berry-only vs whole-cluster GT 절대 섞지 말 것.
| 객체 | 자동 검출 | 정확도 | SAM/YOLO 호환 | 비고 |
|---|---|---|---|---|
| 흰 보드 16cm (현재) | 쉬움 | ±2~5% | SAM3 text "white board" 양호 | 평면 깊이차로 5~10% 추가 오차 |
| ChArUco A4 (권장 중간 단계) | 매우 쉬움 (cv2.aruco) | ±0.5% | OpenCV 직접 | $15, 라미네이팅, 자동 pose |
| 체커보드 | 쉬움 | ±0.3% | OpenCV | 전체 보드 보여야 |
| 트렐리스 기둥 80mm (드론용) | 보통 | ±5~10% | SAM3 text "metal pole" 양호 | 거리·기울기 의존, 별도 calibration |
| 와이어 | 어려움 | ±10~15% | SAM 약함 | 추천 X |
| 동전 | 쉬움 | ±1% | YOLO 학습 쉬움 | 한국 동전 정합 라이브러리 |
[PoC] 흰 보드 16cm (현재)
↓
[중간] ChArUco A4 라미네이트 ($15, ±0.5% 자동)
↓
[드론] 기둥 80mm + ChArUco 1회 보정 후 기둥 폭 회귀
Apple sizing 84.8% (Wang 2017)이 알려주는 것: GSD 15% 오차 → bunch weight 30%+ 오차 증폭. reference 정확도가 가장 큰 error source.
| 데이터셋 | 라이선스 | 송이/이미지 | 라벨 | Close-up? | 품종 |
|---|---|---|---|---|---|
| WGISD (Embrapa, Zenodo) | CC BY-NC-SA 4.0 | 300장 / 4,432 클러스터 (mask 2,020) | bbox + binary mask | ✅ 1~2m handheld | Chardonnay, Cabernet Franc/Sauvignon, Sauvignon Blanc, Syrah |
| AgML grape (GitHub) | 데이터셋별 | 다양 (126~448) | COCO bbox + semantic | ground + 합성 + 야간 | 혼합 |
| Casado-García 2023 (Agronomy 13(8):1995) | 논문 확인 | instance mask + 성숙도 | mask | close-up | 다수 |
| GrapeCS-ML (Liu 2020) | 비상업 | 4,000+ / 18품종 | bbox + 색 클래스 | handheld | 다수 |
| GrapeSet (GCNet, PMC11856392) | 논문 확인 | 2,160 (10 cluster × 4각도 × foliage) | mask + weight GT | 실내 close-up iPhone | Blue/Green/Purple |
| Roboflow Universe "grape" | CC BY 4.0 다수 | 5~5,000 | bbox 위주 | close-up dominant | 혼합 |
| 한국 RDA / AI Hub | 제한적 | 캠벨얼리/거봉/홍주 등 | bbox+분류 위주 | 노지/시설 | 한국 품종 |
- 공개된 머루 instance mask + weight 데이터셋 = 없음
- → 우리가 30-50 송이 GT 수집하면 새 baseline 데이터셋 가능성 (학계 기여 잠재력 있음)
| 항목 | 머루 | V. vinifera (캠벨얼리 등) | 출처 |
|---|---|---|---|
| 송이 크기 | 큼 ("large clusters") | 다양 | Wikipedia |
| Berry 크기 | 작음 (~7-10mm) | 캠벨얼리 ~18mm | 위 + 표본 |
| Berry 색 | crimson / black-purple, 큰 보라색 씨 | 품종별 | 위 |
| 송이 무게 분포 통계 | 공개 학술자료 없음 | 캠벨얼리 표준 ≥351g, 적정 350-450g (KGEA) | — |
| 우리 GT | A=327g, B=204g, C=400g | 캠벨얼리 적정 범위와 부분 겹침 | — |
| Mask + weight 공개 | 없음 | RDA 일부 (bbox 위주) | — |
함의:
- 머루 berry가 작다 → Aquino식 berry counting은 close-up 해상도(4K~12MP) 충족 시 가능
- 송이 무게 통계 부재 → 30-50 GT가 사실상 신규 baseline 구축
| Metric | 언제 | 한계 |
|---|---|---|
| LOOCV | N ≤ 30 표준 | 작은 N에서 c-statistic 0 쪽 bias (Sci. Adv. 2024) — a, b CI도 함께 보고 |
| Bootstrap 95% CI (B=2000) | 계수 신뢰구간 | N=4에선 거의 의미 없음 → N≥10 이전엔 CI만 보고, 해석 금지 |
| Bayesian credible interval | prior 안정화 | prior: b ~ Normal(1.0, 0.3), a ~ LogNormal — prior 선택 정당화 필요 |
| MAPE / MAE in grams | 사업적 해석 | grape industry 표준 ±10% |
| Calibration plot + residual | 모델 형태 진단 | 시각적 honest |
| Cultivar-stratified test | A2 cultivar dependency 대응 | "범용 모델 아님" 명시 |
- "N too small, no test split" → LOOCV + bootstrap CI + 명시적 PoC 한정
- "Single view, occlusion ignored" → GCNet 인용 + 다각도 4샷 SOP
- "Single cultivar" → Victorino 인용하며 cultivar-specific 명시
- "Reference object plane ≠ object plane" → ChArUco PnP 거리 보정
- "berry-only vs whole-cluster 혼용" → label scheme 분리
"These results are reported as a proof-of-concept feasibility study on a single cultivar (Vitis coignetiae) with N=4 ground-truth bunches. Coefficients are not intended for production use; the goal is to establish whether mask-area-based regression is dimensionally consistent prior to scaling ground-truth collection to N≥30 across multiple cultivars and phenological stages."
-
흰 보드 → ChArUco A4(15cm×20cm) 라미네이트 전환
- cv2.aruco 자동 pose, ±0.5%, 비용 $15
- 평면 깊이차 보정까지 자동 — 현재 5-10% GSD 오차 즉시 감소
- 참고: A12 apple sizing
-
GCNet 4각도 프로토콜
- 송이 1개당 0°/90°/180°/270° = 4샷 → 면적 평균 또는 max
- 단일-view occlusion 보정 (학계 검증)
- 참고: A4 GCNet
-
이중 모델 보고
- (a) 우리 power law
w = a · A^b - (b) Aquino식
w = n_visible · ⟨w_berry⟩ · c - 두 추정 mean ± diff 보고 → 단일 모델 의존 회피
- 참고: A3 Aquino
- (a) 우리 power law
-
LOOCV + Bayesian credible interval
- prior b ~ Normal(1.0, 0.3) → N=4~30 구간 honest 보고
- R² / p-value 단독 사용 금지
-
머루 GT 수집 SOP 표준화
- 흰 백드롭 + ChArUco + 4각도 + 전자저울(±1g)
- berry-only / whole-cluster / stem 분리 라벨
- 성숙도 단계 라벨
- → 30-50점 모이면 공개 가능한 신규 데이터셋 잠재력
-
"R²=0.91이 우리 목표"는 위험
- Victorino A2는 N=192, 4품종, 4-feature, train/test split
- 우리 N=4는 R² 어떤 값이든 통계적으로 무의미
- bootstrap CI가 [−∞, ∞] 가까이 나올 가능성 농후
- 회귀계수보다는 "dimensionally consistent" 정도까지만 주장
-
흰 보드 평면 ≠ 송이 평면
- 보드를 송이 옆에 들고 찍어도 깊이차 5-15cm 발생
- GSD 5-10% 오차 → 면적 제곱 → 무게 10-20% 오차
- ChArUco PnP pose로 깊이 보정 안 하면 "정확함"은 환상
- IMG_8106의 0.6% 오차도 사실은 우연 (보드 절반 가려진 상태)
-
머루 b=0.78을 다른 상황에 그대로 쓰는 순간 망함
- A2: cultivar dependency 명시
- A5: 성숙도 stage 변동
- A6: 관수 condition 변동
- 모델은 "머루 × 흰 보드 × 1m × 12MP × 성숙기 close-up" 4중 조건부 함수
- 드론 전환 시 b 처음부터 재학습 (재사용 금지)
[Phase 1.x — 지금 ~ 1개월]
✅ 흰 보드 SOP → ChArUco 전환 (1주)
✅ 4각도 촬영 SOP 적용 (즉시)
✅ 이중 모델 보고 (Power + Aquino) (1-2주)
✅ LOOCV + Bayesian CI 코드 (1주)
⚠ 머루 GT 30-50점 추가 수집 (1-2개월)
[Phase 2 — 수확기]
⚠ 머루 GT 50-100점 → power law 재학습
⚠ bucket classifier (S/M/L/XL) 전환
⚠ Occlusion-level 라벨 (visible / partial / heavy)
⚠ Frame edge crop 자동 필터
[Phase 3 — 드론 production]
⚠ 기둥 80mm reference + post detector (T1)
⚠ Multi-view (nadir + oblique 또는 row 양쪽 통로)
⚠ SfM bunch association (double-counting 방지)
- Diago et al. 2012, Sensors 12:16988 (PMC3571822)
- Victorino et al. 2022, Horticulturae 8(3):233
- Aquino et al. 2020, CEA 168:105108
- Quiñones et al. 2025 (GCNet), PMC11856392
- Íñiguez et al. 2021, OENO One 55(1)
- Victorino et al. 2024, OENO One 9309
- SAM 3, arXiv:2511.16719 (2025-11) · Meta blog
- SAM3 vs YOLO benchmark, arXiv:2512.11884
- YOLO-SAM AgriScan, Sensors 25(24):7678
- YOLOv11 + SAM canopy, CEA 2025
- Kierdorf et al. 2022 "Behind the Leaves" (PMC8990779)
- Nuske et al. 2014, JFR
- Pinheiro et al. 2021, UAV grape (PMC8125571)
- Torres-Sánchez et al. 2021, Sensors
- Bayesian yield mapping 2025
- CMAViT 2024, arXiv:2411.16989
- AgriNeRF 2024, arXiv:2409.15487
- Wang et al. 2017, Apple 3D vision
- ArUco uncertainty analysis 2021
- Kweon et al. 2023, Tomato RGBD, arXiv:2304.06177
- Strawberry weight ML, Agronomy 12(10):2487
- Rosa roxburghii mass, Nature Sci. Rep. 2024
- Ficus carica mass (PMC3967750)
- WGISD Zenodo 10.5281/zenodo.3361736 · GitHub thsant/wgisd
- Casado-García et al. 2023, Agronomy 13(8):1995
- AgML, GitHub Project-AgML
- Roboflow Universe
- Vitis coignetiae Wikipedia
- Shim et al. 2014, Korean J. Plant Res. 27(6):650-659
- Korean Grape Export Association, Campbell Early
우리 close-up PoC는 학계 standard와 같은 길에 서 있음 (handheld RGB + segmentation + area→weight). 다만 N=4, 단일 품종, 단일 view, 평면 정렬 미검증 4중 한계로 "PoC 이상"으로 주장하면 안 됨. 즉시 도입 가능한 5가지 (ChArUco + 4각도 + 이중 모델 + LOOCV + GT SOP) 적용 후 30-50 GT 수집이 정공법.
- 2026-06: Grape-Yield-Occlusion-UNet-Eval-2026-06 — WGISD 정량 평가 + 자체 UNet 학습 (weight_err 1.8% 🏆) + 드론 cross-domain 한계 분석
Deepvisions | AI Engineer 2026.03 ~ 재직중
2026.05 ~ | @ Deepvisions 캠퍼스 CCTV 4대 · 자전거 OCR + 차량 공회전 다중 신호
2026.04 ~ | @ Deepvisions 포도밭 침입 탐지 (5종 multi-class · 라즈베리파이 4 실시간)
2026.03 ~ | @ Deepvisions 드론 이미지 기반 객체 탐지 + GSD calibration + 수확량 예측
- 프로젝트 메인
- 관련 연구 종합 + 한계 (2026-05) ← 최신
- 수확량 close-up 4장 + 3-Model (2026-05-19)
- 드론 포도 수확량 예측 — 파이프라인 (2026-05)
- 드론 포도송이 탐지 — 학습 변천사 (2026-04)
- SAM3 vs Fine-tuned YOLO
- Grounding DINO vs YOLO Top3 비교 요약
- YOLO Baseline Top3 비교 요약
- YOLO Model Comparison Summary
- 포도 탐지를 위한 데이터 수집
- 포도 수확량 측정을 위한 Object Detection
2025.03 ~ 2025.08 | 카카오테크부트캠프 | ✅ 종료 AI 기반 데스크테리어 추천 서비스
- Name: Woody (이동재)
- Focus: Vision AI, LLM Integration, Backend Engineering
- GitHub: @ehdwo0427
- Email: ehdwo0427@naver.com
- 포트폴리오 : 포트폴리오