배경
멀티에이전트 리뷰 오케스트레이터 추천을 검토한 결과, 원안은 기존 인프라(5개 aidlc reviewer + codex plugin)와 중복되고 auto-fix가 "승인 없이 코드 작성 금지" 원칙과 충돌하여 기각.
다만 비용 효율성(cost-efficiency) 은 기존 리뷰어 누구도 다루지 않는 직교 축이고, Jay의 주 프로젝트 유형(AI/LLM 연동, 인프라/DevOps, Agentic AI)에서 실제 돈이 걸린 영역이므로 단일 스킬로 도입 가치 있음.
문제
기존 리뷰어 커버리지:
- security-reviewer: 취약점
- code-reviewer: 정합성/버그
- quality-reviewer: 코드 품질
- maintainability-reviewer: 유지보수성
- spec-reviewer: 스펙 준수
공백 영역:
- LLM 호출 비용 (prompt 비대, cache miss 구조, 모델 티어 오선택, 무제한 재시도)
- 클라우드 비용 (인스턴스 over-sizing, TTL 누락, auto-scaling 부재, 로그 무한 적재)
- Agentic 오버헤드 (서브에이전트 병렬 폭증, 컨텍스트 반복 전달)
제안 범위 (Option A)
포함
- 신규 스킬 1개:
aidlc-cost-review
- 트리거: 사용자 명시 호출 OR devflow에서 LLM/인프라 단위 감지 시 질문
- 대상: API 호출 코드, IaC(Terraform/CDK), 프롬프트 구성, 서브에이전트 오케스트레이션
- 산출: 우선순위 정렬 리포트(critical/high/medium/low)
- 수정은 사용자 승인 후에만 적용
제외 (원안 대비 축소)
- performance reviewer는 별도 도입하지 않음 → quality-reviewer 프롬프트 확장으로 대체 검토 (별도 이슈)
- 자동 적용(auto-apply) 기능 없음
- retry/exponential backoff 프레임워크 없음 — 메모리 기록된 "stall >5min → intermediate fallback" 전략 재사용
- fixture 기반 integration test 없음 — 정의만 Layer 2 eval로 추적 (BL-042 기준)
- JSON 스키마 강제 없음 — 기존 마크다운 리뷰 포맷 따름
설계 포인트
- 조건부 발동: 일반 CRUD 코드에 매번 돌리면 노이즈. LLM/IaC/agent 코드 감지 시만 제안
- 도메인별 체크리스트: LLM / cloud-infra / agentic 3개 섹션으로 체크리스트 분리
- 비즈니스 판단 존중: 모델 티어/인스턴스 사이즈는 "지적만, 수정은 사용자"
- devflow 통합: CONSTRUCTION 완료 후 선택적 리뷰 단계 (auto-mode는 요구사항 확인 후 결정)
선행/관련
- 원안 기각 근거:
aidlc:security-reviewer 외 4개 reviewer + codex:review/adversarial-review로 이미 대부분 커버
- BL-055 (리뷰 ROI 자동화)와 장기적으로 통합 가능 — risk score 기반 동적 호출
- BL-053 (audit 기반 하네스 최적화 + 비용-품질 메트릭)과 데이터 공유 여지
우선순위
P2 — AI/인프라 프로젝트에서는 실질 가치 크지만, 일반 코드 리뷰 플로우의 blocking 이슈 아님
배경
멀티에이전트 리뷰 오케스트레이터 추천을 검토한 결과, 원안은 기존 인프라(5개 aidlc reviewer + codex plugin)와 중복되고 auto-fix가 "승인 없이 코드 작성 금지" 원칙과 충돌하여 기각.
다만 비용 효율성(cost-efficiency) 은 기존 리뷰어 누구도 다루지 않는 직교 축이고, Jay의 주 프로젝트 유형(AI/LLM 연동, 인프라/DevOps, Agentic AI)에서 실제 돈이 걸린 영역이므로 단일 스킬로 도입 가치 있음.
문제
기존 리뷰어 커버리지:
공백 영역:
제안 범위 (Option A)
포함
aidlc-cost-review제외 (원안 대비 축소)
설계 포인트
선행/관련
aidlc:security-reviewer외 4개 reviewer +codex:review/adversarial-review로 이미 대부분 커버우선순위
P2 — AI/인프라 프로젝트에서는 실질 가치 크지만, 일반 코드 리뷰 플로우의 blocking 이슈 아님