# 재현 실험 템플릿 (Reproducibility Template)

이 노트북은 시나리오 재현·다변성 평가 실험의 공통 템플릿입니다.

- 필수: 모든 실험은 아래 메타데이터를 채워 넣습니다.
- 결과: 핵심 결과 이미지는 `docs/experiments/`에 요약을 남깁니다.


In [None]:
# 재현 메타데이터 (필수)
SCENARIO = {
    'scenario_id': '',
    'seed': 42,
    'model_version': '',
    'prompt_hash': '',
    'retrieval_snapshot_id': '',
    'base_image_digest': '',
    'sbom_ref': '',
    'variation_key': {
        'top_p': 0.95,
        'temperature': 0.7,
        'self_consistency_k': 5
    }
}
SCENARIO

In [None]:
# 공통: 난수 시드 고정
import os, random
try:
    import numpy as np
except Exception:
    np = None
try:
    import torch
except Exception:
    torch = None

def set_seed(seed: int = 42):
    random.seed(seed)
    os.environ['PYTHONHASHSEED'] = str(seed)
    if np is not None:
        np.random.seed(seed)
    if torch is not None:
        torch.manual_seed(seed)
        torch.cuda.manual_seed_all(seed)
        torch.backends.cudnn.deterministic = True
        torch.backends.cudnn.benchmark = False

set_seed(SCENARIO.get('seed', 42))
print('Seed fixed:', SCENARIO.get('seed', 42))

## 1) 요구 정의
- 예: CWE-89 (SQLi), 또는 특정 CVE 설명
- 테스트베드 기대 동작, PoC 성공 조건


## 2) 실험 단계 계획
- 생성 → 빌드 → 실행 → 검증 → 리뷰
- 다변성 모드(top-p/temperature/self-consistency) 파라미터 실험 매트릭스


## 3) 결과 요약
- Exploit 성공 여부, 루프 횟수, 실패 로그 요약
- 다양성 지표(H), 시나리오 거리, 재현율
- 주요 아티팩트 경로 및 해시(SID 포함)
