Skip to content

v1.3 — 서브 패턴 발굴 운영 체계 + 본진 신규 1건·보강 3건

Choose a tag to compare

@epoko77-ai epoko77-ai released this 25 Apr 11:26
· 43 commits to main since this release
3be2026

분류 체계의 본진 패턴은 그대로 유지하면서, 에이전트들이 실전에서 만난 미분류 의심 패턴을 단일 풀에 누적·점검·승격하는 운영 인프라를 도입합니다. v1.1까지의 패턴 추가가 사람의 1회성 결정이었고 v1.2에서 voice profile 권한 위계가 들어왔다면, v1.3은 분류 체계 자체가 시간을 따라 자라나는 구조입니다.

발행 전 두 회차의 파일럿(회차 1 합성 샘플 인프라 검증 + 회차 2 외부 매체 진짜 GPT 출력 분석)에서 본진 신규 1건과 보강 3건을 동시에 영구 반영했습니다.

운영 인프라 5종

  • references/pattern-candidates.md — 본진 승격 전 모든 의심 패턴을 누적하는 단일 그릇
  • 3개 에이전트 풀 적재 채널 — detector·rewriter·naturalness-reviewer가 미분류 패턴을 풀에 직접 적재
  • taxonomist 풀 운영자 역할 — 4가지 trigger 기반 정기 점검, 6단계 절차
  • references/sample-collection.md — 4축 다양성 매트릭스, 4종 채널, 익명화·저작권 5대 정책
  • references/promotion-checklist.md — 6게이트 정량 판정 표준

누적 결과

항목 회차 1 회차 2 합계
본진 신규 C-9 (숫자 괄호 인덱싱) 0 1건
본진 보강 I-2 (결합형) I-3 (결말 변종) · H-3 (메타 진입 변종) 3건
풀 hold 누적 1건 3건 (강력 후보) 4건

회차 2 핵심 발견

뉴스핌 [AI로 읽는 경제] 시리즈(ChatGPT 작성 명시) 분석에서 Gate 1.3 분산 보호장치가 진짜 외부 데이터에서도 정확히 작동한 것이 가장 큰 결과입니다. 9회+ 등장한 "결국" 문두 단언, 7회+ 등장한 "X은 A가 아니라 B다" 부정-긍정 대구 결산이 occurrences·source distinct는 모두 통과했지만 같은 모델·같은 기자 시리즈라는 정성 분산 검사로 hold 처리됐습니다. 단일 출처 노이즈가 본진을 오염시키지 않으면서 다음 회차에 다른 모델 데이터에서 재현되면 즉시 promoted 가능한 강력 후보로 풀에 누적됐습니다. v1.2 워크플로였다면 이 정보는 모두 묻혔을 것입니다.

보너스 발견

본진 H-1 명시 어휘("또한·따라서·즉·나아가·아울러·게다가·더욱이")가 한국 매체 GPT 출력에서 적게 나오고, 본진 미수록 "결국·다시 말해·특히"가 압도적으로 많다는 분포 미스매치 발견. 향후 H-1 어휘 셋의 재캘리브레이션 신호.

하위 호환성

v1.3은 v1.2와 하위 호환입니다. 에이전트 입출력 변경 없음, voice profile 동작 동일. 풀 적재는 부수 효과이며 적재 실패가 메인 파이프라인을 막지 않습니다.

회차 3 권장 입력 (v1.3.1 hotfix 트리거)

회차 2 데이터 확보의 정직한 한계: Gemini가 작성한 한국 매체 칼럼 본문은 검색에서 직접 인용 텍스트로 확보하지 못했습니다. 회차 3는 다음 데이터 우선 확보 — Gemini Pro 2.5 / HyperCLOVA X·Solar·Exaone / 다른 매체 GPT 출력. 위 3건 중 2건 이상에서 hold 후보가 재현되면 자동 승격 가능. v1.2 정책처럼 회차 3 결과는 v1.3.1 hotfix로 분리 발행 예정.

PR

#9 — 8 커밋 누적 (인프라 5 + 회차 1 + 회차 2)

출처 (회차 2 외부 데이터)