-
-
Notifications
You must be signed in to change notification settings - Fork 0
parallel subagent eval model floor
brake 1 (parallel-subagent-eval) の評価品質の床(評価者のモデル能力)をどう保証するか。専用 custom agent を用意すべきか。
床は per-call で固定する。eval subagent の spawn ごとに Agent ツールの model パラメータを opus 級以上で明示指定する(暗黙の親モデル継承は禁止、sonnet / haiku は brake 1 evaluator として禁止、opus 級以上と積極的に分類できない id は literal opus に fallback)。custom-agent frontmatter model: ピン留めは不採用。
- depends on parallel-subagent-eval three-axis decomposition — N/M/P の spawn 設計を前提に、per-spawn のモデル品質制約を直交軸として追加する判断。
spawn 手順にモデル指定が無い構造では親セッションのモデルを暗黙継承するため、親が sub-opus (sonnet / haiku) で動く session では評価床が静かに下がる穴があった。Master 起点 (#1482、2026-06-12 対話)。
- 本スキルの subagent には judge 型(軸質問に答える評価者)と probe 型(素の subagent の現在挙動そのものが観測対象)が混在する。
- custom-agent file の body は subagent の system prompt = identity を置換するため、probe 型の観測対象を変質させる。per-call
modelパラメータは context / identity 面を一切変えない。この非対称が方式選択の根拠。 - Claude Code の Agent ツールに per-call
modelパラメータが存在する(省略 = 親継承)。非対応ホストでは床未満 session で brake 1 を満たせない(床を満たす session から実行)。
- 採用 = per-call 明示指定 + opus 級床 + doubt →
opusfallback(PR #1483。brake 1 round 1 で「opus-class 所属判定基準の欠落」が 3/3 同根 partial として検出され、membership 決定規則を追補して round 2 で settle)。 - 不採用 = custom-agent frontmatter
model:ピン留め。judge / probe 混在が理由であり、judge 型専用エージェントとしての将来採用までは否定しない。
- issue #1482 / PR #1483
- l1 brake2 root criteria evaluator — brake 2 が custom agent で成立しているのは judge 専用 surface ゆえ、という対比例
- parallel-subagent-eval cost acceptance
この Wiki は、Li+ に基づく開発・運用を支えるための情報整理空間です。
数字で始まるページは、 Li+プログラムの各レイヤーの仕様を定義するページです。
- 要求(何を満たすか)と仕様(どう振る舞うか)を一体として記述する
- 実装前に作成または更新する
- issue群から採用された要件を集約する
これらのページは 安定性と一貫性を重視して管理されます。
アルファベットで始まるページは、 Li+の構想・設定・導入手順などの参照用ページです。
- 設計思想・背景
- 設定リファレンス・インストール手順
これらのページは 必要に応じて更新・拡張されます。
リポジトリ内の rules/**/*.md(L1–L4 の常時ロード分、subdir 含む)、skills/**/SKILL.md(トリガー起動分)、adapter/claude/CLAUDE.md、adapter/claude/hooks-settings.md、adapter/claude/hooks/*.sh、adapter/codex/AGENTS.md、およびルート直下の Li+config.md、Li+update.md は、
AIやランタイムが直接読む実行用プログラム / 定義ファイルです。
-
docs/は人間向けの仕様書・要求仕様・手順書 -
rules/,skills/および adapter / update は実行時に読み込まれる本体
両者は対応しているが、役割は同じではない。
Home | 1. Model | 2. Evolution | 3. Task | 4. Operations | A. Concept
要求仕様書 (1-6)
参考文書 (A-K)
- A. Concept
- B. Configuration
- C. Update
- D. Installation
- DiDD(対話駆動開発)
- E. Li+ language
- F. Behavior-First
- G. Sheepdog Engineering
- H. Roles and Evaluation
- K. Source File Format
判断構造
- Decision Structure
- layer reorg rationale
- github app user-to-server token expiration
- sheepdog engineering concept
- prerelease tag recovery procedure
- release flip drift patterns
- Li+ long-term vision (feedback only)
- Master role as client-architect
- current architecture as concession
- Li+ license Apache-2.0 rationale
- Character_Instance evolution history
- prompt as emotion vector controller
- agentic-search five-phase refactor
- Character_Instance output-styles migration
- Li+ lightening L1 gate override
- subagent state-machine label mechanism
- LSP integration out of scope
- Character_Instance opt-in and surface scope
- parallel-subagent-eval three-axis decomposition
- parallel-subagent-eval cost acceptance
- parallel-subagent-eval model floor
- release version rule always-on relocation
- bootstrap walkthrough skip and gh install relocation
- wiki sync sidebar integrity check
- decision structure rename rationale
- decision structure industry positioning
- subtractive structural beauty framing
- Li+ authorship is collaborative
- Li+ design intent vs current limit
- Li+ history is empirical
- Master verification at runtime not spec
- rules cache fetch address table
- dialogue-evaluator scoring redesign
- Li+ always-on footprint is load-bearing
- DiDD umbrella naming
- milestone subsystem removal
- L1 brake 2 root-criteria evaluator