History

macOS claude/gemini NI PASS, macOS claude/kimi NI PASS

tmuskal committed May 23, 2026

15fc080

Windows codex/kimi NI FAIL

tmuskal committed May 23, 2026

278dd70

Ubuntu pi/mini NI PASS, Windows codex/sonnet NI FAIL

tmuskal committed May 23, 2026

fa7e44e

macOS claude/gpt-5.4-mini NI PASS — completes gpt-5.4-mini NI row for claude+codex

tmuskal committed May 23, 2026

1103f8b

Add pi/gpt-5.4-mini NI: macOS PASS, Windows FAIL

tmuskal committed May 23, 2026

eaf2a31

Ubuntu claude/mini NI PASS (was git flake), Windows codex/gemini NI PASS

tmuskal committed May 23, 2026

a11674c

Update: Windows sonnet NI PASS (was FAIL), macOS gemini NI PASS, claude/mini FAIL evidence

tmuskal committed May 23, 2026

cf8ff2c

Add pi/gpt-5.5 BI PASS + NI FAIL evidence

tmuskal committed May 23, 2026

62f5405

Add 19 FAIL evidences to QA matrix — vanilla NI/BI failures across platforms

tmuskal committed May 23, 2026

3943b30

Add Windows codex/gpt-5.4-mini BI PASS

tmuskal committed May 23, 2026

8ff7cf5

Add Windows gpt-5.4-mini NI PASS for claude-code + codex

tmuskal committed May 23, 2026

8efbcca

Add 4 more PASS: macOS sonnet NI, Windows gpt-5.5 BI, Ubuntu gemini BI

tmuskal committed May 23, 2026

050bd73

Add 6 new PASS evidences: gpt-5.4-mini NI+BI, gemini NI, sonnet BI, pi/kimi BI

tmuskal committed May 23, 2026

560c9f0

Fill historical evidence: claude/sonnet NI, claude/kimi NI, codex/gemini NI, bp/predefined, bp/create passes from May 21-23

tmuskal committed May 23, 2026

9a8fb50

Add gpt-5.4-mini model to all QA matrix sections

tmuskal committed May 23, 2026

501fc4a

Add claude-sonnet-4-6 and gemini-3.5-flash model sections to all BP test types

tmuskal committed May 23, 2026

79c5a44

Complete QA matrix: all agents x all models x all modes x all BP types

tmuskal committed May 23, 2026

6d95d8a

Add Kimi-K2.6 rows to all BP test sections

tmuskal committed May 23, 2026

3f6ceaf

Add BP interactive + bridged-hooks modes to QA matrix

tmuskal committed May 23, 2026

fbf3ae4

Expand QA evidence with all agents (pi, hermes, cursor, copilot, opencode, gemini-cli) and models (sonnet-4-6, gemini, kimi)

tmuskal committed May 23, 2026

3bb23ed

Update QA evidence with live-stack pass results (2026-05-23)

tmuskal committed May 23, 2026

70b55db

Created QA Evidence (markdown)

tmuskal committed May 23, 2026

4baaa0e

docs: daily update 2026-05-21

github-actions[bot] committed May 21, 2026

5cd9ebc

Initial Home page

tmuskal committed May 21, 2026

fd9cb49

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Revisions