v0.4.20 — Token-Ersparnis neu vermessen + Mess-Script
Token-Ersparnis: Rechnung auf Messdaten korrigiert
Die "Token savings"-Sektion in beiden READMEs basierte auf einer Frühmessung (125 Sessions, Stand 30.05.) plus Annahmen. Neu vermessen über 141 Sessions / 33 Tage (11.05.–12.06.2026) aus den Claude-Code-Transcripts:
| Parameter | alt | neu (gemessen) |
|---|---|---|
| Sessions/Tag | 5 (Annahme) | ~4,3 |
| Recall-Rate | 72 % | 59 % |
| Retrieval-Overhead | ~720 Token/Session | ~2,8k Token/Recall-Session |
| Entities im Graph | 146 | 262 |
| Netto-Ersparnis | ~1,2 Mio Token/Monat | ~0,7 Mio Token/Monat |
Die Ersparnis pro Recall-Session (~12k) bleibt ein Modell — siehe Methodik-Fußnote im README.
Neu: bin/measure-savings.py
Misst die Basisdaten reproduzierbar aus den lokalen Claude-Code-Transcripts (~/.claude/projects/*/*.jsonl): Sessions/Tag, Recall-Rate, ai-rem-Calls und Retrieval-Payload. Gibt nur Aggregate aus, kein Inhalt verlässt den Rechner.
Kein Schema-Change, keine API-Änderung — reines Doku-/Tooling-Release.
🤖 Generated with Claude Code