Skip to content

v0.4.20 — Token-Ersparnis neu vermessen + Mess-Script

Choose a tag to compare

@markus7h markus7h released this 12 Jun 14:35
· 44 commits to main since this release

Token-Ersparnis: Rechnung auf Messdaten korrigiert

Die "Token savings"-Sektion in beiden READMEs basierte auf einer Frühmessung (125 Sessions, Stand 30.05.) plus Annahmen. Neu vermessen über 141 Sessions / 33 Tage (11.05.–12.06.2026) aus den Claude-Code-Transcripts:

Parameter alt neu (gemessen)
Sessions/Tag 5 (Annahme) ~4,3
Recall-Rate 72 % 59 %
Retrieval-Overhead ~720 Token/Session ~2,8k Token/Recall-Session
Entities im Graph 146 262
Netto-Ersparnis ~1,2 Mio Token/Monat ~0,7 Mio Token/Monat

Die Ersparnis pro Recall-Session (~12k) bleibt ein Modell — siehe Methodik-Fußnote im README.

Neu: bin/measure-savings.py

Misst die Basisdaten reproduzierbar aus den lokalen Claude-Code-Transcripts (~/.claude/projects/*/*.jsonl): Sessions/Tag, Recall-Rate, ai-rem-Calls und Retrieval-Payload. Gibt nur Aggregate aus, kein Inhalt verlässt den Rechner.

Kein Schema-Change, keine API-Änderung — reines Doku-/Tooling-Release.

🤖 Generated with Claude Code