Releases: markus7h/ai-rem
v0.7.2 — Ollama-URL via Config
Änderungen
- fix(ollama):
ollama_urlist jetzt ein echter Config-Key.write_settings_template()schreibt ihn aussetup-config.jsoninssettings-template.json, sodass der bereits vorhandeneTMPL.get("ollama_url")-Pfad auch über die Config greift — nicht mehr nur über Env oder Hardcode. - fix: Redundante, config-ignorierende Re-Definition von
AI_REM_OLLAMA_URLim Nightly-Cleanup-Block entfernt; der Cleanup nutzt jetzt dieselbe config-aware Variable. - docs: Falscher Default
http://localhost:11434→http://myubuntu:11434korrigiert (DE/EN), Konfigurierbarkeit dokumentiert.setup-config.example.jsonumollama_urlergänzt.
Priorität der Ollama-URL: Env AI_REM_OLLAMA_URL > setup-config ollama_url > Default http://myubuntu:11434.
v0.7.1 — CLI ohne venv-re-exec (reine stdlib)
Änderungen
- refactor(cli):
bin/ai-remwirft das.venv-Re-exec raus und nutzt nur noch Python-stdlib (urllib/json/argparse). Läuft damit auf jedempython3 ≥3.8unter Windows/Linux/macOS; ein plattformfremdes.venvauf Shared-Storage kann die CLI nicht mehr kapern. Server-Deps (fastmcp/kuzu) bleiben im Docker-Container. - docs: DE/EN-Doku (Hooks/Automation + Installation) entsprechend nachgezogen.
- chore:
.gitignoreum.kaiguard*,context-dump.md,.pii-guard*ergänzt.
v0.6.2 — OOM-Fix mem_limit
- fix(compose): mem_limit 2g→3g gegen OOM-Restart-Loop
v0.6.1 — Built-in-Tool-Denies & CLAUDE.md-Pointer
- feat(setup): Built-in-Tool-Denies als Default + idempotenter CLAUDE.md-Pointer
v0.6.0 — Schlankes MCP-Tool-Surface
- feat(server): schlankes MCP-Tool-Surface — nur 4 Always-on-Tools (#32)
v0.5.3 — Discover-Routinen, CI Tier-1-Gate & Graph-Export-Test
- discover: gepinnte Routinen mitliefern + Tool-Matching schärfen
- ci: Tier-1-Gate — Lint/Compile/Import auf push+PR + VERSION↔Tag-Check (#26)
- test(graph): pytest für /graph-Export-Vertrag (type/context/archived)
v0.5.2 — Graph-Filter
Highlights
/graph-Filter — Die Node-Link-Visualisierung lässt sich jetzt filtern:- Kontext-Dropdown: alle /
work/private/ global (ohne Tag) - Typ-Filter: Einträge der Legende sind anklickbar und blenden den jeweiligen Entity-Typ aus/ein
- Kontext-Dropdown: alle /
Reiner UI-Change in der Graph-Ansicht, kein Schema- oder API-Change.
v0.4.23 — Backup-Verschlüsselung
Backup-Verschlüsselung (AES-256-GCM, opt-in)
Backups können jetzt at-rest verschlüsselt werden. Gesetzt via AI_REM_BACKUP_KEY → Backups werden mit AES-256-GCM geschrieben (backup_<ts>.json.enc) und beim Download als verschlüsselter Blob ausgegeben — die Daten verlassen den Server nie im Klartext. Leer → Klartext wie bisher (rückwärtskompatibel).
- Key via
scryptaus der Passphrase abgeleitet, Salt+Nonce pro Datei neu. - Restore erkennt verschlüsselte und Klartext-Backups automatisch.
- Schlüssel-Quelle: mykeyvault (
ai-rem-backup-key), viadeploy.shin die.env. ⚠️ Geht die Passphrase verloren, sind verschlüsselte Backups nicht mehr wiederherstellbar.
Schließt #31.
v0.4.21 — Server-Version in der Web-UI sichtbar
Version in der Web-UI
/uizeigt die Server-Version jetzt in der Kopfzeile (Knowledge Graph Memory · v0.4.21 · …) — serverseitig eingesetzt, gleiches Platzhalter-Muster wie__CTX_LIMIT__auf/prefs./api/statusliefert zusätzlich einversion-Feld — nützlich für Clients und Healthchecks.
Kein Schema-Change, keine API-Breaking-Änderung.
🤖 Generated with Claude Code
v0.4.20 — Token-Ersparnis neu vermessen + Mess-Script
Token-Ersparnis: Rechnung auf Messdaten korrigiert
Die "Token savings"-Sektion in beiden READMEs basierte auf einer Frühmessung (125 Sessions, Stand 30.05.) plus Annahmen. Neu vermessen über 141 Sessions / 33 Tage (11.05.–12.06.2026) aus den Claude-Code-Transcripts:
| Parameter | alt | neu (gemessen) |
|---|---|---|
| Sessions/Tag | 5 (Annahme) | ~4,3 |
| Recall-Rate | 72 % | 59 % |
| Retrieval-Overhead | ~720 Token/Session | ~2,8k Token/Recall-Session |
| Entities im Graph | 146 | 262 |
| Netto-Ersparnis | ~1,2 Mio Token/Monat | ~0,7 Mio Token/Monat |
Die Ersparnis pro Recall-Session (~12k) bleibt ein Modell — siehe Methodik-Fußnote im README.
Neu: bin/measure-savings.py
Misst die Basisdaten reproduzierbar aus den lokalen Claude-Code-Transcripts (~/.claude/projects/*/*.jsonl): Sessions/Tag, Recall-Rate, ai-rem-Calls und Retrieval-Payload. Gibt nur Aggregate aus, kein Inhalt verlässt den Rechner.
Kein Schema-Change, keine API-Änderung — reines Doku-/Tooling-Release.
🤖 Generated with Claude Code