Skip to content

Releases: markus7h/ai-rem

v0.7.2 — Ollama-URL via Config

29 Jun 14:40

Choose a tag to compare

Änderungen

  • fix(ollama): ollama_url ist jetzt ein echter Config-Key. write_settings_template() schreibt ihn aus setup-config.json ins settings-template.json, sodass der bereits vorhandene TMPL.get("ollama_url")-Pfad auch über die Config greift — nicht mehr nur über Env oder Hardcode.
  • fix: Redundante, config-ignorierende Re-Definition von AI_REM_OLLAMA_URL im Nightly-Cleanup-Block entfernt; der Cleanup nutzt jetzt dieselbe config-aware Variable.
  • docs: Falscher Default http://localhost:11434http://myubuntu:11434 korrigiert (DE/EN), Konfigurierbarkeit dokumentiert. setup-config.example.json um ollama_url ergänzt.

Priorität der Ollama-URL: Env AI_REM_OLLAMA_URL > setup-config ollama_url > Default http://myubuntu:11434.

v0.7.1 — CLI ohne venv-re-exec (reine stdlib)

29 Jun 07:47

Choose a tag to compare

Änderungen

  • refactor(cli): bin/ai-rem wirft das .venv-Re-exec raus und nutzt nur noch Python-stdlib (urllib/json/argparse). Läuft damit auf jedem python3 ≥3.8 unter Windows/Linux/macOS; ein plattformfremdes .venv auf Shared-Storage kann die CLI nicht mehr kapern. Server-Deps (fastmcp/kuzu) bleiben im Docker-Container.
  • docs: DE/EN-Doku (Hooks/Automation + Installation) entsprechend nachgezogen.
  • chore: .gitignore um .kaiguard*, context-dump.md, .pii-guard* ergänzt.

v0.6.2 — OOM-Fix mem_limit

26 Jun 12:38

Choose a tag to compare

  • fix(compose): mem_limit 2g→3g gegen OOM-Restart-Loop

v0.6.1 — Built-in-Tool-Denies & CLAUDE.md-Pointer

26 Jun 12:38

Choose a tag to compare

  • feat(setup): Built-in-Tool-Denies als Default + idempotenter CLAUDE.md-Pointer

v0.6.0 — Schlankes MCP-Tool-Surface

26 Jun 12:38
40b5aaf

Choose a tag to compare

  • feat(server): schlankes MCP-Tool-Surface — nur 4 Always-on-Tools (#32)

v0.5.3 — Discover-Routinen, CI Tier-1-Gate & Graph-Export-Test

26 Jun 12:38

Choose a tag to compare

  • discover: gepinnte Routinen mitliefern + Tool-Matching schärfen
  • ci: Tier-1-Gate — Lint/Compile/Import auf push+PR + VERSION↔Tag-Check (#26)
  • test(graph): pytest für /graph-Export-Vertrag (type/context/archived)

v0.5.2 — Graph-Filter

20 Jun 06:53

Choose a tag to compare

Highlights

  • /graph-Filter — Die Node-Link-Visualisierung lässt sich jetzt filtern:
    • Kontext-Dropdown: alle / work / private / global (ohne Tag)
    • Typ-Filter: Einträge der Legende sind anklickbar und blenden den jeweiligen Entity-Typ aus/ein

Reiner UI-Change in der Graph-Ansicht, kein Schema- oder API-Change.

v0.4.23 — Backup-Verschlüsselung

14 Jun 12:42

Choose a tag to compare

Backup-Verschlüsselung (AES-256-GCM, opt-in)

Backups können jetzt at-rest verschlüsselt werden. Gesetzt via AI_REM_BACKUP_KEY → Backups werden mit AES-256-GCM geschrieben (backup_<ts>.json.enc) und beim Download als verschlüsselter Blob ausgegeben — die Daten verlassen den Server nie im Klartext. Leer → Klartext wie bisher (rückwärtskompatibel).

  • Key via scrypt aus der Passphrase abgeleitet, Salt+Nonce pro Datei neu.
  • Restore erkennt verschlüsselte und Klartext-Backups automatisch.
  • Schlüssel-Quelle: mykeyvault (ai-rem-backup-key), via deploy.sh in die .env.
  • ⚠️ Geht die Passphrase verloren, sind verschlüsselte Backups nicht mehr wiederherstellbar.

Schließt #31.

v0.4.21 — Server-Version in der Web-UI sichtbar

12 Jun 14:46

Choose a tag to compare

Version in der Web-UI

  • /ui zeigt die Server-Version jetzt in der Kopfzeile (Knowledge Graph Memory · v0.4.21 · …) — serverseitig eingesetzt, gleiches Platzhalter-Muster wie __CTX_LIMIT__ auf /prefs.
  • /api/status liefert zusätzlich ein version-Feld — nützlich für Clients und Healthchecks.

Kein Schema-Change, keine API-Breaking-Änderung.

🤖 Generated with Claude Code

v0.4.20 — Token-Ersparnis neu vermessen + Mess-Script

12 Jun 14:35

Choose a tag to compare

Token-Ersparnis: Rechnung auf Messdaten korrigiert

Die "Token savings"-Sektion in beiden READMEs basierte auf einer Frühmessung (125 Sessions, Stand 30.05.) plus Annahmen. Neu vermessen über 141 Sessions / 33 Tage (11.05.–12.06.2026) aus den Claude-Code-Transcripts:

Parameter alt neu (gemessen)
Sessions/Tag 5 (Annahme) ~4,3
Recall-Rate 72 % 59 %
Retrieval-Overhead ~720 Token/Session ~2,8k Token/Recall-Session
Entities im Graph 146 262
Netto-Ersparnis ~1,2 Mio Token/Monat ~0,7 Mio Token/Monat

Die Ersparnis pro Recall-Session (~12k) bleibt ein Modell — siehe Methodik-Fußnote im README.

Neu: bin/measure-savings.py

Misst die Basisdaten reproduzierbar aus den lokalen Claude-Code-Transcripts (~/.claude/projects/*/*.jsonl): Sessions/Tag, Recall-Rate, ai-rem-Calls und Retrieval-Payload. Gibt nur Aggregate aus, kein Inhalt verlässt den Rechner.

Kein Schema-Change, keine API-Änderung — reines Doku-/Tooling-Release.

🤖 Generated with Claude Code