TurboMemory

Claude-style long-term memory with 4/6/8-bit TurboQuant compression — runs on a laptop.

🚀 Live Demo (Colab) · 📖 Docs · 🗺️ Roadmap · 💬 Discussions

Why TurboMemory?

Feature	TurboMemory	Mem0	Zep	LangMem
Embedding Compression	✅ 4/6/8-bit packed	❌	❌	❌
Self-Healing (autoDream)	✅ Merge, dedupe, resolve contradictions	Partial	Partial	❌
Retrieval Verification	✅ Cross-reference scoring	❌	❌	❌
Quality Scoring	✅ Confidence + freshness + specificity	❌	❌	❌
Exclusion Rules	✅ Configurable "what NOT to store"	❌	❌	❌
Runs on Laptop	✅ SQLite + local models	⚠️ Needs vector DB	❌ Needs server	⚠️ Needs vector DB
Memory Size (10K chunks)	~5 MB (6-bit)	~150 MB	~200 MB	~150 MB
Open Source	✅ MIT	✅ Apache 2.0	✅	✅
Plugin System	✅ Scorers, providers, storage	❌	❌	❌

The compression advantage: TurboMemory's 6-bit quantization stores embeddings at ~25% the size of full float32 with >0.95 cosine similarity. That means 10,000 memories in ~5 MB instead of ~150 MB.

Want to Help? Pick a Good First Issue!

We especially need:

Benchmarks — Compare vs Mem0, Zep, LangMem
LangChain integration — Retriever + chat history (started, needs testing)
Web dashboard — Streamlit app for browsing memories
Documentation — Tutorials, API docs, architecture diagrams

👉 Good First Issues · Contributing Guide

Quick Start

pip install -e .

from turbomemory import TurboMemory

with TurboMemory(root="my_memory") as tm:
    # Add memory
    tm.add_memory("python", "Python uses dynamic typing and garbage collection")

    # Query with verification
    results = tm.verify_and_score("How does Python work?")
    for score, topic, chunk, verif in results:
        print(f"{'✓' if verif.verified else '?'} {chunk['text']}")

Design Principles

Memory = index, not storage MEMORY.md stores only pointers (~150 chars/line). Actual knowledge lives in topic files.

3-layer bandwidth-aware design Index (always) → Topics (on-demand) → Transcripts (append-only)

Strict write discipline Write to file, then update index. Never dump content into the index.

Background memory rewriting (autoDream) Merges duplicates, resolves contradictions, converts vague → absolute. Memory is continuously edited.

Staleness is first-class If memory ≠ reality, memory is wrong. Code-derived facts are never stored.

Retrieval is skeptical, not blind Memory is a hint, not truth. Cross-reference verification before use.

What we don't store is the real insight No debug logs, no code structure, no PR history. If derivable, don't persist.

Features

Core

SQLite index with connection pooling
Packed quantization (4-bit / 6-bit / 8-bit) — up to 8x compression
Topic centroid prefilter for fast retrieval
Contradiction detection + confidence decay
TTL (time-to-live) for memory chunks

Verification

Cross-reference verification across topics
Agreement scoring between related chunks
Contradiction flagging during retrieval
Optional "verified-only" query mode

Quality Scoring

Per-chunk quality scores (confidence + freshness + specificity + verification)
Automatic quality decay over time
Quality-based ranking adjustments

Exclusion Rules

Configurable patterns for what NOT to store
Blocks: debug output, code snippets, secrets, PR history
Exclusion logging for auditability

Self-Healing Consolidation

Semantic merging of similar chunks
Contradiction resolution (older chunks decayed)
Vague-to-absolute language conversion
Aggressive deduplication and pruning

Observability

Per-topic health scores (0.0 - 1.0)
Consolidation event logging
Comprehensive metrics (JSON output)

Plugin System

Custom quality scorers
Custom embedding providers
Custom storage backends (Redis, PostgreSQL, etc.)
Custom verification strategies

Integrations

LangChain — TurboMemoryRetriever, TurboMemoryChatMessageHistory
CrewAI — Memory provider example
More coming: AutoGen, LlamaIndex, Haystack

Usage

CLI

# Add memory
python cli.py add_memory --topic turboquant.video --text "TurboQuant-v3 uses block matching" --bits 6

# Query with verification
python cli.py query --query "How does TurboQuant work?" --verify

# Stats with topic health
python cli.py stats

# Consolidate
python consolidator.py

LangChain

from turbomemory.integrations.langchain import TurboMemoryRetriever

retriever = TurboMemoryRetriever(root="my_memory", k=5, enable_verification=True)
docs = retriever.invoke("What is TurboQuant?")

Streamlit Dashboard

pip install streamlit
streamlit run dashboard.py

Compression Benchmarks

Bits	Original (384-dim)	Compressed	Ratio	Similarity
4-bit	1536 bytes	~192 bytes	8.0x	>0.90
6-bit	1536 bytes	~288 bytes	5.3x	>0.95
8-bit	1536 bytes	~384 bytes	4.0x	>0.99

Run benchmarks: python -m benchmarks.compression_bench

Architecture

MEMORY.md (index, always loaded)
    ↓
topics/*.tmem (structured topic files, loaded on demand)
    ↓
sessions/*.jsonl (immutable logs, appended only)
    ↓
db/index.sqlite (fast retrieval, connection pooled)
    ↓
plugins/ (custom scorers, providers, storage, verification)

Contributing

We welcome contributions! See CONTRIBUTING.md for details.

Good first issues: View issues

Roadmap: ROADMAP.md

License

MIT — see LICENSE

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
examples		examples
tests		tests
turbomemory		turbomemory
CODE_OF_CONDUCT.md		CODE_OF_CONDUCT.md
CONTRIBUTING.md		CONTRIBUTING.md
LICENSE		LICENSE
README.md		README.md
ROADMAP.md		ROADMAP.md
cli.py		cli.py
consolidator.py		consolidator.py
daemon.py		daemon.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
turbomemory.py		turbomemory.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

TurboMemory

Why TurboMemory?

Want to Help? Pick a Good First Issue!

Quick Start

Design Principles

Features

Core

Verification

Quality Scoring

Exclusion Rules

Self-Healing Consolidation

Observability

Plugin System

Integrations

Usage

CLI

LangChain

Streamlit Dashboard

Compression Benchmarks

Architecture

Contributing

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 1

Languages

Folders and files

Latest commit

History

Repository files navigation

TurboMemory

Why TurboMemory?

Want to Help? Pick a Good First Issue!

Quick Start

Design Principles

Features

Core

Verification

Quality Scoring

Exclusion Rules

Self-Healing Consolidation

Observability

Plugin System

Integrations

Usage

CLI

LangChain

Streamlit Dashboard

Compression Benchmarks

Architecture

Contributing

License

About

Resources

License

Code of conduct

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 1

Languages

Packages