EmbedBench

Embedding model comparison toolkit — a Python library for benchmarking and comparing text embedding quality across different approaches (TF-IDF, bag-of-words, character n-grams).

Architecture

graph TD
    A[User Code] --> B[EmbedBench API]
    B --> C[TfIdfEmbedder]
    B --> D[BowEmbedder]
    B --> E[NgramEmbedder]
    C --> F[Vocabulary Builder]
    D --> F
    E --> G[Char N-gram Extractor]
    F --> H[numpy Vector Math]
    G --> H
    H --> I[Cosine Similarity]
    H --> J[Benchmark Report]
    J --> K[Precision / Recall / MRR]

Quickstart

Installation

pip install -e .

Basic Usage

from embedbench import TfIdfEmbedder, BowEmbedder, NgramEmbedder, EmbedBench

# Embed text with TF-IDF
embedder = TfIdfEmbedder()
embedder.fit(["the cat sat on the mat", "the dog chased the cat"])
vec = embedder.embed("cat sat")

# Compare two texts
similarity = embedder.compare("the cat sat", "the dog chased")
print(f"Similarity: {similarity:.4f}")

# Benchmark retrieval across all embedders
bench = EmbedBench()
corpus = [
    "machine learning algorithms",
    "deep neural networks",
    "natural language processing",
    "computer vision models",
]
queries = ["neural network training"]
relevance = {0: [1]}  # query 0 is relevant to doc 1

report = bench.benchmark(corpus, queries, relevance)
print(report)

Run the Benchmark Report

from embedbench import EmbedBench

bench = EmbedBench()
corpus = ["doc one", "doc two", "doc three"]
queries = ["one", "two"]
relevance = {0: [0], 1: [1]}

bench.benchmark(corpus, queries, relevance)
print(bench.get_report())

Features

TF-IDF Embeddings — term frequency-inverse document frequency vectors
Bag-of-Words Embeddings — simple word count vectors
Character N-gram Embeddings — sub-word level representations
Cosine Similarity — compare any two texts
Retrieval Benchmarking — precision, recall, and MRR metrics
Pydantic Configuration — type-safe, validated settings
Zero external API calls — everything runs locally with numpy

Development

make install    # install in dev mode
make test       # run tests
make lint       # run linter
make format     # auto-format code

Inspired by embedding and RAG evaluation trends

Built by Officethree Technologies | Made with love and AI

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.github/workflows		.github/workflows
docs		docs
src/embedbench		src/embedbench
tests		tests
.env.example		.env.example
.gitignore		.gitignore
CONTRIBUTING.md		CONTRIBUTING.md
Makefile		Makefile
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

EmbedBench

Architecture

Quickstart

Installation

Basic Usage

Run the Benchmark Report

Features

Development

Inspired by embedding and RAG evaluation trends

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

EmbedBench

Architecture

Quickstart

Installation

Basic Usage

Run the Benchmark Report

Features

Development

Inspired by embedding and RAG evaluation trends

About

Topics

Resources

Contributing

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages