Universal Model Routing Experiment

Implementation of "Universal Model Routing for Efficient LLM Inference" by Jitkrittum et al. (2025)

Key Concept

Route queries to different LLMs based on cost-quality tradeoff using cluster-based error profiles that work with new unseen models without retraining.

Quick Start

Setup: 01_unirouter_experiment.ipynb - Dependencies and model configuration
Characterization: 02_model_characterization.ipynb - Compute error profiles and routing
Evaluation: 03_evaluation.ipynb - Deferral curves and adding new models

Core Innovation

Ψ(m) Vectors: Each model represented as error rates per question cluster

Enables routing to new models without expensive retraining
Cost-quality tradeoff via λ parameter: score = error_rate + λ × cost

Setup

pip install openai scikit-learn sentence-transformers datasets groq

Add your API keys:

API_KEYS = {
    'openai': 'your-key-here',
    'groq': 'your-key-here'
}

Results

Universal: Works with any new LLM by computing its error profile
Efficient: No retraining required for new models
Evaluation:

Paper: https://arxiv.org/pdf/2502.08773
Authors: Jitkrittum et al. (2025)

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
data		data
01_unirouter_experiment.ipynb		01_unirouter_experiment.ipynb
02_model_characterization.ipynb		02_model_characterization.ipynb
03_evaluation.ipynb		03_evaluation.ipynb
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Universal Model Routing Experiment

Key Concept

Quick Start

Core Innovation

Setup

Results

About

Uh oh!

Releases

Packages

Languages

lineCode/Unirouter

Folders and files

Latest commit

History

Repository files navigation

Universal Model Routing Experiment

Key Concept

Quick Start

Core Innovation

Setup

Results

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages