@modelux/sdk

TypeScript SDK for the Modelux LLM proxy. Wraps the OpenAI SDK with Modelux-specific extensions for routing, budgets, caching, and observability.

Install

npm install @modelux/sdk openai

Requires Node 18+ (native fetch). openai is a peer dependency.

Quick start

import { Modelux } from "@modelux/sdk";

const client = new Modelux({ apiKey: "mlx_sk_..." });

const response = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [{ role: "user", content: "Hello" }],
});

console.log(response.choices[0].message.content);
console.log(response.modelux.provider_used);  // "openai"
console.log(response.modelux.cost_usd);

Modelux extensions

Pass Modelux-specific parameters alongside standard OpenAI params:

const response = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [{ role: "user", content: "Hello" }],

  // Modelux extensions
  userId: "user_123",                    // end-user tracking
  tags: { tier: "premium", team: "ml" }, // routing & analytics tags
  traceId: "req-abc-123",               // distributed tracing
  noCache: true,                         // skip semantic cache
  dryRun: true,                          // routing evaluation only, no LLM call
});

These are mapped to X-Modelux-* request headers automatically.

Response metadata

Every response includes a .modelux object with metadata extracted from response headers:

response.modelux.request_id     // unique request ID
response.modelux.provider_used  // "openai", "anthropic", etc.
response.modelux.model_used     // actual model that served the request
response.modelux.cache_hit      // true if served from semantic cache
response.modelux.cache_similarity // cosine similarity (on cache hits)
response.modelux.ab_variant     // A/B test variant label
response.modelux.budget_name    // matching budget name
response.modelux.budget_remaining // USD remaining in budget period
response.modelux.budget_action  // "block", "downgrade", or "warn_only"

Streaming

const stream = await client.chat.completions.create({
  model: "gpt-4o",
  messages: [{ role: "user", content: "Hello" }],
  stream: true,
  userId: "user_123",
});

// Metadata available immediately from response headers
console.log(stream.modelux.provider_used);

for await (const chunk of stream) {
  process.stdout.write(chunk.choices[0]?.delta?.content || "");
}

Budget errors

When a request is blocked by budget enforcement, the SDK throws a typed BudgetExceededError:

import { BudgetExceededError } from "@modelux/sdk";

try {
  await client.chat.completions.create({ ... });
} catch (err) {
  if (err instanceof BudgetExceededError) {
    console.log(err.budget.name);       // "team-ml"
    console.log(err.budget.spend_usd);  // 105.00
    console.log(err.budget.cap_usd);    // 100.00
    console.log(err.budget.period);     // "monthly"
    console.log(err.retryAfter);        // seconds until budget resets
  }
}

Configuration

const client = new Modelux({
  apiKey: "mlx_sk_...",                    // required
  baseURL: "https://api.modelux.ai/v1",  // default
  timeout: 60_000,                         // ms, default 60s
  maxRetries: 2,                           // retry on 429/5xx, default 2
  fetch: customFetch,                      // custom fetch for testing/edge runtimes
  defaultHeaders: { "X-Custom": "value" }, // extra headers on every request
});

Routing configs

Use the @config-name selector to route through a named routing config:

const response = await client.chat.completions.create({
  model: "@production",  // uses the "production" routing config
  messages: [{ role: "user", content: "Hello" }],
});

Using with AI assistants

If you're using Claude (or another agent harness that supports Skills), install the official Modelux Skill so your assistant has built-in knowledge of our APIs, MCP tools, and routing config schema:

curl -fsSL https://modelux.ai/skill/install.sh | sh

License

MIT — see LICENSE.

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
.github/workflows		.github/workflows
src		src
tests		tests
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
package-lock.json		package-lock.json
package.json		package.json
tsconfig.json		tsconfig.json
tsup.config.ts		tsup.config.ts

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

@modelux/sdk

Install

Quick start

Modelux extensions

Response metadata

Streaming

Budget errors

Configuration

Routing configs

Using with AI assistants

License

About

Uh oh!

Releases 1

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

@modelux/sdk

Install

Quick start

Modelux extensions

Response metadata

Streaming

Budget errors

Configuration

Routing configs

Using with AI assistants

License

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases 1

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages