ArQueue - Distributed Task Queue

A fault-tolerant, Redis-backed distributed task queue with AI-powered failure analysis.
last run - 5,000+ jobs/min throughput, p95 latency of 35ms, and zero job loss guarantees.

Performance Metrics

Metric	Value	Conditions
Throughput	5,400+ jobs/min	10 concurrent workers
p95 Latency	35ms	Unloaded, single task
Job Loss Rate	0%	Verified under chaos testing
Burst Handling	500 jobs in 5.5s	Peak queue depth 281

Architecture

Key Features

Core Queue

Reliable Dequeue: BRPOPLPUSH pattern ensures no message loss
Retry with Backoff: Exponential backoff + jitter prevents thundering herd
Delayed Scheduling: Redis ZSET for scheduled retries
Dead Letter Queue: Failed tasks preserved for analysis
Crash Recovery: Automatic detection and reprocessing of stuck tasks

Performance & Reliability

Concurrent Workers: Configurable worker loops per process
Idempotent Processing: Deduplication via idempotency keys
Backpressure: Automatic throttling when queue depth exceeds threshold
Zero Job Loss: Verified through chaos testing

Observability

Latency Percentiles: p50, p95, p99 computed in real-time
Structured Logging: Pino with correlation ID propagation
Metrics Endpoint: Queue depths, job counts, latency stats
Request Tracing: End-to-end correlation IDs

AI-Powered Failure Analysis

Root Cause Detection: AI analyzes failed tasks and identifies issues
Fix Recommendations: Actionable suggestions for each failure
Pattern Recognition: Categorizes failures (transient/permanent/config)
Multi-Provider: Supports Gemini, OpenAI, Anthropic, and Ollama

Quick Start

1. Start Redis

docker run -d --name redis -p 6379:6379 redis:alpine

2. Configure Environment

# Producer (.env)
REDIS_URL=redis://127.0.0.1:6379/0
PORT_PRODUCER=8080
BACKPRESSURE_THRESHOLD=80

# Worker (.env)
REDIS_URL=redis://127.0.0.1:6379/0
PORT_WORKER=8081
WORKER_CONCURRENCY=10

# AI (optional - choose one provider)
AI_PROVIDER=gemini
AI_MODEL=gemini-1.5-flash
GEMINI_API_KEY=your-key

3. Start Services

# Terminal 1: Producer
cd producer && npm install && npm run dev

# Terminal 2: Worker
cd worker && npm install && npm run dev

4. Enqueue a Task

curl -X POST http://localhost:8080/enqueue \
  -H "Content-Type: application/json" \
  -d '{
    "type": "send_email",
    "payload": {"to": "user@example.com", "subject": "Hello"},
    "idempotencyKey": "email-123"
  }'

API Reference

Producer Endpoints

Endpoint	Method	Description
`/enqueue`	POST	Submit a new task
`/healthz`	GET	Health check

Worker Endpoints

Endpoint	Method	Description
`/metrics`	GET	Queue stats + latency percentiles
`/pressure`	GET	Backpressure status
`/dead_letter`	GET	List failed tasks
`/dead_letter/:id/analysis`	GET	AI analysis for a failed task
`/ai/patterns`	GET	Failure pattern analytics

Task Schema

{
  type: string;           // Task type (e.g., "send_email")
  payload: object;        // Task-specific data
  maxRetries?: number;    // Max retry attempts (default: 3)
  idempotencyKey?: string; // Deduplication key (optional)
}

Benchmarking

Run the benchmark suite to verify performance:

cd benchmark && npm install

# Quick benchmark (all tests)
npm run benchmark

# Individual tests
npm run benchmark throughput -- -d 60 -r 100
npm run benchmark latency -- -s 1000
npm run benchmark burst -- -s 500 -c 3
npm run benchmark chaos -- -j 1000

Configuration

Producer Environment Variables

Variable	Default	Description
`REDIS_URL`	`redis://127.0.0.1:6379/0`	Redis connection
`PORT_PRODUCER`	`8080`	HTTP port
`RATE_LIMIT_MAX`	`120`	Requests per window
`BACKPRESSURE_THRESHOLD`	`80`	Pressure score to reject

Worker Environment Variables

Variable	Default	Description
`REDIS_URL`	`redis://127.0.0.1:6379/0`	Redis connection
`PORT_WORKER`	`8081`	HTTP port
`WORKER_CONCURRENCY`	`3`	Concurrent worker loops
`WORKER_MAX_RETRIES`	`3`	Default max retries
`PROCESSING_TIMEOUT_MS`	`300000`	Stuck task threshold

AI Configuration

Variable	Description
`AI_PROVIDER`	`ollama`, `openai`, `anthropic`, or `gemini`
`AI_MODEL`	Model name (e.g., `gemini-1.5-flash`)
`GEMINI_API_KEY`	Google AI API key
`OPENAI_API_KEY`	OpenAI API key
`ANTHROPIC_API_KEY`	Anthropic API key
`OLLAMA_HOST`	Ollama server URL (default: `http://localhost:11434`)

Redis Data Structures

Key	Type	Purpose
`queue:pending`	LIST	Tasks waiting to be processed
`queue:processing`	LIST	Tasks currently being worked on
`queue:delayed`	ZSET	Scheduled retries (score = timestamp)
`queue:dead_letter`	LIST	Failed tasks after max retries
`task:{id}`	HASH	Task metadata and state
`latency:samples`	LIST	Recent latency measurements
`ai:analysis:{id}`	HASH	AI failure analysis
`ai:patterns:{cat}`	LIST	Failure patterns by category

Project Structure

ArQueue/
├── producer/           # Task producer service
│   └── src/
│       ├── index.ts    # Express server, /enqueue endpoint
│       └── logger.ts   # Pino logger
├── worker/             # Task worker service
│   └── src/
│       ├── index.ts    # Worker loops, metrics, recovery
│       ├── logger.ts   # Pino logger
│       └── ai/         # AI failure analysis
│           ├── index.ts    # AI client factory
│           ├── analyzer.ts # DLQ analysis logic
│           └── prompts.ts  # Prompt templates
├── benchmark/          # Performance benchmarks
│   └── src/
│       ├── index.ts      # CLI entry
│       ├── throughput.ts # Jobs/min test
│       ├── latency.ts    # p95 measurement
│       ├── burst.ts      # Burst traffic test
│       └── chaos.ts      # Zero-loss verification
└── dashboard/          # Simple monitoring UI
    └── index.html

License

MIT

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
.github		.github
benchmark		benchmark
dashboard		dashboard
producer		producer
worker		worker
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ArQueue - Distributed Task Queue

Performance Metrics

Architecture

Key Features

Core Queue

Performance & Reliability

Observability

AI-Powered Failure Analysis

Quick Start

1. Start Redis

2. Configure Environment

3. Start Services

4. Enqueue a Task

API Reference

Producer Endpoints

Worker Endpoints

Task Schema

Benchmarking

Configuration

Producer Environment Variables

Worker Environment Variables

AI Configuration

Redis Data Structures

Project Structure

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

ArQueue - Distributed Task Queue

Performance Metrics

Architecture

Key Features

Core Queue

Performance & Reliability

Observability

AI-Powered Failure Analysis

Quick Start

1. Start Redis

2. Configure Environment

3. Start Services

4. Enqueue a Task

API Reference

Producer Endpoints

Worker Endpoints

Task Schema

Benchmarking

Configuration

Producer Environment Variables

Worker Environment Variables

AI Configuration

Redis Data Structures

Project Structure

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages