diff --git a/Cargo.toml b/Cargo.toml
index 91d1557..07e2f3e 100644
--- a/Cargo.toml
+++ b/Cargo.toml
@@ -15,6 +15,7 @@ bench = false
 [features]
 default = ["sysinfo-monitor"]
 sysinfo-monitor = ["dep:sysinfo"]
+metrics = ["dep:metrics"]
 profile = ["dep:pprof"]
 
 [dependencies]
@@ -28,12 +29,15 @@ serde = { version = "1", features = ["derive"] }
 serde_json = "1"
 sha2 = "0.10"
 fastrand = "2"
+metrics = { version = "0.24", optional = true }
 sysinfo = { version = "0.33", optional = true }
 pprof = { version = "0.13", features = ["flamegraph", "criterion"], optional = true }
 
 [dev-dependencies]
 tokio = { version = "1", features = ["full", "test-util"] }
 criterion = { version = "0.5", features = ["async_tokio"] }
+metrics = "0.24"
+metrics-util = "0.19"
 
 [[bench]]
 name = "scheduler"
diff --git a/docs/configuration.md b/docs/configuration.md
index c8f7ed9..698524c 100644
--- a/docs/configuration.md
+++ b/docs/configuration.md
@@ -320,6 +320,7 @@ scheduler.register_state(Arc::new(LibraryState { /* ... */ })).await;
 | Feature | Default | Description |
 |---------|---------|-------------|
 | `sysinfo-monitor` | Enabled | Cross-platform CPU, disk IO, and network monitoring via `sysinfo`. Disable for mobile targets or when using a custom sampler. |
+| `metrics` | Disabled | Emit counters, gauges, and histograms via the [`metrics`](https://crates.io/crates/metrics) crate facade. See [Metrics & Observability](metrics.md). |
 
 ```toml
 # Disable platform monitoring
@@ -546,6 +547,9 @@ Scheduler::builder()
 | `group_minimum_slots(group, slots)` | Minimum guaranteed dispatch slots for a group, regardless of weight. |
 | `app_state(state)` | Register global state visible to all domains. |
 | `app_state_arc(arc)` | Register global state from a pre-existing `Arc`. |
+| `metrics_prefix(prefix)` | Prefix for all `metrics` crate metric names (e.g. `"myapp"` → `myapp_taskmill_*`). See [Metrics](metrics.md). |
+| `metrics_label(key, value)` | Global label applied to every emitted metric. |
+| `disable_metric(name)` | Suppress emission of a specific metric by unprefixed name. |
 | `build()` | Build and return the `Scheduler`. |
 
 ### `Domain<D>` builder methods
diff --git a/docs/io-and-backpressure.md b/docs/io-and-backpressure.md
index 0c9d9c5..74b1c99 100644
--- a/docs/io-and-backpressure.md
+++ b/docs/io-and-backpressure.md
@@ -237,3 +237,5 @@ for (name, value) in &snap.pressure_breakdown {
     println!("  {}: {:.0}%", name, value * 100.0);
 }
 ```
+
+For production monitoring beyond snapshots, see [Metrics & Observability](metrics.md) — the `metrics` crate integration exports pressure gauges, gate denial counters, and rate limit token availability as standard Prometheus/StatsD metrics.
diff --git a/docs/metrics.md b/docs/metrics.md
new file mode 100644
index 0000000..5fed3c7
--- /dev/null
+++ b/docs/metrics.md
@@ -0,0 +1,206 @@
+# Observability Metrics
+
+Taskmill provides built-in observability through two complementary systems:
+
+1. **Always-on internal counters** — cheap `AtomicU64` counters maintained regardless of feature flags, exposed via `Scheduler::metrics_snapshot()`.
+2. **`metrics` crate integration** (optional) — when the `metrics` Cargo feature is enabled, the scheduler emits counters, gauges, and histograms via the standard [`metrics`](https://crates.io/crates/metrics) facade. Consumers choose their exporter (Prometheus, StatsD, Datadog, etc.).
+
+## Quick Start
+
+### Without the `metrics` feature (default)
+
+```rust
+let snap = scheduler.metrics_snapshot().await;
+println!("submitted: {}, completed: {}, failed: {}",
+    snap.submitted, snap.completed, snap.failed);
+println!("pending: {}, running: {}, pressure: {:.2}",
+    snap.pending, snap.running, snap.pressure);
+```
+
+### With the `metrics` feature
+
+```toml
+[dependencies]
+taskmill = { version = "0.6", features = ["metrics"] }
+metrics-exporter-prometheus = "0.16"
+```
+
+```rust
+// Install a Prometheus exporter (or any metrics recorder).
+let builder = metrics_exporter_prometheus::PrometheusBuilder::new();
+builder.install().expect("failed to install Prometheus recorder");
+
+// Build the scheduler — metrics are automatically emitted.
+let scheduler = Scheduler::builder()
+    .store_path("tasks.db")
+    .domain(Domain::<MyApp>::new().task(MyExecutor))
+    .metrics_prefix("myapp")           // → myapp_taskmill_*
+    .metrics_label("service", "ingest") // global label on every metric
+    .build()
+    .await?;
+```
+
+## MetricsSnapshot
+
+`Scheduler::metrics_snapshot()` returns a `MetricsSnapshot` struct with:
+
+### Counters (cumulative since scheduler creation)
+
+| Field | Description |
+|-------|-------------|
+| `submitted` | Total tasks accepted into the queue |
+| `dispatched` | Total tasks that entered Running state |
+| `completed` | Total successful completions |
+| `failed` | Total failures (retryable + permanent) |
+| `failed_retryable` | Subset of `failed` that were retryable |
+| `retried` | Total retry requeue attempts |
+| `dead_lettered` | Tasks that exhausted retries |
+| `superseded` | Tasks replaced by newer submissions with the same dedup key |
+| `cancelled` | Explicit cancellations |
+| `expired` | Tasks that hit TTL before dispatch |
+| `preempted` | Tasks preempted by higher-priority work |
+| `batches_submitted` | Total `submit_batch()` calls |
+| `gate_denials` | Dispatch gate rejections (backpressure, IO budget, concurrency, rate limit) |
+| `rate_limit_throttles` | Rate limit token exhaustion events |
+| `group_pauses` | Group pause events |
+| `group_resumes` | Group resume events |
+| `dependency_failures` | Blocked tasks cancelled because a dependency failed |
+| `recurring_skipped` | Recurring instances skipped due to pile-up prevention |
+
+### Gauges (point-in-time)
+
+| Field | Description |
+|-------|-------------|
+| `pending` | Current queue depth |
+| `running` | Current running task count |
+| `blocked` | Tasks waiting on unmet dependencies |
+| `paused` | Tasks in pause state |
+| `waiting` | Parent tasks waiting for children |
+| `pressure` | Aggregate backpressure (0.0–1.0) |
+| `max_concurrency` | Current concurrency cap |
+| `groups_paused` | Number of currently paused groups |
+
+## `metrics` Crate Metrics Reference
+
+All metrics use the prefix `taskmill_` (customizable via `SchedulerBuilder::metrics_prefix`).
+
+### Counters
+
+| Metric | Labels | Description |
+|--------|--------|-------------|
+| `taskmill_tasks_submitted_total` | `type`, `module`, `group` | Total tasks accepted into the queue |
+| `taskmill_tasks_dispatched_total` | `type`, `module`, `group` | Total tasks that entered Running state |
+| `taskmill_tasks_completed_total` | `type`, `module`, `group` | Total successful completions |
+| `taskmill_tasks_failed_total` | `type`, `module`, `group`, `retryable` | Total failures, split by retryability |
+| `taskmill_tasks_retried_total` | `type`, `module`, `group` | Total retry requeue attempts |
+| `taskmill_tasks_dead_lettered_total` | `type`, `module`, `group` | Tasks that exhausted retries |
+| `taskmill_tasks_superseded_total` | `type`, `module`, `group` | Tasks replaced by newer submissions |
+| `taskmill_tasks_cancelled_total` | `type`, `module`, `group` | Explicit cancellations |
+| `taskmill_tasks_expired_total` | `type`, `module`, `group` | Tasks that hit TTL before dispatch |
+| `taskmill_tasks_preempted_total` | `type`, `module` | Tasks preempted by higher-priority work |
+| `taskmill_batches_submitted_total` | — | Total batch submission calls |
+| `taskmill_gate_denials_total` | `reason` | Dispatch gate rejections by reason |
+| `taskmill_rate_limit_throttles_total` | `scope_kind`, `scope` | Rate limit token exhaustion events |
+| `taskmill_group_pauses_total` | `group` | Group pause events |
+| `taskmill_group_resumes_total` | `group` | Group resume events |
+| `taskmill_dependency_failures_total` | — | Blocked tasks cancelled because a dependency failed |
+| `taskmill_recurring_skipped_total` | `type`, `module` | Recurring instances skipped |
+
+### Gauges
+
+Updated each dispatch cycle (~500ms default).
+
+| Metric | Labels | Description |
+|--------|--------|-------------|
+| `taskmill_tasks_pending` | — | Current queue depth |
+| `taskmill_tasks_running` | — | Current running task count |
+| `taskmill_tasks_blocked` | — | Tasks waiting on unmet dependencies |
+| `taskmill_tasks_paused` | — | Tasks in pause state |
+| `taskmill_tasks_waiting` | — | Parent tasks waiting for children |
+| `taskmill_max_concurrency` | — | Current concurrency cap |
+| `taskmill_pressure` | — | Aggregate backpressure (0.0–1.0) |
+| `taskmill_pressure_source` | `source` | Per-source pressure level |
+| `taskmill_groups_paused_count` | — | Number of currently paused groups |
+| `taskmill_rate_limit_tokens_available` | `scope_kind`, `scope` | Current available tokens per rate-limit bucket |
+| `taskmill_module_tasks_running` | `module` | Running tasks per registered module |
+
+### Histograms
+
+| Metric | Labels | Description |
+|--------|--------|-------------|
+| `taskmill_task_duration_seconds` | `type`, `module`, `status` | Wall-clock execution time (completed/failed) |
+| `taskmill_task_queue_wait_seconds` | `type`, `module` | Time from submission to dispatch start |
+| `taskmill_batch_size` | — | Number of tasks per batch submission call |
+| `taskmill_completion_batch_size` | — | Number of completions coalesced per drain cycle |
+| `taskmill_failure_batch_size` | — | Number of failures coalesced per drain cycle |
+
+## Recommended Dashboard Layout (Prometheus/Grafana)
+
+### Row 1 — Throughput & Queue Health
+
+| Panel | PromQL | Signal |
+|-------|--------|--------|
+| Submission rate | `rate(taskmill_tasks_submitted_total[5m])` | How fast work is arriving |
+| Throughput | `rate(taskmill_tasks_completed_total[5m])` | How fast work is completing |
+| Queue depth | `taskmill_tasks_pending` | Primary health signal |
+| Absorption ratio | `rate(taskmill_tasks_dispatched_total[5m]) / rate(taskmill_tasks_submitted_total[5m])` | Values <1.0 = queue growing |
+
+### Row 2 — Failure & Retry Health
+
+| Panel | PromQL | Signal |
+|-------|--------|--------|
+| Failure rate | `rate(taskmill_tasks_failed_total[5m])` by `retryable` | Transient vs permanent |
+| Retry ratio | `rate(taskmill_tasks_retried_total[5m]) / rate(taskmill_tasks_dispatched_total[5m])` | >10% warrants investigation |
+| Dead letter rate | `rate(taskmill_tasks_dead_lettered_total[5m])` | Alert on any nonzero |
+| Expiry rate | `rate(taskmill_tasks_expired_total[5m])` | Correlate with queue depth |
+
+### Row 3 — Latency Distributions
+
+| Panel | PromQL | Signal |
+|-------|--------|--------|
+| Execution p50/p95/p99 | `histogram_quantile(0.95, rate(taskmill_task_duration_seconds_bucket[5m]))` | Tail latency |
+| Queue wait p50/p95/p99 | `histogram_quantile(0.95, rate(taskmill_task_queue_wait_seconds_bucket[5m]))` | Time in queue |
+
+### Row 4 — Capacity & Bottlenecks
+
+| Panel | PromQL | Signal |
+|-------|--------|--------|
+| Concurrency utilization | `taskmill_tasks_running / taskmill_max_concurrency` | Sustained 1.0 = at limit |
+| Backpressure | `taskmill_pressure` | >0.8 = active throttling |
+| Gate denials by reason | `rate(taskmill_gate_denials_total[5m])` by `reason` | Primary bottleneck |
+
+## Suggested Alert Rules
+
+| Alert | Condition | Severity |
+|-------|-----------|----------|
+| Queue growing | `taskmill_tasks_pending > <threshold>` for 10m | Warning |
+| Dead letters | `rate(taskmill_tasks_dead_lettered_total[5m]) > 0` for 5m | Critical |
+| High retry ratio | retry ratio > 0.1 for 15m | Warning |
+| Sustained backpressure | `taskmill_pressure > 0.9` for 10m | Warning |
+| Queue wait SLO breach | p95 queue wait > SLO for 5m | Warning |
+
+## Builder API
+
+```rust
+Scheduler::builder()
+    // Prefix all metric names: "myapp_taskmill_*"
+    .metrics_prefix("myapp")
+
+    // Add global labels to every metric
+    .metrics_label("service", "ingest")
+    .metrics_label("env", "production")
+
+    // Suppress specific metrics (use unprefixed name)
+    .disable_metric("task_duration_seconds")
+
+    .build()
+    .await?;
+```
+
+## Design Principles
+
+- **Zero-cost when unused** — no overhead when no `metrics` recorder is installed. Internal atomic counters cost a few cache lines.
+- **Standard facade** — uses the `metrics` crate so consumers choose their exporter.
+- **Source-level instrumentation** — metrics emitted where the event happens, not from a channel subscriber.
+- **Bounded label cardinality** — only `type`, `module`, `group`, and `reason` appear as labels. Never `task_id`, `key`, or user-provided `tags`.
+- **No allocations on the hot path** — label values are borrowed `&str` or small stack strings.
diff --git a/docs/progress-and-events.md b/docs/progress-and-events.md
index 921142d..6f02016 100644
--- a/docs/progress-and-events.md
+++ b/docs/progress-and-events.md
@@ -194,3 +194,8 @@ async fn scheduler_status(
     scheduler.snapshot().await
 }
 ```
+
+## See also
+
+- [Metrics & Observability](metrics.md) — for production monitoring with Prometheus, StatsD, or Datadog. The `metrics` crate integration emits counters, gauges, and histograms that complement the real-time event stream described above.
+- [Query APIs](query-apis.md) — for polling-based dashboards and task inspection.
diff --git a/docs/query-apis.md b/docs/query-apis.md
index 60a0552..d6276e8 100644
--- a/docs/query-apis.md
+++ b/docs/query-apis.md
@@ -58,7 +58,7 @@ These methods operate across all domains and are available directly on `Schedule
 | `scheduler.task(id)` | `Option<TaskRecord>` | Look up any active task by ID, regardless of which domain owns it. |
 | `scheduler.snapshot()` | `SchedulerSnapshot` | Global aggregates: total running, pending, pressure, progress, and recurring schedules. |
 
-See [Multi-Module Applications](multi-module-apps.md#building-a-cross-module-dashboard) for dashboard patterns using these APIs.
+See [Multi-Module Applications](multi-module-apps.md#building-a-cross-module-dashboard) for dashboard patterns using these APIs, and [Metrics & Observability](metrics.md) for production-grade metrics export to Prometheus, StatsD, or Datadog.
 
 ## Cancellation
 
diff --git a/docs/quick-start.md b/docs/quick-start.md
index 1e3cd6c..c1bb49c 100644
--- a/docs/quick-start.md
+++ b/docs/quick-start.md
@@ -556,6 +556,7 @@ Work through the topic guides in order:
 4. [Persistence & Recovery](persistence-and-recovery.md) — understand crash safety and deduplication
 5. [Configuration](configuration.md) — tune for your workload
 6. [Query APIs](query-apis.md) — build dashboards and debug stuck tasks
-7. [Multi-Module Applications](multi-module-apps.md) — assemble multiple domains, cross-domain dependencies, tags, and dashboards
-8. [Writing a Reusable Module](library-modules.md) — publish a domain as a library crate
-9. [Design](design.md) — understand the architecture for advanced use
+7. [Metrics & Observability](metrics.md) — internal counters, `metrics` crate integration, Prometheus dashboards
+8. [Multi-Module Applications](multi-module-apps.md) — assemble multiple domains, cross-domain dependencies, tags, and dashboards
+9. [Writing a Reusable Module](library-modules.md) — publish a domain as a library crate
+10. [Design](design.md) — understand the architecture for advanced use
diff --git a/src/lib.rs b/src/lib.rs
index 7f86409..5a00b26 100644
--- a/src/lib.rs
+++ b/src/lib.rs
@@ -801,6 +801,28 @@
 //!   when providing a custom [`ResourceSampler`]. Without this feature, calling
 //!   [`SchedulerBuilder::with_resource_monitoring`] requires a custom sampler
 //!   via [`resource_sampler()`](SchedulerBuilder::resource_sampler).
+//! - **`metrics`**: Enables integration with the [`metrics`](https://crates.io/crates/metrics) crate.
+//!   When enabled, the scheduler emits counters, gauges, and histograms via the `metrics`
+//!   facade — consumers choose their exporter (Prometheus, StatsD, etc.). Internal atomic
+//!   counters and [`MetricsSnapshot`] are always available regardless of this feature.
+//!
+//! # Metrics
+//!
+//! Taskmill provides two levels of observability:
+//!
+//! 1. **Always-on internal counters** — [`Scheduler::metrics_snapshot()`] returns a
+//!    [`MetricsSnapshot`] with cumulative counters (submitted, dispatched, completed,
+//!    failed, retried, dead-lettered, etc.) and point-in-time gauges (pending, running,
+//!    pressure, max_concurrency). Available without any feature flags.
+//!
+//! 2. **`metrics` crate integration** (feature-gated) — when the `metrics` feature is
+//!    enabled, the scheduler emits ~30 metrics via the standard `metrics` facade. All
+//!    metric names use the `taskmill_` prefix (customizable via
+//!    [`SchedulerBuilder::metrics_prefix`]). Labels include `type`, `module`, `group`,
+//!    and `reason` (bounded cardinality). Configure with:
+//!    - [`SchedulerBuilder::metrics_prefix`] — custom prefix
+//!    - [`SchedulerBuilder::metrics_label`] — global labels
+//!    - [`SchedulerBuilder::disable_metric`] — suppress specific metrics
 
 pub mod backpressure;
 pub mod domain;
@@ -826,9 +848,10 @@ pub use resource::network_pressure::NetworkPressure;
 pub use resource::sampler::SamplerConfig;
 pub use resource::{ResourceReader, ResourceSampler, ResourceSnapshot};
 pub use scheduler::{
-    AgingConfig, EstimatedProgress, GroupAllocationInfo, GroupLimits, PausedGroupInfo,
-    ProgressReporter, RateLimit, RateLimitInfo, Scheduler, SchedulerBuilder, SchedulerConfig,
-    SchedulerEvent, SchedulerSnapshot, ShutdownMode, TaskEventHeader, TaskProgress,
+    AgingConfig, EstimatedProgress, GroupAllocationInfo, GroupLimits, MetricsSnapshot,
+    PausedGroupInfo, ProgressReporter, RateLimit, RateLimitInfo, Scheduler, SchedulerBuilder,
+    SchedulerConfig, SchedulerEvent, SchedulerSnapshot, ShutdownMode, TaskEventHeader,
+    TaskProgress,
 };
 pub use store::{RetentionPolicy, StoreConfig, StoreError, TaskStore};
 pub use task::{
diff --git a/src/scheduler/builder.rs b/src/scheduler/builder.rs
index 3f39663..4e1343b 100644
--- a/src/scheduler/builder.rs
+++ b/src/scheduler/builder.rs
@@ -60,6 +60,9 @@ pub struct SchedulerBuilder {
     group_weights: Vec<(String, u32)>,
     default_group_weight: u32,
     group_min_slots: Vec<(String, usize)>,
+    metrics_prefix: Option<String>,
+    metrics_global_labels: Vec<(String, String)>,
+    metrics_disabled: std::collections::HashSet<String>,
 }
 
 impl SchedulerBuilder {
@@ -85,6 +88,9 @@ impl SchedulerBuilder {
             group_weights: Vec::new(),
             default_group_weight: 1,
             group_min_slots: Vec::new(),
+            metrics_prefix: None,
+            metrics_global_labels: Vec::new(),
+            metrics_disabled: std::collections::HashSet::new(),
         }
     }
 
@@ -351,6 +357,34 @@ impl SchedulerBuilder {
         self
     }
 
+    /// Set a prefix prepended to all metric names.
+    ///
+    /// Example: `metrics_prefix("myapp")` →
+    /// `myapp_taskmill_tasks_submitted_total`
+    pub fn metrics_prefix(mut self, prefix: impl Into<String>) -> Self {
+        self.metrics_prefix = Some(prefix.into());
+        self
+    }
+
+    /// Add a global label applied to all emitted metrics.
+    ///
+    /// Example: `metrics_label("service", "ingest")` adds
+    /// `service="ingest"` to every metric.
+    pub fn metrics_label(mut self, key: impl Into<String>, value: impl Into<String>) -> Self {
+        self.metrics_global_labels.push((key.into(), value.into()));
+        self
+    }
+
+    /// Disable emission of a specific metric by name.
+    ///
+    /// Useful for suppressing high-cardinality or expensive metrics
+    /// (e.g. histograms in extremely hot paths). The metric name should
+    /// be the full name without prefix (e.g. `"task_duration_seconds"`).
+    pub fn disable_metric(mut self, name: impl Into<String>) -> Self {
+        self.metrics_disabled.insert(name.into());
+        self
+    }
+
     /// Build the scheduler. Opens the database and wires all components.
     ///
     /// # Errors
@@ -498,7 +532,13 @@ impl SchedulerBuilder {
                 .map_err(|e| StoreError::Database(e.into()))?;
         }
 
-        let scheduler = Scheduler::with_gate(
+        let metrics_config = super::MetricsConfig {
+            prefix: self.metrics_prefix,
+            global_labels: self.metrics_global_labels,
+            disabled: self.metrics_disabled,
+        };
+
+        let scheduler = Scheduler::with_gate_and_metrics(
             store,
             self.config,
             Arc::new(registry),
@@ -506,6 +546,7 @@ impl SchedulerBuilder {
             app_state,
             module_registry,
             module_state,
+            metrics_config,
         );
 
         // Load persisted group pause state (survives restarts).
@@ -626,6 +667,10 @@ impl SchedulerBuilder {
                 .store(true, std::sync::atomic::Ordering::Relaxed);
         }
 
+        // Register metric descriptions (once, at build time).
+        #[cfg(feature = "metrics")]
+        scheduler.inner.emitter.describe_metrics();
+
         Ok(scheduler)
     }
 }
diff --git a/src/scheduler/control.rs b/src/scheduler/control.rs
index 9684631..21d1502 100644
--- a/src/scheduler/control.rs
+++ b/src/scheduler/control.rs
@@ -137,6 +137,13 @@ impl Scheduler {
             .pause_group(group_key, &self.inner.store, &self.inner.event_tx)
             .await;
 
+        self.inner
+            .counters
+            .group_pauses
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+        #[cfg(feature = "metrics")]
+        self.inner.emitter.record_group_pause(group_key);
+
         let _ = self.inner.event_tx.send(SchedulerEvent::GroupPaused {
             group: group_key.to_string(),
             pending_count: pending_paused as usize,
@@ -195,6 +202,13 @@ impl Scheduler {
             self.inner.work_notify.notify_one();
         }
 
+        self.inner
+            .counters
+            .group_resumes
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+        #[cfg(feature = "metrics")]
+        self.inner.emitter.record_group_resume(group_key);
+
         let _ = self.inner.event_tx.send(SchedulerEvent::GroupResumed {
             group: group_key.to_string(),
             resumed_count: resumed_count as usize,
diff --git a/src/scheduler/counters.rs b/src/scheduler/counters.rs
new file mode 100644
index 0000000..2f655f8
--- /dev/null
+++ b/src/scheduler/counters.rs
@@ -0,0 +1,142 @@
+//! Internal atomic counters for scheduler throughput metrics.
+//!
+//! Always maintained regardless of feature flags. Exposed via
+//! [`MetricsSnapshot`] for consumers who don't use the `metrics` crate.
+
+use std::sync::atomic::{AtomicU64, Ordering::Relaxed};
+
+/// Internal atomic counters for scheduler throughput metrics.
+///
+/// Always maintained regardless of feature flags. Counters are
+/// incremented at the code path where the event happens (submit,
+/// dispatch, completion, failure, etc.) and exposed via
+/// [`Scheduler::metrics_snapshot()`](super::Scheduler::metrics_snapshot).
+pub(crate) struct SchedulerCounters {
+    pub submitted: AtomicU64,
+    pub dispatched: AtomicU64,
+    pub completed: AtomicU64,
+    pub failed: AtomicU64,
+    pub failed_retryable: AtomicU64,
+    pub retried: AtomicU64,
+    pub dead_lettered: AtomicU64,
+    pub superseded: AtomicU64,
+    pub cancelled: AtomicU64,
+    pub expired: AtomicU64,
+    pub preempted: AtomicU64,
+    pub batches_submitted: AtomicU64,
+    pub gate_denials: AtomicU64,
+    pub rate_limit_throttles: AtomicU64,
+    pub group_pauses: AtomicU64,
+    pub group_resumes: AtomicU64,
+    pub dependency_failures: AtomicU64,
+    pub recurring_skipped: AtomicU64,
+}
+
+impl SchedulerCounters {
+    pub(crate) fn new() -> Self {
+        Self {
+            submitted: AtomicU64::new(0),
+            dispatched: AtomicU64::new(0),
+            completed: AtomicU64::new(0),
+            failed: AtomicU64::new(0),
+            failed_retryable: AtomicU64::new(0),
+            retried: AtomicU64::new(0),
+            dead_lettered: AtomicU64::new(0),
+            superseded: AtomicU64::new(0),
+            cancelled: AtomicU64::new(0),
+            expired: AtomicU64::new(0),
+            preempted: AtomicU64::new(0),
+            batches_submitted: AtomicU64::new(0),
+            gate_denials: AtomicU64::new(0),
+            rate_limit_throttles: AtomicU64::new(0),
+            group_pauses: AtomicU64::new(0),
+            group_resumes: AtomicU64::new(0),
+            dependency_failures: AtomicU64::new(0),
+            recurring_skipped: AtomicU64::new(0),
+        }
+    }
+
+    /// Take a snapshot of all counter values.
+    pub(crate) fn snapshot(&self) -> CounterSnapshot {
+        CounterSnapshot {
+            submitted: self.submitted.load(Relaxed),
+            dispatched: self.dispatched.load(Relaxed),
+            completed: self.completed.load(Relaxed),
+            failed: self.failed.load(Relaxed),
+            failed_retryable: self.failed_retryable.load(Relaxed),
+            retried: self.retried.load(Relaxed),
+            dead_lettered: self.dead_lettered.load(Relaxed),
+            superseded: self.superseded.load(Relaxed),
+            cancelled: self.cancelled.load(Relaxed),
+            expired: self.expired.load(Relaxed),
+            preempted: self.preempted.load(Relaxed),
+            batches_submitted: self.batches_submitted.load(Relaxed),
+            gate_denials: self.gate_denials.load(Relaxed),
+            rate_limit_throttles: self.rate_limit_throttles.load(Relaxed),
+            group_pauses: self.group_pauses.load(Relaxed),
+            group_resumes: self.group_resumes.load(Relaxed),
+            dependency_failures: self.dependency_failures.load(Relaxed),
+            recurring_skipped: self.recurring_skipped.load(Relaxed),
+        }
+    }
+}
+
+/// Snapshot of counter values only (no gauges). Used internally to build
+/// [`MetricsSnapshot`].
+pub(crate) struct CounterSnapshot {
+    pub submitted: u64,
+    pub dispatched: u64,
+    pub completed: u64,
+    pub failed: u64,
+    pub failed_retryable: u64,
+    pub retried: u64,
+    pub dead_lettered: u64,
+    pub superseded: u64,
+    pub cancelled: u64,
+    pub expired: u64,
+    pub preempted: u64,
+    pub batches_submitted: u64,
+    pub gate_denials: u64,
+    pub rate_limit_throttles: u64,
+    pub group_pauses: u64,
+    pub group_resumes: u64,
+    pub dependency_failures: u64,
+    pub recurring_skipped: u64,
+}
+
+/// Point-in-time counter and gauge snapshot for consumers who don't use
+/// the `metrics` crate.
+///
+/// All counter values are cumulative since scheduler creation. Gauge values
+/// reflect the current instant. Available without any feature flags.
+#[derive(Debug, Clone, serde::Serialize, serde::Deserialize)]
+pub struct MetricsSnapshot {
+    // Counters (cumulative)
+    pub submitted: u64,
+    pub dispatched: u64,
+    pub completed: u64,
+    pub failed: u64,
+    pub failed_retryable: u64,
+    pub retried: u64,
+    pub dead_lettered: u64,
+    pub superseded: u64,
+    pub cancelled: u64,
+    pub expired: u64,
+    pub preempted: u64,
+    pub batches_submitted: u64,
+    pub gate_denials: u64,
+    pub rate_limit_throttles: u64,
+    pub group_pauses: u64,
+    pub group_resumes: u64,
+    pub dependency_failures: u64,
+    pub recurring_skipped: u64,
+    // Gauges (point-in-time)
+    pub pending: i64,
+    pub running: usize,
+    pub blocked: i64,
+    pub paused: i64,
+    pub waiting: i64,
+    pub pressure: f32,
+    pub max_concurrency: usize,
+    pub groups_paused: usize,
+}
diff --git a/src/scheduler/gate.rs b/src/scheduler/gate.rs
index 55b02b5..c3d4c5d 100644
--- a/src/scheduler/gate.rs
+++ b/src/scheduler/gate.rs
@@ -61,6 +61,8 @@ pub struct GateContext<'a> {
     /// `dispatch_fair()` pass 1 where group slot budgets are already
     /// enforced by the allocation algorithm.
     pub skip_group_concurrency: bool,
+    /// Internal atomic counters for throughput metrics.
+    pub counters: &'a super::counters::SchedulerCounters,
 }
 
 // ── Dispatch Gate ──────────────────────────────────────────────────
@@ -144,6 +146,8 @@ impl DispatchGate for DefaultDispatchGate {
         ctx: &'a GateContext<'a>,
     ) -> BoxFuture<'a, Result<Admission, StoreError>> {
         Box::pin(async move {
+            use std::sync::atomic::Ordering::Relaxed;
+
             // Backpressure check.
             let current_pressure = self.pressure.lock().await.pressure();
             if self.policy.should_throttle(task.priority, current_pressure) {
@@ -152,6 +156,7 @@ impl DispatchGate for DefaultDispatchGate {
                     pressure = current_pressure,
                     "task throttled by backpressure — requeuing"
                 );
+                ctx.counters.gate_denials.fetch_add(1, Relaxed);
                 return Ok(Admission::Deny);
             }
 
@@ -163,6 +168,7 @@ impl DispatchGate for DefaultDispatchGate {
                     expected_write = task.expected_io.disk_write,
                     "task deferred — disk IO budget exhausted — requeuing"
                 );
+                ctx.counters.gate_denials.fetch_add(1, Relaxed);
                 return Ok(Admission::Deny);
             }
 
@@ -174,6 +180,7 @@ impl DispatchGate for DefaultDispatchGate {
                     expected_tx = task.expected_io.net_tx,
                     "task deferred — network IO budget exhausted — requeuing"
                 );
+                ctx.counters.gate_denials.fetch_add(1, Relaxed);
                 return Ok(Admission::Deny);
             }
 
@@ -185,6 +192,7 @@ impl DispatchGate for DefaultDispatchGate {
                         group = group_key,
                         "task deferred — group paused — requeuing"
                     );
+                    ctx.counters.gate_denials.fetch_add(1, Relaxed);
                     return Ok(Admission::Deny);
                 }
             }
@@ -204,6 +212,7 @@ impl DispatchGate for DefaultDispatchGate {
                                     limit,
                                     "task deferred — group concurrency saturated — requeuing"
                                 );
+                                ctx.counters.gate_denials.fetch_add(1, Relaxed);
                                 return Ok(Admission::Deny);
                             }
                         }
@@ -227,6 +236,7 @@ impl DispatchGate for DefaultDispatchGate {
                             cap,
                             "task deferred — module concurrency saturated — requeuing"
                         );
+                        ctx.counters.gate_denials.fetch_add(1, Relaxed);
                         return Ok(Admission::Deny);
                     }
                 }
@@ -240,6 +250,8 @@ impl DispatchGate for DefaultDispatchGate {
                     task_type = task.task_type,
                     "task deferred — task-type rate limit"
                 );
+                ctx.counters.gate_denials.fetch_add(1, Relaxed);
+                ctx.counters.rate_limit_throttles.fetch_add(1, Relaxed);
                 return Ok(Admission::RateLimited(next));
             }
 
@@ -251,6 +263,8 @@ impl DispatchGate for DefaultDispatchGate {
                         group = group_key,
                         "task deferred — group rate limit"
                     );
+                    ctx.counters.gate_denials.fetch_add(1, Relaxed);
+                    ctx.counters.rate_limit_throttles.fetch_add(1, Relaxed);
                     return Ok(Admission::RateLimited(next));
                 }
             }
diff --git a/src/scheduler/metrics_bridge.rs b/src/scheduler/metrics_bridge.rs
new file mode 100644
index 0000000..ebd3ad0
--- /dev/null
+++ b/src/scheduler/metrics_bridge.rs
@@ -0,0 +1,477 @@
+//! `metrics` crate integration — feature-gated metric emission.
+//!
+//! This module provides [`MetricsEmitter`], a thin wrapper that emits metrics
+//! via the `metrics` crate facade. All methods compile to nothing when no
+//! recorder is installed (the `metrics` crate's built-in no-op path).
+
+use std::time::Duration;
+
+use metrics::{counter, gauge, histogram, Label};
+
+/// Thin wrapper that formats metric names with an optional prefix and
+/// attaches global labels. All methods are `#[inline]` for zero overhead
+/// when the recorder is a no-op.
+#[allow(dead_code)]
+pub(crate) struct MetricsEmitter {
+    prefix: String,
+    global_labels: Vec<Label>,
+}
+
+#[allow(dead_code)]
+impl MetricsEmitter {
+    pub(crate) fn new(prefix: Option<String>, global_labels: Vec<(String, String)>) -> Self {
+        let prefix = match prefix {
+            Some(p) => format!("{p}_taskmill_"),
+            None => "taskmill_".to_string(),
+        };
+        let global_labels = global_labels
+            .into_iter()
+            .map(|(k, v)| Label::new(k, v))
+            .collect();
+        Self {
+            prefix,
+            global_labels,
+        }
+    }
+
+    fn name(&self, suffix: &str) -> String {
+        format!("{}{suffix}", self.prefix)
+    }
+
+    fn labels(&self, extra: &[(&str, &str)]) -> Vec<Label> {
+        let mut labels: Vec<Label> = self.global_labels.clone();
+        for (k, v) in extra {
+            labels.push(Label::new(k.to_string(), v.to_string()));
+        }
+        labels
+    }
+
+    /// Register metric descriptions. Called once at scheduler build time.
+    pub(crate) fn describe_metrics(&self) {
+        use metrics::{describe_counter, describe_gauge, describe_histogram, Unit};
+
+        // Counters
+        describe_counter!(
+            self.name("tasks_submitted_total"),
+            Unit::Count,
+            "Total tasks accepted into the queue"
+        );
+        describe_counter!(
+            self.name("tasks_dispatched_total"),
+            Unit::Count,
+            "Total tasks that entered Running state"
+        );
+        describe_counter!(
+            self.name("tasks_completed_total"),
+            Unit::Count,
+            "Total successful completions"
+        );
+        describe_counter!(
+            self.name("tasks_failed_total"),
+            Unit::Count,
+            "Total failures, split by retryability"
+        );
+        describe_counter!(
+            self.name("tasks_retried_total"),
+            Unit::Count,
+            "Total retry requeue attempts"
+        );
+        describe_counter!(
+            self.name("tasks_dead_lettered_total"),
+            Unit::Count,
+            "Tasks that exhausted retries"
+        );
+        describe_counter!(
+            self.name("tasks_superseded_total"),
+            Unit::Count,
+            "Tasks replaced by newer submissions with the same dedup key"
+        );
+        describe_counter!(
+            self.name("tasks_cancelled_total"),
+            Unit::Count,
+            "Explicit cancellations"
+        );
+        describe_counter!(
+            self.name("tasks_expired_total"),
+            Unit::Count,
+            "Tasks that hit TTL before dispatch"
+        );
+        describe_counter!(
+            self.name("tasks_preempted_total"),
+            Unit::Count,
+            "Tasks preempted by higher-priority work"
+        );
+        describe_counter!(
+            self.name("batches_submitted_total"),
+            Unit::Count,
+            "Total batch submission calls"
+        );
+        describe_counter!(
+            self.name("gate_denials_total"),
+            Unit::Count,
+            "Dispatch gate rejections by reason"
+        );
+        describe_counter!(
+            self.name("rate_limit_throttles_total"),
+            Unit::Count,
+            "Rate limit token exhaustion events per scope"
+        );
+        describe_counter!(
+            self.name("group_pauses_total"),
+            Unit::Count,
+            "Group pause events"
+        );
+        describe_counter!(
+            self.name("group_resumes_total"),
+            Unit::Count,
+            "Group resume events"
+        );
+        describe_counter!(
+            self.name("dependency_failures_total"),
+            Unit::Count,
+            "Blocked tasks cancelled because a dependency failed"
+        );
+        describe_counter!(
+            self.name("recurring_skipped_total"),
+            Unit::Count,
+            "Recurring instances skipped due to pile-up prevention"
+        );
+
+        // Gauges
+        describe_gauge!(
+            self.name("tasks_pending"),
+            Unit::Count,
+            "Current queue depth"
+        );
+        describe_gauge!(
+            self.name("tasks_running"),
+            Unit::Count,
+            "Current running task count"
+        );
+        describe_gauge!(
+            self.name("tasks_blocked"),
+            Unit::Count,
+            "Tasks waiting on unmet dependencies"
+        );
+        describe_gauge!(
+            self.name("tasks_paused"),
+            Unit::Count,
+            "Tasks in pause state"
+        );
+        describe_gauge!(
+            self.name("tasks_waiting"),
+            Unit::Count,
+            "Parent tasks waiting for children"
+        );
+        describe_gauge!(
+            self.name("max_concurrency"),
+            Unit::Count,
+            "Current concurrency cap"
+        );
+        describe_gauge!(
+            self.name("pressure"),
+            Unit::Count,
+            "Aggregate backpressure (0.0-1.0)"
+        );
+        describe_gauge!(
+            self.name("pressure_source"),
+            Unit::Count,
+            "Per-source pressure level"
+        );
+        describe_gauge!(
+            self.name("groups_paused_count"),
+            Unit::Count,
+            "Number of currently paused groups"
+        );
+        describe_gauge!(
+            self.name("rate_limit_tokens_available"),
+            Unit::Count,
+            "Current available tokens per rate-limit bucket"
+        );
+        describe_gauge!(
+            self.name("module_tasks_running"),
+            Unit::Count,
+            "Running tasks per registered module"
+        );
+
+        // Histograms
+        describe_histogram!(
+            self.name("task_duration_seconds"),
+            Unit::Seconds,
+            "Wall-clock execution time"
+        );
+        describe_histogram!(
+            self.name("task_queue_wait_seconds"),
+            Unit::Seconds,
+            "Time from submission to dispatch start"
+        );
+        describe_histogram!(
+            self.name("batch_size"),
+            Unit::Count,
+            "Number of tasks per batch submission call"
+        );
+        describe_histogram!(
+            self.name("completion_batch_size"),
+            Unit::Count,
+            "Number of completions coalesced per drain cycle"
+        );
+        describe_histogram!(
+            self.name("failure_batch_size"),
+            Unit::Count,
+            "Number of failures coalesced per drain cycle"
+        );
+    }
+
+    // ── Counters ────────────────────────────────────────────────────
+
+    #[inline]
+    pub(crate) fn record_submitted(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_submitted_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_dispatched(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_dispatched_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_completed(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_completed_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_failed(
+        &self,
+        task_type: &str,
+        module: &str,
+        group: Option<&str>,
+        retryable: &str,
+    ) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+            ("retryable", retryable),
+        ]);
+        counter!(self.name("tasks_failed_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_retried(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_retried_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_dead_lettered(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_dead_lettered_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_superseded(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_superseded_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_cancelled(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_cancelled_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_expired(&self, task_type: &str, module: &str, group: Option<&str>) {
+        let labels = self.labels(&[
+            ("type", task_type),
+            ("module", module),
+            ("group", group.unwrap_or("")),
+        ]);
+        counter!(self.name("tasks_expired_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_preempted(&self, task_type: &str, module: &str) {
+        let labels = self.labels(&[("type", task_type), ("module", module)]);
+        counter!(self.name("tasks_preempted_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_batch_submitted(&self) {
+        let labels = self.labels(&[]);
+        counter!(self.name("batches_submitted_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_gate_denial(&self, reason: &str) {
+        let labels = self.labels(&[("reason", reason)]);
+        counter!(self.name("gate_denials_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_rate_limit_throttle(&self, scope_kind: &str, scope: &str) {
+        let labels = self.labels(&[("scope_kind", scope_kind), ("scope", scope)]);
+        counter!(self.name("rate_limit_throttles_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_group_pause(&self, group: &str) {
+        let labels = self.labels(&[("group", group)]);
+        counter!(self.name("group_pauses_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_group_resume(&self, group: &str) {
+        let labels = self.labels(&[("group", group)]);
+        counter!(self.name("group_resumes_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_dependency_failure(&self) {
+        let labels = self.labels(&[]);
+        counter!(self.name("dependency_failures_total"), labels).increment(1);
+    }
+
+    #[inline]
+    pub(crate) fn record_recurring_skipped(&self, task_type: &str, module: &str) {
+        let labels = self.labels(&[("type", task_type), ("module", module)]);
+        counter!(self.name("recurring_skipped_total"), labels).increment(1);
+    }
+
+    // ── Gauges ──────────────────────────────────────────────────────
+
+    #[inline]
+    pub(crate) fn set_gauge_pending(&self, value: i64) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("tasks_pending"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_running(&self, value: usize) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("tasks_running"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_blocked(&self, value: i64) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("tasks_blocked"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_paused(&self, value: i64) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("tasks_paused"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_waiting(&self, value: i64) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("tasks_waiting"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_max_concurrency(&self, value: usize) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("max_concurrency"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_pressure(&self, value: f32) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("pressure"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_pressure_source(&self, source: &str, value: f32) {
+        let labels = self.labels(&[("source", source)]);
+        gauge!(self.name("pressure_source"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_groups_paused(&self, value: usize) {
+        let labels = self.labels(&[]);
+        gauge!(self.name("groups_paused_count"), labels).set(value as f64);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_rate_limit_tokens(&self, scope_kind: &str, scope: &str, value: f64) {
+        let labels = self.labels(&[("scope_kind", scope_kind), ("scope", scope)]);
+        gauge!(self.name("rate_limit_tokens_available"), labels).set(value);
+    }
+
+    #[inline]
+    pub(crate) fn set_gauge_module_running(&self, module: &str, value: usize) {
+        let labels = self.labels(&[("module", module)]);
+        gauge!(self.name("module_tasks_running"), labels).set(value as f64);
+    }
+
+    // ── Histograms ──────────────────────────────────────────────────
+
+    #[inline]
+    pub(crate) fn record_duration(
+        &self,
+        duration: Duration,
+        task_type: &str,
+        module: &str,
+        status: &str,
+    ) {
+        let labels = self.labels(&[("type", task_type), ("module", module), ("status", status)]);
+        histogram!(self.name("task_duration_seconds"), labels).record(duration.as_secs_f64());
+    }
+
+    #[inline]
+    pub(crate) fn record_queue_wait(&self, wait: Duration, task_type: &str, module: &str) {
+        let labels = self.labels(&[("type", task_type), ("module", module)]);
+        histogram!(self.name("task_queue_wait_seconds"), labels).record(wait.as_secs_f64());
+    }
+
+    #[inline]
+    pub(crate) fn record_batch_size(&self, size: usize) {
+        let labels = self.labels(&[]);
+        histogram!(self.name("batch_size"), labels).record(size as f64);
+    }
+
+    #[inline]
+    pub(crate) fn record_completion_batch_size(&self, size: usize) {
+        let labels = self.labels(&[]);
+        histogram!(self.name("completion_batch_size"), labels).record(size as f64);
+    }
+
+    #[inline]
+    pub(crate) fn record_failure_batch_size(&self, size: usize) {
+        let labels = self.labels(&[]);
+        histogram!(self.name("failure_batch_size"), labels).record(size as f64);
+    }
+}
diff --git a/src/scheduler/mod.rs b/src/scheduler/mod.rs
index da848a8..95cc8db 100644
--- a/src/scheduler/mod.rs
+++ b/src/scheduler/mod.rs
@@ -24,10 +24,13 @@
 pub mod aging;
 mod builder;
 mod control;
+pub(crate) mod counters;
 pub(crate) mod dispatch;
 pub(crate) mod event;
 pub mod fair;
 pub(crate) mod gate;
+#[cfg(feature = "metrics")]
+pub(crate) mod metrics_bridge;
 pub mod progress;
 mod queries;
 pub(crate) mod rate_limit;
@@ -47,6 +50,8 @@ use tokio_util::sync::CancellationToken;
 
 use crate::task::{IoBudget, TaskRecord};
 
+use counters::SchedulerCounters;
+
 use crate::backpressure::{CompositePressure, ThrottlePolicy};
 use crate::priority::Priority;
 use crate::registry::TaskTypeRegistry;
@@ -62,9 +67,11 @@ pub use builder::SchedulerBuilder;
 /// Message sent from spawned tasks to the scheduler's completion channel.
 ///
 /// Batched by `drain_completions` to reduce per-completion transaction overhead.
+#[allow(dead_code)]
 pub(crate) struct CompletionMsg {
     pub task: TaskRecord,
     pub metrics: IoBudget,
+    pub duration: std::time::Duration,
 }
 
 // ── Failure coalescing ───────────────────────────────────────────
@@ -73,13 +80,16 @@ pub(crate) struct CompletionMsg {
 ///
 /// Batched by `drain_failures` to reduce per-failure transaction overhead,
 /// mirroring the completion coalescing pattern.
+#[allow(dead_code)]
 pub(crate) struct FailureMsg {
     pub task: TaskRecord,
     pub error: String,
     pub retryable: bool,
     pub metrics: IoBudget,
+    pub duration: std::time::Duration,
 }
 pub use aging::AgingConfig;
+pub use counters::MetricsSnapshot;
 pub use event::{
     PausedGroupInfo, SchedulerConfig, SchedulerEvent, SchedulerSnapshot, ShutdownMode,
     TaskEventHeader,
@@ -203,6 +213,20 @@ pub(crate) struct SchedulerInner {
     pub(crate) aging_config: Option<Arc<aging::AgingConfig>>,
     /// Per-group scheduling weights for weighted fair dispatch.
     pub(crate) group_weights: fair::GroupWeights,
+    /// Internal atomic counters for throughput metrics (always active).
+    pub(crate) counters: Arc<SchedulerCounters>,
+    /// Prefix prepended to all `metrics` crate metric names (e.g. "myapp" → "myapp_taskmill_*").
+    #[allow(dead_code)]
+    pub(crate) metrics_prefix: Option<String>,
+    /// Global labels applied to every emitted `metrics` crate metric.
+    #[allow(dead_code)]
+    pub(crate) metrics_global_labels: Vec<(String, String)>,
+    /// Set of metric names to suppress.
+    #[allow(dead_code)]
+    pub(crate) metrics_disabled: std::collections::HashSet<String>,
+    /// The `metrics` crate emitter (feature-gated).
+    #[cfg(feature = "metrics")]
+    pub(crate) emitter: Arc<metrics_bridge::MetricsEmitter>,
 }
 
 /// IO-aware priority scheduler.
@@ -243,6 +267,14 @@ impl WeakScheduler {
     }
 }
 
+/// Configuration for metrics emission (internal).
+#[derive(Default)]
+pub(crate) struct MetricsConfig {
+    pub prefix: Option<String>,
+    pub global_labels: Vec<(String, String)>,
+    pub disabled: std::collections::HashSet<String>,
+}
+
 impl Scheduler {
     /// Create a weak handle that does not prevent scheduler shutdown.
     pub(crate) fn downgrade(&self) -> WeakScheduler {
@@ -279,6 +311,30 @@ impl Scheduler {
         app_state: Arc<crate::registry::StateMap>,
         module_registry: Arc<crate::module::ModuleRegistry>,
         module_state: Arc<HashMap<String, crate::registry::StateSnapshot>>,
+    ) -> Self {
+        Self::with_gate_and_metrics(
+            store,
+            config,
+            registry,
+            gate,
+            app_state,
+            module_registry,
+            module_state,
+            MetricsConfig::default(),
+        )
+    }
+
+    /// Create a scheduler with a custom dispatch gate and metrics configuration.
+    #[allow(clippy::too_many_arguments)]
+    pub(crate) fn with_gate_and_metrics(
+        store: TaskStore,
+        config: SchedulerConfig,
+        registry: Arc<TaskTypeRegistry>,
+        gate: Box<dyn gate::DispatchGate>,
+        app_state: Arc<crate::registry::StateMap>,
+        module_registry: Arc<crate::module::ModuleRegistry>,
+        module_state: Arc<HashMap<String, crate::registry::StateSnapshot>>,
+        metrics_config: MetricsConfig,
     ) -> Self {
         let module_paused: HashMap<String, AtomicBool> = module_registry
             .entries()
@@ -352,6 +408,15 @@ impl Scheduler {
                 failure_rx: std::sync::Arc::new(Mutex::new(failure_rx)),
                 aging_config: config.aging_config.map(Arc::new),
                 group_weights: fair::GroupWeights::new(),
+                counters: Arc::new(SchedulerCounters::new()),
+                #[cfg(feature = "metrics")]
+                emitter: Arc::new(metrics_bridge::MetricsEmitter::new(
+                    metrics_config.prefix.clone(),
+                    metrics_config.global_labels.clone(),
+                )),
+                metrics_prefix: metrics_config.prefix,
+                metrics_global_labels: metrics_config.global_labels,
+                metrics_disabled: metrics_config.disabled,
             }),
         }
     }
diff --git a/src/scheduler/queries.rs b/src/scheduler/queries.rs
index 590f04b..a527c6d 100644
--- a/src/scheduler/queries.rs
+++ b/src/scheduler/queries.rs
@@ -2,6 +2,7 @@
 
 use crate::store::StoreError;
 
+use super::counters::MetricsSnapshot;
 use super::event::PausedGroupInfo;
 use super::fair::GroupAllocationInfo;
 use super::progress::TaskProgress;
@@ -136,6 +137,54 @@ impl Scheduler {
         self.inner.store.dead_letter_tasks(limit, offset).await
     }
 
+    /// Returns a point-in-time snapshot of internal counters and gauges.
+    ///
+    /// Available without the `metrics` feature. Counter values are cumulative
+    /// since scheduler creation; gauge values reflect the current instant.
+    pub async fn metrics_snapshot(&self) -> MetricsSnapshot {
+        let cs = self.inner.counters.snapshot();
+        let pending = self.inner.store.pending_count().await.unwrap_or(0);
+        let running = self.inner.active.count();
+        let blocked = self.inner.store.blocked_count().await.unwrap_or(0);
+        let paused = self.inner.store.paused_count().await.unwrap_or(0);
+        let waiting = self.inner.store.waiting_count().await.unwrap_or(0);
+        let pressure = self.inner.gate.pressure().await;
+        let max_concurrency = self
+            .inner
+            .max_concurrency
+            .load(std::sync::atomic::Ordering::Relaxed);
+        let groups_paused = self.inner.paused_groups.read().unwrap().len();
+
+        MetricsSnapshot {
+            submitted: cs.submitted,
+            dispatched: cs.dispatched,
+            completed: cs.completed,
+            failed: cs.failed,
+            failed_retryable: cs.failed_retryable,
+            retried: cs.retried,
+            dead_lettered: cs.dead_lettered,
+            superseded: cs.superseded,
+            cancelled: cs.cancelled,
+            expired: cs.expired,
+            preempted: cs.preempted,
+            batches_submitted: cs.batches_submitted,
+            gate_denials: cs.gate_denials,
+            rate_limit_throttles: cs.rate_limit_throttles,
+            group_pauses: cs.group_pauses,
+            group_resumes: cs.group_resumes,
+            dependency_failures: cs.dependency_failures,
+            recurring_skipped: cs.recurring_skipped,
+            pending,
+            running,
+            blocked,
+            paused,
+            waiting,
+            pressure,
+            max_concurrency,
+            groups_paused,
+        }
+    }
+
     /// Capture a single status snapshot for dashboard UIs.
     ///
     /// Gathers running tasks, queue depths, progress estimates, and
diff --git a/src/scheduler/run_loop.rs b/src/scheduler/run_loop.rs
index 0e3d1b9..3df1004 100644
--- a/src/scheduler/run_loop.rs
+++ b/src/scheduler/run_loop.rs
@@ -39,6 +39,9 @@ impl Scheduler {
             failure_tx: self.inner.failure_tx.clone(),
             failure_rx: self.inner.failure_rx.clone(),
             aging_config: self.inner.aging_config.clone(),
+            counters: self.inner.counters.clone(),
+            #[cfg(feature = "metrics")]
+            emitter: self.inner.emitter.clone(),
         }
     }
 
@@ -89,6 +92,10 @@ impl Scheduler {
         if let Some(expires_at) = candidate.expires_at {
             if expires_at <= chrono::Utc::now() {
                 if let Ok(Some(task)) = self.inner.store.expire_single(candidate.id).await {
+                    self.inner
+                        .counters
+                        .expired
+                        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
                     let age = (chrono::Utc::now() - task.created_at)
                         .to_std()
                         .unwrap_or_default();
@@ -117,6 +124,7 @@ impl Scheduler {
             type_rate_limits: &self.inner.type_rate_limits,
             group_rate_limits: &self.inner.group_rate_limits,
             skip_group_concurrency: false,
+            counters: &self.inner.counters,
         };
 
         // Admission check while the task is still pending — no running
@@ -400,6 +408,7 @@ impl Scheduler {
                     type_rate_limits: &self.inner.type_rate_limits,
                     group_rate_limits: &self.inner.group_rate_limits,
                     skip_group_concurrency: true,
+                    counters: &self.inner.counters,
                 };
 
                 match self.inner.gate.admit(&candidate, &gate_ctx).await? {
@@ -472,6 +481,7 @@ impl Scheduler {
                     type_rate_limits: &self.inner.type_rate_limits,
                     group_rate_limits: &self.inner.group_rate_limits,
                     skip_group_concurrency: false,
+                    counters: &self.inner.counters,
                 };
 
                 match self.inner.gate.admit(&candidate, &gate_ctx).await? {
@@ -565,6 +575,7 @@ impl Scheduler {
                 type_rate_limits: &self.inner.type_rate_limits,
                 group_rate_limits: &self.inner.group_rate_limits,
                 skip_group_concurrency: false,
+                counters: &self.inner.counters,
             };
 
             match self.inner.gate.admit(&candidate, &gate_ctx).await? {
@@ -709,6 +720,12 @@ impl Scheduler {
 
         match self.inner.store.expire_tasks().await {
             Ok(expired) => {
+                if !expired.is_empty() {
+                    self.inner
+                        .counters
+                        .expired
+                        .fetch_add(expired.len() as u64, std::sync::atomic::Ordering::Relaxed);
+                }
                 for task in &expired {
                     let age = (chrono::Utc::now() - task.created_at)
                         .to_std()
@@ -854,6 +871,47 @@ impl Scheduler {
             }
         }
 
+        // Update metrics gauges.
+        #[cfg(feature = "metrics")]
+        {
+            let pending = self.inner.store.pending_count().await.unwrap_or(0);
+            let running = self.inner.active.count();
+            let pressure = self.inner.gate.pressure().await;
+            let emitter = &self.inner.emitter;
+            emitter.set_gauge_pending(pending);
+            emitter.set_gauge_running(running);
+            emitter.set_gauge_pressure(pressure);
+            emitter.set_gauge_max_concurrency(
+                self.inner.max_concurrency.load(AtomicOrdering::Relaxed),
+            );
+            emitter.set_gauge_groups_paused(self.inner.paused_groups.read().unwrap().len());
+            // Per-source pressure breakdown.
+            for (source, value) in self.inner.gate.pressure_breakdown().await {
+                emitter.set_gauge_pressure_source(&source, value);
+            }
+            // Per-module running counts.
+            for (module, count) in self.inner.module_running.iter() {
+                emitter.set_gauge_module_running(module, count.load(AtomicOrdering::Relaxed));
+            }
+            // Rate limit token availability.
+            for info in self.inner.type_rate_limits.snapshot_info("type") {
+                emitter.set_gauge_rate_limit_tokens("type", &info.scope, info.available_tokens);
+            }
+            for info in self.inner.group_rate_limits.snapshot_info("group") {
+                emitter.set_gauge_rate_limit_tokens("group", &info.scope, info.available_tokens);
+            }
+            // Additional gauges from store.
+            if let Ok(blocked) = self.inner.store.blocked_count().await {
+                emitter.set_gauge_blocked(blocked);
+            }
+            if let Ok(paused) = self.inner.store.paused_count().await {
+                emitter.set_gauge_paused(paused);
+            }
+            if let Ok(waiting) = self.inner.store.waiting_count().await {
+                emitter.set_gauge_waiting(waiting);
+            }
+        }
+
         // Dispatch any pending finalizers (parent tasks ready for finalize phase).
         loop {
             match self.try_dispatch_finalizer().await {
diff --git a/src/scheduler/spawn.rs b/src/scheduler/spawn.rs
index 6d7a016..8062d97 100644
--- a/src/scheduler/spawn.rs
+++ b/src/scheduler/spawn.rs
@@ -71,6 +71,22 @@ pub(crate) async fn spawn_task(
         }
     }
 
+    // Increment dispatch counter.
+    ctx.counters
+        .dispatched
+        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+    #[cfg(feature = "metrics")]
+    {
+        let module = task.module_name().unwrap_or_default();
+        ctx.emitter
+            .record_dispatched(&task.task_type, module, task.group_key.as_deref());
+        // Queue wait: wallclock time from submission to now.
+        let wait = (chrono::Utc::now() - task.created_at)
+            .to_std()
+            .unwrap_or_default();
+        ctx.emitter.record_queue_wait(wait, &task.task_type, module);
+    }
+
     // Emit dispatched event with aging-aware effective priority.
     emit_event(
         &ctx.event_tx,
@@ -86,6 +102,9 @@ pub(crate) async fn spawn_task(
         max_retries: ctx.max_retries,
         completion_tx: ctx.completion_tx.clone(),
         completion_rx: ctx.completion_rx.clone(),
+        counters: ctx.counters.clone(),
+        #[cfg(feature = "metrics")]
+        emitter: ctx.emitter.clone(),
     };
     let failure_deps = failure::FailureDeps {
         store: ctx.store.clone(),
@@ -96,6 +115,9 @@ pub(crate) async fn spawn_task(
         registry: ctx.registry.clone(),
         failure_tx: ctx.failure_tx.clone(),
         failure_rx: ctx.failure_rx.clone(),
+        counters: ctx.counters.clone(),
+        #[cfg(feature = "metrics")]
+        emitter: ctx.emitter.clone(),
     };
 
     // Keep SpawnContext alive for inline retry context rebuilds.
@@ -106,6 +128,8 @@ pub(crate) async fn spawn_task(
     let token_for_spawn = prepared.token.clone();
     let module_running = spawn_ctx.module_running.clone();
 
+    let started_at = std::time::Instant::now();
+
     let handle = tokio::spawn(async move {
         let task_id = task.id;
         let mut task = task;
@@ -143,11 +167,13 @@ pub(crate) async fn spawn_task(
 
             match result {
                 Ok(memo) => {
+                    let duration = started_at.elapsed();
                     completion::handle_success(
                         &task,
                         phase,
                         &metrics,
                         memo,
+                        duration,
                         &completion_deps,
                         &mut decrement_module_once,
                     )
@@ -190,6 +216,20 @@ pub(crate) async fn spawn_task(
                                     .await;
                                 task.retry_count += 1;
 
+                                // Increment failure/retry counters for inline retries.
+                                failure_deps
+                                    .counters
+                                    .failed
+                                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                                failure_deps
+                                    .counters
+                                    .failed_retryable
+                                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                                failure_deps
+                                    .counters
+                                    .retried
+                                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+
                                 // Emit retry event.
                                 emit_event(
                                     &failure_deps.event_tx,
@@ -209,10 +249,12 @@ pub(crate) async fn spawn_task(
                     }
 
                     // Not inline-retryable — use normal failure path.
+                    let duration = started_at.elapsed();
                     failure::handle_failure(
                         &task,
                         te,
                         &metrics,
+                        duration,
                         &failure_deps,
                         &mut decrement_module_once,
                     )
diff --git a/src/scheduler/spawn/completion.rs b/src/scheduler/spawn/completion.rs
index 097e6f7..abc0904 100644
--- a/src/scheduler/spawn/completion.rs
+++ b/src/scheduler/spawn/completion.rs
@@ -19,6 +19,9 @@ pub(crate) struct CompletionDeps {
     pub max_retries: i32,
     pub completion_tx: tokio::sync::mpsc::UnboundedSender<CompletionMsg>,
     pub completion_rx: Arc<tokio::sync::Mutex<tokio::sync::mpsc::UnboundedReceiver<CompletionMsg>>>,
+    pub counters: Arc<crate::scheduler::counters::SchedulerCounters>,
+    #[cfg(feature = "metrics")]
+    pub emitter: Arc<crate::scheduler::metrics_bridge::MetricsEmitter>,
 }
 
 /// Handle a successful task execution.
@@ -31,6 +34,7 @@ pub(crate) async fn handle_success(
     phase: ExecutionPhase,
     metrics: &IoBudget,
     memo: Option<Vec<u8>>,
+    duration: std::time::Duration,
     deps: &CompletionDeps,
     mut decrement_module: impl FnMut(),
 ) {
@@ -84,10 +88,24 @@ pub(crate) async fn handle_success(
         }
     }
 
+    // Increment completion counter.
+    deps.counters
+        .completed
+        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+    #[cfg(feature = "metrics")]
+    {
+        let module = task.module_name().unwrap_or_default();
+        deps.emitter
+            .record_completed(&task.task_type, module, task.group_key.as_deref());
+        deps.emitter
+            .record_duration(duration, &task.task_type, module, "completed");
+    }
+
     // Send completion to the coalescing channel.
     let msg = CompletionMsg {
         task: task.clone(),
         metrics: *metrics,
+        duration,
     };
 
     // Decrement module counter and remove from active map eagerly so that
diff --git a/src/scheduler/spawn/context.rs b/src/scheduler/spawn/context.rs
index 6c2ae71..d8c4702 100644
--- a/src/scheduler/spawn/context.rs
+++ b/src/scheduler/spawn/context.rs
@@ -47,6 +47,11 @@ pub(crate) struct SpawnContext {
     >,
     /// Priority aging configuration. `None` = aging disabled.
     pub aging_config: Option<Arc<crate::scheduler::aging::AgingConfig>>,
+    /// Internal atomic counters for throughput metrics.
+    pub counters: Arc<crate::scheduler::counters::SchedulerCounters>,
+    /// `metrics` crate emitter (feature-gated).
+    #[cfg(feature = "metrics")]
+    pub emitter: Arc<crate::scheduler::metrics_bridge::MetricsEmitter>,
 }
 
 /// Output of task context construction — everything needed to insert into the
diff --git a/src/scheduler/spawn/failure.rs b/src/scheduler/spawn/failure.rs
index aa79091..c646d7d 100644
--- a/src/scheduler/spawn/failure.rs
+++ b/src/scheduler/spawn/failure.rs
@@ -20,6 +20,9 @@ pub(crate) struct FailureDeps {
     pub failure_tx: tokio::sync::mpsc::UnboundedSender<FailureMsg>,
     pub failure_rx:
         std::sync::Arc<tokio::sync::Mutex<tokio::sync::mpsc::UnboundedReceiver<FailureMsg>>>,
+    pub counters: Arc<crate::scheduler::counters::SchedulerCounters>,
+    #[cfg(feature = "metrics")]
+    pub emitter: Arc<crate::scheduler::metrics_bridge::MetricsEmitter>,
 }
 
 /// Handle a failed task execution.
@@ -30,6 +33,7 @@ pub(crate) async fn handle_failure(
     task: &TaskRecord,
     error: TaskError,
     metrics: &IoBudget,
+    duration: std::time::Duration,
     deps: &FailureDeps,
     mut decrement_module: impl FnMut(),
 ) {
@@ -62,6 +66,38 @@ pub(crate) async fn handle_failure(
         None
     };
 
+    // Increment failure counters.
+    deps.counters
+        .failed
+        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+    if error.retryable {
+        deps.counters
+            .failed_retryable
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+    }
+    if will_retry {
+        deps.counters
+            .retried
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+    }
+    #[cfg(feature = "metrics")]
+    {
+        let module = task.module_name().unwrap_or_default();
+        let retryable_label = if error.retryable { "true" } else { "false" };
+        deps.emitter.record_failed(
+            &task.task_type,
+            module,
+            task.group_key.as_deref(),
+            retryable_label,
+        );
+        deps.emitter
+            .record_duration(duration, &task.task_type, module, "failed");
+        if will_retry {
+            deps.emitter
+                .record_retried(&task.task_type, module, task.group_key.as_deref());
+        }
+    }
+
     tracing::warn!(
         task_id,
         task_type = task.task_type,
@@ -111,6 +147,7 @@ pub(crate) async fn handle_failure(
             error: error.message.clone(),
             retryable: error.retryable,
             metrics: *metrics,
+            duration,
         };
 
         if deps.failure_tx.send(msg).is_err() {
@@ -156,6 +193,15 @@ pub(crate) async fn handle_failure(
 
     let dead_lettered = error.retryable && !will_retry;
     if dead_lettered {
+        deps.counters
+            .dead_lettered
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+        #[cfg(feature = "metrics")]
+        {
+            let module = task.module_name().unwrap_or_default();
+            deps.emitter
+                .record_dead_lettered(&task.task_type, module, task.group_key.as_deref());
+        }
         emit_event(
             &deps.event_tx,
             SchedulerEvent::DeadLettered {
@@ -209,6 +255,12 @@ async fn propagate_failure(task: &TaskRecord, error: &TaskError, deps: &FailureD
 
     match deps.store.fail_dependents(task_id).await {
         Ok((failed_ids, unblocked_ids)) => {
+            if !failed_ids.is_empty() {
+                deps.counters.dependency_failures.fetch_add(
+                    failed_ids.len() as u64,
+                    std::sync::atomic::Ordering::Relaxed,
+                );
+            }
             for fid in &failed_ids {
                 emit_event(
                     &deps.event_tx,
diff --git a/src/scheduler/submit.rs b/src/scheduler/submit.rs
index bde4c72..1f1994c 100644
--- a/src/scheduler/submit.rs
+++ b/src/scheduler/submit.rs
@@ -42,6 +42,50 @@ impl Scheduler {
         self.resolve_ttl(&mut sub);
         let outcome = self.inner.store.submit(&sub).await?;
 
+        // Increment submit counters.
+        match &outcome {
+            SubmitOutcome::Inserted { .. } => {
+                self.inner
+                    .counters
+                    .submitted
+                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                #[cfg(feature = "metrics")]
+                {
+                    let module = sub.task_type.split_once("::").map(|(n, _)| n).unwrap_or("");
+                    self.inner.emitter.record_submitted(
+                        &sub.task_type,
+                        module,
+                        sub.group_key.as_deref(),
+                    );
+                }
+            }
+            SubmitOutcome::Superseded { .. } => {
+                self.inner
+                    .counters
+                    .submitted
+                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                self.inner
+                    .counters
+                    .superseded
+                    .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                #[cfg(feature = "metrics")]
+                {
+                    let module = sub.task_type.split_once("::").map(|(n, _)| n).unwrap_or("");
+                    self.inner.emitter.record_submitted(
+                        &sub.task_type,
+                        module,
+                        sub.group_key.as_deref(),
+                    );
+                    self.inner.emitter.record_superseded(
+                        &sub.task_type,
+                        module,
+                        sub.group_key.as_deref(),
+                    );
+                }
+            }
+            _ => {}
+        }
+
         // Handle superseded tasks.
         if let SubmitOutcome::Superseded {
             new_task_id,
@@ -115,6 +159,38 @@ impl Scheduler {
         }
         let results = self.inner.store.submit_batch(&resolved).await?;
 
+        // Increment batch and per-task counters.
+        self.inner
+            .counters
+            .batches_submitted
+            .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+        #[cfg(feature = "metrics")]
+        {
+            self.inner.emitter.record_batch_submitted();
+            self.inner.emitter.record_batch_size(resolved.len());
+        }
+        for outcome in &results {
+            match outcome {
+                SubmitOutcome::Inserted { .. } => {
+                    self.inner
+                        .counters
+                        .submitted
+                        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                }
+                SubmitOutcome::Superseded { .. } => {
+                    self.inner
+                        .counters
+                        .submitted
+                        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                    self.inner
+                        .counters
+                        .superseded
+                        .fetch_add(1, std::sync::atomic::Ordering::Relaxed);
+                }
+                _ => {}
+            }
+        }
+
         // Handle superseded tasks.
         for (sub, outcome) in resolved.iter().zip(results.iter()) {
             if let SubmitOutcome::Superseded {
diff --git a/tests/integration.rs b/tests/integration.rs
index ee9898e..9fdeb0d 100644
--- a/tests/integration.rs
+++ b/tests/integration.rs
@@ -26,6 +26,8 @@ mod fair_scheduling;
 mod group_pause;
 #[path = "integration/memo.rs"]
 mod memo;
+#[path = "integration/metrics.rs"]
+mod metrics;
 #[path = "integration/module_features.rs"]
 mod module_features;
 #[path = "integration/modules.rs"]
diff --git a/tests/integration/metrics.rs b/tests/integration/metrics.rs
new file mode 100644
index 0000000..706e765
--- /dev/null
+++ b/tests/integration/metrics.rs
@@ -0,0 +1,270 @@
+//! Integration tests for the observability metrics system.
+
+use std::sync::atomic::AtomicI32;
+use std::time::Duration;
+
+use taskmill::{Domain, Priority, Scheduler, TaskSubmission};
+use tokio_util::sync::CancellationToken;
+
+use super::common::*;
+
+/// Helper: start the scheduler run loop and return the token + join handle.
+fn start_scheduler(scheduler: &Scheduler) -> (CancellationToken, tokio::task::JoinHandle<()>) {
+    let token = CancellationToken::new();
+    let sched = scheduler.clone();
+    let t = token.clone();
+    let handle = tokio::spawn(async move { sched.run(t).await });
+    (token, handle)
+}
+
+// ── A. MetricsSnapshot — basic counter lifecycle ──────────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_submit_dispatch_complete() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(
+            Domain::<TestDomain>::new()
+                .task::<TestTask>(NoopExecutor)
+                .task::<SlowTask>(NoopExecutor),
+        )
+        .max_concurrency(4)
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    let handle = scheduler.domain::<TestDomain>();
+    handle.submit(TestTask).await.unwrap();
+    handle.submit(SlowTask).await.unwrap();
+
+    tokio::time::sleep(Duration::from_millis(500)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert_eq!(snap.submitted, 2, "should have 2 submitted");
+    assert!(snap.dispatched >= 2, "should have dispatched at least 2");
+    assert!(snap.completed >= 2, "should have completed at least 2");
+    assert_eq!(snap.failed, 0, "no failures");
+    assert_eq!(snap.dead_lettered, 0);
+
+    token.cancel();
+    let _ = run_handle.await;
+}
+
+// ── B. MetricsSnapshot — failure and retry counters ──────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_failure_and_retry_counters() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(
+            Domain::<TestDomain>::new().task::<TestTask>(FailNTimesExecutor {
+                failures: AtomicI32::new(0),
+                max_failures: 2,
+            }),
+        )
+        .max_concurrency(1)
+        .max_retries(3)
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    scheduler
+        .domain::<TestDomain>()
+        .submit(TestTask)
+        .await
+        .unwrap();
+
+    // Wait for retries and eventual success.
+    tokio::time::sleep(Duration::from_secs(2)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert_eq!(snap.submitted, 1);
+    assert!(snap.dispatched >= 1);
+    assert!(
+        snap.failed >= 2,
+        "should have at least 2 failures (retryable): got {}",
+        snap.failed
+    );
+    assert!(
+        snap.failed_retryable >= 2,
+        "retryable failures should be >= 2"
+    );
+    assert!(
+        snap.retried >= 2,
+        "should have retried at least 2 times: got {}",
+        snap.retried
+    );
+    assert!(snap.completed >= 1, "should eventually complete");
+    assert_eq!(snap.dead_lettered, 0, "should not dead-letter");
+
+    token.cancel();
+    let _ = run_handle.await;
+}
+
+// ── C. MetricsSnapshot — dead letter counter ─────────────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_dead_letter() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(
+            Domain::<TestDomain>::new().task::<TestTask>(FailNTimesExecutor {
+                failures: AtomicI32::new(0),
+                max_failures: 100, // always fail retryably
+            }),
+        )
+        .max_concurrency(1)
+        .max_retries(1) // only 1 retry allowed
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    scheduler
+        .domain::<TestDomain>()
+        .submit(TestTask)
+        .await
+        .unwrap();
+    tokio::time::sleep(Duration::from_secs(2)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert!(
+        snap.dead_lettered >= 1,
+        "should have at least 1 dead letter: got {}",
+        snap.dead_lettered
+    );
+
+    token.cancel();
+    let _ = run_handle.await;
+}
+
+// ── D. MetricsSnapshot — batch submission counter ────────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_batch_submission() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(Domain::<TestDomain>::new().task::<TestTask>(NoopExecutor))
+        .max_concurrency(4)
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    let subs: Vec<_> = (0..5)
+        .map(|i| {
+            TaskSubmission::new("test::test")
+                .key(format!("batch-{i}"))
+                .priority(Priority::NORMAL)
+        })
+        .collect();
+    scheduler.submit_batch(&subs).await.unwrap();
+
+    tokio::time::sleep(Duration::from_millis(500)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert_eq!(snap.batches_submitted, 1, "one batch call");
+    assert_eq!(snap.submitted, 5, "5 tasks submitted");
+
+    token.cancel();
+    let _ = run_handle.await;
+}
+
+// ── E. MetricsSnapshot — group pause/resume counters ─────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_group_pause_resume() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(Domain::<TestDomain>::new().task::<TestTask>(NoopExecutor))
+        .max_concurrency(4)
+        .default_group_concurrency(2)
+        .build()
+        .await
+        .unwrap();
+
+    scheduler.pause_group("g1").await.unwrap();
+    scheduler.resume_group("g1").await.unwrap();
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert_eq!(snap.group_pauses, 1);
+    assert_eq!(snap.group_resumes, 1);
+}
+
+// ── F. MetricsSnapshot — gauges reflect current state ────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_gauges() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(
+            Domain::<TestDomain>::new().task::<TestTask>(DelayExecutor(Duration::from_millis(500))),
+        )
+        .max_concurrency(2)
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    let handle = scheduler.domain::<TestDomain>();
+    for i in 0..3 {
+        handle
+            .submit_with(TestTask)
+            .key(format!("g-{i}"))
+            .await
+            .unwrap();
+    }
+
+    tokio::time::sleep(Duration::from_millis(200)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert_eq!(snap.max_concurrency, 2);
+    assert!(
+        snap.running <= 2,
+        "running should be at most max_concurrency"
+    );
+
+    token.cancel();
+    let _ = run_handle.await;
+}
+
+// ── G. MetricsSnapshot — superseded counter ──────────────────────────
+
+#[tokio::test]
+async fn metrics_snapshot_superseded() {
+    let scheduler = Scheduler::builder()
+        .store(taskmill::TaskStore::open_memory().await.unwrap())
+        .domain(Domain::<TestDomain>::new().task::<TestTask>(DelayExecutor(Duration::from_secs(5))))
+        .max_concurrency(1)
+        .build()
+        .await
+        .unwrap();
+
+    let (token, run_handle) = start_scheduler(&scheduler);
+
+    let sub = TaskSubmission::new("test::test")
+        .key("same-key")
+        .on_duplicate(taskmill::DuplicateStrategy::Supersede);
+    scheduler.submit(&sub).await.unwrap();
+    tokio::time::sleep(Duration::from_millis(100)).await;
+    scheduler.submit(&sub).await.unwrap();
+
+    tokio::time::sleep(Duration::from_millis(200)).await;
+
+    let snap = scheduler.metrics_snapshot().await;
+    assert!(
+        snap.superseded >= 1,
+        "should have superseded at least 1: got {}",
+        snap.superseded
+    );
+
+    token.cancel();
+    let _ = run_handle.await;
+}