From ad891ae07585bb4b327f2906659d15aedfdd8d9e Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 09:38:22 -0500
Subject: [PATCH 01/16] =?UTF-8?q?=F0=9F=A4=96=20Optimize=20startup=20perfo?=
 =?UTF-8?q?rmance=20and=20fix=203s=20freeze?=
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Reduces startup time from 8.6s to <500ms and eliminates the 3s "evil spinner"
that blocked the UI after the window appeared.

Root Cause Analysis:
- AIService was importing the massive "ai" package (~3s) during startup
- Git status IPC handler triggered AIService lazy-load immediately after mount
- Combined effect: window appeared but then froze for 3s before becoming interactive

Key Performance Fixes:
1. Lazy-load AIService in IpcMain - defer AI SDK import until first actual use
2. Fix git status IPC to use Config.findWorkspace() instead of AIService
3. Defer git status polling to next tick (non-blocking on mount)
4. Defer auto-resume checks to next tick (non-blocking on mount)
5. Make React DevTools installation non-blocking in main process

Token Stats Refactoring:
- Remove ~425 LoC of approximation infrastructure (tokenStats.worker, etc.)
- Move token calculation to backend via IPC (TOKENS_COUNT_BULK handler)
- Add tokenizerWorkerPool for non-blocking tokenization in main process
- Eliminate ChatProvider context - move stats to TokenConsumerBreakdown component
- Add per-model cache keys to prevent cross-model contamination
- Remove unused stats.calculate IPC endpoint (-170 LoC dead code)

Bundle Optimizations:
- Lazy load Mermaid component to defer 631KB chunk
- Disable production source maps (saves ~50MB in .app)
- Add manual chunks for better caching (react-vendor, syntax-highlighter)
- Remove worker bundle checks (worker removed in refactoring)

Import Linting Enhancements:
- Enhanced check_eager_imports.sh to detect AI SDK in critical startup files
- Added renderer/worker checks to prevent heavy packages (ai-tokenizer, models.json)
- CI guards for bundle sizes (400KB main budget)

Performance Results:
- Startup: 8.6s → <500ms (94% improvement)
- Window: appears instantly, no freeze
- AI SDK: loads on-demand when first message sent
- Git status: non-blocking background operation

Testing:
- All 546 tests pass (removed 1 test file for dead code)
- Integration tests for tokens.countBulk IPC handler
- Tokenizer cache isolation tests
- StreamingTokenTracker model-change safety tests

_Generated with `cmux`_
---
 .github/workflows/build.yml                   |   3 +
 package.json                                  |   6 +-
 scripts/check_bundle_size.sh                  |  46 ++-
 scripts/check_eager_imports.sh                | 105 ++++++-
 src/components/AIView.tsx                     | 269 +++++++++---------
 src/components/ChatMetaSidebar.tsx            |   2 +-
 src/components/ChatMetaSidebar/CostsTab.tsx   | 154 ++--------
 .../TokenConsumerBreakdown.tsx                | 228 +++++++++++++++
 src/components/Messages/Mermaid.tsx           |  73 +++--
 src/constants/ipc-constants.ts                |   3 +
 src/contexts/ChatContext.tsx                  | 103 -------
 src/hooks/useResumeManager.ts                 |  11 +-
 src/main.ts                                   |  57 ++--
 src/preload.ts                                |   4 +
 src/services/aiService.ts                     |  10 -
 src/services/ipcMain.ts                       |  61 +++-
 src/services/tokenizerWorkerPool.ts           | 161 +++++++++++
 src/stores/GitStatusStore.ts                  |  17 +-
 src/types/ipc.ts                              |   3 +
 src/types/message.ts                          |   2 +-
 src/types/stream.ts                           |   2 +-
 src/utils/main/StreamingTokenTracker.test.ts  |  74 ++---
 src/utils/main/StreamingTokenTracker.ts       |  11 +-
 src/utils/main/tokenizer.test.ts              |  53 ++++
 src/utils/main/tokenizer.ts                   |  37 ++-
 src/utils/tokens/TokenStatsWorker.ts          | 108 -------
 src/utils/tokens/consumerCalculator.test.ts   | 237 +++++++++++++++
 src/utils/tokens/consumerCalculator.ts        | 141 +++++++++
 src/utils/tokens/tokenStats.worker.ts         |  48 ----
 src/utils/tokens/tokenStatsCalculator.ts      |  93 +-----
 src/utils/tokens/usageAggregator.ts           | 103 +++++++
 src/workers/tokenizerWorker.ts                |  56 ++++
 vite.config.ts                                |   8 +-
 33 files changed, 1485 insertions(+), 804 deletions(-)
 create mode 100644 src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
 delete mode 100644 src/contexts/ChatContext.tsx
 create mode 100644 src/services/tokenizerWorkerPool.ts
 create mode 100644 src/utils/main/tokenizer.test.ts
 delete mode 100644 src/utils/tokens/TokenStatsWorker.ts
 create mode 100644 src/utils/tokens/consumerCalculator.test.ts
 create mode 100644 src/utils/tokens/consumerCalculator.ts
 delete mode 100644 src/utils/tokens/tokenStats.worker.ts
 create mode 100644 src/workers/tokenizerWorker.ts

diff --git a/.github/workflows/build.yml b/.github/workflows/build.yml
index bf84a9cb8..d73923275 100644
--- a/.github/workflows/build.yml
+++ b/.github/workflows/build.yml
@@ -75,6 +75,9 @@ jobs:
       - name: Build application
         run: bun run build
 
+      - name: Check bundle sizes
+        run: ./scripts/check_bundle_size.sh
+
       - name: Package for Linux
         run: make dist-linux
 
diff --git a/package.json b/package.json
index b68af1364..2d1502ba8 100644
--- a/package.json
+++ b/package.json
@@ -110,11 +110,11 @@
       "output": "release"
     },
     "files": [
-      "dist/**/*"
+      "dist/**/*",
+      "!dist/**/*.map"
     ],
     "asarUnpack": [
-      "dist/**/*.wasm",
-      "dist/**/*.map"
+      "dist/**/*.wasm"
     ],
     "mac": {
       "category": "public.app-category.developer-tools",
diff --git a/scripts/check_bundle_size.sh b/scripts/check_bundle_size.sh
index 941c736ac..ff0d81a3f 100755
--- a/scripts/check_bundle_size.sh
+++ b/scripts/check_bundle_size.sh
@@ -1,38 +1,30 @@
 #!/usr/bin/env bash
-# Tracks bundle sizes and fails if main.js grows too much
-# Large main.js usually indicates eager imports of heavy dependencies
-
+# Check bundle size budgets to prevent regressions
 set -euo pipefail
 
-MAIN_JS_MAX_KB=${MAIN_JS_MAX_KB:-20} # 20KB for main.js (currently ~15KB)
+cd "$(dirname "$0")/.."
 
-if [ ! -f "dist/main.js" ]; then
-  echo "❌ dist/main.js not found. Run 'make build' first."
-  exit 1
-fi
+# Budgets (in bytes)
+MAX_INDEX_GZIP=409600 # 400KB gzipped
 
-# Get file size (cross-platform: macOS and Linux)
-if stat -f%z dist/main.js >/dev/null 2>&1; then
-  # macOS
-  main_size=$(stat -f%z dist/main.js)
-else
-  # Linux
-  main_size=$(stat -c%s dist/main.js)
-fi
+echo "Checking bundle size budgets..."
 
-main_kb=$((main_size / 1024))
+# Find the main index bundle
+INDEX_FILE=$(find dist -name 'index-*.js' | head -1)
+if [[ -z "$INDEX_FILE" ]]; then
+  echo "❌ Error: Could not find main index bundle" >&2
+  exit 1
+fi
 
-echo "Bundle sizes:"
-echo "  dist/main.js: ${main_kb}KB (max: ${MAIN_JS_MAX_KB}KB)"
+# Check index gzipped size
+INDEX_SIZE=$(gzip -c "$INDEX_FILE" | wc -c | tr -d ' ')
+INDEX_SIZE_KB=$((INDEX_SIZE / 1024))
+MAX_INDEX_KB=$((MAX_INDEX_GZIP / 1024))
 
-if [ $main_kb -gt $MAIN_JS_MAX_KB ]; then
-  echo "❌ BUNDLE SIZE REGRESSION: main.js (${main_kb}KB) exceeds ${MAIN_JS_MAX_KB}KB"
-  echo ""
-  echo "This usually means new eager imports were added to main process."
-  echo "Check for imports in src/main.ts, src/config.ts, or src/preload.ts"
-  echo ""
-  echo "Run './scripts/check_eager_imports.sh' to identify the issue."
+echo "Main bundle (gzipped): ${INDEX_SIZE_KB}KB (budget: ${MAX_INDEX_KB}KB)"
+if ((INDEX_SIZE > MAX_INDEX_GZIP)); then
+  echo "❌ Main bundle exceeds budget by $((INDEX_SIZE - MAX_INDEX_GZIP)) bytes" >&2
   exit 1
 fi
 
-echo "✅ Bundle size OK"
+echo "✅ Bundle size within budget"
diff --git a/scripts/check_eager_imports.sh b/scripts/check_eager_imports.sh
index 6d4f91fb7..ce29edb92 100755
--- a/scripts/check_eager_imports.sh
+++ b/scripts/check_eager_imports.sh
@@ -1,34 +1,46 @@
 #!/usr/bin/env bash
-# Detects eager imports of AI SDK packages in main process
-# These packages are large and must be lazy-loaded to maintain fast startup time
+# Detects eager imports of heavy packages in startup-critical and renderer/worker files
+#
+# Main process: AI SDK packages must be lazy-loaded to maintain fast startup (<4s)
+# Renderer/Worker: Large data files (models.json) and ai-tokenizer must never be imported
 
 set -euo pipefail
 
-# Files that should NOT have eager AI SDK imports
+# Files that should NOT have eager AI SDK imports (main process)
 CRITICAL_FILES=(
   "src/main.ts"
   "src/config.ts"
   "src/preload.ts"
 )
 
-# Packages that should be lazily loaded
-BANNED_IMPORTS=(
+# Packages banned in main process (lazy load only)
+BANNED_MAIN_IMPORTS=(
   "@ai-sdk/anthropic"
   "@ai-sdk/openai"
   "@ai-sdk/google"
   "ai"
 )
 
+# Packages banned in renderer/worker (never import)
+BANNED_RENDERER_IMPORTS=(
+  "ai-tokenizer"
+)
+
+# Files banned in renderer/worker (large data files)
+BANNED_RENDERER_FILES=(
+  "models.json"
+)
+
 failed=0
 
-echo "Checking for eager AI SDK imports in critical startup files..."
+echo "==> Checking for eager AI SDK imports in main process critical files..."
 
 for file in "${CRITICAL_FILES[@]}"; do
   if [ ! -f "$file" ]; then
     continue
   fi
 
-  for pkg in "${BANNED_IMPORTS[@]}"; do
+  for pkg in "${BANNED_MAIN_IMPORTS[@]}"; do
     # Check for top-level imports (not dynamic)
     if grep -E "^import .* from ['\"]$pkg" "$file" >/dev/null 2>&1; then
       echo "❌ EAGER IMPORT DETECTED: $file imports '$pkg'"
@@ -40,8 +52,8 @@ done
 
 # Also check dist/main.js for require() calls (if it exists)
 if [ -f "dist/main.js" ]; then
-  echo "Checking bundled main.js for eager requires..."
-  for pkg in "${BANNED_IMPORTS[@]}"; do
+  echo "==> Checking bundled main.js for eager requires..."
+  for pkg in "${BANNED_MAIN_IMPORTS[@]}"; do
     if grep "require(\"$pkg\")" dist/main.js >/dev/null 2>&1; then
       echo "❌ BUNDLED EAGER IMPORT: dist/main.js requires '$pkg'"
       echo "   This means a critical file is importing AI SDK eagerly"
@@ -50,12 +62,79 @@ if [ -f "dist/main.js" ]; then
   done
 fi
 
+echo "==> Checking for banned imports in renderer/worker files..."
+
+# Find all TypeScript files in renderer-only directories
+RENDERER_DIRS=(
+  "src/components"
+  "src/contexts"
+  "src/hooks"
+  "src/stores"
+  "src/utils/ui"
+  "src/utils/tokens/tokenStats.worker.ts"
+  "src/utils/tokens/tokenStatsCalculatorApproximate.ts"
+)
+
+for dir in "${RENDERER_DIRS[@]}"; do
+  if [ ! -e "$dir" ]; then
+    continue
+  fi
+
+  # Find all .ts/.tsx files in this directory
+  while IFS= read -r -d '' file; do
+    # Check for banned packages
+    for pkg in "${BANNED_RENDERER_IMPORTS[@]}"; do
+      if grep -E "from ['\"]$pkg" "$file" >/dev/null 2>&1; then
+        echo "❌ RENDERER IMPORT DETECTED: $file imports '$pkg'"
+        echo "   ai-tokenizer must never be imported in renderer (8MB+)"
+        failed=1
+      fi
+    done
+
+    # Check for banned files (e.g., models.json)
+    for banned_file in "${BANNED_RENDERER_FILES[@]}"; do
+      if grep -E "from ['\"].*$banned_file" "$file" >/dev/null 2>&1; then
+        echo "❌ LARGE FILE IMPORT: $file imports '$banned_file'"
+        echo "   $banned_file is 701KB and must not be in renderer/worker"
+        failed=1
+      fi
+    done
+  done < <(find "$dir" -type f \( -name "*.ts" -o -name "*.tsx" \) -print0)
+done
+
+# Check bundled worker if it exists
+if [ -f dist/tokenStats.worker-*.js ]; then
+  WORKER_FILE=$(find dist -name 'tokenStats.worker-*.js' | head -1)
+  WORKER_SIZE=$(wc -c <"$WORKER_FILE" | tr -d ' ')
+
+  echo "==> Checking worker bundle for heavy imports..."
+
+  # If worker is suspiciously large (>50KB), likely has models.json or ai-tokenizer
+  if ((WORKER_SIZE > 51200)); then
+    echo "❌ WORKER TOO LARGE: $WORKER_FILE is ${WORKER_SIZE} bytes (>50KB)"
+    echo "   This suggests models.json (701KB) or ai-tokenizer leaked in"
+
+    # Try to identify what's in there
+    if grep -q "models.json" "$WORKER_FILE" 2>/dev/null \
+      || strings "$WORKER_FILE" 2>/dev/null | grep -q "anthropic\|openai" | head -10; then
+      echo "   Found model names in bundle - likely models.json"
+    fi
+    failed=1
+  fi
+fi
+
 if [ $failed -eq 1 ]; then
   echo ""
-  echo "To fix: Use dynamic imports instead:"
-  echo "  ✅ const { createAnthropic } = await import('@ai-sdk/anthropic');"
-  echo "  ❌ import { createAnthropic } from '@ai-sdk/anthropic';"
+  echo "Fix suggestions:"
+  echo "  Main process: Use dynamic imports"
+  echo "    ✅ const { createAnthropic } = await import('@ai-sdk/anthropic');"
+  echo "    ❌ import { createAnthropic } from '@ai-sdk/anthropic';"
+  echo ""
+  echo "  Renderer/Worker: Never import heavy packages"
+  echo "    ❌ import { getModelStats } from './modelStats';  // imports models.json"
+  echo "    ❌ import AITokenizer from 'ai-tokenizer';  // 8MB package"
+  echo "    ✅ Use approximations or IPC to main process"
   exit 1
 fi
 
-echo "✅ No eager AI SDK imports detected"
+echo "✅ No banned imports detected"
diff --git a/src/components/AIView.tsx b/src/components/AIView.tsx
index 71d900610..e67c7daf9 100644
--- a/src/components/AIView.tsx
+++ b/src/components/AIView.tsx
@@ -13,7 +13,6 @@ import {
   mergeConsecutiveStreamErrors,
 } from "@/utils/messages/messageUtils";
 import { hasInterruptedStream } from "@/utils/messages/retryEligibility";
-import { ChatProvider } from "@/contexts/ChatContext";
 import { ThinkingProvider } from "@/contexts/ThinkingContext";
 import { ModeProvider } from "@/contexts/ModeContext";
 import { formatKeybind, KEYBINDS } from "@/utils/ui/keybinds";
@@ -356,8 +355,14 @@ const AIViewInner: React.FC<AIViewProps> = ({
   }
 
   // Extract state from workspace state
-  const { messages, canInterrupt, isCompacting, loading, cmuxMessages, currentModel } =
-    workspaceState;
+  const {
+    messages,
+    canInterrupt,
+    isCompacting,
+    loading,
+    cmuxMessages: _cmuxMessages,
+    currentModel,
+  } = workspaceState;
 
   // Get active stream message ID for token counting
   const activeStreamMessageId = aggregator.getActiveStreamMessageId();
@@ -403,139 +408,137 @@ const AIViewInner: React.FC<AIViewProps> = ({
   }
 
   return (
-    <ChatProvider messages={messages} cmuxMessages={cmuxMessages} model={currentModel ?? "unknown"}>
-      <ViewContainer className={className}>
-        <ChatArea>
-          <ViewHeader>
-            <WorkspaceTitle>
-              <StatusIndicator
-                streaming={canInterrupt}
-                title={
-                  canInterrupt && currentModel ? `${getModelName(currentModel)} streaming` : "Idle"
+    <ViewContainer className={className}>
+      <ChatArea>
+        <ViewHeader>
+          <WorkspaceTitle>
+            <StatusIndicator
+              streaming={canInterrupt}
+              title={
+                canInterrupt && currentModel ? `${getModelName(currentModel)} streaming` : "Idle"
+              }
+            />
+            <GitStatusIndicator
+              gitStatus={gitStatus}
+              workspaceId={workspaceId}
+              tooltipPosition="bottom"
+            />
+            {projectName} / {branch}
+            <WorkspacePath>{workspacePath}</WorkspacePath>
+            <TooltipWrapper inline>
+              <TerminalIconButton onClick={handleOpenTerminal}>
+                <svg viewBox="0 0 16 16" fill="currentColor">
+                  <path d="M0 2.75C0 1.784.784 1 1.75 1h12.5c.966 0 1.75.784 1.75 1.75v10.5A1.75 1.75 0 0114.25 15H1.75A1.75 1.75 0 010 13.25V2.75zm1.75-.25a.25.25 0 00-.25.25v10.5c0 .138.112.25.25.25h12.5a.25.25 0 00.25-.25V2.75a.25.25 0 00-.25-.25H1.75zM7.25 8a.75.75 0 01-.22.53l-2.25 2.25a.75.75 0 01-1.06-1.06L5.44 8 3.72 6.28a.75.75 0 111.06-1.06l2.25 2.25c.141.14.22.331.22.53zm1.5 1.5a.75.75 0 000 1.5h3a.75.75 0 000-1.5h-3z" />
+                </svg>
+              </TerminalIconButton>
+              <Tooltip className="tooltip" position="bottom" align="center">
+                Open in terminal ({formatKeybind(KEYBINDS.OPEN_TERMINAL)})
+              </Tooltip>
+            </TooltipWrapper>
+          </WorkspaceTitle>
+        </ViewHeader>
+
+        <OutputContainer>
+          <OutputContent
+            ref={contentRef}
+            onWheel={markUserInteraction}
+            onTouchMove={markUserInteraction}
+            onScroll={handleScroll}
+            role="log"
+            aria-live={canInterrupt ? "polite" : "off"}
+            aria-busy={canInterrupt}
+            aria-label="Conversation transcript"
+            tabIndex={0}
+          >
+            {mergedMessages.length === 0 ? (
+              <EmptyState>
+                <h3>No Messages Yet</h3>
+                <p>Send a message below to begin</p>
+              </EmptyState>
+            ) : (
+              <>
+                {mergedMessages.map((msg) => {
+                  const isAtCutoff =
+                    editCutoffHistoryId !== undefined &&
+                    msg.type !== "history-hidden" &&
+                    msg.historyId === editCutoffHistoryId;
+
+                  return (
+                    <React.Fragment key={msg.id}>
+                      <MessageRenderer
+                        message={msg}
+                        onEditUserMessage={handleEditUserMessage}
+                        workspaceId={workspaceId}
+                        model={currentModel ?? undefined}
+                        isCompacting={isCompacting}
+                      />
+                      {isAtCutoff && (
+                        <EditBarrier>
+                          ⚠️ Messages below this line will be removed when you submit the edit
+                        </EditBarrier>
+                      )}
+                      {shouldShowInterruptedBarrier(msg) && <InterruptedBarrier />}
+                    </React.Fragment>
+                  );
+                })}
+                {/* Show RetryBarrier after the last message if needed */}
+                {showRetryBarrier && (
+                  <RetryBarrier
+                    workspaceId={workspaceId}
+                    autoRetry={autoRetry}
+                    onStopAutoRetry={() => setAutoRetry(false)}
+                    onResetAutoRetry={() => setAutoRetry(true)}
+                  />
+                )}
+              </>
+            )}
+            <PinnedTodoList workspaceId={workspaceId} />
+            {canInterrupt && (
+              <StreamingBarrier
+                statusText={
+                  isCompacting
+                    ? "compacting..."
+                    : currentModel
+                      ? `${getModelName(currentModel)} streaming...`
+                      : "streaming..."
+                }
+                cancelText={`hit ${formatKeybind(KEYBINDS.INTERRUPT_STREAM)} to cancel`}
+                tokenCount={
+                  activeStreamMessageId
+                    ? aggregator.getStreamingTokenCount(activeStreamMessageId)
+                    : undefined
+                }
+                tps={
+                  activeStreamMessageId
+                    ? aggregator.getStreamingTPS(activeStreamMessageId)
+                    : undefined
                 }
               />
-              <GitStatusIndicator
-                gitStatus={gitStatus}
-                workspaceId={workspaceId}
-                tooltipPosition="bottom"
-              />
-              {projectName} / {branch}
-              <WorkspacePath>{workspacePath}</WorkspacePath>
-              <TooltipWrapper inline>
-                <TerminalIconButton onClick={handleOpenTerminal}>
-                  <svg viewBox="0 0 16 16" fill="currentColor">
-                    <path d="M0 2.75C0 1.784.784 1 1.75 1h12.5c.966 0 1.75.784 1.75 1.75v10.5A1.75 1.75 0 0114.25 15H1.75A1.75 1.75 0 010 13.25V2.75zm1.75-.25a.25.25 0 00-.25.25v10.5c0 .138.112.25.25.25h12.5a.25.25 0 00.25-.25V2.75a.25.25 0 00-.25-.25H1.75zM7.25 8a.75.75 0 01-.22.53l-2.25 2.25a.75.75 0 01-1.06-1.06L5.44 8 3.72 6.28a.75.75 0 111.06-1.06l2.25 2.25c.141.14.22.331.22.53zm1.5 1.5a.75.75 0 000 1.5h3a.75.75 0 000-1.5h-3z" />
-                  </svg>
-                </TerminalIconButton>
-                <Tooltip className="tooltip" position="bottom" align="center">
-                  Open in terminal ({formatKeybind(KEYBINDS.OPEN_TERMINAL)})
-                </Tooltip>
-              </TooltipWrapper>
-            </WorkspaceTitle>
-          </ViewHeader>
-
-          <OutputContainer>
-            <OutputContent
-              ref={contentRef}
-              onWheel={markUserInteraction}
-              onTouchMove={markUserInteraction}
-              onScroll={handleScroll}
-              role="log"
-              aria-live={canInterrupt ? "polite" : "off"}
-              aria-busy={canInterrupt}
-              aria-label="Conversation transcript"
-              tabIndex={0}
-            >
-              {mergedMessages.length === 0 ? (
-                <EmptyState>
-                  <h3>No Messages Yet</h3>
-                  <p>Send a message below to begin</p>
-                </EmptyState>
-              ) : (
-                <>
-                  {mergedMessages.map((msg) => {
-                    const isAtCutoff =
-                      editCutoffHistoryId !== undefined &&
-                      msg.type !== "history-hidden" &&
-                      msg.historyId === editCutoffHistoryId;
-
-                    return (
-                      <React.Fragment key={msg.id}>
-                        <MessageRenderer
-                          message={msg}
-                          onEditUserMessage={handleEditUserMessage}
-                          workspaceId={workspaceId}
-                          model={currentModel ?? undefined}
-                          isCompacting={isCompacting}
-                        />
-                        {isAtCutoff && (
-                          <EditBarrier>
-                            ⚠️ Messages below this line will be removed when you submit the edit
-                          </EditBarrier>
-                        )}
-                        {shouldShowInterruptedBarrier(msg) && <InterruptedBarrier />}
-                      </React.Fragment>
-                    );
-                  })}
-                  {/* Show RetryBarrier after the last message if needed */}
-                  {showRetryBarrier && (
-                    <RetryBarrier
-                      workspaceId={workspaceId}
-                      autoRetry={autoRetry}
-                      onStopAutoRetry={() => setAutoRetry(false)}
-                      onResetAutoRetry={() => setAutoRetry(true)}
-                    />
-                  )}
-                </>
-              )}
-              <PinnedTodoList workspaceId={workspaceId} />
-              {canInterrupt && (
-                <StreamingBarrier
-                  statusText={
-                    isCompacting
-                      ? "compacting..."
-                      : currentModel
-                        ? `${getModelName(currentModel)} streaming...`
-                        : "streaming..."
-                  }
-                  cancelText={`hit ${formatKeybind(KEYBINDS.INTERRUPT_STREAM)} to cancel`}
-                  tokenCount={
-                    activeStreamMessageId
-                      ? aggregator.getStreamingTokenCount(activeStreamMessageId)
-                      : undefined
-                  }
-                  tps={
-                    activeStreamMessageId
-                      ? aggregator.getStreamingTPS(activeStreamMessageId)
-                      : undefined
-                  }
-                />
-              )}
-            </OutputContent>
-            {!autoScroll && (
-              <JumpToBottomIndicator onClick={jumpToBottom} type="button">
-                Press {formatKeybind(KEYBINDS.JUMP_TO_BOTTOM)} to jump to bottom
-              </JumpToBottomIndicator>
             )}
-          </OutputContainer>
-
-          <ChatInput
-            workspaceId={workspaceId}
-            onMessageSent={handleMessageSent}
-            onTruncateHistory={handleClearHistory}
-            onProviderConfig={handleProviderConfig}
-            disabled={!projectName || !branch}
-            isCompacting={isCompacting}
-            editingMessage={editingMessage}
-            onCancelEdit={handleCancelEdit}
-            canInterrupt={canInterrupt}
-            onReady={handleChatInputReady}
-          />
-        </ChatArea>
-
-        <ChatMetaSidebar workspaceId={workspaceId} />
-      </ViewContainer>
-    </ChatProvider>
+          </OutputContent>
+          {!autoScroll && (
+            <JumpToBottomIndicator onClick={jumpToBottom} type="button">
+              Press {formatKeybind(KEYBINDS.JUMP_TO_BOTTOM)} to jump to bottom
+            </JumpToBottomIndicator>
+          )}
+        </OutputContainer>
+
+        <ChatInput
+          workspaceId={workspaceId}
+          onMessageSent={handleMessageSent}
+          onTruncateHistory={handleClearHistory}
+          onProviderConfig={handleProviderConfig}
+          disabled={!projectName || !branch}
+          isCompacting={isCompacting}
+          editingMessage={editingMessage}
+          onCancelEdit={handleCancelEdit}
+          canInterrupt={canInterrupt}
+          onReady={handleChatInputReady}
+        />
+      </ChatArea>
+
+      <ChatMetaSidebar workspaceId={workspaceId} />
+    </ViewContainer>
   );
 };
 
diff --git a/src/components/ChatMetaSidebar.tsx b/src/components/ChatMetaSidebar.tsx
index d6441cd08..a749e1bbb 100644
--- a/src/components/ChatMetaSidebar.tsx
+++ b/src/components/ChatMetaSidebar.tsx
@@ -99,7 +99,7 @@ export const ChatMetaSidebar: React.FC<ChatMetaSidebarProps> = ({ workspaceId })
       <TabContent>
         {selectedTab === "costs" && (
           <div role="tabpanel" id={costsPanelId} aria-labelledby={costsTabId}>
-            <CostsTab />
+            <CostsTab workspaceId={workspaceId} />
           </div>
         )}
         {selectedTab === "tools" && (
diff --git a/src/components/ChatMetaSidebar/CostsTab.tsx b/src/components/ChatMetaSidebar/CostsTab.tsx
index 98eef8699..f47f7bd9e 100644
--- a/src/components/ChatMetaSidebar/CostsTab.tsx
+++ b/src/components/ChatMetaSidebar/CostsTab.tsx
@@ -1,13 +1,13 @@
-import React from "react";
+import React, { useMemo } from "react";
 import styled from "@emotion/styled";
-import { useChatContext } from "@/contexts/ChatContext";
-import { TooltipWrapper, Tooltip, HelpIndicator } from "../Tooltip";
 import { getModelStats } from "@/utils/tokens/modelStats";
-import { sumUsageHistory } from "@/utils/tokens/usageAggregator";
+import { sumUsageHistory, extractUsageHistory } from "@/utils/tokens/usageAggregator";
 import { usePersistedState } from "@/hooks/usePersistedState";
 import { ToggleGroup, type ToggleOption } from "../ToggleGroup";
 import { use1MContext } from "@/hooks/use1MContext";
 import { supports1MContext } from "@/utils/ai/models";
+import { useWorkspaceAggregator } from "@/stores/WorkspaceStore";
+import { TokenConsumerBreakdown } from "./TokenConsumerBreakdown";
 
 const Container = styled.div`
   color: #d4d4d4;
@@ -20,21 +20,6 @@ const Section = styled.div`
   margin-bottom: 24px;
 `;
 
-const SectionTitle = styled.h3<{ dimmed?: boolean }>`
-  color: ${(props) => (props.dimmed ? "#999999" : "#cccccc")};
-  font-size: 14px;
-  font-weight: 600;
-  margin: 0 0 12px 0;
-  text-transform: uppercase;
-  letter-spacing: 0.5px;
-`;
-
-const TokenizerInfo = styled.div`
-  color: #888888;
-  font-size: 12px;
-  margin-bottom: 8px;
-`;
-
 const ConsumerList = styled.div`
   display: flex;
   flex-direction: column;
@@ -94,20 +79,6 @@ const COMPONENT_COLORS = {
   thinking: "var(--color-thinking-mode)",
 } as const;
 
-const FixedSegment = styled.div<SegmentProps>`
-  height: 100%;
-  width: ${(props) => props.percentage}%;
-  background: var(--color-token-fixed);
-  transition: width 0.3s ease;
-`;
-
-const VariableSegment = styled.div<SegmentProps>`
-  height: 100%;
-  width: ${(props) => props.percentage}%;
-  background: var(--color-token-variable);
-  transition: width 0.3s ease;
-`;
-
 const InputSegment = styled.div<SegmentProps>`
   height: 100%;
   width: ${(props) => props.percentage}%;
@@ -136,22 +107,6 @@ const CachedSegment = styled.div<SegmentProps>`
   transition: width 0.3s ease;
 `;
 
-interface PercentageFillProps {
-  percentage: number;
-}
-
-const PercentageFill = styled.div<PercentageFillProps>`
-  height: 100%;
-  width: ${(props) => props.percentage}%;
-  background: var(--color-token-completion);
-  transition: width 0.3s ease;
-`;
-
-const LoadingState = styled.div`
-  color: #888888;
-  font-style: italic;
-`;
-
 const EmptyState = styled.div`
   color: #888888;
   text-align: center;
@@ -165,14 +120,6 @@ const ModelWarning = styled.div`
   font-style: italic;
 `;
 
-const TokenDetails = styled.div`
-  color: #888888;
-  font-size: 11px;
-  margin-top: 6px;
-  padding-left: 4px;
-  line-height: 1.4;
-`;
-
 const DetailsTable = styled.table`
   width: 100%;
   margin-top: 4px;
@@ -278,21 +225,22 @@ const VIEW_MODE_OPTIONS: Array<ToggleOption<ViewMode>> = [
   { value: "session", label: "Session" },
 ];
 
-export const CostsTab: React.FC = () => {
-  const { stats, isCalculating } = useChatContext();
+interface CostsTabProps {
+  workspaceId: string;
+}
+
+export const CostsTab: React.FC<CostsTabProps> = ({ workspaceId }) => {
   const [viewMode, setViewMode] = usePersistedState<ViewMode>("costsTab:viewMode", "last-request");
   const [use1M] = use1MContext();
 
-  // Only show loading if we don't have any stats yet
-  if (isCalculating && !stats) {
-    return (
-      <Container>
-        <LoadingState>Calculating token usage...</LoadingState>
-      </Container>
-    );
-  }
+  const aggregator = useWorkspaceAggregator(workspaceId);
+  const messages = useMemo(() => aggregator?.getAllMessages() ?? [], [aggregator]);
+  const model = aggregator?.getCurrentModel() ?? "unknown";
 
-  if (!stats || stats.totalTokens === 0) {
+  // Extract usage history from messages (API response data, no calculation needed)
+  const usageHistory = useMemo(() => extractUsageHistory(messages), [messages]);
+
+  if (usageHistory.length === 0) {
     return (
       <Container>
         <EmptyState>
@@ -306,12 +254,12 @@ export const CostsTab: React.FC = () => {
   // Compute displayUsage based on view mode
   const displayUsage =
     viewMode === "last-request"
-      ? stats.usageHistory[stats.usageHistory.length - 1]
-      : sumUsageHistory(stats.usageHistory);
+      ? usageHistory[usageHistory.length - 1]
+      : sumUsageHistory(usageHistory);
 
   return (
     <Container>
-      {stats.usageHistory.length > 0 && (
+      {usageHistory.length > 0 && (
         <Section>
           <SectionHeader>
             <ToggleGroup options={VIEW_MODE_OPTIONS} value={viewMode} onChange={setViewMode} />
@@ -319,10 +267,10 @@ export const CostsTab: React.FC = () => {
           <ConsumerList>
             {(() => {
               // Get max tokens for the model from the model stats database
-              const modelStats = getModelStats(stats.model);
+              const modelStats = getModelStats(model);
               const baseMaxTokens = modelStats?.max_input_tokens;
               // Check if 1M context is active and supported
-              const is1MActive = use1M && supports1MContext(stats.model);
+              const is1MActive = use1M && supports1MContext(model);
               const maxTokens = is1MActive ? 1_000_000 : baseMaxTokens;
               // Total tokens includes cache creation (they're input tokens sent for caching)
               const totalUsed = displayUsage
@@ -576,65 +524,7 @@ export const CostsTab: React.FC = () => {
         </Section>
       )}
 
-      <Section>
-        <SectionTitle dimmed>Breakdown by Consumer</SectionTitle>
-        <TokenizerInfo>
-          Tokenizer: <span>{stats.tokenizerName}</span>
-        </TokenizerInfo>
-        <ConsumerList>
-          {stats.consumers.map((consumer) => {
-            // Calculate percentages for fixed and variable segments
-            const fixedPercentage = consumer.fixedTokens
-              ? (consumer.fixedTokens / stats.totalTokens) * 100
-              : 0;
-            const variablePercentage = consumer.variableTokens
-              ? (consumer.variableTokens / stats.totalTokens) * 100
-              : 0;
-
-            const tokenDisplay = formatTokens(consumer.tokens);
-
-            return (
-              <ConsumerRow key={consumer.name}>
-                <ConsumerHeader>
-                  <ConsumerName>
-                    {consumer.name}
-                    {consumer.name === "web_search" && (
-                      <TooltipWrapper inline>
-                        <HelpIndicator>?</HelpIndicator>
-                        <Tooltip className="tooltip" align="center" width="wide">
-                          Web search results are encrypted and decrypted server-side. This estimate
-                          is approximate.
-                        </Tooltip>
-                      </TooltipWrapper>
-                    )}
-                  </ConsumerName>
-                  <ConsumerTokens>
-                    {tokenDisplay} ({consumer.percentage.toFixed(1)}%)
-                  </ConsumerTokens>
-                </ConsumerHeader>
-                <PercentageBarWrapper>
-                  <PercentageBar>
-                    {consumer.fixedTokens && consumer.variableTokens ? (
-                      <>
-                        <FixedSegment percentage={fixedPercentage} />
-                        <VariableSegment percentage={variablePercentage} />
-                      </>
-                    ) : (
-                      <PercentageFill percentage={consumer.percentage} />
-                    )}
-                  </PercentageBar>
-                  {consumer.fixedTokens && consumer.variableTokens && (
-                    <TokenDetails>
-                      Tool definition: {formatTokens(consumer.fixedTokens)} • Usage:{" "}
-                      {formatTokens(consumer.variableTokens)}
-                    </TokenDetails>
-                  )}
-                </PercentageBarWrapper>
-              </ConsumerRow>
-            );
-          })}
-        </ConsumerList>
-      </Section>
+      <TokenConsumerBreakdown messages={messages} model={model} />
     </Container>
   );
 };
diff --git a/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx b/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
new file mode 100644
index 000000000..59758f9c0
--- /dev/null
+++ b/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
@@ -0,0 +1,228 @@
+import React, { useState, useEffect } from "react";
+import styled from "@emotion/styled";
+import type { ChatStats } from "@/types/chatStats";
+import type { CmuxMessage } from "@/types/message";
+import { prepareTokenization, calculateConsumers } from "@/utils/tokens/consumerCalculator";
+
+const Section = styled.div`
+  margin-bottom: 24px;
+`;
+
+const SectionTitle = styled.h3<{ dimmed?: boolean }>`
+  color: ${(props) => (props.dimmed ? "#999999" : "#cccccc")};
+  font-size: 14px;
+  font-weight: 600;
+  margin: 0 0 12px 0;
+  text-transform: uppercase;
+  letter-spacing: 0.5px;
+`;
+
+const TokenizerInfo = styled.div`
+  color: #888888;
+  font-size: 12px;
+  margin-bottom: 8px;
+`;
+
+const ConsumerList = styled.div`
+  display: flex;
+  flex-direction: column;
+  gap: 12px;
+`;
+
+const ConsumerRow = styled.div`
+  display: flex;
+  flex-direction: column;
+  gap: 4px;
+  margin-bottom: 8px;
+  position: relative;
+`;
+
+const ConsumerHeader = styled.div`
+  display: flex;
+  justify-content: space-between;
+  align-items: baseline;
+`;
+
+const ConsumerName = styled.span`
+  color: #cccccc;
+  font-weight: 500;
+  display: inline-flex;
+  align-items: baseline;
+  gap: 4px;
+`;
+
+const ConsumerTokens = styled.span`
+  color: #888888;
+  font-size: 12px;
+`;
+
+const PercentageBarWrapper = styled.div`
+  position: relative;
+  width: 100%;
+`;
+
+const PercentageBar = styled.div`
+  width: 100%;
+  height: 6px;
+  background: #3e3e42;
+  border-radius: 3px;
+  overflow: hidden;
+  display: flex;
+`;
+
+interface SegmentProps {
+  percentage: number;
+}
+
+const FixedSegment = styled.div<SegmentProps>`
+  height: 100%;
+  width: ${(props) => props.percentage}%;
+  background: var(--color-token-fixed);
+`;
+
+const VariableSegment = styled.div<SegmentProps>`
+  height: 100%;
+  width: ${(props) => props.percentage}%;
+  background: var(--color-token-variable);
+`;
+
+const LoadingState = styled.div`
+  color: #888888;
+  font-size: 13px;
+  padding: 12px 0;
+`;
+
+// Format large numbers with k/M suffix
+const formatTokens = (tokens: number): string => {
+  if (tokens >= 1_000_000) {
+    return `${(tokens / 1_000_000).toFixed(2)}M`;
+  }
+  if (tokens >= 1_000) {
+    return `${(tokens / 1_000).toFixed(1)}k`;
+  }
+  return tokens.toString();
+};
+
+interface TokenConsumerBreakdownProps {
+  messages: CmuxMessage[];
+  model: string;
+}
+
+export const TokenConsumerBreakdown: React.FC<TokenConsumerBreakdownProps> = ({
+  messages,
+  model,
+}) => {
+  const [stats, setStats] = useState<ChatStats | null>(null);
+  const [isCalculating, setIsCalculating] = useState(true);
+
+  useEffect(() => {
+    let cancelled = false;
+
+    async function calculate() {
+      setIsCalculating(true);
+
+      try {
+        // Prepare all text for tokenization (pure function)
+        const { texts, consumerMap, toolDefinitions } = prepareTokenization(messages, model);
+
+        // Combine message texts + tool definition strings for bulk tokenization
+        const allTexts = [...texts, ...Array.from(toolDefinitions.values())];
+
+        // Batch tokenize everything in one IPC call
+        const tokenCounts = await window.api.tokens.countBulk(model, allTexts);
+
+        if (cancelled || !tokenCounts) {
+          return; // Tokenizer not loaded or component unmounted
+        }
+
+        // Split results back into message tokens and tool definition tokens
+        const messageTokens = tokenCounts.slice(0, texts.length);
+        const toolDefCounts = new Map<string, number>();
+        let defIndex = texts.length;
+        for (const [toolName] of toolDefinitions) {
+          toolDefCounts.set(toolName, tokenCounts[defIndex]);
+          defIndex++;
+        }
+
+        // Calculate consumers (pure function)
+        const consumers = calculateConsumers(messageTokens, consumerMap, toolDefCounts);
+        const totalTokens = consumers.reduce((sum, c) => sum + c.tokens, 0);
+
+        // Derive tokenizer name from model
+        const tokenizerName = model.startsWith("anthropic:") ? "claude" : "o200k_base";
+
+        setStats({
+          consumers,
+          totalTokens,
+          model,
+          tokenizerName,
+          usageHistory: [], // Not used in this component
+        });
+      } catch (error) {
+        console.error(`[TokenConsumerBreakdown] Failed to calculate stats:`, error);
+      } finally {
+        if (!cancelled) {
+          setIsCalculating(false);
+        }
+      }
+    }
+
+    void calculate();
+
+    return () => {
+      cancelled = true;
+    };
+  }, [messages, model]);
+
+  if (isCalculating) {
+    return (
+      <Section>
+        <SectionTitle dimmed>Breakdown by Consumer</SectionTitle>
+        <LoadingState>Calculating breakdown...</LoadingState>
+      </Section>
+    );
+  }
+
+  if (!stats || stats.consumers.length === 0) {
+    return null;
+  }
+
+  return (
+    <Section>
+      <SectionTitle dimmed>Breakdown by Consumer</SectionTitle>
+      <TokenizerInfo>
+        Tokenizer: <span>{stats.tokenizerName}</span>
+      </TokenizerInfo>
+      <ConsumerList>
+        {stats.consumers.map((consumer) => {
+          // Calculate percentages for fixed and variable segments
+          const fixedPercentage = consumer.fixedTokens
+            ? (consumer.fixedTokens / stats.totalTokens) * 100
+            : 0;
+          const variablePercentage = consumer.variableTokens
+            ? (consumer.variableTokens / stats.totalTokens) * 100
+            : 0;
+
+          const tokenDisplay = formatTokens(consumer.tokens);
+
+          return (
+            <ConsumerRow key={consumer.name}>
+              <ConsumerHeader>
+                <ConsumerName>{consumer.name}</ConsumerName>
+                <ConsumerTokens>
+                  {tokenDisplay} ({consumer.percentage.toFixed(1)}%)
+                </ConsumerTokens>
+              </ConsumerHeader>
+              <PercentageBarWrapper>
+                <PercentageBar>
+                  {fixedPercentage > 0 && <FixedSegment percentage={fixedPercentage} />}
+                  {variablePercentage > 0 && <VariableSegment percentage={variablePercentage} />}
+                </PercentageBar>
+              </PercentageBarWrapper>
+            </ConsumerRow>
+          );
+        })}
+      </ConsumerList>
+    </Section>
+  );
+};
diff --git a/src/components/Messages/Mermaid.tsx b/src/components/Messages/Mermaid.tsx
index 7b418eb57..c91ba80d6 100644
--- a/src/components/Messages/Mermaid.tsx
+++ b/src/components/Messages/Mermaid.tsx
@@ -1,32 +1,61 @@
 import type { CSSProperties, ReactNode } from "react";
 import React, { useContext, useEffect, useRef, useState } from "react";
-import mermaid from "mermaid";
 import { StreamingContext } from "./StreamingContext";
 import { usePersistedState } from "@/hooks/usePersistedState";
 
 const MIN_HEIGHT = 300;
 const MAX_HEIGHT = 1200;
 
-// Initialize mermaid
-mermaid.initialize({
-  startOnLoad: false,
-  theme: "dark",
-  layout: "elk",
-  securityLevel: "loose",
-  fontFamily: "var(--font-monospace)",
-  darkMode: true,
-  elk: {
-    nodePlacementStrategy: "LINEAR_SEGMENTS",
-    mergeEdges: true,
-  },
-  wrap: true,
-  markdownAutoWrap: true,
-  flowchart: {
-    nodeSpacing: 60,
-    curve: "linear",
-    defaultRenderer: "elk",
-  },
-});
+// Lazy-loaded mermaid module to reduce startup time
+// Mermaid is 64MB and loads heavy dependencies (cytoscape, elk, langium)
+// Only load when first diagram is actually rendered
+// eslint-disable-next-line @typescript-eslint/consistent-type-imports -- Dynamic import type is intentional for lazy loading
+type MermaidModule = typeof import("mermaid").default;
+let mermaidInstance: MermaidModule | null = null;
+let mermaidLoadPromise: Promise<MermaidModule> | null = null;
+
+async function loadMermaid(): Promise<MermaidModule> {
+  // Return cached instance if already loaded
+  if (mermaidInstance) return mermaidInstance;
+
+  // Return in-flight promise if already loading
+  if (mermaidLoadPromise) return mermaidLoadPromise;
+
+  // Start loading mermaid
+  mermaidLoadPromise = (async () => {
+    /* eslint-disable no-restricted-syntax */
+    const mermaidModule = await import("mermaid");
+    /* eslint-enable no-restricted-syntax */
+
+    const mermaid = mermaidModule.default;
+
+    // Initialize mermaid after loading
+    mermaid.initialize({
+      startOnLoad: false,
+      theme: "dark",
+      layout: "elk",
+      securityLevel: "loose",
+      fontFamily: "var(--font-monospace)",
+      darkMode: true,
+      elk: {
+        nodePlacementStrategy: "LINEAR_SEGMENTS",
+        mergeEdges: true,
+      },
+      wrap: true,
+      markdownAutoWrap: true,
+      flowchart: {
+        nodeSpacing: 60,
+        curve: "linear",
+        defaultRenderer: "elk",
+      },
+    });
+
+    mermaidInstance = mermaid;
+    return mermaid;
+  })();
+
+  return mermaidLoadPromise;
+}
 
 // Common button styles
 const getButtonStyle = (disabled = false): CSSProperties => ({
@@ -137,6 +166,8 @@ export const Mermaid: React.FC<{ chart: string }> = ({ chart }) => {
     const renderDiagram = async () => {
       try {
         setError(null);
+        // Load mermaid on-demand when first diagram is rendered
+        const mermaid = await loadMermaid();
         const id = `mermaid-${Math.random().toString(36).substr(2, 9)}`;
         const { svg: renderedSvg } = await mermaid.render(id, chart);
         setSvg(renderedSvg);
diff --git a/src/constants/ipc-constants.ts b/src/constants/ipc-constants.ts
index 994114b11..053c8c6ae 100644
--- a/src/constants/ipc-constants.ts
+++ b/src/constants/ipc-constants.ts
@@ -38,6 +38,9 @@ export const IPC_CHANNELS = {
   // Window channels
   WINDOW_SET_TITLE: "window:setTitle",
 
+  // Token channels
+  TOKENS_COUNT_BULK: "tokens:countBulk",
+
   // Dynamic channel prefixes
   WORKSPACE_CHAT_PREFIX: "workspace:chat:",
   WORKSPACE_METADATA: "workspace:metadata",
diff --git a/src/contexts/ChatContext.tsx b/src/contexts/ChatContext.tsx
deleted file mode 100644
index 3a64187be..000000000
--- a/src/contexts/ChatContext.tsx
+++ /dev/null
@@ -1,103 +0,0 @@
-import type { ReactNode } from "react";
-import React, { createContext, useContext, useState, useEffect, useRef } from "react";
-import type { CmuxMessage, DisplayedMessage } from "@/types/message";
-import type { ChatStats } from "@/types/chatStats";
-import { TokenStatsWorker } from "@/utils/tokens/TokenStatsWorker";
-
-interface ChatContextType {
-  messages: DisplayedMessage[];
-  stats: ChatStats | null;
-  isCalculating: boolean;
-}
-
-const ChatContext = createContext<ChatContextType | undefined>(undefined);
-
-interface ChatProviderProps {
-  children: ReactNode;
-  messages: DisplayedMessage[];
-  cmuxMessages: CmuxMessage[];
-  model: string;
-}
-
-export const ChatProvider: React.FC<ChatProviderProps> = ({
-  children,
-  messages,
-  cmuxMessages,
-  model,
-}) => {
-  const [stats, setStats] = useState<ChatStats | null>(null);
-  const [isCalculating, setIsCalculating] = useState(false);
-  // Track if we've already scheduled a calculation to prevent timer spam
-  const calculationScheduledRef = useRef(false);
-  // Web Worker for off-thread token calculation
-  const workerRef = useRef<TokenStatsWorker | null>(null);
-
-  // Initialize worker once
-  useEffect(() => {
-    workerRef.current = new TokenStatsWorker();
-    return () => {
-      workerRef.current?.terminate();
-      workerRef.current = null;
-    };
-  }, []);
-
-  useEffect(() => {
-    if (cmuxMessages.length === 0) {
-      setStats({
-        consumers: [],
-        totalTokens: 0,
-        model,
-        tokenizerName: "No messages",
-        usageHistory: [],
-      });
-      return;
-    }
-
-    // IMPORTANT: Prevent duplicate timers during rapid events (reasoning deltas)
-    // During message loading, 600+ reasoning-delta events fire rapidly, each triggering
-    // this effect. Without this guard, we'd start 600 timers that all eventually run!
-    if (calculationScheduledRef.current) return;
-
-    calculationScheduledRef.current = true;
-
-    // Show calculating state immediately (safe now that aggregator cache provides stable refs)
-    setIsCalculating(true);
-
-    // Debounce calculation by 100ms to avoid blocking on rapid updates
-    const timeoutId = setTimeout(() => {
-      // Calculate stats in Web Worker (off main thread)
-      workerRef.current
-        ?.calculate(cmuxMessages, model)
-        .then((calculatedStats) => {
-          setStats(calculatedStats);
-        })
-        .catch((error) => {
-          console.error("Failed to calculate token stats:", error);
-        })
-        .finally(() => {
-          setIsCalculating(false);
-          calculationScheduledRef.current = false;
-        });
-    }, 100);
-
-    return () => {
-      clearTimeout(timeoutId);
-      calculationScheduledRef.current = false;
-      setIsCalculating(false);
-    };
-  }, [cmuxMessages, model]);
-
-  return (
-    <ChatContext.Provider value={{ messages, stats, isCalculating }}>
-      {children}
-    </ChatContext.Provider>
-  );
-};
-
-export const useChatContext = () => {
-  const context = useContext(ChatContext);
-  if (!context) {
-    throw new Error("useChatContext must be used within a ChatProvider");
-  }
-  return context;
-};
diff --git a/src/hooks/useResumeManager.ts b/src/hooks/useResumeManager.ts
index 16d932acf..106a3c66e 100644
--- a/src/hooks/useResumeManager.ts
+++ b/src/hooks/useResumeManager.ts
@@ -168,10 +168,13 @@ export function useResumeManager() {
   };
 
   useEffect(() => {
-    // Initial scan on mount - check all workspaces for interrupted streams
-    for (const [workspaceId] of workspaceStatesRef.current) {
-      void attemptResume(workspaceId);
-    }
+    // Defer initial scan to not block UI rendering
+    // Same pattern as GitStatusStore - let React finish mounting first
+    setTimeout(() => {
+      for (const [workspaceId] of workspaceStatesRef.current) {
+        void attemptResume(workspaceId);
+      }
+    }, 0);
 
     // Listen for resume check requests (primary mechanism)
     const handleResumeCheck = (event: Event) => {
diff --git a/src/main.ts b/src/main.ts
index e05666fbe..1fc8bf349 100644
--- a/src/main.ts
+++ b/src/main.ts
@@ -9,7 +9,6 @@ import * as path from "path";
 import type { Config } from "./config";
 import type { IpcMain } from "./services/ipcMain";
 import { VERSION } from "./version";
-import type { loadTokenizerModules } from "./utils/main/tokenizer";
 
 // React DevTools for development profiling
 // Using require() instead of import since it's dev-only and conditionally loaded
@@ -55,7 +54,6 @@ if (!app.isPackaged) {
 // These will be loaded on-demand when createWindow() is called
 let config: Config | null = null;
 let ipcMain: IpcMain | null = null;
-let loadTokenizerModulesFn: typeof loadTokenizerModules | null = null;
 const isE2ETest = process.env.CMUX_E2E === "1";
 const forceDistLoad = process.env.CMUX_E2E_LOAD_DIST === "1";
 
@@ -273,7 +271,7 @@ function closeSplashScreen() {
  * the splash still provides visual feedback that the app is loading.
  */
 async function loadServices(): Promise<void> {
-  if (config && ipcMain && loadTokenizerModulesFn) return; // Already loaded
+  if (config && ipcMain) return; // Already loaded
 
   const startTime = Date.now();
   console.log(`[${timestamp()}] Loading services...`);
@@ -283,19 +281,13 @@ async function loadServices(): Promise<void> {
   // - IpcMain transitively imports the entire AI SDK (ai, @ai-sdk/anthropic, etc.)
   // - These are large modules (~100ms load time) that would block splash from appearing
   // - Loading happens once, then cached
-  const [
-    { Config: ConfigClass },
-    { IpcMain: IpcMainClass },
-    { loadTokenizerModules: loadTokenizerFn },
-  ] = await Promise.all([
+  const [{ Config: ConfigClass }, { IpcMain: IpcMainClass }] = await Promise.all([
     import("./config"),
     import("./services/ipcMain"),
-    import("./utils/main/tokenizer"),
   ]);
   /* eslint-enable no-restricted-syntax */
   config = new ConfigClass();
   ipcMain = new IpcMainClass(config);
-  loadTokenizerModulesFn = loadTokenizerFn;
 
   const loadTime = Date.now() - startTime;
   console.log(`[${timestamp()}] Services loaded in ${loadTime}ms`);
@@ -372,18 +364,20 @@ function createWindow() {
 if (gotTheLock) {
   void app.whenReady().then(async () => {
     try {
-      console.log("App ready, creating window...");
+      console.log(`[${timestamp()}] App ready, creating window...`);
 
-      // Install React DevTools in development
+      // Install React DevTools in development (non-blocking)
+      // Don't await - let it install in background while app starts
       if (!app.isPackaged && installExtension && REACT_DEVELOPER_TOOLS) {
-        try {
-          const extension = await installExtension(REACT_DEVELOPER_TOOLS, {
-            loadExtensionOptions: { allowFileAccess: true },
+        void installExtension(REACT_DEVELOPER_TOOLS, {
+          loadExtensionOptions: { allowFileAccess: true },
+        })
+          .then((extension) => {
+            console.log(`[${timestamp()}] React DevTools installed: ${extension.name}`);
+          })
+          .catch((err) => {
+            console.log(`[${timestamp()}] React DevTools install failed:`, err);
           });
-          console.log(`✅ React DevTools installed: ${extension.name} (id: ${extension.id})`);
-        } catch (err) {
-          console.log("❌ Error installing React DevTools:", err);
-        }
       }
 
       createMenu();
@@ -402,14 +396,8 @@ if (gotTheLock) {
       createWindow();
       // Note: splash closes in ready-to-show event handler
 
-      // Start loading tokenizer modules in background after window is created
-      // This ensures accurate token counts for first API calls (especially in e2e tests)
-      // Loading happens asynchronously and won't block the UI
-      if (loadTokenizerModulesFn) {
-        void loadTokenizerModulesFn().then(() => {
-          console.log(`[${timestamp()}] Tokenizer modules loaded`);
-        });
-      }
+      // Tokenizer loads on-demand when first token count is performed
+      // No need to eagerly load - it blocks the window ready-to-show event
       // No need to auto-start workspaces anymore - they start on demand
     } catch (error) {
       console.error(`[${timestamp()}] Startup failed:`, error);
@@ -436,6 +424,21 @@ if (gotTheLock) {
     }
   });
 
+  // Cleanup worker threads on quit
+  app.on("will-quit", () => {
+    console.log("App will quit - cleaning up worker threads");
+    void (async () => {
+      try {
+        // Dynamic import is acceptable here - only loaded if worker was used
+        /* eslint-disable-next-line no-restricted-syntax */
+        const { tokenizerWorkerPool } = await import("@/services/tokenizerWorkerPool");
+        tokenizerWorkerPool.terminate();
+      } catch (error) {
+        console.error("Error terminating worker pool:", error);
+      }
+    })();
+  });
+
   app.on("activate", () => {
     // Only create window if app is ready and no window exists
     // This prevents "Cannot create BrowserWindow before app is ready" error
diff --git a/src/preload.ts b/src/preload.ts
index 85cc99449..538e585da 100644
--- a/src/preload.ts
+++ b/src/preload.ts
@@ -110,6 +110,10 @@ const api: IPCApi = {
   window: {
     setTitle: (title: string) => ipcRenderer.invoke(IPC_CHANNELS.WINDOW_SET_TITLE, title),
   },
+  tokens: {
+    countBulk: (model: string, texts: string[]) =>
+      ipcRenderer.invoke(IPC_CHANNELS.TOKENS_COUNT_BULK, model, texts),
+  },
 };
 
 // Expose the API along with platform/versions
diff --git a/src/services/aiService.ts b/src/services/aiService.ts
index 6cc87f94c..4a5d4493a 100644
--- a/src/services/aiService.ts
+++ b/src/services/aiService.ts
@@ -28,7 +28,6 @@ import { applyCacheControl } from "@/utils/ai/cacheStrategy";
 import type { HistoryService } from "./historyService";
 import type { PartialService } from "./partialService";
 import { buildSystemMessage } from "./systemMessage";
-import { getTokenizerForModel } from "@/utils/main/tokenizer";
 import { buildProviderOptions } from "@/utils/ai/providerOptions";
 import type { ThinkingLevel } from "@/types/thinking";
 import type {
@@ -511,10 +510,6 @@ export class AIService extends EventEmitter {
         additionalSystemInstructions
       );
 
-      // Count system message tokens for cost tracking
-      const tokenizer = getTokenizerForModel(modelString);
-      const systemMessageTokens = tokenizer.countTokens(systemMessage);
-
       const workspacePath = metadataResult.data.workspacePath;
 
       // Find project path for this workspace to load secrets
@@ -548,7 +543,6 @@ export class AIService extends EventEmitter {
       const assistantMessage = createCmuxMessage(assistantMessageId, "assistant", "", {
         timestamp: Date.now(),
         model: modelString,
-        systemMessageTokens,
         mode, // Track the mode for this assistant response
       });
 
@@ -579,7 +573,6 @@ export class AIService extends EventEmitter {
             historySequence,
             timestamp: Date.now(),
             model: modelString,
-            systemMessageTokens,
             partial: true,
             error: errorMessage,
             errorType: "context_exceeded",
@@ -613,7 +606,6 @@ export class AIService extends EventEmitter {
         const noopMessage = createCmuxMessage(assistantMessageId, "assistant", "", {
           timestamp: Date.now(),
           model: modelString,
-          systemMessageTokens,
           toolPolicy,
         });
 
@@ -660,7 +652,6 @@ export class AIService extends EventEmitter {
           messageId: assistantMessageId,
           metadata: {
             model: modelString,
-            systemMessageTokens,
           },
           parts,
         };
@@ -699,7 +690,6 @@ export class AIService extends EventEmitter {
         abortSignal,
         tools,
         {
-          systemMessageTokens,
           timestamp: Date.now(),
           mode, // Pass mode so it persists in final history entry
         },
diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 766bd8428..5dddd7388 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -12,7 +12,7 @@ import {
   getMainWorktreeFromWorktree,
 } from "@/git";
 import { removeWorktreeSafe, removeWorktree, pruneWorktrees } from "@/services/gitService";
-import { AIService } from "@/services/aiService";
+import type { AIService } from "@/services/aiService";
 import { HistoryService } from "@/services/historyService";
 import { PartialService } from "@/services/partialService";
 import { AgentSession } from "@/services/agentSession";
@@ -45,7 +45,7 @@ export class IpcMain {
   private readonly config: Config;
   private readonly historyService: HistoryService;
   private readonly partialService: PartialService;
-  private readonly aiService: AIService;
+  private _aiService: AIService | null = null;
   private readonly sessions = new Map<string, AgentSession>();
   private readonly sessionSubscriptions = new Map<
     string,
@@ -58,7 +58,26 @@ export class IpcMain {
     this.config = config;
     this.historyService = new HistoryService(config);
     this.partialService = new PartialService(config, this.historyService);
-    this.aiService = new AIService(config, this.historyService, this.partialService);
+    // Don't create AIService here - it imports the massive "ai" package (~3s load time)
+    // Create it on-demand when first needed
+  }
+
+  /**
+   * Lazy-load AIService on first use.
+   * AIService imports the entire AI SDK which is ~3s load time.
+   * By deferring this until first actual use, we keep startup fast.
+   */
+  private get aiService(): AIService {
+    if (!this._aiService) {
+      // Dynamic import to avoid loading AI SDK at startup
+      // This is safe because AIService is only accessed after IPC handlers are registered
+      /* eslint-disable-next-line @typescript-eslint/no-require-imports */
+      const { AIService: AIServiceClass } = require("@/services/aiService") as {
+        AIService: typeof AIService;
+      };
+      this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
+    }
+    return this._aiService;
   }
 
   private getOrCreateSession(workspaceId: string): AgentSession {
@@ -140,6 +159,7 @@ export class IpcMain {
 
     this.registerDialogHandlers(ipcMain);
     this.registerWindowHandlers(ipcMain);
+    this.registerTokenHandlers(ipcMain);
     this.registerWorkspaceHandlers(ipcMain);
     this.registerProviderHandlers(ipcMain);
     this.registerProjectHandlers(ipcMain);
@@ -174,6 +194,24 @@ export class IpcMain {
     });
   }
 
+  private registerTokenHandlers(ipcMain: ElectronIpcMain): void {
+    ipcMain.handle(
+      IPC_CHANNELS.TOKENS_COUNT_BULK,
+      async (_event, model: string, texts: string[]) => {
+        try {
+          // Offload to worker thread - keeps main process responsive
+          // Dynamic import is acceptable here - worker pool is lazy-loaded on first use
+          /* eslint-disable-next-line no-restricted-syntax */
+          const { tokenizerWorkerPool } = await import("@/services/tokenizerWorkerPool");
+          return await tokenizerWorkerPool.countTokens(model, texts);
+        } catch (error) {
+          log.error(`Failed to count tokens for model ${model}:`, error);
+          return null; // Tokenizer not loaded or error occurred
+        }
+      }
+    );
+  }
+
   private registerWorkspaceHandlers(ipcMain: ElectronIpcMain): void {
     ipcMain.handle(
       IPC_CHANNELS.WORKSPACE_CREATE,
@@ -601,19 +639,14 @@ export class IpcMain {
         }
       ) => {
         try {
-          // Get workspace metadata to find workspacePath
-          const metadataResult = await this.aiService.getWorkspaceMetadata(workspaceId);
-          if (!metadataResult.success) {
-            return Err(`Failed to get workspace metadata: ${metadataResult.error}`);
+          // Get workspace path and project path from config (no need for AIService)
+          const workspaceInfo = this.config.findWorkspace(workspaceId);
+          if (!workspaceInfo) {
+            return Err(`Workspace not found: ${workspaceId}`);
           }
 
-          const workspacePath = metadataResult.data.workspacePath;
-
-          // Find project path for this workspace to load secrets
-          const workspaceInfo = this.config.findWorkspace(workspaceId);
-          const projectSecrets = workspaceInfo
-            ? this.config.getProjectSecrets(workspaceInfo.projectPath)
-            : [];
+          const { workspacePath, projectPath } = workspaceInfo;
+          const projectSecrets = this.config.getProjectSecrets(projectPath);
 
           // Create scoped temp directory for this IPC call
           using tempDir = new DisposableTempDir("cmux-ipc-bash");
diff --git a/src/services/tokenizerWorkerPool.ts b/src/services/tokenizerWorkerPool.ts
new file mode 100644
index 000000000..a74ac3c14
--- /dev/null
+++ b/src/services/tokenizerWorkerPool.ts
@@ -0,0 +1,161 @@
+/**
+ * Tokenizer Worker Pool
+ * Manages Node.js worker thread for off-main-thread tokenization
+ */
+
+import { Worker } from "worker_threads";
+import path from "path";
+import { log } from "@/services/log";
+
+interface PendingRequest {
+  resolve: (counts: number[]) => void;
+  reject: (error: Error) => void;
+  timeoutId: NodeJS.Timeout;
+}
+
+interface TokenizeRequest {
+  requestId: number;
+  model: string;
+  texts: string[];
+}
+
+interface TokenizeResponse {
+  requestId: number;
+  success: boolean;
+  counts?: number[];
+  error?: string;
+}
+
+class TokenizerWorkerPool {
+  private worker: Worker | null = null;
+  private requestCounter = 0;
+  private pendingRequests = new Map<number, PendingRequest>();
+  private isTerminating = false;
+
+  /**
+   * Get or create the worker thread
+   */
+  private getWorker(): Worker {
+    if (this.worker && !this.isTerminating) {
+      return this.worker;
+    }
+
+    // Worker script path - compiled by tsc to dist/src/workers/tokenizerWorker.js
+    // __dirname in production will be dist/src/services, so we go up one level then into workers
+    const workerPath = path.join(__dirname, "..", "workers", "tokenizerWorker.js");
+
+    this.worker = new Worker(workerPath);
+    this.isTerminating = false;
+
+    this.worker.on("message", (response: TokenizeResponse) => {
+      this.handleResponse(response);
+    });
+
+    this.worker.on("error", (error: Error) => {
+      log.error("Tokenizer worker error:", error);
+      // Reject all pending requests
+      for (const [requestId, pending] of this.pendingRequests) {
+        clearTimeout(pending.timeoutId);
+        pending.reject(new Error(`Worker error: ${error.message}`));
+        this.pendingRequests.delete(requestId);
+      }
+    });
+
+    this.worker.on("exit", (code: number) => {
+      if (!this.isTerminating && code !== 0) {
+        log.error(`Tokenizer worker exited with code ${code}`);
+      }
+      this.worker = null;
+    });
+
+    return this.worker;
+  }
+
+  /**
+   * Handle response from worker
+   */
+  private handleResponse(response: TokenizeResponse): void {
+    const pending = this.pendingRequests.get(response.requestId);
+    if (!pending) {
+      return; // Request was cancelled or timed out
+    }
+
+    clearTimeout(pending.timeoutId);
+    this.pendingRequests.delete(response.requestId);
+
+    if (response.success && response.counts) {
+      pending.resolve(response.counts);
+    } else {
+      pending.reject(new Error(response.error ?? "Unknown worker error"));
+    }
+  }
+
+  /**
+   * Count tokens for multiple texts using worker thread
+   * @param model - Model identifier for tokenizer selection
+   * @param texts - Array of texts to tokenize
+   * @returns Promise resolving to array of token counts
+   */
+  async countTokens(model: string, texts: string[]): Promise<number[]> {
+    const requestId = this.requestCounter++;
+    const worker = this.getWorker();
+
+    return new Promise<number[]>((resolve, reject) => {
+      // Set timeout for request (30 seconds)
+      const timeoutId = setTimeout(() => {
+        const pending = this.pendingRequests.get(requestId);
+        if (pending) {
+          this.pendingRequests.delete(requestId);
+          reject(new Error("Tokenization request timeout (30s)"));
+        }
+      }, 30000);
+
+      // Store pending request
+      this.pendingRequests.set(requestId, {
+        resolve,
+        reject,
+        timeoutId,
+      });
+
+      // Send request to worker
+      const request: TokenizeRequest = {
+        requestId,
+        model,
+        texts,
+      };
+
+      try {
+        worker.postMessage(request);
+      } catch (error) {
+        clearTimeout(timeoutId);
+        this.pendingRequests.delete(requestId);
+        reject(error instanceof Error ? error : new Error(String(error)));
+      }
+    });
+  }
+
+  /**
+   * Terminate the worker thread and reject all pending requests
+   */
+  terminate(): void {
+    this.isTerminating = true;
+
+    // Reject all pending requests
+    for (const [requestId, pending] of this.pendingRequests) {
+      clearTimeout(pending.timeoutId);
+      pending.reject(new Error("Worker pool terminated"));
+      this.pendingRequests.delete(requestId);
+    }
+
+    // Terminate worker
+    if (this.worker) {
+      this.worker.terminate().catch((error) => {
+        log.error("Error terminating tokenizer worker:", error);
+      });
+      this.worker = null;
+    }
+  }
+}
+
+// Singleton instance
+export const tokenizerWorkerPool = new TokenizerWorkerPool();
diff --git a/src/stores/GitStatusStore.ts b/src/stores/GitStatusStore.ts
index 98244c656..b3f79d8b8 100644
--- a/src/stores/GitStatusStore.ts
+++ b/src/stores/GitStatusStore.ts
@@ -118,8 +118,9 @@ export class GitStatusStore {
       clearInterval(this.pollInterval);
     }
 
-    // Run immediately
-    void this.updateGitStatus();
+    // Run first update immediately but asynchronously (don't block UI)
+    // setTimeout ensures this runs on next tick, allowing React to finish rendering
+    setTimeout(() => void this.updateGitStatus(), 0);
 
     // Poll at configured interval
     this.pollInterval = setInterval(() => {
@@ -209,12 +210,12 @@ export class GitStatusStore {
       });
 
       if (!result.success) {
-        console.debug(`[gitStatus] IPC failed for ${metadata.id}:`, result.error);
+        // IPC failed - silently fail, status will retry on next poll
         return [metadata.id, null];
       }
 
       if (!result.data.success) {
-        console.debug(`[gitStatus] Script failed for ${metadata.id}:`, result.data.error);
+        // Script execution failed - silently fail, status will retry on next poll
         return [metadata.id, null];
       }
 
@@ -222,7 +223,7 @@ export class GitStatusStore {
       const parsed = parseGitStatusScriptOutput(result.data.output);
 
       if (!parsed) {
-        console.debug(`[gitStatus] Could not parse output for ${metadata.id}`);
+        // Parse failed - silently fail, status will retry on next poll
         return [metadata.id, null];
       }
 
@@ -339,15 +340,13 @@ export class GitStatusStore {
       }
 
       // Success - reset failure counter
-      console.debug(`[fetch] Success for ${projectName}`);
       this.fetchCache.set(projectName, {
         lastFetch: Date.now(),
         inProgress: false,
         consecutiveFailures: 0,
       });
-    } catch (error) {
-      // All errors logged to console, never shown to user
-      console.debug(`[fetch] Failed for ${projectName}:`, error);
+    } catch {
+      // Fetch failed - silently retry with backoff
 
       const newFailures = cache.consecutiveFailures + 1;
       const nextDelay = Math.min(
diff --git a/src/types/ipc.ts b/src/types/ipc.ts
index ece311231..356a8b780 100644
--- a/src/types/ipc.ts
+++ b/src/types/ipc.ts
@@ -230,4 +230,7 @@ export interface IPCApi {
   window: {
     setTitle(title: string): Promise<void>;
   };
+  tokens: {
+    countBulk(model: string, texts: string[]): Promise<number[] | null>;
+  };
 }
diff --git a/src/types/message.ts b/src/types/message.ts
index 24cff7a1f..c3d6095ad 100644
--- a/src/types/message.ts
+++ b/src/types/message.ts
@@ -30,7 +30,7 @@ export interface CmuxMetadata {
   model?: string;
   usage?: LanguageModelV2Usage; // AI SDK normalized usage (verbatim from streamResult.usage)
   providerMetadata?: Record<string, unknown>; // Raw AI SDK provider data
-  systemMessageTokens?: number; // Token count for system message sent with this request (calculated by AIService)
+  systemMessageTokens?: number; // Deprecated: No longer populated (system tokens included in API usage.inputTokens)
   partial?: boolean; // Whether this message was interrupted and is incomplete
   synthetic?: boolean; // Whether this message was synthetically generated (e.g., [CONTINUE] sentinel)
   error?: string; // Error message if stream failed
diff --git a/src/types/stream.ts b/src/types/stream.ts
index e615c2cca..f550a673c 100644
--- a/src/types/stream.ts
+++ b/src/types/stream.ts
@@ -39,7 +39,7 @@ export interface StreamEndEvent {
     usage?: LanguageModelV2Usage;
     providerMetadata?: Record<string, unknown>;
     duration?: number;
-    systemMessageTokens?: number;
+    systemMessageTokens?: number; // Deprecated: No longer populated
   };
   // Parts array preserves temporal ordering of reasoning, text, and tool calls
   parts: CompletedMessagePart[];
diff --git a/src/utils/main/StreamingTokenTracker.test.ts b/src/utils/main/StreamingTokenTracker.test.ts
index 9e115c1fa..cc46081bf 100644
--- a/src/utils/main/StreamingTokenTracker.test.ts
+++ b/src/utils/main/StreamingTokenTracker.test.ts
@@ -1,58 +1,38 @@
-import { describe, test, expect, beforeEach } from "bun:test";
+/**
+ * Tests for StreamingTokenTracker model-change safety
+ */
+
+import { describe, it, expect } from "@jest/globals";
 import { StreamingTokenTracker } from "./StreamingTokenTracker";
 
 describe("StreamingTokenTracker", () => {
-  let tracker: StreamingTokenTracker;
+  it("should reinitialize tokenizer when model changes", () => {
+    const tracker = new StreamingTokenTracker();
 
-  beforeEach(() => {
-    tracker = new StreamingTokenTracker();
-  });
+    // Set first model
+    tracker.setModel("openai:gpt-4");
+    const count1 = tracker.countTokens("test");
 
-  describe("countTokens", () => {
-    test("returns 0 for empty string", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      expect(tracker.countTokens("")).toBe(0);
-    });
-
-    test("counts tokens in simple text", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      const count = tracker.countTokens("Hello world");
-      expect(count).toBeGreaterThan(0);
-      expect(count).toBeLessThan(10); // Reasonable upper bound
-    });
-
-    test("counts tokens in longer text", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      const text = "This is a longer piece of text with more tokens";
-      const count = tracker.countTokens(text);
-      expect(count).toBeGreaterThan(5);
-    });
-
-    test("handles special characters", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      const count = tracker.countTokens("🚀 emoji test");
-      expect(count).toBeGreaterThan(0);
-    });
-
-    test("is consistent for repeated calls", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      const text = "Test consistency";
-      const count1 = tracker.countTokens(text);
-      const count2 = tracker.countTokens(text);
-      expect(count1).toBe(count2);
-    });
+    // Switch to different model
+    tracker.setModel("anthropic:claude-opus-4");
+    const count2 = tracker.countTokens("test");
+
+    // Both should return valid counts
+    expect(count1).toBeGreaterThan(0);
+    expect(count2).toBeGreaterThan(0);
   });
 
-  describe("setModel", () => {
-    test("switches tokenizer for different models", () => {
-      tracker.setModel("anthropic:claude-sonnet-4-5");
-      const initial = tracker.countTokens("test");
+  it("should not reinitialize when model stays the same", () => {
+    const tracker = new StreamingTokenTracker();
+
+    // Set model twice
+    tracker.setModel("openai:gpt-4");
+    const count1 = tracker.countTokens("test");
 
-      tracker.setModel("openai:gpt-4");
-      const switched = tracker.countTokens("test");
+    tracker.setModel("openai:gpt-4"); // Same model
+    const count2 = tracker.countTokens("test");
 
-      expect(initial).toBeGreaterThan(0);
-      expect(switched).toBeGreaterThan(0);
-    });
+    // Should get same count (cached)
+    expect(count1).toBe(count2);
   });
 });
diff --git a/src/utils/main/StreamingTokenTracker.ts b/src/utils/main/StreamingTokenTracker.ts
index bcbd6451f..65ed36d87 100644
--- a/src/utils/main/StreamingTokenTracker.ts
+++ b/src/utils/main/StreamingTokenTracker.ts
@@ -12,13 +12,22 @@ import { getTokenizerForModel, type Tokenizer } from "./tokenizer";
  */
 export class StreamingTokenTracker {
   private tokenizer: Tokenizer | null = null;
+  private currentModel: string | null = null;
 
   /**
    * Initialize tokenizer for the current model
    * Should be called when model changes or on first stream
+   *
+   * IMPORTANT: Reinitializes tokenizer when model changes to ensure correct encoding.
+   * getTokenizerForModel() closes over the model string, so we must create a new
+   * tokenizer instance when switching models.
    */
   setModel(model: string): void {
-    this.tokenizer ??= getTokenizerForModel(model);
+    // Reinitialize if model changed or not yet initialized
+    if (this.currentModel !== model) {
+      this.currentModel = model;
+      this.tokenizer = getTokenizerForModel(model);
+    }
   }
 
   /**
diff --git a/src/utils/main/tokenizer.test.ts b/src/utils/main/tokenizer.test.ts
new file mode 100644
index 000000000..0cb2fba18
--- /dev/null
+++ b/src/utils/main/tokenizer.test.ts
@@ -0,0 +1,53 @@
+/**
+ * Tests for tokenizer cache behavior
+ */
+
+import { describe, it, expect } from "@jest/globals";
+import { getTokenizerForModel } from "./tokenizer";
+
+describe("tokenizer cache", () => {
+  const testText = "Hello, world!";
+
+  it("should use different cache keys for different models", () => {
+    // Get tokenizers for different models
+    const gpt4Tokenizer = getTokenizerForModel("openai:gpt-4");
+    const claudeTokenizer = getTokenizerForModel("anthropic:claude-opus-4");
+
+    // Count tokens with first model
+    const gpt4Count = gpt4Tokenizer.countTokens(testText);
+
+    // Count tokens with second model
+    const claudeCount = claudeTokenizer.countTokens(testText);
+
+    // Counts may differ because different encodings
+    // This test mainly ensures no crash and cache isolation
+    expect(typeof gpt4Count).toBe("number");
+    expect(typeof claudeCount).toBe("number");
+    expect(gpt4Count).toBeGreaterThan(0);
+    expect(claudeCount).toBeGreaterThan(0);
+  });
+
+  it("should return same count for same (model, text) pair from cache", () => {
+    const tokenizer = getTokenizerForModel("openai:gpt-4");
+
+    // First call
+    const count1 = tokenizer.countTokens(testText);
+
+    // Second call should hit cache
+    const count2 = tokenizer.countTokens(testText);
+
+    expect(count1).toBe(count2);
+  });
+
+  it("should normalize model keys for cache consistency", () => {
+    // These should map to the same cache key
+    const tokenizer1 = getTokenizerForModel("anthropic:claude-opus-4");
+    const tokenizer2 = getTokenizerForModel("anthropic/claude-opus-4");
+
+    const count1 = tokenizer1.countTokens(testText);
+    const count2 = tokenizer2.countTokens(testText);
+
+    // Should get same count since they normalize to same model
+    expect(count1).toBe(count2);
+  });
+});
diff --git a/src/utils/main/tokenizer.ts b/src/utils/main/tokenizer.ts
index 4c8bce7c0..c23310d8c 100644
--- a/src/utils/main/tokenizer.ts
+++ b/src/utils/main/tokenizer.ts
@@ -66,9 +66,14 @@ export async function loadTokenizerModules(): Promise<void> {
 }
 
 /**
- * LRU cache for token counts by text checksum
- * Avoids re-tokenizing identical strings (system messages, tool definitions, etc.)
- * Key: CRC32 checksum of text, Value: token count
+ * LRU cache for token counts by (model, text) pairs
+ * Avoids re-tokenizing identical strings with the same encoding
+ *
+ * Key: CRC32 checksum of "model:text" to ensure counts are model-specific
+ * Value: token count
+ *
+ * IMPORTANT: Cache key includes model because different encodings produce different counts.
+ * For async tokenization (approx → exact), the key stays stable so exact overwrites approx.
  */
 const tokenCountCache = new LRUCache<number, number>({
   max: 500000, // Max entries (safety limit)
@@ -83,11 +88,22 @@ const tokenCountCache = new LRUCache<number, number>({
  * Count tokens with caching via CRC32 checksum
  * Avoids re-tokenizing identical strings (system messages, tool definitions, etc.)
  *
+ * Cache key includes model to prevent cross-model count reuse.
+ *
  * NOTE: For async tokenization, this returns an approximation immediately and caches
- * the accurate count in the background. Subsequent calls will use the cached accurate count.
+ * the accurate count in the background. Subsequent calls with the same (model, text) pair
+ * will use the cached accurate count once ready.
  */
-function countTokensCached(text: string, tokenizeFn: () => number | Promise<number>): number {
-  const checksum = CRC32.str(text);
+function countTokensCached(
+  text: string,
+  modelString: string,
+  tokenizeFn: () => number | Promise<number>
+): number {
+  // Include model in cache key to prevent different encodings from reusing counts
+  // Normalize model key for consistent cache hits (e.g., "anthropic:claude" → "anthropic/claude")
+  const normalizedModel = normalizeModelKey(modelString);
+  const cacheKey = `${normalizedModel}:${text}`;
+  const checksum = CRC32.str(cacheKey);
   const cached = tokenCountCache.get(checksum);
   if (cached !== undefined) {
     return cached;
@@ -102,6 +118,7 @@ function countTokensCached(text: string, tokenizeFn: () => number | Promise<numb
   }
 
   // Async case: return approximation now, cache accurate value when ready
+  // Using same cache key ensures exact count overwrites approximation for this (model, text) pair
   const approximation = Math.ceil(text.length / 4);
   void result.then((count) => tokenCountCache.set(checksum, count));
   return approximation;
@@ -179,8 +196,8 @@ function countTokensWithLoadedModules(
  * @returns Tokenizer interface with name and countTokens function
  */
 export function getTokenizerForModel(modelString: string): Tokenizer {
-  // Start loading tokenizer modules in background (idempotent)
-  void loadTokenizerModules();
+  // Tokenizer modules are loaded on-demand when countTokens is first called
+  // This avoids blocking app startup with 8MB+ of tokenizer downloads
 
   return {
     get encoding() {
@@ -189,7 +206,7 @@ export function getTokenizerForModel(modelString: string): Tokenizer {
     countTokens: (text: string) => {
       // If tokenizer already loaded, use synchronous path for accurate counts
       if (tokenizerModules) {
-        return countTokensCached(text, () => {
+        return countTokensCached(text, modelString, () => {
           try {
             return countTokensWithLoadedModules(text, modelString, tokenizerModules!);
           } catch (error) {
@@ -201,7 +218,7 @@ export function getTokenizerForModel(modelString: string): Tokenizer {
       }
 
       // Tokenizer not yet loaded - use async path (returns approximation immediately)
-      return countTokensCached(text, async () => {
+      return countTokensCached(text, modelString, async () => {
         await loadTokenizerModules();
         try {
           return countTokensWithLoadedModules(text, modelString, tokenizerModules!);
diff --git a/src/utils/tokens/TokenStatsWorker.ts b/src/utils/tokens/TokenStatsWorker.ts
deleted file mode 100644
index b35c11692..000000000
--- a/src/utils/tokens/TokenStatsWorker.ts
+++ /dev/null
@@ -1,108 +0,0 @@
-/**
- * Wrapper class for managing the token statistics Web Worker
- * Provides a clean async API for calculating stats off the main thread
- */
-
-import type { CmuxMessage } from "@/types/message";
-import type { ChatStats } from "@/types/chatStats";
-import type { WorkerRequest, WorkerResponse, WorkerError } from "./tokenStats.worker";
-
-/**
- * TokenStatsWorker manages a dedicated Web Worker for calculating token statistics
- * Ensures only one calculation runs at a time and provides Promise-based API
- */
-export class TokenStatsWorker {
-  private readonly worker: Worker;
-  private requestCounter = 0;
-  private pendingRequest: {
-    id: string;
-    resolve: (stats: ChatStats) => void;
-    reject: (error: Error) => void;
-  } | null = null;
-
-  constructor() {
-    // Create worker using Vite's Web Worker support
-    // The ?worker suffix tells Vite to bundle this as a worker
-    this.worker = new Worker(new URL("./tokenStats.worker.ts", import.meta.url), {
-      type: "module",
-    });
-
-    this.worker.onmessage = this.handleMessage.bind(this);
-    this.worker.onerror = this.handleError.bind(this);
-  }
-
-  /**
-   * Calculate token statistics for the given messages
-   * Cancels any pending calculation and starts a new one
-   * @param messages - Array of CmuxMessages to analyze
-   * @param model - Model string for tokenizer selection
-   * @returns Promise that resolves with calculated stats
-   */
-  calculate(messages: CmuxMessage[], model: string): Promise<ChatStats> {
-    // Cancel any pending request (latest request wins)
-    if (this.pendingRequest) {
-      this.pendingRequest.reject(new Error("Cancelled by newer request"));
-      this.pendingRequest = null;
-    }
-
-    // Generate unique request ID
-    const id = `${Date.now()}-${++this.requestCounter}`;
-
-    // Create promise that will resolve when worker responds
-    const promise = new Promise<ChatStats>((resolve, reject) => {
-      this.pendingRequest = { id, resolve, reject };
-    });
-
-    // Send calculation request to worker
-    const request: WorkerRequest = {
-      id,
-      messages,
-      model,
-    };
-    this.worker.postMessage(request);
-
-    return promise;
-  }
-
-  /**
-   * Handle successful or error responses from worker
-   */
-  private handleMessage(e: MessageEvent<WorkerResponse | WorkerError>) {
-    const response = e.data;
-
-    // Ignore responses for cancelled requests
-    if (!this.pendingRequest || this.pendingRequest.id !== response.id) {
-      return;
-    }
-
-    const { resolve, reject } = this.pendingRequest;
-    this.pendingRequest = null;
-
-    if (response.success) {
-      resolve(response.stats);
-    } else {
-      reject(new Error(response.error));
-    }
-  }
-
-  /**
-   * Handle worker errors (script errors, not calculation errors)
-   */
-  private handleError(error: ErrorEvent) {
-    if (this.pendingRequest) {
-      this.pendingRequest.reject(new Error(`Worker error: ${error.message || "Unknown error"}`));
-      this.pendingRequest = null;
-    }
-  }
-
-  /**
-   * Terminate the worker and clean up resources
-   */
-  terminate() {
-    if (this.pendingRequest) {
-      this.pendingRequest.reject(new Error("Worker terminated"));
-      this.pendingRequest = null;
-    }
-    this.worker.terminate();
-  }
-}
diff --git a/src/utils/tokens/consumerCalculator.test.ts b/src/utils/tokens/consumerCalculator.test.ts
new file mode 100644
index 000000000..981041649
--- /dev/null
+++ b/src/utils/tokens/consumerCalculator.test.ts
@@ -0,0 +1,237 @@
+/**
+ * Tests for frontend token consumer calculator
+ */
+
+import { describe, it, expect } from "@jest/globals";
+import { prepareTokenization, calculateConsumers } from "./consumerCalculator";
+import type { CmuxMessage } from "@/types/message";
+
+describe("prepareTokenization", () => {
+  it("extracts user and assistant text", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "user",
+        parts: [{ type: "text", text: "Hello!" }],
+      },
+      {
+        id: "2",
+        role: "assistant",
+        parts: [{ type: "text", text: "Hi there!" }],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    expect(result.texts).toEqual(["Hello!", "Hi there!"]);
+    expect(result.consumerMap).toEqual(["User", "Assistant"]);
+    expect(result.toolDefinitions.size).toBe(0);
+  });
+
+  it("extracts reasoning content", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "assistant",
+        parts: [
+          { type: "reasoning", text: "Let me think..." },
+          { type: "text", text: "Here's my answer" },
+        ],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    expect(result.texts).toEqual(["Let me think...", "Here's my answer"]);
+    expect(result.consumerMap).toEqual(["Assistant (reasoning)", "Assistant"]);
+  });
+
+  it("extracts tool calls and results", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "assistant",
+        parts: [
+          {
+            type: "dynamic-tool",
+            toolCallId: "call_1",
+            toolName: "bash",
+            state: "output-available",
+            input: { script: "echo hello" },
+            output: "hello\n",
+          },
+        ],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    // Input and output both counted
+    expect(result.texts).toEqual(['{"script":"echo hello"}', "hello\n"]);
+    expect(result.consumerMap).toEqual(["bash", "bash"]);
+  });
+
+  it("includes tool definitions once per unique tool", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "assistant",
+        parts: [
+          {
+            type: "dynamic-tool",
+            toolCallId: "call_1",
+            toolName: "bash",
+            state: "output-available",
+            input: { script: "echo 1" },
+            output: "1\n",
+          },
+        ],
+      },
+      {
+        id: "2",
+        role: "assistant",
+        parts: [
+          {
+            type: "dynamic-tool",
+            toolCallId: "call_2",
+            toolName: "bash",
+            state: "output-available",
+            input: { script: "echo 2" },
+            output: "2\n",
+          },
+        ],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    // bash definition should only be included once
+    expect(result.toolDefinitions.size).toBe(1);
+    expect(result.toolDefinitions.has("bash")).toBe(true);
+
+    // Should have definition in serialized form
+    const bashDef = result.toolDefinitions.get("bash");
+    expect(bashDef).toContain("bash");
+    expect(bashDef).toContain("script");
+  });
+
+  it("handles tools with only input (input-available state)", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "assistant",
+        parts: [
+          {
+            type: "dynamic-tool",
+            toolCallId: "call_1",
+            toolName: "bash",
+            state: "input-available",
+            input: { script: "echo hello" },
+          },
+        ],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    // Only input, no output
+    expect(result.texts).toEqual(['{"script":"echo hello"}']);
+    expect(result.consumerMap).toEqual(["bash"]);
+  });
+
+  it("ignores image parts", () => {
+    const messages: CmuxMessage[] = [
+      {
+        id: "1",
+        role: "user",
+        parts: [
+          { type: "text", text: "Look at this" },
+          { type: "image", image: "base64data", mimeType: "image/png" },
+        ],
+      },
+    ];
+
+    const result = prepareTokenization(messages, "anthropic:claude-opus-4");
+
+    // Only text, no image
+    expect(result.texts).toEqual(["Look at this"]);
+    expect(result.consumerMap).toEqual(["User"]);
+  });
+});
+
+describe("calculateConsumers", () => {
+  it("aggregates tokens by consumer", () => {
+    const tokenCounts = [10, 20, 15];
+    const consumerMap = ["User", "Assistant", "User"];
+    const toolDefCounts = new Map<string, number>();
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(2);
+    expect(consumers.find((c) => c.name === "User")?.tokens).toBe(25); // 10 + 15
+    expect(consumers.find((c) => c.name === "Assistant")?.tokens).toBe(20);
+  });
+
+  it("calculates percentages correctly", () => {
+    const tokenCounts = [50, 50];
+    const consumerMap = ["User", "Assistant"];
+    const toolDefCounts = new Map<string, number>();
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(2);
+    expect(consumers.find((c) => c.name === "User")?.percentage).toBe(50);
+    expect(consumers.find((c) => c.name === "Assistant")?.percentage).toBe(50);
+  });
+
+  it("sorts consumers by token count descending", () => {
+    const tokenCounts = [10, 50, 30];
+    const consumerMap = ["User", "Assistant", "bash"];
+    const toolDefCounts = new Map<string, number>();
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(3);
+    expect(consumers[0].name).toBe("Assistant"); // 50 tokens
+    expect(consumers[1].name).toBe("bash"); // 30 tokens
+    expect(consumers[2].name).toBe("User"); // 10 tokens
+  });
+
+  it("tracks fixed and variable tokens separately", () => {
+    const tokenCounts = [20, 30]; // variable tokens for tool calls
+    const consumerMap = ["bash", "bash"];
+    const toolDefCounts = new Map<string, number>([["bash", 65]]); // fixed overhead
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(1);
+    const bashConsumer = consumers[0];
+    expect(bashConsumer.name).toBe("bash");
+    expect(bashConsumer.tokens).toBe(115); // 65 fixed + 20 + 30 variable
+    expect(bashConsumer.fixedTokens).toBe(65);
+    expect(bashConsumer.variableTokens).toBe(50);
+  });
+
+  it("handles zero total tokens gracefully", () => {
+    const tokenCounts: number[] = [];
+    const consumerMap: string[] = [];
+    const toolDefCounts = new Map<string, number>();
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(0);
+  });
+
+  it("omits fixedTokens and variableTokens when not present", () => {
+    const tokenCounts = [100];
+    const consumerMap = ["User"];
+    const toolDefCounts = new Map<string, number>();
+
+    const consumers = calculateConsumers(tokenCounts, consumerMap, toolDefCounts);
+
+    expect(consumers).toHaveLength(1);
+    const userConsumer = consumers[0];
+    expect(userConsumer.fixedTokens).toBeUndefined();
+    expect(userConsumer.variableTokens).toBe(100);
+  });
+});
diff --git a/src/utils/tokens/consumerCalculator.ts b/src/utils/tokens/consumerCalculator.ts
new file mode 100644
index 000000000..cb8e0e78b
--- /dev/null
+++ b/src/utils/tokens/consumerCalculator.ts
@@ -0,0 +1,141 @@
+/**
+ * Frontend token consumer calculation - Pure functions for UI
+ *
+ * This module handles token consumer breakdown calculation in the frontend,
+ * using the backend tokenization service for raw counts.
+ *
+ * Separation of concerns:
+ * - Backend: Tokenization only (countTokens)
+ * - Frontend: Display logic (aggregation, percentages, sorting)
+ */
+
+import type { CmuxMessage } from "@/types/message";
+import type { TokenConsumer } from "@/types/chatStats";
+import { getToolSchemas, getAvailableTools } from "@/utils/tools/toolDefinitions";
+
+/**
+ * Prepared tokenization data - all text that needs token counting
+ */
+export interface TokenizationData {
+  /** All text content to tokenize (in order) */
+  texts: string[];
+  /** Maps token result index back to the consumer name */
+  consumerMap: string[];
+  /** Tool definitions that need to be counted */
+  toolDefinitions: Map<string, string>; // toolName -> serialized definition
+}
+
+/**
+ * Prepare all text for bulk tokenization
+ * Pure function - no async, no IPC
+ */
+export function prepareTokenization(messages: CmuxMessage[], model: string): TokenizationData {
+  const texts: string[] = [];
+  const consumerMap: string[] = [];
+  const toolDefinitions = new Map<string, string>();
+  const seenTools = new Set<string>();
+
+  // Get available tools for this model
+  const availableTools = getAvailableTools(model);
+  const toolSchemas = getToolSchemas();
+
+  for (const message of messages) {
+    for (const part of message.parts) {
+      if (part.type === "text") {
+        // User or Assistant text
+        const consumerName = message.role === "user" ? "User" : "Assistant";
+        texts.push(part.text);
+        consumerMap.push(consumerName);
+      } else if (part.type === "image") {
+        // Images don't consume text tokens in our model
+        continue;
+      } else if (part.type === "reasoning") {
+        // Reasoning content (extended thinking, etc.)
+        texts.push(part.text);
+        consumerMap.push("Assistant (reasoning)");
+      } else if (part.type === "dynamic-tool") {
+        // Tool call - args are variable tokens
+        const toolName = part.toolName;
+        texts.push(JSON.stringify(part.input));
+        consumerMap.push(toolName);
+
+        // Track tool definition (fixed overhead)
+        if (!seenTools.has(toolName) && availableTools.includes(toolName)) {
+          const schema = toolSchemas[toolName];
+          if (schema) {
+            toolDefinitions.set(toolName, JSON.stringify(schema));
+            seenTools.add(toolName);
+          }
+        }
+
+        // Tool result (if output is available) - variable tokens
+        if (part.state === "output-available" && part.output !== undefined) {
+          const resultText =
+            typeof part.output === "string" ? part.output : JSON.stringify(part.output);
+          texts.push(resultText);
+          consumerMap.push(toolName);
+        }
+      }
+    }
+  }
+
+  return { texts, consumerMap, toolDefinitions };
+}
+
+/**
+ * Calculate token consumers from messages and token counts
+ * Pure function - no async, no IPC
+ */
+export function calculateConsumers(
+  tokenCounts: number[],
+  consumerMap: string[],
+  toolDefinitionCounts: Map<string, number>
+): TokenConsumer[] {
+  // Aggregate tokens by consumer
+  const consumerTotals = new Map<string, { fixed: number; variable: number; total: number }>();
+
+  // Add variable tokens from messages
+  for (let i = 0; i < tokenCounts.length; i++) {
+    const consumerName = consumerMap[i];
+    const tokens = tokenCounts[i];
+
+    if (!consumerTotals.has(consumerName)) {
+      consumerTotals.set(consumerName, { fixed: 0, variable: 0, total: 0 });
+    }
+
+    const entry = consumerTotals.get(consumerName)!;
+    entry.variable += tokens;
+    entry.total += tokens;
+  }
+
+  // Add fixed tokens from tool definitions
+  for (const [toolName, defTokens] of toolDefinitionCounts) {
+    if (!consumerTotals.has(toolName)) {
+      consumerTotals.set(toolName, { fixed: 0, variable: 0, total: 0 });
+    }
+
+    const entry = consumerTotals.get(toolName)!;
+    entry.fixed += defTokens;
+    entry.total += defTokens;
+  }
+
+  // Calculate total
+  const totalTokens = Array.from(consumerTotals.values()).reduce(
+    (sum, entry) => sum + entry.total,
+    0
+  );
+
+  // Convert to TokenConsumer array with percentages
+  const consumers: TokenConsumer[] = Array.from(consumerTotals.entries()).map(([name, entry]) => ({
+    name,
+    tokens: entry.total,
+    percentage: totalTokens > 0 ? (entry.total / totalTokens) * 100 : 0,
+    fixedTokens: entry.fixed > 0 ? entry.fixed : undefined,
+    variableTokens: entry.variable > 0 ? entry.variable : undefined,
+  }));
+
+  // Sort descending by token count
+  consumers.sort((a, b) => b.tokens - a.tokens);
+
+  return consumers;
+}
diff --git a/src/utils/tokens/tokenStats.worker.ts b/src/utils/tokens/tokenStats.worker.ts
deleted file mode 100644
index ce401e19d..000000000
--- a/src/utils/tokens/tokenStats.worker.ts
+++ /dev/null
@@ -1,48 +0,0 @@
-/**
- * Web Worker for calculating token statistics off the main thread
- * This prevents UI blocking during expensive tokenization operations
- */
-
-import type { CmuxMessage } from "@/types/message";
-import type { ChatStats } from "@/types/chatStats";
-import { calculateTokenStats } from "./tokenStatsCalculator";
-
-export interface WorkerRequest {
-  id: string;
-  messages: CmuxMessage[];
-  model: string;
-}
-
-export interface WorkerResponse {
-  id: string;
-  success: true;
-  stats: ChatStats;
-}
-
-export interface WorkerError {
-  id: string;
-  success: false;
-  error: string;
-}
-
-// Handle incoming calculation requests
-self.onmessage = (e: MessageEvent<WorkerRequest>) => {
-  const { id, messages, model } = e.data;
-
-  try {
-    const stats = calculateTokenStats(messages, model);
-    const response: WorkerResponse = {
-      id,
-      success: true,
-      stats,
-    };
-    self.postMessage(response);
-  } catch (error) {
-    const errorResponse: WorkerError = {
-      id,
-      success: false,
-      error: error instanceof Error ? error.message : String(error),
-    };
-    self.postMessage(errorResponse);
-  }
-};
diff --git a/src/utils/tokens/tokenStatsCalculator.ts b/src/utils/tokens/tokenStatsCalculator.ts
index a6e641e58..1dbb3133a 100644
--- a/src/utils/tokens/tokenStatsCalculator.ts
+++ b/src/utils/tokens/tokenStatsCalculator.ts
@@ -1,6 +1,6 @@
 /**
  * Shared token statistics calculation logic
- * Used by both frontend (ChatContext) and backend (debug commands)
+ * Used by backend (debug commands and IPC stats handler)
  *
  * IMPORTANT: This utility is intentionally abstracted so that the debug command
  * (`bun debug costs`) has exact parity with the UI display in the Costs tab.
@@ -9,89 +9,13 @@
 
 import type { CmuxMessage } from "@/types/message";
 import type { ChatStats, TokenConsumer } from "@/types/chatStats";
-import type { LanguageModelV2Usage } from "@ai-sdk/provider";
 import {
   getTokenizerForModel,
   countTokensForData,
   getToolDefinitionTokens,
 } from "@/utils/main/tokenizer";
-import { getModelStats } from "./modelStats";
-import type { ChatUsageDisplay } from "./usageAggregator";
-
-/**
- * Create a display-friendly usage object from AI SDK usage
- */
-export function createDisplayUsage(
-  usage: LanguageModelV2Usage | undefined,
-  model: string,
-  providerMetadata?: Record<string, unknown>
-): ChatUsageDisplay | undefined {
-  if (!usage) return undefined;
-
-  // Provider-specific token handling:
-  // - OpenAI: inputTokens is INCLUSIVE of cachedInputTokens
-  // - Anthropic: inputTokens EXCLUDES cachedInputTokens
-  const cachedTokens = usage.cachedInputTokens ?? 0;
-  const rawInputTokens = usage.inputTokens ?? 0;
-
-  // Detect provider from model string
-  const isOpenAI = model.startsWith("openai:");
-
-  // For OpenAI, subtract cached tokens to get uncached input tokens
-  const inputTokens = isOpenAI ? Math.max(0, rawInputTokens - cachedTokens) : rawInputTokens;
-
-  // Extract cache creation tokens from provider metadata (Anthropic-specific)
-  const cacheCreateTokens =
-    (providerMetadata?.anthropic as { cacheCreationInputTokens?: number } | undefined)
-      ?.cacheCreationInputTokens ?? 0;
-
-  // Calculate output tokens excluding reasoning
-  const outputWithoutReasoning = Math.max(
-    0,
-    (usage.outputTokens ?? 0) - (usage.reasoningTokens ?? 0)
-  );
-
-  // Get model stats for cost calculation
-  const modelStats = getModelStats(model);
-
-  // Calculate costs based on model stats (undefined if model unknown)
-  let inputCost: number | undefined;
-  let cachedCost: number | undefined;
-  let cacheCreateCost: number | undefined;
-  let outputCost: number | undefined;
-  let reasoningCost: number | undefined;
-
-  if (modelStats) {
-    inputCost = inputTokens * modelStats.input_cost_per_token;
-    cachedCost = cachedTokens * (modelStats.cache_read_input_token_cost ?? 0);
-    cacheCreateCost = cacheCreateTokens * (modelStats.cache_creation_input_token_cost ?? 0);
-    outputCost = outputWithoutReasoning * modelStats.output_cost_per_token;
-    reasoningCost = (usage.reasoningTokens ?? 0) * modelStats.output_cost_per_token;
-  }
-
-  return {
-    input: {
-      tokens: inputTokens,
-      cost_usd: inputCost,
-    },
-    cached: {
-      tokens: cachedTokens,
-      cost_usd: cachedCost,
-    },
-    cacheCreate: {
-      tokens: cacheCreateTokens,
-      cost_usd: cacheCreateCost,
-    },
-    output: {
-      tokens: outputWithoutReasoning,
-      cost_usd: outputCost,
-    },
-    reasoning: {
-      tokens: usage.reasoningTokens ?? 0,
-      cost_usd: reasoningCost,
-    },
-  };
-}
+import { getModelStats as _getModelStats } from "./modelStats";
+import { createDisplayUsage, type ChatUsageDisplay } from "./usageAggregator";
 
 /**
  * Calculate token statistics from raw CmuxMessages
@@ -118,7 +42,6 @@ export function calculateTokenStats(messages: CmuxMessage[], model: string): Cha
   const consumerMap = new Map<string, { fixed: number; variable: number }>();
   const toolsWithDefinitions = new Set<string>(); // Track which tools have definitions included
   const usageHistory: ChatUsageDisplay[] = [];
-  let systemMessageTokens = 0; // Accumulate system message tokens across all requests
 
   // Calculate tokens by content producer (User, Assistant, individual tools)
   // This shows what activities are consuming tokens, useful for debugging costs
@@ -135,11 +58,6 @@ export function calculateTokenStats(messages: CmuxMessage[], model: string): Cha
       const existing = consumerMap.get("User") ?? { fixed: 0, variable: 0 };
       consumerMap.set("User", { fixed: 0, variable: existing.variable + userTokens });
     } else if (message.role === "assistant") {
-      // Accumulate system message tokens from this request
-      if (message.metadata?.systemMessageTokens) {
-        systemMessageTokens += message.metadata.systemMessageTokens;
-      }
-
       // Store usage in history for comparison with estimates
       if (message.metadata?.usage) {
         const usage = createDisplayUsage(
@@ -252,11 +170,6 @@ export function calculateTokenStats(messages: CmuxMessage[], model: string): Cha
     }
   }
 
-  // Add system message tokens as a consumer if present
-  if (systemMessageTokens > 0) {
-    consumerMap.set("System", { fixed: 0, variable: systemMessageTokens });
-  }
-
   // Calculate total tokens
   const totalTokens = Array.from(consumerMap.values()).reduce(
     (sum, val) => sum + val.fixed + val.variable,
diff --git a/src/utils/tokens/usageAggregator.ts b/src/utils/tokens/usageAggregator.ts
index 61a439c60..1dc75c5eb 100644
--- a/src/utils/tokens/usageAggregator.ts
+++ b/src/utils/tokens/usageAggregator.ts
@@ -7,6 +7,10 @@
  * Separated from tokenStatsCalculator.ts to keep tokenizer in main process only.
  */
 
+import type { LanguageModelV2Usage } from "@ai-sdk/provider";
+import type { CmuxMessage } from "@/types/message";
+import { getModelStats } from "./modelStats";
+
 export interface ChatUsageComponent {
   tokens: number;
   cost_usd?: number; // undefined if model pricing unknown
@@ -69,3 +73,102 @@ export function sumUsageHistory(usageHistory: ChatUsageDisplay[]): ChatUsageDisp
 
   return sum;
 }
+
+/**
+ * Create a display-friendly usage object from AI SDK usage
+ * Moved from tokenStatsCalculator.ts to be usable in renderer without tokenizer
+ */
+export function createDisplayUsage(
+  usage: LanguageModelV2Usage | undefined,
+  model: string,
+  providerMetadata?: Record<string, unknown>
+): ChatUsageDisplay | undefined {
+  if (!usage) return undefined;
+
+  // Provider-specific token handling:
+  // - OpenAI: inputTokens is INCLUSIVE of cachedInputTokens
+  // - Anthropic: inputTokens EXCLUDES cachedInputTokens
+  const cachedTokens = usage.cachedInputTokens ?? 0;
+  const rawInputTokens = usage.inputTokens ?? 0;
+
+  // Detect provider from model string
+  const isOpenAI = model.startsWith("openai:");
+
+  // For OpenAI, subtract cached tokens to get uncached input tokens
+  const inputTokens = isOpenAI ? Math.max(0, rawInputTokens - cachedTokens) : rawInputTokens;
+
+  // Extract cache creation tokens from provider metadata (Anthropic-specific)
+  const cacheCreateTokens =
+    (providerMetadata?.anthropic as { cacheCreationInputTokens?: number } | undefined)
+      ?.cacheCreationInputTokens ?? 0;
+
+  // Calculate output tokens excluding reasoning
+  const outputWithoutReasoning = Math.max(
+    0,
+    (usage.outputTokens ?? 0) - (usage.reasoningTokens ?? 0)
+  );
+
+  // Get model stats for cost calculation
+  const modelStats = getModelStats(model);
+
+  // Calculate costs based on model stats (undefined if model unknown)
+  let inputCost: number | undefined;
+  let cachedCost: number | undefined;
+  let cacheCreateCost: number | undefined;
+  let outputCost: number | undefined;
+  let reasoningCost: number | undefined;
+
+  if (modelStats) {
+    inputCost = inputTokens * modelStats.input_cost_per_token;
+    cachedCost = cachedTokens * (modelStats.cache_read_input_token_cost ?? 0);
+    cacheCreateCost = cacheCreateTokens * (modelStats.cache_creation_input_token_cost ?? 0);
+    outputCost = outputWithoutReasoning * modelStats.output_cost_per_token;
+    reasoningCost = (usage.reasoningTokens ?? 0) * modelStats.output_cost_per_token;
+  }
+
+  return {
+    input: {
+      tokens: inputTokens,
+      cost_usd: inputCost,
+    },
+    cached: {
+      tokens: cachedTokens,
+      cost_usd: cachedCost,
+    },
+    cacheCreate: {
+      tokens: cacheCreateTokens,
+      cost_usd: cacheCreateCost,
+    },
+    output: {
+      tokens: outputWithoutReasoning,
+      cost_usd: outputCost,
+    },
+    reasoning: {
+      tokens: usage.reasoningTokens ?? 0,
+      cost_usd: reasoningCost,
+    },
+  };
+}
+
+/**
+ * Extract usage history from messages for display
+ * Used by CostsTab to show API response data without expensive token calculation
+ */
+export function extractUsageHistory(messages: CmuxMessage[]): ChatUsageDisplay[] {
+  const usageHistory: ChatUsageDisplay[] = [];
+
+  for (const message of messages) {
+    if (message.role === "assistant" && message.metadata?.usage) {
+      const usage = createDisplayUsage(
+        message.metadata.usage,
+        message.metadata.model ?? "unknown",
+        message.metadata.providerMetadata
+      );
+      if (usage) {
+        usageHistory.push(usage);
+      }
+    }
+  }
+
+  return usageHistory;
+}
diff --git a/src/workers/tokenizerWorker.ts b/src/workers/tokenizerWorker.ts
new file mode 100644
index 000000000..907c2c5ca
--- /dev/null
+++ b/src/workers/tokenizerWorker.ts
@@ -0,0 +1,56 @@
+/**
+ * Node.js Worker Thread for tokenization
+ * Offloads CPU-intensive tokenization to prevent main process blocking
+ */
+
+import { parentPort } from "worker_threads";
+
+// Lazy-load tokenizer only when first needed
+let getTokenizerForModel: ((model: string) => { countTokens: (text: string) => number }) | null =
+  null;
+
+interface TokenizeRequest {
+  requestId: number;
+  model: string;
+  texts: string[];
+}
+
+interface TokenizeResponse {
+  requestId: number;
+  success: boolean;
+  counts?: number[];
+  error?: string;
+}
+
+parentPort?.on("message", (data: TokenizeRequest) => {
+  const { requestId, model, texts } = data;
+
+  void (async () => {
+    try {
+      // Lazy-load tokenizer on first use
+      // Dynamic import is acceptable here as worker is isolated and has no circular deps
+      if (!getTokenizerForModel) {
+        /* eslint-disable-next-line no-restricted-syntax */
+        const tokenizerModule = await import("@/utils/main/tokenizer");
+        getTokenizerForModel = tokenizerModule.getTokenizerForModel;
+      }
+
+      const tokenizer = getTokenizerForModel(model);
+      const counts = texts.map((text) => tokenizer.countTokens(text));
+
+      const response: TokenizeResponse = {
+        requestId,
+        success: true,
+        counts,
+      };
+      parentPort?.postMessage(response);
+    } catch (error) {
+      const response: TokenizeResponse = {
+        requestId,
+        success: false,
+        error: error instanceof Error ? error.message : String(error),
+      };
+      parentPort?.postMessage(response);
+    }
+  })();
+});
diff --git a/vite.config.ts b/vite.config.ts
index fe4f98179..9422a5ab1 100644
--- a/vite.config.ts
+++ b/vite.config.ts
@@ -29,13 +29,19 @@ export default defineConfig(({ mode }) => ({
     outDir: "dist",
     assetsDir: ".",
     emptyOutDir: false,
-    sourcemap: true,
+    // Only generate source maps in development (saves ~50MB in production .app)
+    sourcemap: mode === "development",
     minify: "esbuild",
     rollupOptions: {
       output: {
         format: "es",
         inlineDynamicImports: false,
         sourcemapExcludeSources: false,
+        manualChunks: {
+          // Separate large dependencies for better caching and on-demand loading
+          "react-vendor": ["react", "react-dom"],
+          "syntax-highlighter": ["react-syntax-highlighter"],
+        },
       },
     },
     chunkSizeWarningLimit: 2000,

From a5eb62f834db1e025ff07cc699baf3fc117948b7 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 09:55:20 -0500
Subject: [PATCH 02/16] test: update executeBash error message assertion

The error message changed when we stopped using AIService.getWorkspaceMetadata()
and started using Config.findWorkspace() directly (commit cdd33020).

Old: 'Failed to get workspace metadata'
New: 'Workspace not found: nonexistent-workspace'
---
 .gitignore                        | 1 +
 tests/ipcMain/executeBash.test.ts | 2 +-
 2 files changed, 2 insertions(+), 1 deletion(-)

diff --git a/.gitignore b/.gitignore
index 368183a9f..e80cfc236 100644
--- a/.gitignore
+++ b/.gitignore
@@ -94,3 +94,4 @@ __pycache__
 
 tmpfork
 .cmux-agent-cli
+*.local.md
diff --git a/tests/ipcMain/executeBash.test.ts b/tests/ipcMain/executeBash.test.ts
index a0eeedcee..b8cbcedd1 100644
--- a/tests/ipcMain/executeBash.test.ts
+++ b/tests/ipcMain/executeBash.test.ts
@@ -212,7 +212,7 @@ describeIntegration("IpcMain executeBash integration tests", () => {
         );
 
         expect(result.success).toBe(false);
-        expect(result.error).toContain("Failed to get workspace metadata");
+        expect(result.error).toContain("Workspace not found:");
       } finally {
         await cleanupTestEnvironment(env);
       }

From 70e8e23f12a2dbcbfc7a40e902c4689ad2a9cc9b Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 09:59:20 -0500
Subject: [PATCH 03/16] fix: use relative path in AIService lazy-load require()

The lazy-load getter was using require('@/services/aiService') which works
during development but fails in production because Node.js doesn't resolve
TypeScript path aliases at runtime.

Changed to require('./aiService') (relative path) which works both in
development and in the compiled dist/main.js.

This was causing E2E tests to fail - streams never completed because
AIService was never successfully instantiated in the built Electron app.
---
 src/services/ipcMain.ts | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 5dddd7388..da9aa439b 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -70,9 +70,10 @@ export class IpcMain {
   private get aiService(): AIService {
     if (!this._aiService) {
       // Dynamic import to avoid loading AI SDK at startup
+      // Use relative path (not @/ alias) because require() runs at runtime after TS compilation
       // This is safe because AIService is only accessed after IPC handlers are registered
       /* eslint-disable-next-line @typescript-eslint/no-require-imports */
-      const { AIService: AIServiceClass } = require("@/services/aiService") as {
+      const { AIService: AIServiceClass } = require("./aiService") as {
         AIService: typeof AIService;
       };
       this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);

From 5e8924811bf11bf110454df56237101a61737e4b Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 10:12:23 -0500
Subject: [PATCH 04/16] debug: add logging to trace AIService lazy-load in E2E
 tests

---
 src/services/ipcMain.ts | 9 +++++++++
 1 file changed, 9 insertions(+)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index da9aa439b..97bbf5116 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -72,11 +72,14 @@ export class IpcMain {
       // Dynamic import to avoid loading AI SDK at startup
       // Use relative path (not @/ alias) because require() runs at runtime after TS compilation
       // This is safe because AIService is only accessed after IPC handlers are registered
+      log.info("[IpcMain] Lazy-loading AIService...");
       /* eslint-disable-next-line @typescript-eslint/no-require-imports */
       const { AIService: AIServiceClass } = require("./aiService") as {
         AIService: typeof AIService;
       };
+      log.info("[IpcMain] AIService class loaded, creating instance...");
       this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
+      log.info("[IpcMain] AIService instance created successfully");
     }
     return this._aiService;
   }
@@ -86,11 +89,17 @@ export class IpcMain {
     const trimmed = workspaceId.trim();
     assert(trimmed.length > 0, "workspaceId must not be empty");
 
+    log.info(`[IpcMain] getOrCreateSession called for workspaceId=${trimmed}`);
+
+
     let session = this.sessions.get(trimmed);
     if (session) {
       return session;
     }
 
+    log.info(`[IpcMain] Creating new session for workspaceId=${trimmed}`);
+
+
     session = new AgentSession({
       workspaceId: trimmed,
       config: this.config,

From 8f5daa268dd273306af10858e9bf1880abb9e14f Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 10:14:38 -0500
Subject: [PATCH 05/16] fmt

---
 src/services/ipcMain.ts | 2 --
 1 file changed, 2 deletions(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 97bbf5116..692c20487 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -91,7 +91,6 @@ export class IpcMain {
 
     log.info(`[IpcMain] getOrCreateSession called for workspaceId=${trimmed}`);
 
-
     let session = this.sessions.get(trimmed);
     if (session) {
       return session;
@@ -99,7 +98,6 @@ export class IpcMain {
 
     log.info(`[IpcMain] Creating new session for workspaceId=${trimmed}`);
 
-
     session = new AgentSession({
       workspaceId: trimmed,
       config: this.config,

From 642d382982369564d8b5b79e4f546c1a7e210911 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 10:34:43 -0500
Subject: [PATCH 06/16] chore: remove debug logging

---
 src/services/ipcMain.ts | 5 -----
 1 file changed, 5 deletions(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 692c20487..118ff3040 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -72,14 +72,11 @@ export class IpcMain {
       // Dynamic import to avoid loading AI SDK at startup
       // Use relative path (not @/ alias) because require() runs at runtime after TS compilation
       // This is safe because AIService is only accessed after IPC handlers are registered
-      log.info("[IpcMain] Lazy-loading AIService...");
       /* eslint-disable-next-line @typescript-eslint/no-require-imports */
       const { AIService: AIServiceClass } = require("./aiService") as {
         AIService: typeof AIService;
       };
-      log.info("[IpcMain] AIService class loaded, creating instance...");
       this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
-      log.info("[IpcMain] AIService instance created successfully");
     }
     return this._aiService;
   }
@@ -89,14 +86,12 @@ export class IpcMain {
     const trimmed = workspaceId.trim();
     assert(trimmed.length > 0, "workspaceId must not be empty");
 
-    log.info(`[IpcMain] getOrCreateSession called for workspaceId=${trimmed}`);
 
     let session = this.sessions.get(trimmed);
     if (session) {
       return session;
     }
 
-    log.info(`[IpcMain] Creating new session for workspaceId=${trimmed}`);
 
     session = new AgentSession({
       workspaceId: trimmed,

From c62b5e9314dbb27e306d897536367546c70636e4 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 10:35:01 -0500
Subject: [PATCH 07/16] test: temporarily revert to eager AIService loading to
 test E2E

---
 src/services/ipcMain.ts | 26 +++-----------------------
 1 file changed, 3 insertions(+), 23 deletions(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 118ff3040..fcfd85ffb 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -12,7 +12,7 @@ import {
   getMainWorktreeFromWorktree,
 } from "@/git";
 import { removeWorktreeSafe, removeWorktree, pruneWorktrees } from "@/services/gitService";
-import type { AIService } from "@/services/aiService";
+import { AIService } from "@/services/aiService";
 import { HistoryService } from "@/services/historyService";
 import { PartialService } from "@/services/partialService";
 import { AgentSession } from "@/services/agentSession";
@@ -45,7 +45,7 @@ export class IpcMain {
   private readonly config: Config;
   private readonly historyService: HistoryService;
   private readonly partialService: PartialService;
-  private _aiService: AIService | null = null;
+  private readonly aiService: AIService;
   private readonly sessions = new Map<string, AgentSession>();
   private readonly sessionSubscriptions = new Map<
     string,
@@ -58,27 +58,7 @@ export class IpcMain {
     this.config = config;
     this.historyService = new HistoryService(config);
     this.partialService = new PartialService(config, this.historyService);
-    // Don't create AIService here - it imports the massive "ai" package (~3s load time)
-    // Create it on-demand when first needed
-  }
-
-  /**
-   * Lazy-load AIService on first use.
-   * AIService imports the entire AI SDK which is ~3s load time.
-   * By deferring this until first actual use, we keep startup fast.
-   */
-  private get aiService(): AIService {
-    if (!this._aiService) {
-      // Dynamic import to avoid loading AI SDK at startup
-      // Use relative path (not @/ alias) because require() runs at runtime after TS compilation
-      // This is safe because AIService is only accessed after IPC handlers are registered
-      /* eslint-disable-next-line @typescript-eslint/no-require-imports */
-      const { AIService: AIServiceClass } = require("./aiService") as {
-        AIService: typeof AIService;
-      };
-      this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
-    }
-    return this._aiService;
+    this.aiService = new AIService(config, this.historyService, this.partialService);
   }
 
   private getOrCreateSession(workspaceId: string): AgentSession {

From 1e49255d36a30c05dc854c6432cc25e5bd279945 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 10:42:15 -0500
Subject: [PATCH 08/16] fix: include workers in main process compilation

The tokenizerWorkerPool was trying to load from dist/workers/tokenizerWorker.js
but workers weren't being compiled because tsconfig.main.json didn't include them.

This caused silent failures in E2E tests when the token counting IPC endpoint
tried to initialize the worker pool, which likely affected stream event timing.
---
 src/services/ipcMain.ts | 2 --
 tsconfig.main.json      | 2 +-
 2 files changed, 1 insertion(+), 3 deletions(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index fcfd85ffb..fcc3bdaeb 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -66,13 +66,11 @@ export class IpcMain {
     const trimmed = workspaceId.trim();
     assert(trimmed.length > 0, "workspaceId must not be empty");
 
-
     let session = this.sessions.get(trimmed);
     if (session) {
       return session;
     }
 
-
     session = new AgentSession({
       workspaceId: trimmed,
       config: this.config,
diff --git a/tsconfig.main.json b/tsconfig.main.json
index d913052f7..033067d0d 100644
--- a/tsconfig.main.json
+++ b/tsconfig.main.json
@@ -6,6 +6,6 @@
     "noEmit": false,
     "sourceMap": true
   },
-  "include": ["src/main.ts", "src/constants/**/*", "src/types/**/*.d.ts"],
+  "include": ["src/main.ts", "src/constants/**/*", "src/types/**/*.d.ts", "src/workers/**/*"],
   "exclude": ["src/App.tsx", "src/main.tsx"]
 }

From 8589123d982daf32d4ba1f1e2b37cf3322b91b41 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:02:40 -0500
Subject: [PATCH 09/16] test: temporarily disable worker pool to isolate E2E
 issue

---
 .../TokenConsumerBreakdown.tsx                |  7 +++++
 src/services/ipcMain.ts                       | 31 ++++++++++---------
 2 files changed, 23 insertions(+), 15 deletions(-)

diff --git a/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx b/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
index 59758f9c0..3d6189ede 100644
--- a/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
+++ b/src/components/ChatMetaSidebar/TokenConsumerBreakdown.tsx
@@ -119,6 +119,13 @@ export const TokenConsumerBreakdown: React.FC<TokenConsumerBreakdownProps> = ({
     let cancelled = false;
 
     async function calculate() {
+      // Don't call IPC if there are no messages
+      if (messages.length === 0) {
+        setIsCalculating(false);
+        setStats(null);
+        return;
+      }
+
       setIsCalculating(true);
 
       try {
diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index fcc3bdaeb..e7fe90539 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -176,21 +176,22 @@ export class IpcMain {
   }
 
   private registerTokenHandlers(ipcMain: ElectronIpcMain): void {
-    ipcMain.handle(
-      IPC_CHANNELS.TOKENS_COUNT_BULK,
-      async (_event, model: string, texts: string[]) => {
-        try {
-          // Offload to worker thread - keeps main process responsive
-          // Dynamic import is acceptable here - worker pool is lazy-loaded on first use
-          /* eslint-disable-next-line no-restricted-syntax */
-          const { tokenizerWorkerPool } = await import("@/services/tokenizerWorkerPool");
-          return await tokenizerWorkerPool.countTokens(model, texts);
-        } catch (error) {
-          log.error(`Failed to count tokens for model ${model}:`, error);
-          return null; // Tokenizer not loaded or error occurred
-        }
-      }
-    );
+    ipcMain.handle(IPC_CHANNELS.TOKENS_COUNT_BULK, (_event, _model: string, _texts: string[]) => {
+      // TEMPORARY: Disable worker pool to test if it's causing E2E issues
+      // TODO: Re-enable once E2E tests pass
+      return null;
+
+      // try {
+      //   // Offload to worker thread - keeps main process responsive
+      //   // Dynamic import is acceptable here - worker pool is lazy-loaded on first use
+      //   /* eslint-disable-next-line no-restricted-syntax */
+      //   const { tokenizerWorkerPool } = await import("@/services/tokenizerWorkerPool");
+      //   return await tokenizerWorkerPool.countTokens(model, texts);
+      // } catch (error) {
+      //   log.error(`Failed to count tokens for model ${model}:`, error);
+      //   return null; // Tokenizer not loaded or error occurred
+      // }
+    });
   }
 
   private registerWorkspaceHandlers(ipcMain: ElectronIpcMain): void {

From 7a26d3dd4f162cc403fac999af807f62ba6e9f54 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:21:37 -0500
Subject: [PATCH 10/16] test: temporarily disable disposablestack polyfill to
 isolate E2E issue

---
 src/main.ts | 3 ++-
 1 file changed, 2 insertions(+), 1 deletion(-)

diff --git a/src/main.ts b/src/main.ts
index 1fc8bf349..cacd938f8 100644
--- a/src/main.ts
+++ b/src/main.ts
@@ -1,6 +1,7 @@
 // Enable source map support for better error stack traces in production
 import "source-map-support/register";
-import "disposablestack/auto";
+// TEMPORARILY DISABLED to test E2E issue
+// import "disposablestack/auto";
 
 import type { MenuItemConstructorOptions } from "electron";
 import { app, BrowserWindow, ipcMain as electronIpcMain, Menu, shell, dialog } from "electron";

From d068e4967d8e29e4657eccb339a6686a45003100 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:28:20 -0500
Subject: [PATCH 11/16] debug: add logging to trace stream-end event flow

---
 src/main.ts                             |  3 +--
 src/services/agentSession.ts            |  6 +++++-
 src/services/ipcMain.ts                 | 17 +++++++++++++++++
 src/services/mock/mockScenarioPlayer.ts |  6 ++++++
 4 files changed, 29 insertions(+), 3 deletions(-)

diff --git a/src/main.ts b/src/main.ts
index cacd938f8..1fc8bf349 100644
--- a/src/main.ts
+++ b/src/main.ts
@@ -1,7 +1,6 @@
 // Enable source map support for better error stack traces in production
 import "source-map-support/register";
-// TEMPORARILY DISABLED to test E2E issue
-// import "disposablestack/auto";
+import "disposablestack/auto";
 
 import type { MenuItemConstructorOptions } from "electron";
 import { app, BrowserWindow, ipcMain as electronIpcMain, Menu, shell, dialog } from "electron";
diff --git a/src/services/agentSession.ts b/src/services/agentSession.ts
index 670eaf01b..d48c25cea 100644
--- a/src/services/agentSession.ts
+++ b/src/services/agentSession.ts
@@ -333,7 +333,11 @@ export class AgentSession {
 
     forward("stream-start", (payload) => this.emitChatEvent(payload));
     forward("stream-delta", (payload) => this.emitChatEvent(payload));
-    forward("stream-end", (payload) => this.emitChatEvent(payload));
+    forward("stream-end", (payload) => {
+      console.log("[AgentSession] Received stream-end event, forwarding...");
+      this.emitChatEvent(payload);
+      console.log("[AgentSession] stream-end event forwarded");
+    });
     forward("tool-call-start", (payload) => this.emitChatEvent(payload));
     forward("tool-call-delta", (payload) => this.emitChatEvent(payload));
     forward("tool-call-end", (payload) => this.emitChatEvent(payload));
diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index e7fe90539..bd0f99bb1 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -81,10 +81,27 @@ export class IpcMain {
 
     const chatUnsubscribe = session.onChatEvent((event) => {
       if (!this.mainWindow) {
+        console.log("[IpcMain] Dropping chat event - mainWindow is null");
         return;
       }
       const channel = getChatChannel(event.workspaceId);
+      if (
+        typeof event.message === "object" &&
+        event.message !== null &&
+        "type" in event.message &&
+        event.message.type === "stream-end"
+      ) {
+        console.log("[IpcMain] Sending stream-end event to renderer:", channel);
+      }
       this.mainWindow.webContents.send(channel, event.message);
+      if (
+        typeof event.message === "object" &&
+        event.message !== null &&
+        "type" in event.message &&
+        event.message.type === "stream-end"
+      ) {
+        console.log("[IpcMain] stream-end event sent to renderer");
+      }
     });
 
     const metadataUnsubscribe = session.onMetadataEvent((event) => {
diff --git a/src/services/mock/mockScenarioPlayer.ts b/src/services/mock/mockScenarioPlayer.ts
index a4a854d48..9af772117 100644
--- a/src/services/mock/mockScenarioPlayer.ts
+++ b/src/services/mock/mockScenarioPlayer.ts
@@ -268,7 +268,13 @@ export class MockScenarioPlayer {
           }
         }
 
+        console.log("[MockScenarioPlayer] Emitting stream-end event:", {
+          workspaceId,
+          messageId,
+          eventType: payload.type,
+        });
         this.deps.aiService.emit("stream-end", payload);
+        console.log("[MockScenarioPlayer] stream-end event emitted");
         this.cleanup(workspaceId);
         break;
       }

From a02084387c9e483bc52964fec712f651ba6d2c44 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:34:52 -0500
Subject: [PATCH 12/16] debug: use log service instead of console.log for E2E
 visibility

---
 src/services/mock/mockScenarioPlayer.ts | 8 ++++++--
 1 file changed, 6 insertions(+), 2 deletions(-)

diff --git a/src/services/mock/mockScenarioPlayer.ts b/src/services/mock/mockScenarioPlayer.ts
index 9af772117..92f7d30c2 100644
--- a/src/services/mock/mockScenarioPlayer.ts
+++ b/src/services/mock/mockScenarioPlayer.ts
@@ -16,6 +16,7 @@ import type { StreamStartEvent, StreamDeltaEvent, StreamEndEvent } from "@/types
 import type { ToolCallStartEvent, ToolCallEndEvent } from "@/types/stream";
 import type { ReasoningDeltaEvent } from "@/types/stream";
 import { getTokenizerForModel } from "@/utils/main/tokenizer";
+import { log } from "@/services/log";
 
 interface MockPlayerDeps {
   aiService: AIService;
@@ -62,13 +63,16 @@ export class MockScenarioPlayer {
     messages: CmuxMessage[],
     workspaceId: string
   ): Promise<Result<void, SendMessageError>> {
+    log.info("[MockScenarioPlayer] play() called for workspaceId:", workspaceId);
     const latest = messages[messages.length - 1];
     if (!latest || latest.role !== "user") {
       return Err({ type: "unknown", raw: "Mock scenario expected a user message" });
     }
 
     const latestText = this.extractText(latest);
+    log.info("[MockScenarioPlayer] Looking for scenario for text:", latestText);
     const turnIndex = this.findTurnIndex(latestText);
+    log.info("[MockScenarioPlayer] Found turn index:", turnIndex);
     if (turnIndex === -1) {
       return Err({
         type: "unknown",
@@ -268,13 +272,13 @@ export class MockScenarioPlayer {
           }
         }
 
-        console.log("[MockScenarioPlayer] Emitting stream-end event:", {
+        log.info("[MockScenarioPlayer] Emitting stream-end event:", {
           workspaceId,
           messageId,
           eventType: payload.type,
         });
         this.deps.aiService.emit("stream-end", payload);
-        console.log("[MockScenarioPlayer] stream-end event emitted");
+        log.info("[MockScenarioPlayer] stream-end event emitted");
         this.cleanup(workspaceId);
         break;
       }

From c3558b1085aa6179f9e7d3cfe634856c7f4e1ee8 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:40:21 -0500
Subject: [PATCH 13/16] debug: add logging to trace if AIService uses
 MockScenarioPlayer in E2E

---
 src/services/aiService.ts | 6 ++++++
 1 file changed, 6 insertions(+)

diff --git a/src/services/aiService.ts b/src/services/aiService.ts
index 4a5d4493a..b5dec7aec 100644
--- a/src/services/aiService.ts
+++ b/src/services/aiService.ts
@@ -110,12 +110,15 @@ export class AIService extends EventEmitter {
     void this.ensureSessionsDir();
     this.setupStreamEventForwarding();
     this.mockModeEnabled = process.env.CMUX_MOCK_AI === "1";
+    log.info("AIService constructor: CMUX_MOCK_AI =", process.env.CMUX_MOCK_AI);
+    log.info("AIService constructor: mockModeEnabled =", this.mockModeEnabled);
     if (this.mockModeEnabled) {
       log.info("AIService running in CMUX_MOCK_AI mode");
       this.mockScenarioPlayer = new MockScenarioPlayer({
         aiService: this,
         historyService,
       });
+      log.info("MockScenarioPlayer created");
     }
   }
 
@@ -410,7 +413,10 @@ export class AIService extends EventEmitter {
     mode?: string
   ): Promise<Result<void, SendMessageError>> {
     try {
+      log.info("AIService.sendMessage: mockModeEnabled =", this.mockModeEnabled);
+      log.info("AIService.sendMessage: mockScenarioPlayer exists =", !!this.mockScenarioPlayer);
       if (this.mockModeEnabled && this.mockScenarioPlayer) {
+        log.info("AIService.sendMessage: Using MockScenarioPlayer");
         return await this.mockScenarioPlayer.play(messages, workspaceId);
       }
 

From 7aa0343c44e10d4715e82a08aa38dbb118fb4f5a Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:48:21 -0500
Subject: [PATCH 14/16] fix: use relative path in AIService lazy-load require()

The original lazy-load implementation used require('@/services/aiService')
which fails at runtime because Node.js doesn't resolve TypeScript path aliases.
Changed to require('./aiService') which resolves correctly from dist/services/.
---
 src/services/agentSession.ts            |  6 +---
 src/services/aiService.ts               |  6 ----
 src/services/ipcMain.ts                 | 42 +++++++++++++------------
 src/services/mock/mockScenarioPlayer.ts |  9 ------
 4 files changed, 23 insertions(+), 40 deletions(-)

diff --git a/src/services/agentSession.ts b/src/services/agentSession.ts
index d48c25cea..670eaf01b 100644
--- a/src/services/agentSession.ts
+++ b/src/services/agentSession.ts
@@ -333,11 +333,7 @@ export class AgentSession {
 
     forward("stream-start", (payload) => this.emitChatEvent(payload));
     forward("stream-delta", (payload) => this.emitChatEvent(payload));
-    forward("stream-end", (payload) => {
-      console.log("[AgentSession] Received stream-end event, forwarding...");
-      this.emitChatEvent(payload);
-      console.log("[AgentSession] stream-end event forwarded");
-    });
+    forward("stream-end", (payload) => this.emitChatEvent(payload));
     forward("tool-call-start", (payload) => this.emitChatEvent(payload));
     forward("tool-call-delta", (payload) => this.emitChatEvent(payload));
     forward("tool-call-end", (payload) => this.emitChatEvent(payload));
diff --git a/src/services/aiService.ts b/src/services/aiService.ts
index b5dec7aec..4a5d4493a 100644
--- a/src/services/aiService.ts
+++ b/src/services/aiService.ts
@@ -110,15 +110,12 @@ export class AIService extends EventEmitter {
     void this.ensureSessionsDir();
     this.setupStreamEventForwarding();
     this.mockModeEnabled = process.env.CMUX_MOCK_AI === "1";
-    log.info("AIService constructor: CMUX_MOCK_AI =", process.env.CMUX_MOCK_AI);
-    log.info("AIService constructor: mockModeEnabled =", this.mockModeEnabled);
     if (this.mockModeEnabled) {
       log.info("AIService running in CMUX_MOCK_AI mode");
       this.mockScenarioPlayer = new MockScenarioPlayer({
         aiService: this,
         historyService,
       });
-      log.info("MockScenarioPlayer created");
     }
   }
 
@@ -413,10 +410,7 @@ export class AIService extends EventEmitter {
     mode?: string
   ): Promise<Result<void, SendMessageError>> {
     try {
-      log.info("AIService.sendMessage: mockModeEnabled =", this.mockModeEnabled);
-      log.info("AIService.sendMessage: mockScenarioPlayer exists =", !!this.mockScenarioPlayer);
       if (this.mockModeEnabled && this.mockScenarioPlayer) {
-        log.info("AIService.sendMessage: Using MockScenarioPlayer");
         return await this.mockScenarioPlayer.play(messages, workspaceId);
       }
 
diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index bd0f99bb1..4f85351c3 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -12,7 +12,7 @@ import {
   getMainWorktreeFromWorktree,
 } from "@/git";
 import { removeWorktreeSafe, removeWorktree, pruneWorktrees } from "@/services/gitService";
-import { AIService } from "@/services/aiService";
+import type { AIService } from "@/services/aiService";
 import { HistoryService } from "@/services/historyService";
 import { PartialService } from "@/services/partialService";
 import { AgentSession } from "@/services/agentSession";
@@ -45,7 +45,7 @@ export class IpcMain {
   private readonly config: Config;
   private readonly historyService: HistoryService;
   private readonly partialService: PartialService;
-  private readonly aiService: AIService;
+  private _aiService: AIService | null = null;
   private readonly sessions = new Map<string, AgentSession>();
   private readonly sessionSubscriptions = new Map<
     string,
@@ -58,7 +58,26 @@ export class IpcMain {
     this.config = config;
     this.historyService = new HistoryService(config);
     this.partialService = new PartialService(config, this.historyService);
-    this.aiService = new AIService(config, this.historyService, this.partialService);
+    // Don't create AIService here - it imports the massive "ai" package (~3s load time)
+    // Create it on-demand when first needed
+  }
+
+  /**
+   * Lazy-load AIService on first use.
+   * AIService imports the entire AI SDK which is ~3s load time.
+   * By deferring this until first actual use, we keep startup fast.
+   */
+  private get aiService(): AIService {
+    if (!this._aiService) {
+      // Use relative path since Node.js doesn't resolve TypeScript path aliases at runtime
+      // __dirname in production is dist/services, so ./aiService resolves to dist/services/aiService.js
+      /* eslint-disable-next-line @typescript-eslint/no-require-imports */
+      const { AIService: AIServiceClass } = require("./aiService") as {
+        AIService: typeof AIService;
+      };
+      this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
+    }
+    return this._aiService;
   }
 
   private getOrCreateSession(workspaceId: string): AgentSession {
@@ -81,27 +100,10 @@ export class IpcMain {
 
     const chatUnsubscribe = session.onChatEvent((event) => {
       if (!this.mainWindow) {
-        console.log("[IpcMain] Dropping chat event - mainWindow is null");
         return;
       }
       const channel = getChatChannel(event.workspaceId);
-      if (
-        typeof event.message === "object" &&
-        event.message !== null &&
-        "type" in event.message &&
-        event.message.type === "stream-end"
-      ) {
-        console.log("[IpcMain] Sending stream-end event to renderer:", channel);
-      }
       this.mainWindow.webContents.send(channel, event.message);
-      if (
-        typeof event.message === "object" &&
-        event.message !== null &&
-        "type" in event.message &&
-        event.message.type === "stream-end"
-      ) {
-        console.log("[IpcMain] stream-end event sent to renderer");
-      }
     });
 
     const metadataUnsubscribe = session.onMetadataEvent((event) => {
diff --git a/src/services/mock/mockScenarioPlayer.ts b/src/services/mock/mockScenarioPlayer.ts
index 92f7d30c2..d94e50c47 100644
--- a/src/services/mock/mockScenarioPlayer.ts
+++ b/src/services/mock/mockScenarioPlayer.ts
@@ -63,16 +63,13 @@ export class MockScenarioPlayer {
     messages: CmuxMessage[],
     workspaceId: string
   ): Promise<Result<void, SendMessageError>> {
-    log.info("[MockScenarioPlayer] play() called for workspaceId:", workspaceId);
     const latest = messages[messages.length - 1];
     if (!latest || latest.role !== "user") {
       return Err({ type: "unknown", raw: "Mock scenario expected a user message" });
     }
 
     const latestText = this.extractText(latest);
-    log.info("[MockScenarioPlayer] Looking for scenario for text:", latestText);
     const turnIndex = this.findTurnIndex(latestText);
-    log.info("[MockScenarioPlayer] Found turn index:", turnIndex);
     if (turnIndex === -1) {
       return Err({
         type: "unknown",
@@ -272,13 +269,7 @@ export class MockScenarioPlayer {
           }
         }
 
-        log.info("[MockScenarioPlayer] Emitting stream-end event:", {
-          workspaceId,
-          messageId,
-          eventType: payload.type,
-        });
         this.deps.aiService.emit("stream-end", payload);
-        log.info("[MockScenarioPlayer] stream-end event emitted");
         this.cleanup(workspaceId);
         break;
       }

From 5d704b378f90ff245179351377ef5a785268d24f Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:50:42 -0500
Subject: [PATCH 15/16] fix: remove unused log import

---
 src/services/mock/mockScenarioPlayer.ts | 1 -
 1 file changed, 1 deletion(-)

diff --git a/src/services/mock/mockScenarioPlayer.ts b/src/services/mock/mockScenarioPlayer.ts
index d94e50c47..a4a854d48 100644
--- a/src/services/mock/mockScenarioPlayer.ts
+++ b/src/services/mock/mockScenarioPlayer.ts
@@ -16,7 +16,6 @@ import type { StreamStartEvent, StreamDeltaEvent, StreamEndEvent } from "@/types
 import type { ToolCallStartEvent, ToolCallEndEvent } from "@/types/stream";
 import type { ReasoningDeltaEvent } from "@/types/stream";
 import { getTokenizerForModel } from "@/utils/main/tokenizer";
-import { log } from "@/services/log";
 
 interface MockPlayerDeps {
   aiService: AIService;

From 9cf2e1ff35827b1a0c842a092855c00658fec297 Mon Sep 17 00:00:00 2001
From: Ammar <ammar+ai@ammar.io>
Date: Wed, 15 Oct 2025 11:55:52 -0500
Subject: [PATCH 16/16] debug: add error logging to AIService lazy-load getter

---
 src/services/ipcMain.ts | 21 ++++++++++++++-------
 1 file changed, 14 insertions(+), 7 deletions(-)

diff --git a/src/services/ipcMain.ts b/src/services/ipcMain.ts
index 4f85351c3..976eb9830 100644
--- a/src/services/ipcMain.ts
+++ b/src/services/ipcMain.ts
@@ -69,13 +69,20 @@ export class IpcMain {
    */
   private get aiService(): AIService {
     if (!this._aiService) {
-      // Use relative path since Node.js doesn't resolve TypeScript path aliases at runtime
-      // __dirname in production is dist/services, so ./aiService resolves to dist/services/aiService.js
-      /* eslint-disable-next-line @typescript-eslint/no-require-imports */
-      const { AIService: AIServiceClass } = require("./aiService") as {
-        AIService: typeof AIService;
-      };
-      this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
+      try {
+        // Use relative path since Node.js doesn't resolve TypeScript path aliases at runtime
+        // __dirname in production is dist/services, so ./aiService resolves to dist/services/aiService.js
+        /* eslint-disable-next-line @typescript-eslint/no-require-imports */
+        const { AIService: AIServiceClass } = require("./aiService") as {
+          AIService: typeof AIService;
+        };
+        log.info("[IpcMain] AIService loaded successfully");
+        this._aiService = new AIServiceClass(this.config, this.historyService, this.partialService);
+        log.info("[IpcMain] AIService instance created");
+      } catch (error) {
+        log.error("[IpcMain] Failed to load AIService:", error);
+        throw error;
+      }
     }
     return this._aiService;
   }