From 813abdb45943544615e9739051dbbe3308d6995c Mon Sep 17 00:00:00 2001
From: Anthony <agarlan@sandia.gov>
Date: Tue, 25 Nov 2025 00:00:40 +0000
Subject: [PATCH 1/2] Add system prompt loading functionality
MIME-Version: 1.0
Content-Type: text/plain; charset=UTF-8
Content-Transfer-Encoding: 8bit

Enable system prompt to be automatically loaded from prompts/system_prompt.md
and injected at the start of all conversations. This ensures consistent AI
behavior and user personalization via email template variable.

Changes:
- Added PromptProvider.get_system_prompt() method
- Added system_prompt_filename config setting
- Updated MessageBuilder to inject system prompt
- Added comprehensive test coverage
- Updated CLAUDE.md documentation

🤖 Generated with [Claude Code](https://claude.com/claude-code)

Co-Authored-By: Claude <noreply@anthropic.com>
---
 CLAUDE.md                                     |  18 ++
 backend/application/chat/orchestrator.py      |   2 +-
 .../chat/preprocessors/message_builder.py     |  36 +++-
 backend/modules/config/config_manager.py      |   1 +
 backend/modules/prompts/prompt_provider.py    |  18 ++
 backend/tests/test_system_prompt_loading.py   | 182 ++++++++++++++++++
 6 files changed, 250 insertions(+), 7 deletions(-)
 create mode 100644 backend/tests/test_system_prompt_loading.py

diff --git a/CLAUDE.md b/CLAUDE.md
index 33d27e4..bd4a62a 100644
--- a/CLAUDE.md
+++ b/CLAUDE.md
@@ -237,6 +237,24 @@ User Input → ChatContext → WebSocket → Backend ChatService
 - **MCP Servers**: `config/defaults/mcp.json` and `config/overrides/mcp.json`
 - **Environment**: `.env` (copy from `.env.example`)
 
+### Prompt System (Updated 2025-11-24)
+The application uses a prompt system to manage various LLM prompts:
+
+- **System Prompt**: `prompts/system_prompt.md` - Default system prompt prepended to all conversations
+  - Configurable via `system_prompt_filename` in AppSettings (default: `system_prompt.md`)
+  - Supports `{user_email}` template variable
+  - Can be overridden by MCP-provided prompts
+  - Loaded by `PromptProvider.get_system_prompt()`
+  - Automatically injected by `MessageBuilder` at conversation start
+
+- **Agent Prompts**: Used in agent loop strategies
+  - `prompts/agent_reason_prompt.md` - Reasoning phase
+  - `prompts/agent_observe_prompt.md` - Observation phase
+
+- **Tool Synthesis**: `prompts/tool_synthesis_prompt.md` - Tool selection guidance
+
+All prompts are loaded from the directory specified by `prompt_base_path` (default: `prompts/`). The system caches loaded prompts for performance.
+
 ### WebSocket Communication
 Backend serves WebSocket at `/ws` with message types:
 - `chat` - User sends message
diff --git a/backend/application/chat/orchestrator.py b/backend/application/chat/orchestrator.py
index d0df27c..a352c0a 100644
--- a/backend/application/chat/orchestrator.py
+++ b/backend/application/chat/orchestrator.py
@@ -72,7 +72,7 @@ def __init__(
         # Initialize services
         self.tool_authorization = ToolAuthorizationService(tool_manager=tool_manager)
         self.prompt_override = PromptOverrideService(tool_manager=tool_manager)
-        self.message_builder = MessageBuilder()
+        self.message_builder = MessageBuilder(prompt_provider=prompt_provider)
         
         # Initialize or use provided mode runners
         self.plain_mode = plain_mode or PlainModeRunner(
diff --git a/backend/application/chat/preprocessors/message_builder.py b/backend/application/chat/preprocessors/message_builder.py
index 98021bc..30e714a 100644
--- a/backend/application/chat/preprocessors/message_builder.py
+++ b/backend/application/chat/preprocessors/message_builder.py
@@ -1,9 +1,10 @@
 """Message builder - constructs messages with history and files manifest."""
 
 import logging
-from typing import List, Dict, Any
+from typing import List, Dict, Any, Optional
 
 from domain.sessions.models import Session
+from modules.prompts.prompt_provider import PromptProvider
 from ..utilities import file_utils
 
 logger = logging.getLogger(__name__)
@@ -12,10 +13,10 @@
 def build_session_context(session: Session) -> Dict[str, Any]:
     """
     Build session context dictionary from session.
-    
+
     Args:
         session: Chat session
-        
+
     Returns:
         Session context dictionary
     """
@@ -30,14 +31,24 @@ def build_session_context(session: Session) -> Dict[str, Any]:
 class MessageBuilder:
     """
     Service that builds complete message arrays for LLM calls.
-    
-    Combines conversation history with files manifest and other context.
+
+    Combines conversation history with files manifest and system prompt.
     """
 
+    def __init__(self, prompt_provider: Optional[PromptProvider] = None):
+        """
+        Initialize message builder.
+
+        Args:
+            prompt_provider: Optional prompt provider for loading system prompt
+        """
+        self.prompt_provider = prompt_provider
+
     async def build_messages(
         self,
         session: Session,
         include_files_manifest: bool = True,
+        include_system_prompt: bool = True,
     ) -> List[Dict[str, Any]]:
         """
         Build messages array from session history and context.
@@ -45,12 +56,25 @@ async def build_messages(
         Args:
             session: Current chat session
             include_files_manifest: Whether to append files manifest
+            include_system_prompt: Whether to prepend system prompt
 
         Returns:
             List of messages ready for LLM call
         """
+        messages = []
+
+        # Optionally add system prompt at the beginning
+        if include_system_prompt and self.prompt_provider:
+            system_prompt = self.prompt_provider.get_system_prompt(
+                user_email=session.user_email
+            )
+            if system_prompt:
+                messages.append({"role": "system", "content": system_prompt})
+                logger.debug(f"Added system prompt (len={len(system_prompt)})")
+
         # Get conversation history from session
-        messages = session.history.get_messages_for_llm()
+        history_messages = session.history.get_messages_for_llm()
+        messages.extend(history_messages)
 
         # Optionally add files manifest
         if include_files_manifest:
diff --git a/backend/modules/config/config_manager.py b/backend/modules/config/config_manager.py
index dce452b..255309f 100644
--- a/backend/modules/config/config_manager.py
+++ b/backend/modules/config/config_manager.py
@@ -309,6 +309,7 @@ def agent_mode_available(self) -> bool:
 
     # Prompt / template settings
     prompt_base_path: str = "prompts"  # Relative or absolute path to directory containing prompt templates
+    system_prompt_filename: str = "system_prompt.md"  # Filename for system prompt template
     tool_synthesis_prompt_filename: str = "tool_synthesis_prompt.md"  # Filename for tool synthesis prompt template
     # Agent prompts
     agent_reason_prompt_filename: str = "agent_reason_prompt.md"  # Filename for agent reason phase
diff --git a/backend/modules/prompts/prompt_provider.py b/backend/modules/prompts/prompt_provider.py
index 05e5bc6..3aa416d 100644
--- a/backend/modules/prompts/prompt_provider.py
+++ b/backend/modules/prompts/prompt_provider.py
@@ -107,6 +107,24 @@ def get_agent_observe_prompt(
             logger.warning("Formatting agent observe prompt failed: %s", e)
             return None
 
+    def get_system_prompt(self, user_email: Optional[str] = None) -> Optional[str]:
+        """Return formatted system prompt text or None if unavailable.
+
+        Expects template placeholder: {user_email}
+        Missing values are rendered as empty strings.
+        """
+        filename = self.config_manager.app_settings.system_prompt_filename
+        template = self._load_template(filename)
+        if not template:
+            return None
+        try:
+            return template.format(
+                user_email=(user_email or ""),
+            )
+        except Exception as e:  # pragma: no cover
+            logger.warning("Formatting system prompt failed: %s", e)
+            return None
+
     def clear_cache(self) -> None:
         """Clear in-memory prompt cache (e.g., after config reload)."""
         self._cache.clear()
diff --git a/backend/tests/test_system_prompt_loading.py b/backend/tests/test_system_prompt_loading.py
new file mode 100644
index 0000000..4de4348
--- /dev/null
+++ b/backend/tests/test_system_prompt_loading.py
@@ -0,0 +1,182 @@
+import tempfile
+import uuid
+from pathlib import Path
+
+import pytest
+
+from modules.config import ConfigManager
+from modules.prompts.prompt_provider import PromptProvider
+from application.chat.preprocessors.message_builder import MessageBuilder
+from domain.sessions.models import Session
+from domain.messages.models import Message, MessageRole
+
+
+@pytest.mark.asyncio
+async def test_prompt_provider_loads_system_prompt(tmp_path):
+    """Test that PromptProvider correctly loads and formats system_prompt.md"""
+    # Create a temporary system prompt file
+    prompts_dir = tmp_path / "prompts"
+    prompts_dir.mkdir()
+    system_prompt_file = prompts_dir / "system_prompt.md"
+    system_prompt_content = "You are a helpful assistant for user {user_email}."
+    system_prompt_file.write_text(system_prompt_content)
+
+    # Create a config manager with custom prompt base path
+    config_manager = ConfigManager()
+    config_manager.app_settings.prompt_base_path = str(prompts_dir)
+    config_manager.app_settings.system_prompt_filename = "system_prompt.md"
+
+    # Create prompt provider
+    prompt_provider = PromptProvider(config_manager)
+
+    # Test loading system prompt
+    result = prompt_provider.get_system_prompt(user_email="test@example.com")
+
+    assert result is not None
+    assert "test@example.com" in result
+    assert "helpful assistant" in result
+
+
+@pytest.mark.asyncio
+async def test_prompt_provider_handles_missing_system_prompt():
+    """Test that PromptProvider returns None when system_prompt.md is missing"""
+    # Create a config manager pointing to non-existent directory
+    config_manager = ConfigManager()
+    config_manager.app_settings.prompt_base_path = "/nonexistent/path"
+    config_manager.app_settings.system_prompt_filename = "system_prompt.md"
+
+    # Create prompt provider
+    prompt_provider = PromptProvider(config_manager)
+
+    # Test loading system prompt
+    result = prompt_provider.get_system_prompt(user_email="test@example.com")
+
+    assert result is None
+
+
+@pytest.mark.asyncio
+async def test_message_builder_includes_system_prompt(tmp_path):
+    """Test that MessageBuilder includes system prompt in messages"""
+    # Create a temporary system prompt file
+    prompts_dir = tmp_path / "prompts"
+    prompts_dir.mkdir()
+    system_prompt_file = prompts_dir / "system_prompt.md"
+    system_prompt_content = "You are a helpful assistant for user {user_email}."
+    system_prompt_file.write_text(system_prompt_content)
+
+    # Create a config manager with custom prompt base path
+    config_manager = ConfigManager()
+    config_manager.app_settings.prompt_base_path = str(prompts_dir)
+    config_manager.app_settings.system_prompt_filename = "system_prompt.md"
+
+    # Create prompt provider and message builder
+    prompt_provider = PromptProvider(config_manager)
+    message_builder = MessageBuilder(prompt_provider=prompt_provider)
+
+    # Create a session with some history
+    session = Session(user_email="test@example.com")
+    session.history.add_message(Message(role=MessageRole.USER, content="Hello"))
+
+    # Build messages
+    messages = await message_builder.build_messages(
+        session=session,
+        include_files_manifest=False,
+        include_system_prompt=True,
+    )
+
+    # Verify system prompt is first message
+    assert len(messages) >= 2  # system prompt + user message
+    assert messages[0]["role"] == "system"
+    assert "helpful assistant" in messages[0]["content"]
+    assert "test@example.com" in messages[0]["content"]
+
+    # Verify user message is second
+    assert messages[1]["role"] == "user"
+    assert messages[1]["content"] == "Hello"
+
+
+@pytest.mark.asyncio
+async def test_message_builder_without_system_prompt(tmp_path):
+    """Test that MessageBuilder works without system prompt when disabled"""
+    # Create prompt provider without system prompt file
+    config_manager = ConfigManager()
+    config_manager.app_settings.prompt_base_path = "/nonexistent"
+    prompt_provider = PromptProvider(config_manager)
+    message_builder = MessageBuilder(prompt_provider=prompt_provider)
+
+    # Create a session with some history
+    session = Session(user_email="test@example.com")
+    session.history.add_message(Message(role=MessageRole.USER, content="Hello"))
+
+    # Build messages with system prompt disabled
+    messages = await message_builder.build_messages(
+        session=session,
+        include_files_manifest=False,
+        include_system_prompt=False,
+    )
+
+    # Verify no system prompt
+    assert len(messages) == 1
+    assert messages[0]["role"] == "user"
+    assert messages[0]["content"] == "Hello"
+
+
+@pytest.mark.asyncio
+async def test_system_prompt_sent_to_llm():
+    """Test that system prompt is sent to LLM in chat flow"""
+    # Create a temporary directory for prompts
+    import tempfile
+    with tempfile.TemporaryDirectory() as tmp_dir:
+        prompts_dir = Path(tmp_dir) / "prompts"
+        prompts_dir.mkdir()
+        system_prompt_file = prompts_dir / "system_prompt.md"
+        system_prompt_content = "You are a helpful AI assistant for user {user_email}."
+        system_prompt_file.write_text(system_prompt_content)
+
+        # Create config manager
+        config_manager = ConfigManager()
+        config_manager.app_settings.prompt_base_path = str(prompts_dir)
+        config_manager.app_settings.system_prompt_filename = "system_prompt.md"
+
+        # Capture messages sent to LLM
+        captured = {}
+
+        class DummyLLM:
+            async def call_plain(self, model_name, messages, temperature=0.7):
+                captured["messages"] = messages
+                return "Hello! I'm here to help."
+
+        # Create chat service
+        from application.chat.service import ChatService
+
+        chat_service = ChatService(
+            llm=DummyLLM(),
+            tool_manager=None,
+            connection=None,
+            config_manager=config_manager,
+            file_manager=None,
+        )
+
+        # Create session and send message
+        session_id = uuid.uuid4()
+        await chat_service.handle_chat_message(
+            session_id=session_id,
+            content="Hello",
+            model="test-model",
+            user_email="tester@example.com",
+            selected_tools=None,
+            selected_prompts=None,
+            selected_data_sources=None,
+            only_rag=False,
+            tool_choice_required=False,
+            agent_mode=False,
+            temperature=0.7,
+        )
+
+        # Verify system prompt was sent to LLM
+        msgs = captured.get("messages")
+        assert msgs, "LLM was not called or messages not captured"
+        assert len(msgs) >= 2  # system prompt + user message
+        assert msgs[0]["role"] == "system", f"Expected first message to be system, got: {msgs[0]}"
+        assert "helpful AI assistant" in msgs[0]["content"]
+        assert "tester@example.com" in msgs[0]["content"]

From fd72916b2dde32d2ed8ecaa72c4e5e0d25762ada Mon Sep 17 00:00:00 2001
From: Anthony <agarlan@sandia.gov>
Date: Tue, 25 Nov 2025 01:59:37 +0000
Subject: [PATCH 2/2] Remove unnecessary import of tempfile in
 test_system_prompt_sent_to_llm

---
 backend/tests/test_system_prompt_loading.py | 1 -
 1 file changed, 1 deletion(-)

diff --git a/backend/tests/test_system_prompt_loading.py b/backend/tests/test_system_prompt_loading.py
index 4de4348..23807bd 100644
--- a/backend/tests/test_system_prompt_loading.py
+++ b/backend/tests/test_system_prompt_loading.py
@@ -125,7 +125,6 @@ async def test_message_builder_without_system_prompt(tmp_path):
 async def test_system_prompt_sent_to_llm():
     """Test that system prompt is sent to LLM in chat flow"""
     # Create a temporary directory for prompts
-    import tempfile
     with tempfile.TemporaryDirectory() as tmp_dir:
         prompts_dir = Path(tmp_dir) / "prompts"
         prompts_dir.mkdir()