diff --git a/evaluation/.env-example b/evaluation/.env-example
index 4cb153b75..daa030d3a 100644
--- a/evaluation/.env-example
+++ b/evaluation/.env-example
@@ -9,3 +9,24 @@ ZEP_API_KEY="z_***REDACTED***"
 CHAT_MODEL="gpt-4o-mini"
 CHAT_MODEL_BASE_URL="http://***.***.***.***:3000/v1"
 CHAT_MODEL_API_KEY="sk-***REDACTED***"
+
+# Configuration Only For Scheduler
+# RabbitMQ Configuration
+MEMSCHEDULER_RABBITMQ_HOST_NAME=rabbitmq-cn-***.cn-***.amqp-32.net.mq.amqp.aliyuncs.com
+MEMSCHEDULER_RABBITMQ_USER_NAME=***
+MEMSCHEDULER_RABBITMQ_PASSWORD=***
+MEMSCHEDULER_RABBITMQ_VIRTUAL_HOST=memos
+MEMSCHEDULER_RABBITMQ_ERASE_ON_CONNECT=true
+MEMSCHEDULER_RABBITMQ_PORT=5672
+
+# OpenAI Configuration
+MEMSCHEDULER_OPENAI_API_KEY=sk-***
+MEMSCHEDULER_OPENAI_BASE_URL=http://***.***.***.***:3000/v1
+MEMSCHEDULER_OPENAI_DEFAULT_MODEL=gpt-4o-mini
+
+# Graph DB Configuration
+MEMSCHEDULER_GRAPHDBAUTH_URI=bolt://localhost:7687
+MEMSCHEDULER_GRAPHDBAUTH_USER=neo4j
+MEMSCHEDULER_GRAPHDBAUTH_PASSWORD=***
+MEMSCHEDULER_GRAPHDBAUTH_DB_NAME=neo4j
+MEMSCHEDULER_GRAPHDBAUTH_AUTO_CREATE=true
diff --git a/evaluation/__init__.py b/evaluation/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/evaluation/scripts/__init__.py b/evaluation/scripts/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/evaluation/scripts/temporal_locomo/models/__init__.py b/evaluation/scripts/temporal_locomo/models/__init__.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/evaluation/scripts/temporal_locomo/locomo_eval.py b/evaluation/scripts/temporal_locomo/models/locomo_eval.py
similarity index 78%
rename from evaluation/scripts/temporal_locomo/locomo_eval.py
rename to evaluation/scripts/temporal_locomo/models/locomo_eval.py
index f19e5b68f..f98a481e2 100644
--- a/evaluation/scripts/temporal_locomo/locomo_eval.py
+++ b/evaluation/scripts/temporal_locomo/models/locomo_eval.py
@@ -9,7 +9,6 @@
 
 from bert_score import score as bert_score
 from dotenv import load_dotenv
-from modules.locomo_eval_module import LocomoEvalModelModules
 from nltk.translate.bleu_score import SmoothingFunction, sentence_bleu
 from nltk.translate.meteor_score import meteor_score
 from openai import AsyncOpenAI
@@ -19,6 +18,7 @@
 from sentence_transformers import SentenceTransformer
 from tqdm import tqdm
 
+from evaluation.scripts.temporal_locomo.modules.locomo_eval_module import LocomoEvalModelModules
 from memos.log import get_logger
 
 
@@ -281,33 +281,64 @@ def __init__(self, args):
             api_key=os.getenv("OPENAI_API_KEY"), base_url=os.getenv("OPENAI_BASE_URL")
         )
 
-    async def run(self):
-        print(
-            f"\n=== Starting LoCoMo evaluation for {self.frame} (version: {self.version}) with {self.num_runs} run(s) per question ==="
-        )
-        print(f"Using {self.max_workers} concurrent workers for processing groups")
+    def _load_response_data(self):
+        """
+        Load response data from the response path file.
 
+        Returns:
+            dict: The loaded response data
+        """
         with open(self.response_path) as file:
-            locomo_responses = json.load(file)
+            return json.load(file)
 
-        num_users = 10
+    def _load_existing_evaluation_results(self):
+        """
+        Attempt to load existing evaluation results from the judged path.
+        If the file doesn't exist or there's an error loading it, return an empty dict.
+
+        Returns:
+            dict: Existing evaluation results or empty dict if none available
+        """
         all_grades = {}
+        try:
+            if os.path.exists(self.judged_path):
+                with open(self.judged_path) as f:
+                    all_grades = json.load(f)
+                print(f"Loaded existing evaluation results from {self.judged_path}")
+        except Exception as e:
+            print(f"Error loading existing evaluation results: {e}")
 
-        total_responses_count = sum(
-            len(locomo_responses.get(f"locomo_exp_user_{i}", [])) for i in range(num_users)
-        )
-        print(f"Found {total_responses_count} total responses across {num_users} users to evaluate")
+        return all_grades
+
+    def _create_evaluation_tasks(self, locomo_responses, all_grades, num_users):
+        """
+        Create evaluation tasks for groups that haven't been evaluated yet.
+
+        Args:
+            locomo_responses (dict): The loaded response data
+            all_grades (dict): Existing evaluation results
+            num_users (int): Number of user groups to process
 
-        # Create tasks for processing each group
+        Returns:
+            tuple: (tasks list, active users count)
+        """
         tasks = []
         active_users = 0
+
         for group_idx in range(num_users):
             group_id = f"locomo_exp_user_{group_idx}"
             group_responses = locomo_responses.get(group_id, [])
+
             if not group_responses:
                 print(f"No responses found for group {group_id}")
                 continue
 
+            # Skip groups that already have evaluation results
+            if all_grades.get(group_id):
+                print(f"Skipping group {group_id} as it already has evaluation results")
+                active_users += 1
+                continue
+
             active_users += 1
             tasks.append(
                 process_single_group(
@@ -319,29 +350,50 @@ async def run(self):
                 )
             )
 
-        print(f"Starting evaluation of {active_users} user groups with responses")
+        return tasks, active_users
+
+    async def _process_tasks(self, tasks):
+        """
+        Process evaluation tasks with concurrency control.
+
+        Args:
+            tasks (list): List of tasks to process
+
+        Returns:
+            list: Results from processing all tasks
+        """
+        if not tasks:
+            return []
 
         semaphore = asyncio.Semaphore(self.max_workers)
 
         async def limited_task(task):
+            """Helper function to limit concurrent task execution"""
             async with semaphore:
                 return await task
 
         limited_tasks = [limited_task(task) for task in tasks]
-        group_results = await asyncio.gather(*limited_tasks)
+        return await asyncio.gather(*limited_tasks)
 
-        for group_id, graded_responses in group_results:
-            all_grades[group_id] = graded_responses
+    def _calculate_scores(self, all_grades):
+        """
+        Calculate evaluation scores based on all grades.
 
-        print("\n=== Evaluation Complete: Calculating final scores ===")
+        Args:
+            all_grades (dict): The complete evaluation results
 
+        Returns:
+            tuple: (run_scores, evaluated_count)
+        """
         run_scores = []
         evaluated_count = 0
+
         if self.num_runs > 0:
             for i in range(1, self.num_runs + 1):
                 judgment_key = f"judgment_{i}"
                 current_run_correct_count = 0
                 current_run_total_count = 0
+
                 for group in all_grades.values():
                     for response in group:
                         if judgment_key in response["llm_judgments"]:
@@ -355,6 +407,16 @@ async def limited_task(task):
 
             evaluated_count = current_run_total_count
 
+        return run_scores, evaluated_count
+
+    def _report_scores(self, run_scores, evaluated_count):
+        """
+        Report evaluation scores to the console.
+
+        Args:
+            run_scores (list): List of accuracy scores for each run
+            evaluated_count (int): Number of evaluated responses
+        """
         if evaluated_count > 0:
             mean_of_scores = np.mean(run_scores)
             std_of_scores = np.std(run_scores)
@@ -368,11 +430,63 @@ async def limited_task(task):
             print("No responses were evaluated")
             print("LLM-as-a-Judge score: N/A (0/0)")
 
+    def _save_results(self, all_grades):
+        """
+        Save evaluation results to the judged path file.
+
+        Args:
+            all_grades (dict): The complete evaluation results to save
+        """
         all_grades = convert_numpy_types(all_grades)
         with open(self.judged_path, "w") as f:
             json.dump(all_grades, f, indent=2)
             print(f"Saved detailed evaluation results to {self.judged_path}")
 
+    async def run(self):
+        """
+        Main execution method for the LoCoMo evaluation process.
+        This method orchestrates the entire evaluation workflow:
+        1. Loads existing evaluation results if available
+        2. Processes only groups that haven't been evaluated yet
+        3. Calculates and reports final evaluation scores
+        """
+        print(
+            f"\n=== Starting LoCoMo evaluation for {self.frame} (version: {self.version}) with {self.num_runs} run(s) per question ==="
+        )
+        print(f"Using {self.max_workers} concurrent workers for processing groups")
+
+        # Load response data and existing evaluation results
+        locomo_responses = self._load_response_data()
+        all_grades = self._load_existing_evaluation_results()
+
+        # Count total responses for reporting
+        num_users = 10
+        total_responses_count = sum(
+            len(locomo_responses.get(f"locomo_exp_user_{i}", [])) for i in range(num_users)
+        )
+        print(f"Found {total_responses_count} total responses across {num_users} users to evaluate")
+
+        # Create tasks only for groups that haven't been evaluated yet
+        tasks, active_users = self._create_evaluation_tasks(locomo_responses, all_grades, num_users)
+        print(
+            f"Starting evaluation of {len(tasks)} user groups with responses (out of {active_users} active users)"
+        )
+
+        # Process tasks and update all_grades with results
+        if tasks:
+            group_results = await self._process_tasks(tasks)
+            for group_id, graded_responses in group_results:
+                all_grades[group_id] = graded_responses
+
+        print("\n=== Evaluation Complete: Calculating final scores ===")
+
+        # Calculate and report scores
+        run_scores, evaluated_count = self._calculate_scores(all_grades)
+        self._report_scores(run_scores, evaluated_count)
+
+        # Save results
+        self._save_results(all_grades)
+
 
 if __name__ == "__main__":
     parser = argparse.ArgumentParser()
diff --git a/evaluation/scripts/temporal_locomo/locomo_ingestion.py b/evaluation/scripts/temporal_locomo/models/locomo_ingestion.py
similarity index 98%
rename from evaluation/scripts/temporal_locomo/locomo_ingestion.py
rename to evaluation/scripts/temporal_locomo/models/locomo_ingestion.py
index 321302cf2..b45ec3d61 100644
--- a/evaluation/scripts/temporal_locomo/locomo_ingestion.py
+++ b/evaluation/scripts/temporal_locomo/models/locomo_ingestion.py
@@ -6,16 +6,16 @@
 from datetime import datetime, timezone
 from pathlib import Path
 
-from modules.constants import (
+from tqdm import tqdm
+
+from evaluation.scripts.temporal_locomo.modules.constants import (
     MEM0_GRAPH_MODEL,
     MEM0_MODEL,
     MEMOS_MODEL,
     MEMOS_SCHEDULER_MODEL,
     ZEP_MODEL,
 )
-from modules.locomo_eval_module import LocomoEvalModelModules
-from tqdm import tqdm
-
+from evaluation.scripts.temporal_locomo.modules.locomo_eval_module import LocomoEvalModelModules
 from memos.log import get_logger
 
 
diff --git a/evaluation/scripts/temporal_locomo/locomo_metric.py b/evaluation/scripts/temporal_locomo/models/locomo_metric.py
similarity index 99%
rename from evaluation/scripts/temporal_locomo/locomo_metric.py
rename to evaluation/scripts/temporal_locomo/models/locomo_metric.py
index 0187c37e7..532fe2e14 100644
--- a/evaluation/scripts/temporal_locomo/locomo_metric.py
+++ b/evaluation/scripts/temporal_locomo/models/locomo_metric.py
@@ -4,7 +4,7 @@
 import numpy as np
 import pandas as pd
 
-from modules.locomo_eval_module import LocomoEvalModelModules
+from evaluation.scripts.temporal_locomo.modules.locomo_eval_module import LocomoEvalModelModules
 
 
 # Category mapping as per your request
diff --git a/evaluation/scripts/temporal_locomo/locomo_processor.py b/evaluation/scripts/temporal_locomo/models/locomo_processor.py
similarity index 63%
rename from evaluation/scripts/temporal_locomo/locomo_processor.py
rename to evaluation/scripts/temporal_locomo/models/locomo_processor.py
index 4ae9cf915..7cec6f5af 100644
--- a/evaluation/scripts/temporal_locomo/locomo_processor.py
+++ b/evaluation/scripts/temporal_locomo/models/locomo_processor.py
@@ -7,20 +7,19 @@
 from time import time
 
 from dotenv import load_dotenv
-from modules.constants import (
-    MEMOS_MODEL,
+
+from evaluation.scripts.temporal_locomo.modules.constants import (
     MEMOS_SCHEDULER_MODEL,
 )
-from modules.locomo_eval_module import LocomoEvalModelModules
-from modules.prompts import (
+from evaluation.scripts.temporal_locomo.modules.locomo_eval_module import LocomoEvalModelModules
+from evaluation.scripts.temporal_locomo.modules.prompts import (
     SEARCH_PROMPT_MEM0,
     SEARCH_PROMPT_MEM0_GRAPH,
     SEARCH_PROMPT_MEMOS,
     SEARCH_PROMPT_ZEP,
 )
-from modules.schemas import ContextUpdateMethod, RecordingCase
-from modules.utils import save_evaluation_cases
-
+from evaluation.scripts.temporal_locomo.modules.schemas import ContextUpdateMethod, RecordingCase
+from evaluation.scripts.temporal_locomo.modules.utils import save_evaluation_cases
 from memos.log import get_logger
 
 
@@ -54,77 +53,22 @@ def __init__(self, args):
         self.processed_data_dir = self.result_dir / "processed_data"
 
     def update_context(self, conv_id, method, **kwargs):
-        if method == ContextUpdateMethod.DIRECT:
+        if method == ContextUpdateMethod.CHAT_HISTORY:
+            if "query" not in kwargs or "answer" not in kwargs:
+                raise ValueError("query and answer are required for TEMPLATE update method")
+            new_context = f"User: {kwargs['query']}\nAssistant: {kwargs['answer']}\n\n"
+            if self.pre_context_cache[conv_id] is None:
+                self.pre_context_cache[conv_id] = ""
+            self.pre_context_cache[conv_id] += new_context
+        else:
             if "cur_context" not in kwargs:
                 raise ValueError("cur_context is required for DIRECT update method")
             cur_context = kwargs["cur_context"]
             self.pre_context_cache[conv_id] = cur_context
-        elif method == ContextUpdateMethod.TEMPLATE:
-            if "query" not in kwargs or "answer" not in kwargs:
-                raise ValueError("query and answer are required for TEMPLATE update method")
-            self._update_context_template(conv_id, kwargs["query"], kwargs["answer"])
-        else:
-            raise ValueError(f"Unsupported update method: {method}")
-
-    def _update_context_template(self, conv_id, query, answer):
-        new_context = f"User: {query}\nAssistant: {answer}\n\n"
-        if self.pre_context_cache[conv_id] is None:
-            self.pre_context_cache[conv_id] = ""
-        self.pre_context_cache[conv_id] += new_context
-
-    def _process_single_qa(
-        self,
-        qa,
-        *,
-        client,
-        reversed_client,
-        metadata,
-        frame,
-        version,
-        conv_id,
-        conv_stats_path,
-        oai_client,
-        top_k,
-        conv_stats,
-    ):
-        query = qa.get("question")
-        gold_answer = qa.get("answer")
-        qa_category = qa.get("category")
-        if qa_category == 5:
-            return None
 
-        # Search
-        cur_context, search_duration_ms = self.search_query(
-            client, query, metadata, frame, reversed_client=reversed_client, top_k=top_k
-        )
-        if not cur_context:
-            logger.warning(f"No context found for query: {query[:100]}")
-            cur_context = ""
-
-        # Context answerability analysis (for memos_scheduler only)
-        if self.pre_context_cache[conv_id] is None:
-            # Update pre-context cache with current context
-            if self.frame in [MEMOS_MODEL, MEMOS_SCHEDULER_MODEL]:
-                self.update_context(
-                    conv_id=conv_id,
-                    method=self.context_update_method,
-                    cur_context=cur_context,
-                )
-            else:
-                self.update_context(
-                    conv_id=conv_id,
-                    method=self.context_update_method,
-                    query=query,
-                    answer=gold_answer,
-                )
-            return None
-
-        can_answer = False
-        can_answer_duration_ms = 0.0
+    def eval_context(self, context, query, gold_answer, oai_client):
         can_answer_start = time()
-        can_answer = self.analyze_context_answerability(
-            self.pre_context_cache[conv_id], query, gold_answer, oai_client
-        )
+        can_answer = self.analyze_context_answerability(context, query, gold_answer, oai_client)
         can_answer_duration_ms = (time() - can_answer_start) * 1000
         # Update global stats
         with self.stats_lock:
@@ -143,54 +87,41 @@ def _process_single_qa(
                 can_answer_duration_ms
             )
             self.save_stats()
+        return can_answer, can_answer_duration_ms
 
-        # Generate answer
-        answer_start = time()
-        answer = self.locomo_response(frame, oai_client, self.pre_context_cache[conv_id], query)
-        response_duration_ms = (time() - answer_start) * 1000
-
-        # Record case for memos_scheduler
-        if frame == "memos_scheduler":
-            try:
-                recording_case = RecordingCase(
-                    conv_id=conv_id,
-                    query=query,
-                    answer=answer,
-                    context=cur_context,
-                    pre_context=self.pre_context_cache[conv_id],
-                    can_answer=can_answer,
-                    can_answer_reason=f"Context analysis result: {'can answer' if can_answer else 'cannot answer'}",
-                    search_duration_ms=search_duration_ms,
-                    can_answer_duration_ms=can_answer_duration_ms,
-                    response_duration_ms=response_duration_ms,
-                    category=int(qa_category) if qa_category is not None else None,
-                    golden_answer=str(qa.get("answer", "")),
-                    memories=[],
-                    pre_memories=[],
-                    history_queries=[],
-                )
-                if can_answer:
-                    self.can_answer_cases.append(recording_case)
-                else:
-                    self.cannot_answer_cases.append(recording_case)
-            except Exception as e:
-                logger.error(f"Error creating RecordingCase: {e}")
-                print(f"Error creating RecordingCase: {e}")
-                logger.error(f"QA data: {qa}")
-                print(f"QA data: {qa}")
-                logger.error(f"Query: {query}")
-                logger.error(f"Answer: {answer}")
-                logger.error(
-                    f"Golden answer (raw): {qa.get('answer')} (type: {type(qa.get('answer'))})"
-                )
-                logger.error(f"Category: {qa_category} (type: {type(qa_category)})")
-                logger.error(f"Can answer: {can_answer}")
-                raise e
-
+    def _update_stats_and_context(
+        self,
+        *,
+        conv_id,
+        frame,
+        version,
+        conv_stats,
+        conv_stats_path,
+        query,
+        answer,
+        gold_answer,
+        cur_context,
+        can_answer,
+    ):
+        """
+        Update conversation statistics and context.
+
+        Args:
+            conv_id: Conversation ID
+            frame: Model frame
+            version: Model version
+            conv_stats: Conversation statistics dictionary
+            conv_stats_path: Path to save conversation statistics
+            query: User query
+            answer: Generated answer
+            gold_answer: Golden answer
+            cur_context: Current context
+            can_answer: Whether the context can answer the query
+        """
         # Update conversation stats
         conv_stats["total_queries"] += 1
         conv_stats["response_count"] += 1
-        if frame == "memos_scheduler":
+        if frame == MEMOS_SCHEDULER_MODEL:
             if can_answer:
                 conv_stats["can_answer_count"] += 1
             else:
@@ -208,22 +139,137 @@ def _process_single_qa(
 
         # Update pre-context cache with current context
         with self.stats_lock:
-            if self.frame in [MEMOS_MODEL, MEMOS_SCHEDULER_MODEL]:
+            if self.context_update_method == ContextUpdateMethod.CHAT_HISTORY:
                 self.update_context(
                     conv_id=conv_id,
                     method=self.context_update_method,
-                    cur_context=cur_context,
+                    query=query,
+                    answer=answer,
                 )
             else:
                 self.update_context(
                     conv_id=conv_id,
                     method=self.context_update_method,
-                    query=query,
-                    answer=gold_answer,
+                    cur_context=cur_context,
                 )
 
         self.print_eval_info()
 
+    def _process_single_qa(
+        self,
+        qa,
+        *,
+        client,
+        reversed_client,
+        metadata,
+        frame,
+        version,
+        conv_id,
+        conv_stats_path,
+        oai_client,
+        top_k,
+        conv_stats,
+    ):
+        query = qa.get("question")
+        gold_answer = qa.get("answer")
+        qa_category = qa.get("category")
+        if qa_category == 5:
+            return None
+
+        # Search
+        cur_context, search_duration_ms = self.search_query(
+            client, query, metadata, frame, reversed_client=reversed_client, top_k=top_k
+        )
+        if not cur_context:
+            logger.warning(f"No context found for query: {query[:100]}")
+            cur_context = ""
+
+        if self.context_update_method == ContextUpdateMethod.CURRENT_CONTEXT:
+            context = cur_context
+        else:
+            # Context answer ability analysis (for memos_scheduler only)
+            if self.pre_context_cache[conv_id] is None:
+                # Update pre-context cache with current context and return
+                if self.context_update_method == ContextUpdateMethod.CHAT_HISTORY:
+                    answer_from_cur_context = self.locomo_response(
+                        frame, oai_client, cur_context, query
+                    )
+                    self.update_context(
+                        conv_id=conv_id,
+                        method=self.context_update_method,
+                        query=query,
+                        answer=answer_from_cur_context,
+                    )
+                else:
+                    self.update_context(
+                        conv_id=conv_id,
+                        method=self.context_update_method,
+                        cur_context=cur_context,
+                    )
+                return None
+            else:
+                context = self.pre_context_cache[conv_id]
+
+        # Generate answer
+        answer_start = time()
+        answer = self.locomo_response(frame, oai_client, context, query)
+        response_duration_ms = (time() - answer_start) * 1000
+
+        can_answer, can_answer_duration_ms = self.eval_context(
+            context=context, query=query, gold_answer=gold_answer, oai_client=oai_client
+        )
+
+        # Record case for memos_scheduler
+        try:
+            recording_case = RecordingCase(
+                conv_id=conv_id,
+                query=query,
+                answer=answer,
+                context=cur_context,
+                pre_context=self.pre_context_cache[conv_id],
+                can_answer=can_answer,
+                can_answer_reason=f"Context analysis result: {'can answer' if can_answer else 'cannot answer'}",
+                search_duration_ms=search_duration_ms,
+                can_answer_duration_ms=can_answer_duration_ms,
+                response_duration_ms=response_duration_ms,
+                category=int(qa_category) if qa_category is not None else None,
+                golden_answer=str(qa.get("answer", "")),
+            )
+            if can_answer:
+                self.can_answer_cases.append(recording_case)
+            else:
+                self.cannot_answer_cases.append(recording_case)
+        except Exception as e:
+            logger.error(f"Error creating RecordingCase: {e}")
+            print(f"Error creating RecordingCase: {e}")
+            logger.error(f"QA data: {qa}")
+            print(f"QA data: {qa}")
+            logger.error(f"Query: {query}")
+            logger.error(f"Answer: {answer}")
+            logger.error(
+                f"Golden answer (raw): {qa.get('answer')} (type: {type(qa.get('answer'))})"
+            )
+            logger.error(f"Category: {qa_category} (type: {type(qa_category)})")
+            logger.error(f"Can answer: {can_answer}")
+            raise e
+
+        if self.context_update_method == ContextUpdateMethod.CHAT_HISTORY:
+            answer_from_cur_context = self.locomo_response(frame, oai_client, cur_context, query)
+            answer = answer_from_cur_context
+        # Update conversation stats and context
+        self._update_stats_and_context(
+            conv_id=conv_id,
+            frame=frame,
+            version=version,
+            conv_stats=conv_stats,
+            conv_stats_path=conv_stats_path,
+            query=query,
+            answer=answer,
+            gold_answer=gold_answer,
+            cur_context=cur_context,
+            can_answer=can_answer,
+        )
+
         return {
             "question": query,
             "answer": answer,
@@ -233,7 +279,7 @@ def _process_single_qa(
             "response_duration_ms": response_duration_ms,
             "search_duration_ms": search_duration_ms,
             "can_answer_duration_ms": can_answer_duration_ms,
-            "can_answer": can_answer if frame == "memos_scheduler" else None,
+            "can_answer": can_answer if frame == MEMOS_SCHEDULER_MODEL else None,
         }
 
     def run_locomo_processing(self, num_users=10):
diff --git a/evaluation/scripts/temporal_locomo/models/locomo_processor_w_time_eval.py b/evaluation/scripts/temporal_locomo/models/locomo_processor_w_time_eval.py
new file mode 100644
index 000000000..b909c64e1
--- /dev/null
+++ b/evaluation/scripts/temporal_locomo/models/locomo_processor_w_time_eval.py
@@ -0,0 +1,229 @@
+import sys
+import time
+
+from pathlib import Path
+from typing import TYPE_CHECKING
+
+from evaluation.scripts.temporal_locomo.models.locomo_processor import LocomoProcessor
+from evaluation.scripts.temporal_locomo.modules.constants import (
+    MEMOS_SCHEDULER_MODEL,
+)
+from evaluation.scripts.temporal_locomo.modules.prompts import (
+    SEARCH_PROMPT_MEMOS,
+)
+from evaluation.scripts.temporal_locomo.modules.schemas import ContextUpdateMethod, RecordingCase
+from memos.log import get_logger
+
+
+if TYPE_CHECKING:
+    from memos.mem_os.main import MOS
+
+FILE_PATH = Path(__file__).absolute()
+BASE_DIR = FILE_PATH.parent.parent.parent
+sys.path.insert(0, str(BASE_DIR))  # Enable execution from any working directory
+
+logger = get_logger(__name__)
+
+
+class LocomoProcessorWithTimeEval(LocomoProcessor):
+    def __init__(self, args):
+        super().__init__(args=args)
+        self.time_eval_mode = getattr(self.args, "time_eval_mode", False)
+        assert self.args.frame == MEMOS_SCHEDULER_MODEL
+        assert self.context_update_method == ContextUpdateMethod.PRE_CONTEXT
+        if self.time_eval_mode:
+            logger.warning(
+                "time_eval_mode is activated. _process_single_qa is replaced by _process_single_qa_for_time_eval"
+            )
+        self._process_single_qa = self._process_single_qa_for_time_eval
+
+    def memos_scheduler_search(
+        self, client, query, conv_id, speaker_a, speaker_b, reversed_client=None, top_k=20
+    ):
+        # MemOS full search process and skip the parts of scheduler
+        start = time.time()
+        client: MOS = client
+
+        if not self.scheduler_flag:
+            # if not scheduler_flag, search to update working memory
+            self.memos_search(client, query, conv_id, speaker_a, speaker_b, reversed_client)
+
+        # ========= MemOS Search =========
+        # Search for speaker A
+        search_a_results = client.search(
+            query=query,
+            user_id=conv_id + "_speaker_a",
+            install_cube_ids=[conv_id + "_speaker_a"],
+            top_k=top_k,
+            mode="fine",
+            internet_search=False,
+            moscube=False,  # cube for mos introduction
+            session_id=None,
+        )["text_mem"]
+        search_a_results = [[m.memory for m in one["memories"]] for one in search_a_results]
+        search_a_results = [item for sublist in search_a_results for item in sublist]
+
+        # Search for speaker B
+        search_b_results = client.search(
+            query=query,
+            user_id=conv_id + "_speaker_b",
+            install_cube_ids=[conv_id + "_speaker_b"],
+            top_k=top_k,
+            mode="fine",
+            internet_search=False,
+            moscube=False,  # cube for mos introduction
+            session_id=None,
+        )["text_mem"]
+        search_b_results = [[m.memory for m in one["memories"]] for one in search_b_results]
+        search_b_results = [item for sublist in search_b_results for item in sublist]
+
+        speaker_a_context = ""
+        for item in search_a_results:
+            speaker_a_context += f"{item}\n"
+
+        speaker_b_context = ""
+        for item in search_b_results:
+            speaker_b_context += f"{item}\n"
+
+        context = SEARCH_PROMPT_MEMOS.format(
+            speaker_1=speaker_a,
+            speaker_1_memories=speaker_a_context,
+            speaker_2=speaker_b,
+            speaker_2_memories=speaker_b_context,
+        )
+
+        logger.info(f'query "{query[:100]}", context: {context[:100]}"')
+        duration_ms = (time.time() - start) * 1000
+
+        return context, duration_ms
+
+    def _process_single_qa_for_time_eval(
+        self,
+        qa,
+        *,
+        client,
+        reversed_client,
+        metadata,
+        frame,
+        version,
+        conv_id,
+        conv_stats_path,
+        oai_client,
+        top_k,
+        conv_stats,
+    ):
+        query = qa.get("question")
+        gold_answer = qa.get("answer")
+        qa_category = qa.get("category")
+        if qa_category == 5:
+            return None
+
+        # 1. two parallel process,
+        # 1. memos search + response
+        # 2. pre_memories can answer, true : direct answer   false:
+
+        # Search
+        assert self.args.frame == MEMOS_SCHEDULER_MODEL
+        cur_context, search_duration_ms = self.search_query(
+            client, query, metadata, frame, reversed_client=reversed_client, top_k=top_k
+        )
+        if not cur_context:
+            logger.warning(f"No context found for query: {query[:100]}")
+            cur_context = ""
+
+        # Context answer ability analysis (for memos_scheduler only)
+        if self.pre_context_cache[conv_id] is None:
+            # Update pre-context cache with current context and return
+            self.update_context(
+                conv_id=conv_id,
+                method=self.context_update_method,
+                cur_context=cur_context,
+            )
+
+            # ========= MemOS Scheduler update =========
+            _ = client.mem_scheduler.update_working_memory_for_eval(
+                query=query, user_id=conv_id + "_speaker_a", top_k=top_k
+            )
+
+            _ = client.mem_scheduler.update_working_memory_for_eval(
+                query=query, user_id=conv_id + "_speaker_b", top_k=top_k
+            )
+            return None
+
+        context = self.pre_context_cache[conv_id]
+
+        # Generate answer
+        answer_start = time.time()
+        answer = self.locomo_response(frame, oai_client, context, query)
+        response_duration_ms = (time.time() - answer_start) * 1000
+
+        can_answer, can_answer_duration_ms = self.eval_context(
+            context=context, query=query, gold_answer=gold_answer, oai_client=oai_client
+        )
+
+        # Record case for memos_scheduler
+        try:
+            recording_case = RecordingCase(
+                conv_id=conv_id,
+                query=query,
+                answer=answer,
+                context=cur_context,
+                pre_context=self.pre_context_cache[conv_id],
+                can_answer=can_answer,
+                can_answer_reason=f"Context analysis result: {'can answer' if can_answer else 'cannot answer'}",
+                search_duration_ms=search_duration_ms,
+                can_answer_duration_ms=can_answer_duration_ms,
+                response_duration_ms=response_duration_ms,
+                category=int(qa_category) if qa_category is not None else None,
+                golden_answer=str(qa.get("answer", "")),
+            )
+            if can_answer:
+                self.can_answer_cases.append(recording_case)
+            else:
+                self.cannot_answer_cases.append(recording_case)
+        except Exception as e:
+            logger.error(f"Error creating RecordingCase: {e}")
+            print(f"Error creating RecordingCase: {e}")
+            logger.error(f"QA data: {qa}")
+            print(f"QA data: {qa}")
+            logger.error(f"Query: {query}")
+            logger.error(f"Answer: {answer}")
+            logger.error(
+                f"Golden answer (raw): {qa.get('answer')} (type: {type(qa.get('answer'))})"
+            )
+            logger.error(f"Category: {qa_category} (type: {type(qa_category)})")
+            logger.error(f"Can answer: {can_answer}")
+            raise e
+
+        # Update conversation stats and context
+        self._update_stats_and_context(
+            conv_id=conv_id,
+            frame=frame,
+            version=version,
+            conv_stats=conv_stats,
+            conv_stats_path=conv_stats_path,
+            query=query,
+            answer=answer,
+            gold_answer=gold_answer,
+            cur_context=cur_context,
+            can_answer=can_answer,
+        )
+        # ========= MemOS Scheduler update =========
+        _ = client.mem_scheduler.update_working_memory_for_eval(
+            query=query, user_id=conv_id + "_speaker_a", top_k=top_k
+        )
+
+        _ = client.mem_scheduler.update_working_memory_for_eval(
+            query=query, user_id=conv_id + "_speaker_b", top_k=top_k
+        )
+        return {
+            "question": query,
+            "answer": answer,
+            "category": qa_category,
+            "golden_answer": gold_answer,
+            "search_context": cur_context,
+            "response_duration_ms": response_duration_ms,
+            "search_duration_ms": search_duration_ms,
+            "can_answer_duration_ms": can_answer_duration_ms,
+            "can_answer": can_answer if frame == MEMOS_SCHEDULER_MODEL else None,
+        }
diff --git a/evaluation/scripts/temporal_locomo/modules/base_eval_module.py b/evaluation/scripts/temporal_locomo/modules/base_eval_module.py
index 4ec7d4922..d056745cc 100644
--- a/evaluation/scripts/temporal_locomo/modules/base_eval_module.py
+++ b/evaluation/scripts/temporal_locomo/modules/base_eval_module.py
@@ -16,7 +16,6 @@
 
 from .constants import (
     BASE_DIR,
-    MEMOS_MODEL,
     MEMOS_SCHEDULER_MODEL,
 )
 from .prompts import (
@@ -42,10 +41,9 @@ def __init__(self, args):
         self.top_k = self.args.top_k
 
         # attributes
-        if self.frame in [MEMOS_MODEL, MEMOS_SCHEDULER_MODEL]:
-            self.context_update_method = ContextUpdateMethod.DIRECT
-        else:
-            self.context_update_method = ContextUpdateMethod.TEMPLATE
+        self.context_update_method = getattr(
+            self.args, "context_update_method", ContextUpdateMethod.PRE_CONTEXT
+        )
         self.custom_instructions = CUSTOM_INSTRUCTIONS
         self.data_dir = Path(f"{BASE_DIR}/data")
         self.locomo_df = pd.read_json(f"{self.data_dir}/locomo/locomo10.json")
@@ -61,18 +59,26 @@ def __init__(self, args):
             )
         else:
             logger.warning(f"Temporal locomo dataset not found at {temporal_locomo_file}")
+
+        result_dir_prefix = getattr(self.args, "result_dir_prefix", "")
+
         # Configure result dir; if scheduler disabled and using memos scheduler, mark as ablation
         if (
             hasattr(self.args, "scheduler_flag")
-            and self.frame == "memos_scheduler"
+            and self.frame == MEMOS_SCHEDULER_MODEL
             and self.args.scheduler_flag is False
         ):
             self.result_dir = Path(
-                f"{BASE_DIR}/results/temporal_locomo/{self.frame}-{self.version}-ablation/"
+                f"{BASE_DIR}/results/temporal_locomo/{result_dir_prefix}{self.frame}-{self.version}-ablation/"
             )
         else:
             self.result_dir = Path(
-                f"{BASE_DIR}/results/temporal_locomo/{self.frame}-{self.version}/"
+                f"{BASE_DIR}/results/temporal_locomo/{result_dir_prefix}{self.frame}-{self.version}/"
+            )
+
+        if self.context_update_method != ContextUpdateMethod.PRE_CONTEXT:
+            self.result_dir = (
+                self.result_dir.parent / f"{self.result_dir.name}_{self.context_update_method}"
             )
         self.result_dir.mkdir(parents=True, exist_ok=True)
 
@@ -85,6 +91,7 @@ def __init__(self, args):
         self.ingestion_storage_dir = self.result_dir / "storages"
         self.mos_config_path = Path(f"{BASE_DIR}/configs-example/mos_w_scheduler_config.json")
         self.mem_cube_config_path = Path(f"{BASE_DIR}/configs-example/mem_cube_config.json")
+
         self.openai_api_key = os.getenv("CHAT_MODEL_API_KEY")
         self.openai_base_url = os.getenv("CHAT_MODEL_BASE_URL")
         self.openai_chat_model = os.getenv("CHAT_MODEL")
@@ -92,53 +99,51 @@ def __init__(self, args):
         auth_config_path = Path(f"{BASE_DIR}/scripts/temporal_locomo/eval_auth.json")
         if auth_config_path.exists():
             auth_config = AuthConfig.from_local_config(config_path=auth_config_path)
-
-            self.mos_config_data = json.load(self.mos_config_path.open("r", encoding="utf-8"))
-            self.mem_cube_config_data = json.load(
-                self.mem_cube_config_path.open("r", encoding="utf-8")
-            )
-
-            # Update LLM authentication information in MOS configuration using dictionary assignment
-            self.mos_config_data["mem_reader"]["config"]["llm"]["config"]["api_key"] = (
-                auth_config.openai.api_key
-            )
-            self.mos_config_data["mem_reader"]["config"]["llm"]["config"]["api_base"] = (
-                auth_config.openai.base_url
-            )
-
-            # Update graph database authentication information in memory cube configuration using dictionary assignment
-            self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["uri"] = (
-                auth_config.graph_db.uri
-            )
-            self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["user"] = (
-                auth_config.graph_db.user
+            print(
+                f"✅ Configuration loaded successfully: from local config file {auth_config_path}"
             )
-            self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["password"] = (
-                auth_config.graph_db.password
-            )
-            self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["db_name"] = (
-                auth_config.graph_db.db_name
-            )
-            self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["auto_create"] = (
-                auth_config.graph_db.auto_create
-            )
-
-            self.openai_api_key = auth_config.openai.api_key
-            self.openai_base_url = auth_config.openai.base_url
-            self.openai_chat_model = auth_config.openai.default_model
         else:
-            print("Please referring to configs-example to provide valid configs.")
-            exit()
+            # Load .env file first before reading environment variables
+            load_dotenv()
+            auth_config = AuthConfig.from_local_env()
+            print("✅ Configuration loaded successfully: from environment variables")
+        self.openai_api_key = auth_config.openai.api_key
+        self.openai_base_url = auth_config.openai.base_url
+        self.openai_chat_model = auth_config.openai.default_model
+
+        self.mos_config_data = json.load(self.mos_config_path.open("r", encoding="utf-8"))
+        self.mem_cube_config_data = json.load(self.mem_cube_config_path.open("r", encoding="utf-8"))
+
+        # Update LLM authentication information in MOS configuration using dictionary assignment
+        self.mos_config_data["mem_reader"]["config"]["llm"]["config"]["api_key"] = (
+            auth_config.openai.api_key
+        )
+        self.mos_config_data["mem_reader"]["config"]["llm"]["config"]["api_base"] = (
+            auth_config.openai.base_url
+        )
+
+        # Update graph database authentication information in memory cube configuration using dictionary assignment
+        self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["uri"] = (
+            auth_config.graph_db.uri
+        )
+        self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["user"] = (
+            auth_config.graph_db.user
+        )
+        self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["password"] = (
+            auth_config.graph_db.password
+        )
+        self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["db_name"] = (
+            auth_config.graph_db.db_name
+        )
+        self.mem_cube_config_data["text_mem"]["config"]["graph_db"]["config"]["auto_create"] = (
+            auth_config.graph_db.auto_create
+        )
 
         # Logger initialization
         self.logger = logger
 
         # Statistics tracking with thread safety
         self.stats = {self.frame: {self.version: defaultdict(dict)}}
-        self.stats[self.frame][self.version]["response_stats"] = defaultdict(dict)
-        self.stats[self.frame][self.version]["response_stats"]["response_failure"] = 0
-        self.stats[self.frame][self.version]["response_stats"]["response_count"] = 0
-
         self.stats[self.frame][self.version]["memory_stats"] = defaultdict(dict)
         self.stats[self.frame][self.version]["memory_stats"]["total_queries"] = 0
         self.stats[self.frame][self.version]["memory_stats"]["can_answer_count"] = 0
@@ -155,7 +160,6 @@ def __init__(self, args):
 
         self.can_answer_cases: list[RecordingCase] = []
         self.cannot_answer_cases: list[RecordingCase] = []
-        load_dotenv()
 
     def print_eval_info(self):
         """
diff --git a/evaluation/scripts/temporal_locomo/modules/client_manager.py b/evaluation/scripts/temporal_locomo/modules/client_manager.py
index f49ab40f0..c5882179e 100644
--- a/evaluation/scripts/temporal_locomo/modules/client_manager.py
+++ b/evaluation/scripts/temporal_locomo/modules/client_manager.py
@@ -146,9 +146,14 @@ def get_client_from_storage(
                 scheduler_for_eval.current_mem_cube_id = user_id
                 scheduler_for_eval.current_user_id = user_id
 
+                # set llms to openai api
+                mos.chat_llm = mos.mem_reader.llm
+                for cube in mos.mem_cubes.values():
+                    cube.text_mem.dispatcher_llm = mos.mem_reader.llm
+                    cube.text_mem.extractor_llm = mos.mem_reader.llm
+
                 # Replace the original scheduler
                 mos.mem_scheduler = scheduler_for_eval
-
             return mos
 
     def locomo_response(self, frame, llm_client, context: str, question: str) -> str:
diff --git a/evaluation/scripts/temporal_locomo/modules/locomo_eval_module.py b/evaluation/scripts/temporal_locomo/modules/locomo_eval_module.py
index c824fe5f4..d444ea62c 100644
--- a/evaluation/scripts/temporal_locomo/modules/locomo_eval_module.py
+++ b/evaluation/scripts/temporal_locomo/modules/locomo_eval_module.py
@@ -13,8 +13,11 @@
 
 from .client_manager import EvalModuleWithClientManager
 from .constants import (
+    MEM0_GRAPH_MODEL,
+    MEM0_MODEL,
     MEMOS_MODEL,
     MEMOS_SCHEDULER_MODEL,
+    ZEP_MODEL,
 )
 from .prompts import (
     CONTEXT_ANSWERABILITY_PROMPT,
@@ -141,7 +144,9 @@ def mem0_search(self, client, query, speaker_a_user_id, speaker_b_user_id, top_k
         duration_ms = (time.time() - start) * 1000
         return context, duration_ms
 
-    def memos_search(self, client, query, conv_id, speaker_a, speaker_b, reversed_client=None):
+    def memos_search(
+        self, client, query, conv_id, speaker_a, speaker_b, reversed_client=None, top_k=20
+    ):
         """
         Search memories using the memos framework.
 
@@ -158,13 +163,10 @@ def memos_search(self, client, query, conv_id, speaker_a, speaker_b, reversed_cl
         """
         start = time.time()
         # Search memories for speaker A
-        search_a_results = client.search(
-            query=query,
-            user_id=conv_id + "_speaker_a",
-        )
+        search_a_results = client.search(query=query, user_id=conv_id + "_speaker_a")
         filtered_search_a_results = filter_memory_data(search_a_results)["text_mem"][0]["memories"]
         speaker_a_context = ""
-        for item in filtered_search_a_results:
+        for item in filtered_search_a_results[:top_k]:
             speaker_a_context += f"{item['memory']}\n"
 
         # Search memories for speaker B
@@ -174,7 +176,7 @@ def memos_search(self, client, query, conv_id, speaker_a, speaker_b, reversed_cl
         )
         filtered_search_b_results = filter_memory_data(search_b_results)["text_mem"][0]["memories"]
         speaker_b_context = ""
-        for item in filtered_search_b_results:
+        for item in filtered_search_b_results[:top_k]:
             speaker_b_context += f"{item['memory']}\n"
 
         # Create context using template
@@ -189,16 +191,20 @@ def memos_search(self, client, query, conv_id, speaker_a, speaker_b, reversed_cl
         return context, duration_ms
 
     def memos_scheduler_search(
-        self, client, query, conv_id, speaker_a, speaker_b, reversed_client=None
+        self, client, query, conv_id, speaker_a, speaker_b, reversed_client=None, top_k=20
     ):
         start = time.time()
         client: MOS = client
 
+        if not self.scheduler_flag:
+            # if not scheduler_flag, search to update working memory
+            self.memos_search(client, query, conv_id, speaker_a, speaker_b, reversed_client, top_k)
+
         # Search for speaker A
         search_a_results = client.mem_scheduler.search_for_eval(
             query=query,
             user_id=conv_id + "_speaker_a",
-            top_k=client.config.top_k,
+            top_k=top_k,
             scheduler_flag=self.scheduler_flag,
         )
 
@@ -206,7 +212,7 @@ def memos_scheduler_search(
         search_b_results = reversed_client.mem_scheduler.search_for_eval(
             query=query,
             user_id=conv_id + "_speaker_b",
-            top_k=client.config.top_k,
+            top_k=top_k,
             scheduler_flag=self.scheduler_flag,
         )
 
@@ -342,23 +348,23 @@ def search_query(self, client, query, metadata, frame, reversed_client=None, top
         speaker_a_user_id = metadata.get("speaker_a_user_id")
         speaker_b_user_id = metadata.get("speaker_b_user_id")
 
-        if frame == "zep":
+        if frame == ZEP_MODEL:
             context, duration_ms = self.zep_search(client, query, conv_id, top_k)
-        elif frame == "mem0":
+        elif frame == MEM0_MODEL:
             context, duration_ms = self.mem0_search(
                 client, query, speaker_a_user_id, speaker_b_user_id, top_k
             )
-        elif frame == "mem0_graph":
+        elif frame == MEM0_GRAPH_MODEL:
             context, duration_ms = self.mem0_graph_search(
                 client, query, speaker_a_user_id, speaker_b_user_id, top_k
             )
-        elif frame == "memos":
+        elif frame == MEMOS_MODEL:
             context, duration_ms = self.memos_search(
-                client, query, conv_id, speaker_a, speaker_b, reversed_client
+                client, query, conv_id, speaker_a, speaker_b, reversed_client, top_k
             )
-        elif frame == "memos_scheduler":
+        elif frame == MEMOS_SCHEDULER_MODEL:
             context, duration_ms = self.memos_scheduler_search(
-                client, query, conv_id, speaker_a, speaker_b, reversed_client
+                client, query, conv_id, speaker_a, speaker_b, reversed_client, top_k
             )
         else:
             raise NotImplementedError()
@@ -527,6 +533,25 @@ def process_qa(qa):
             json.dump(dict(search_results), fw, indent=2)
             print(f"Save search results {conv_id}")
 
+        search_durations = []
+        for result in response_results[conv_id]:
+            if "search_duration_ms" in result:
+                search_durations.append(result["search_duration_ms"])
+
+        if search_durations:
+            avg_search_duration = sum(search_durations) / len(search_durations)
+            with self.stats_lock:
+                if self.stats[self.frame][self.version]["memory_stats"]["avg_search_duration_ms"]:
+                    self.stats[self.frame][self.version]["memory_stats"][
+                        "avg_search_duration_ms"
+                    ] = (
+                        self.stats[self.frame][self.version]["memory_stats"][
+                            "avg_search_duration_ms"
+                        ]
+                        + avg_search_duration
+                    ) / 2
+                print(f"Average search duration: {avg_search_duration:.2f} ms")
+
         # Dump stats after processing each user
         self.save_stats()
 
diff --git a/evaluation/scripts/temporal_locomo/modules/schemas.py b/evaluation/scripts/temporal_locomo/modules/schemas.py
index e5872c35d..fee89cc62 100644
--- a/evaluation/scripts/temporal_locomo/modules/schemas.py
+++ b/evaluation/scripts/temporal_locomo/modules/schemas.py
@@ -1,14 +1,23 @@
-from enum import Enum
 from typing import Any
 
 from pydantic import BaseModel, Field
 
 
-class ContextUpdateMethod(Enum):
+class ContextUpdateMethod:
     """Enumeration for context update methods"""
 
-    DIRECT = "direct"  # Directly update with current context
-    TEMPLATE = "chat_history"  # Update using template with history queries and answers
+    PRE_CONTEXT = "pre_context"
+    CHAT_HISTORY = "chat_history"
+    CURRENT_CONTEXT = "current_context"
+
+    @classmethod
+    def values(cls):
+        """Return a list of all constant values"""
+        return [
+            getattr(cls, attr)
+            for attr in dir(cls)
+            if not attr.startswith("_") and isinstance(getattr(cls, attr), str)
+        ]
 
 
 class RecordingCase(BaseModel):
@@ -22,11 +31,6 @@ class RecordingCase(BaseModel):
     # Conversation identification
     conv_id: str = Field(description="Conversation identifier for this evaluation case")
 
-    # Conversation history and context
-    history_queries: list[str] = Field(
-        default_factory=list, description="List of previous queries in the conversation history"
-    )
-
     context: str = Field(
         default="",
         description="Current search context retrieved from memory systems for answering the query",
@@ -42,16 +46,6 @@ class RecordingCase(BaseModel):
 
     answer: str = Field(description="The generated answer for the query")
 
-    # Memory data
-    memories: list[Any] = Field(
-        default_factory=list,
-        description="Current memories retrieved from the memory system for this query",
-    )
-
-    pre_memories: list[Any] | None = Field(
-        default=None, description="Previous memories from the last query, used for comparison"
-    )
-
     # Evaluation metrics
     can_answer: bool | None = Field(
         default=None,
@@ -139,3 +133,29 @@ class Config:
         extra = "allow"  # Allow additional fields not defined in the schema
         validate_assignment = True  # Validate on assignment
         use_enum_values = True  # Use enum values instead of enum names
+
+
+class TimeEvalRecordingCase(BaseModel):
+    memos_search_duration_ms: float | None = Field(
+        default=None, description="Time taken for memory search in milliseconds"
+    )
+
+    memos_response_duration_ms: float | None = Field(
+        default=None, description="Time taken for response generation in milliseconds"
+    )
+
+    memos_can_answer_duration_ms: float | None = Field(
+        default=None, description="Time taken for answerability analysis in milliseconds"
+    )
+
+    scheduler_search_duration_ms: float | None = Field(
+        default=None, description="Time taken for memory search in milliseconds"
+    )
+
+    scheduler_response_duration_ms: float | None = Field(
+        default=None, description="Time taken for response generation in milliseconds"
+    )
+
+    scheduler_can_answer_duration_ms: float | None = Field(
+        default=None, description="Time taken for answerability analysis in milliseconds"
+    )
diff --git a/evaluation/scripts/temporal_locomo/scheduler_time_eval.py b/evaluation/scripts/temporal_locomo/scheduler_time_eval.py
new file mode 100644
index 000000000..12d1964cd
--- /dev/null
+++ b/evaluation/scripts/temporal_locomo/scheduler_time_eval.py
@@ -0,0 +1,93 @@
+import argparse
+import sys
+
+from pathlib import Path
+
+from modules.locomo_eval_module import LocomoEvalModelModules
+from modules.schemas import ContextUpdateMethod
+
+from evaluation.scripts.temporal_locomo.models.locomo_ingestion import LocomoIngestor
+from evaluation.scripts.temporal_locomo.models.locomo_processor_w_time_eval import (
+    LocomoProcessorWithTimeEval,
+)
+from memos.log import get_logger
+
+
+FILE_PATH = Path(__file__).absolute()
+BASE_DIR = FILE_PATH.parent.parent.parent
+sys.path.insert(0, str(BASE_DIR))  # Enable execution from any working directory
+
+logger = get_logger(__name__)
+
+
+# TODO: This evaluation has been suspended—it is not finished yet.
+class TemporalLocomoForTimeEval(LocomoEvalModelModules):
+    def __init__(self, args):
+        args.result_dir_prefix = "time_eval-"
+
+        super().__init__(args=args)
+        self.num_of_users = 10
+
+        self.locomo_ingestor = LocomoIngestor(args=args)
+        self.locomo_processor = LocomoProcessorWithTimeEval(args=args)
+
+    def run_time_eval_pipeline(self, skip_ingestion=True, skip_processing=False):
+        """
+        Run the complete evaluation pipeline including dataset conversion,
+        data ingestion, and processing.
+        """
+        print("=" * 80)
+        print("Starting TimeLocomo Evaluation Pipeline")
+        print("=" * 80)
+
+        # Step 1: Check if temporal_locomo dataset exists, if not convert it
+        temporal_locomo_file = self.data_dir / "temporal_locomo" / "temporal_locomo_qa.json"
+        if not temporal_locomo_file.exists():
+            print(f"Temporal locomo dataset not found at {temporal_locomo_file}")
+            print("Converting locomo dataset to temporal_locomo format...")
+            self.convert_locomo_to_temporal_locomo(output_dir=self.data_dir / "temporal_locomo")
+            print("Dataset conversion completed.")
+        else:
+            print(f"Temporal locomo dataset found at {temporal_locomo_file}, skipping conversion.")
+
+        # Step 2: Data ingestion
+        if not skip_ingestion:
+            print("\n" + "=" * 50)
+            print("Step 2: Data Ingestion")
+            print("=" * 50)
+            self.locomo_ingestor.run_ingestion()
+
+        # Step 3: Processing and evaluation
+        print("\n" + "=" * 50)
+        print("Step 3: Processing and Evaluation")
+        print("=" * 50)
+        print("Running locomo processing to search and answer...")
+
+        print("Starting locomo processing to generate search and response results...")
+        self.locomo_processor.run_locomo_processing(num_users=self.num_of_users)
+        print("Processing completed successfully.")
+
+
+if __name__ == "__main__":
+    parser = argparse.ArgumentParser()
+    parser.add_argument(
+        "--version",
+        type=str,
+        default="v1.0.1",
+        help="Version identifier for saving results (e.g., 1010)",
+    )
+    parser.add_argument(
+        "--workers", type=int, default=10, help="Number of parallel workers to process users"
+    )
+    parser.add_argument(
+        "--top_k", type=int, default=20, help="Number of results to retrieve in search queries"
+    )
+
+    args = parser.parse_args()
+
+    args.frame = "memos_scheduler"
+    args.scheduler_flag = True
+    args.context_update_method = ContextUpdateMethod.PRE_CONTEXT
+
+    evaluator = TemporalLocomoForTimeEval(args=args)
+    evaluator.run_time_eval_pipeline()
diff --git a/evaluation/scripts/temporal_locomo/temporal_locomo_eval.py b/evaluation/scripts/temporal_locomo/temporal_locomo_eval.py
index 0a2c20a0e..bb6967e7f 100644
--- a/evaluation/scripts/temporal_locomo/temporal_locomo_eval.py
+++ b/evaluation/scripts/temporal_locomo/temporal_locomo_eval.py
@@ -5,13 +5,14 @@
 
 from pathlib import Path
 
-from locomo_eval import LocomoEvaluator
-from locomo_ingestion import LocomoIngestor
-from locomo_metric import LocomoMetric
-from locomo_processor import LocomoProcessor
 from modules.locomo_eval_module import LocomoEvalModelModules
+from modules.schemas import ContextUpdateMethod
 from modules.utils import compute_can_answer_count_by_pre_evidences
 
+from evaluation.scripts.temporal_locomo.models.locomo_eval import LocomoEvaluator
+from evaluation.scripts.temporal_locomo.models.locomo_ingestion import LocomoIngestor
+from evaluation.scripts.temporal_locomo.models.locomo_metric import LocomoMetric
+from evaluation.scripts.temporal_locomo.models.locomo_processor import LocomoProcessor
 from memos.log import get_logger
 
 
@@ -29,8 +30,10 @@ def __init__(self, args):
 
         self.locomo_ingestor = LocomoIngestor(args=args)
         self.locomo_processor = LocomoProcessor(args=args)
+        self.locomo_evaluator = LocomoEvaluator(args=args)
+        self.locomo_metric = LocomoMetric(args=args)
 
-    def run_eval_pipeline(self):
+    def run_answer_hit_eval_pipeline(self, skip_ingestion=True, skip_processing=False):
         """
         Run the complete evaluation pipeline including dataset conversion,
         data ingestion, and processing.
@@ -50,46 +53,39 @@ def run_eval_pipeline(self):
             print(f"Temporal locomo dataset found at {temporal_locomo_file}, skipping conversion.")
 
         # Step 2: Data ingestion
-        print("\n" + "=" * 50)
-        print("Step 2: Data Ingestion")
-        print("=" * 50)
-        if not self.ingestion_storage_dir.exists() or not any(self.ingestion_storage_dir.iterdir()):
-            print(f"Directory {self.ingestion_storage_dir} not found, starting data ingestion...")
+        if not skip_ingestion:
+            print("\n" + "=" * 50)
+            print("Step 2: Data Ingestion")
+            print("=" * 50)
             self.locomo_ingestor.run_ingestion()
-            print("Data ingestion completed.")
-        else:
-            print(
-                f"Directory {self.ingestion_storage_dir} already exists and is not empty, skipping ingestion."
-            )
 
         # Step 3: Processing and evaluation
-        print("\n" + "=" * 50)
-        print("Step 3: Processing and Evaluation")
-        print("=" * 50)
-        print("Running locomo processing to search and answer...")
+        if not skip_processing:
+            print("\n" + "=" * 50)
+            print("Step 3: Processing and Evaluation")
+            print("=" * 50)
+            print("Running locomo processing to search and answer...")
 
-        print("Starting locomo processing to generate search and response results...")
-        self.locomo_processor.run_locomo_processing(num_users=self.num_of_users)
-        print("Processing completed successfully.")
+            print("Starting locomo processing to generate search and response results...")
+            self.locomo_processor.run_locomo_processing(num_users=self.num_of_users)
+            print("Processing completed successfully.")
 
         # Optional: run post-hoc evaluation over generated responses if available
         try:
-            evaluator = LocomoEvaluator(args=args)
-
-            if os.path.exists(evaluator.response_path):
+            if os.path.exists(self.response_path):
                 print("Running LocomoEvaluator over existing response results...")
-                asyncio.run(evaluator.run())
+                asyncio.run(self.locomo_evaluator.run())
             else:
                 print(
                     f"Skipping LocomoEvaluator: response file not found at {evaluator.response_path}"
                 )
             # Run metrics summarization if judged file is produced
-            metric = LocomoMetric(args=args)
-            if os.path.exists(metric.judged_path):
+
+            if os.path.exists(self.judged_path):
                 print("Running LocomoMetric over judged results...")
-                metric.run()
+                self.locomo_metric.run()
             else:
-                print(f"Skipping LocomoMetric: judged file not found at {metric.judged_path}")
+                print(f"Skipping LocomoMetric: judged file not found at {self.judged_path}")
         except Exception as e:
             logger.error(f"LocomoEvaluator step skipped due to error: {e}", exc_info=True)
 
@@ -124,7 +120,7 @@ def compute_can_answer_count_by_pre_evidences(self, rounds_to_consider):
     parser.add_argument(
         "--frame",
         type=str,
-        default="memos_scheduler",
+        default="memos",
         choices=["zep", "memos", "mem0", "mem0_graph", "memos_scheduler"],
         help="Specify the memory framework (zep or memos or mem0 or mem0_graph)",
     )
@@ -141,16 +137,19 @@ def compute_can_answer_count_by_pre_evidences(self, rounds_to_consider):
         "--top_k", type=int, default=20, help="Number of results to retrieve in search queries"
     )
     parser.add_argument(
-        "--scheduler-flag",
+        "--scheduler_flag",
         action=argparse.BooleanOptionalAction,
-        default=True,
+        default=False,
         help="Enable or disable memory scheduler features",
     )
+    parser.add_argument(
+        "--context_update_method",
+        type=str,
+        default="chat_history",
+        choices=ContextUpdateMethod.values(),
+        help="Method to update context: pre_context (use previous context), chat_history (use template with history), current_context (use current context)",
+    )
     args = parser.parse_args()
 
     evaluator = TemporalLocomoEval(args=args)
-    evaluator.run_eval_pipeline()
-
-    # rule-based baselines
-    evaluator.compute_can_answer_count_by_pre_evidences(rounds_to_consider=float("inf"))
-    evaluator.compute_can_answer_count_by_pre_evidences(rounds_to_consider=1)
+    evaluator.run_answer_hit_eval_pipeline()
diff --git a/examples/data/config/mem_scheduler/mem_cube_config.yaml b/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml
similarity index 100%
rename from examples/data/config/mem_scheduler/mem_cube_config.yaml
rename to examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml
diff --git a/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler_and_openai.yaml b/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler.yaml
similarity index 100%
rename from examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler_and_openai.yaml
rename to examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler.yaml
diff --git a/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml b/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml
index 0152d8cdd..cdfa49a76 100644
--- a/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml
+++ b/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml
@@ -10,14 +10,16 @@ mem_reader:
   backend: "simple_struct"
   config:
     llm:
-      backend: "ollama"
+      backend: "openai"
       config:
-        model_name_or_path: "qwen3:0.6b"
-        remove_think_prefix: true
+        model_name_or_path: "gpt-4o-mini"
         temperature: 0.8
-        max_tokens: 1024
+        max_tokens: 4096
         top_p: 0.9
         top_k: 50
+        remove_think_prefix: true
+        api_key: "sk-xxxxxx"
+        api_base: "https://api.openai.com/v1"
     embedder:
       backend: "ollama"
       config:
diff --git a/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml b/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml
deleted file mode 100644
index cdfa49a76..000000000
--- a/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml
+++ /dev/null
@@ -1,51 +0,0 @@
-user_id: "root"
-chat_model:
-  backend: "huggingface_singleton"
-  config:
-    model_name_or_path: "Qwen/Qwen3-1.7B"
-    temperature: 0.1
-    remove_think_prefix: true
-    max_tokens: 4096
-mem_reader:
-  backend: "simple_struct"
-  config:
-    llm:
-      backend: "openai"
-      config:
-        model_name_or_path: "gpt-4o-mini"
-        temperature: 0.8
-        max_tokens: 4096
-        top_p: 0.9
-        top_k: 50
-        remove_think_prefix: true
-        api_key: "sk-xxxxxx"
-        api_base: "https://api.openai.com/v1"
-    embedder:
-      backend: "ollama"
-      config:
-        model_name_or_path: "nomic-embed-text:latest"
-    chunker:
-      backend: "sentence"
-      config:
-        tokenizer_or_token_counter: "gpt2"
-        chunk_size: 512
-        chunk_overlap: 128
-        min_sentences_per_chunk: 1
-mem_scheduler:
-  backend: "general_scheduler"
-  config:
-    top_k: 10
-    act_mem_update_interval: 30
-    context_window_size: 10
-    thread_pool_max_workers: 10
-    consume_interval_seconds: 1
-    working_mem_monitor_capacity: 20
-    activation_mem_monitor_capacity: 5
-    enable_parallel_dispatch: true
-    enable_activation_memory: true
-max_turns_window: 20
-top_k: 5
-enable_textual_memory: true
-enable_activation_memory: true
-enable_parametric_memory: false
-enable_mem_scheduler: true
diff --git a/examples/mem_api/pipeline_test.py b/examples/mem_api/pipeline_test.py
new file mode 100644
index 000000000..cd7b3bee3
--- /dev/null
+++ b/examples/mem_api/pipeline_test.py
@@ -0,0 +1,178 @@
+"""
+Pipeline test script for MemOS Server API functions.
+This script directly tests add and search functionalities without going through the API layer.
+If you want to start server_api set .env to MemOS/.env and run:
+uvicorn memos.api.server_api:app --host 0.0.0.0 --port 8002 --workers 4
+"""
+
+from typing import Any
+
+from dotenv import load_dotenv
+
+# Import directly from server_router to reuse initialized components
+from memos.api.routers.server_router import (
+    _create_naive_mem_cube,
+    mem_reader,
+)
+from memos.log import get_logger
+
+
+# Load environment variables
+load_dotenv()
+
+logger = get_logger(__name__)
+
+
+def test_add_memories(
+    messages: list[dict[str, str]],
+    user_id: str,
+    mem_cube_id: str,
+    session_id: str = "default_session",
+) -> list[str]:
+    """
+    Test adding memories to the system.
+
+    Args:
+        messages: List of message dictionaries with 'role' and 'content'
+        user_id: User identifier
+        mem_cube_id: Memory cube identifier
+        session_id: Session identifier
+
+    Returns:
+        List of memory IDs that were added
+    """
+    logger.info(f"Testing add memories for user: {user_id}, mem_cube: {mem_cube_id}")
+
+    # Create NaiveMemCube using server_router function
+    naive_mem_cube = _create_naive_mem_cube()
+
+    # Extract memories from messages using server_router's mem_reader
+    memories = mem_reader.get_memory(
+        [messages],
+        type="chat",
+        info={
+            "user_id": user_id,
+            "session_id": session_id,
+        },
+    )
+
+    # Flatten memory list
+    flattened_memories = [mm for m in memories for mm in m]
+
+    # Add memories to the system
+    mem_id_list: list[str] = naive_mem_cube.text_mem.add(
+        flattened_memories,
+        user_name=mem_cube_id,
+    )
+
+    logger.info(f"Added {len(mem_id_list)} memories: {mem_id_list}")
+
+    # Print details of added memories
+    for memory_id, memory in zip(mem_id_list, flattened_memories, strict=False):
+        logger.info(f"  - ID: {memory_id}")
+        logger.info(f"    Memory: {memory.memory}")
+        logger.info(f"    Type: {memory.metadata.memory_type}")
+
+    return mem_id_list
+
+
+def test_search_memories(
+    query: str,
+    user_id: str,
+    mem_cube_id: str,
+    session_id: str = "default_session",
+    top_k: int = 5,
+    mode: str = "fast",
+    internet_search: bool = False,
+    moscube: bool = False,
+    chat_history: list | None = None,
+) -> list[Any]:
+    """
+    Test searching memories from the system.
+
+    Args:
+        query: Search query text
+        user_id: User identifier
+        mem_cube_id: Memory cube identifier
+        session_id: Session identifier
+        top_k: Number of top results to return
+        mode: Search mode
+        internet_search: Whether to enable internet search
+        moscube: Whether to enable moscube search
+        chat_history: Chat history for context
+
+    Returns:
+        List of search results
+    """
+
+    # Create NaiveMemCube using server_router function
+    naive_mem_cube = _create_naive_mem_cube()
+
+    # Prepare search filter
+    search_filter = {"session_id": session_id} if session_id != "default_session" else None
+
+    search_results = naive_mem_cube.text_mem.search(
+        query=query,
+        user_name=mem_cube_id,
+        top_k=top_k,
+        mode=mode,
+        manual_close_internet=not internet_search,
+        moscube=moscube,
+        search_filter=search_filter,
+        info={
+            "user_id": user_id,
+            "session_id": session_id,
+            "chat_history": chat_history or [],
+        },
+    )
+
+    # Print search results
+    for idx, result in enumerate(search_results, 1):
+        logger.info(f"\n  Result {idx}:")
+        logger.info(f"    ID: {result.id}")
+        logger.info(f"    Memory: {result.memory}")
+        logger.info(f"    Score: {getattr(result, 'score', 'N/A')}")
+        logger.info(f"    Type: {result.metadata.memory_type}")
+
+    return search_results
+
+
+def main():
+    # Test parameters
+    user_id = "test_user_123"
+    mem_cube_id = "test_cube_123"
+    session_id = "test_session_001"
+
+    test_messages = [
+        {"role": "user", "content": "Where should I go for Christmas?"},
+        {
+            "role": "assistant",
+            "content": "There are many places to visit during Christmas, such as the Bund and Disneyland in Shanghai.",
+        },
+        {"role": "user", "content": "What about New Year's Eve?"},
+        {
+            "role": "assistant",
+            "content": "For New Year's Eve, you could visit Times Square in New York or watch fireworks at the Sydney Opera House.",
+        },
+    ]
+
+    memory_ids = test_add_memories(
+        messages=test_messages, user_id=user_id, mem_cube_id=mem_cube_id, session_id=session_id
+    )
+
+    logger.info(f"\nSuccessfully added {len(memory_ids)} memories!")
+
+    search_queries = [
+        "How to enjoy Christmas?",
+        "Where to celebrate New Year?",
+        "What are good places to visit during holidays?",
+    ]
+
+    for query in search_queries:
+        logger.info("\n" + "-" * 80)
+        results = test_search_memories(query=query, user_id=user_id, mem_cube_id=mem_cube_id)
+        print(f"Query: '{query}' returned {len(results)} results")
+
+
+if __name__ == "__main__":
+    main()
diff --git a/examples/mem_os/chat_w_scheduler.py b/examples/mem_os/chat_w_scheduler.py
index 6810fe5ed..28c4c31a9 100644
--- a/examples/mem_os/chat_w_scheduler.py
+++ b/examples/mem_os/chat_w_scheduler.py
@@ -17,11 +17,11 @@
 
 # set configs
 mos_config = MOSConfig.from_yaml_file(
-    f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml"
+    f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml"
 )
 
 mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-    f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+    f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
 )
 
 # default local graphdb uri
diff --git a/examples/mem_scheduler/debug_text_mem_replace.py b/examples/mem_scheduler/debug_text_mem_replace.py
index df80f7d0c..a5de8e572 100644
--- a/examples/mem_scheduler/debug_text_mem_replace.py
+++ b/examples/mem_scheduler/debug_text_mem_replace.py
@@ -28,11 +28,11 @@
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/examples/mem_scheduler/memos_w_optimized_scheduler.py b/examples/mem_scheduler/memos_w_optimized_scheduler.py
index fbd145368..664168f62 100644
--- a/examples/mem_scheduler/memos_w_optimized_scheduler.py
+++ b/examples/mem_scheduler/memos_w_optimized_scheduler.py
@@ -26,11 +26,11 @@ def run_with_scheduler_init():
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/examples/mem_scheduler/memos_w_optimized_scheduler_for_test.py b/examples/mem_scheduler/memos_w_optimized_scheduler_for_test.py
index 9b39bf771..ed4f721ad 100644
--- a/examples/mem_scheduler/memos_w_optimized_scheduler_for_test.py
+++ b/examples/mem_scheduler/memos_w_optimized_scheduler_for_test.py
@@ -28,11 +28,11 @@
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_optimized_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/examples/mem_scheduler/memos_w_scheduler.py b/examples/mem_scheduler/memos_w_scheduler.py
index 286415070..dc196b85a 100644
--- a/examples/mem_scheduler/memos_w_scheduler.py
+++ b/examples/mem_scheduler/memos_w_scheduler.py
@@ -76,11 +76,11 @@ def run_with_scheduler_init():
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/examples/mem_scheduler/memos_w_scheduler_for_test.py b/examples/mem_scheduler/memos_w_scheduler_for_test.py
index ddf2dc6da..6faac98af 100644
--- a/examples/mem_scheduler/memos_w_scheduler_for_test.py
+++ b/examples/mem_scheduler/memos_w_scheduler_for_test.py
@@ -163,11 +163,11 @@ def init_task():
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/examples/mem_scheduler/try_schedule_modules.py b/examples/mem_scheduler/try_schedule_modules.py
index 634d69c38..de99f1c95 100644
--- a/examples/mem_scheduler/try_schedule_modules.py
+++ b/examples/mem_scheduler/try_schedule_modules.py
@@ -136,11 +136,11 @@ def show_web_logs(mem_scheduler: GeneralScheduler):
 
     # set configs
     mos_config = MOSConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler_and_openai.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/memos_config_w_scheduler.yaml"
     )
 
     mem_cube_config = GeneralMemCubeConfig.from_yaml_file(
-        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config.yaml"
+        f"{BASE_DIR}/examples/data/config/mem_scheduler/mem_cube_config_neo4j.yaml"
     )
 
     # default local graphdb uri
diff --git a/poetry.lock b/poetry.lock
index e6830016f..d34f964b6 100644
--- a/poetry.lock
+++ b/poetry.lock
@@ -1,4 +1,4 @@
-# This file is automatically @generated by Poetry 2.1.3 and should not be changed by hand.
+# This file is automatically @generated by Poetry 2.1.4 and should not be changed by hand.
 
 [[package]]
 name = "absl-py"
@@ -6310,4 +6310,4 @@ tree-mem = ["neo4j", "schedule"]
 [metadata]
 lock-version = "2.1"
 python-versions = ">=3.10,<4.0"
-content-hash = "d85cb8a08870d67df6e462610231f1e735ba5293bd3fe5b0c4a212b3ccff7b72"
+content-hash = "d85cb8a08870d67df6e462610231f1e735ba5293bd3fe5b0c4a212b3ccff7b72"
\ No newline at end of file
diff --git a/src/memos/api/config.py b/src/memos/api/config.py
index c9ff70d4e..d552369c5 100644
--- a/src/memos/api/config.py
+++ b/src/memos/api/config.py
@@ -76,6 +76,24 @@ def get_activation_config() -> dict[str, Any]:
             },
         }
 
+    @staticmethod
+    def get_memreader_config() -> dict[str, Any]:
+        """Get MemReader configuration."""
+        return {
+            "backend": "openai",
+            "config": {
+                "model_name_or_path": os.getenv("MEMRADER_MODEL", "gpt-4o-mini"),
+                "temperature": 0.6,
+                "max_tokens": int(os.getenv("MEMRADER_MAX_TOKENS", "5000")),
+                "top_p": 0.95,
+                "top_k": 20,
+                "api_key": os.getenv("MEMRADER_API_KEY", "EMPTY"),
+                "api_base": os.getenv("MEMRADER_API_BASE"),
+                "remove_think_prefix": True,
+                "extra_body": {"chat_template_kwargs": {"enable_thinking": False}},
+            },
+        }
+
     @staticmethod
     def get_activation_vllm_config() -> dict[str, Any]:
         """Get Ollama configuration."""
@@ -351,10 +369,7 @@ def get_product_default_config() -> dict[str, Any]:
             "mem_reader": {
                 "backend": "simple_struct",
                 "config": {
-                    "llm": {
-                        "backend": "openai",
-                        "config": openai_config,
-                    },
+                    "llm": APIConfig.get_memreader_config(),
                     "embedder": APIConfig.get_embedder_config(),
                     "chunker": {
                         "backend": "sentence",
@@ -447,10 +462,7 @@ def create_user_config(user_name: str, user_id: str) -> tuple[MOSConfig, General
             "mem_reader": {
                 "backend": "simple_struct",
                 "config": {
-                    "llm": {
-                        "backend": "openai",
-                        "config": openai_config,
-                    },
+                    "llm": APIConfig.get_memreader_config(),
                     "embedder": APIConfig.get_embedder_config(),
                     "chunker": {
                         "backend": "sentence",
diff --git a/src/memos/api/product_api.py b/src/memos/api/product_api.py
index 681644a0d..709ad74fb 100644
--- a/src/memos/api/product_api.py
+++ b/src/memos/api/product_api.py
@@ -33,6 +33,6 @@
 
     parser = argparse.ArgumentParser()
     parser.add_argument("--port", type=int, default=8001)
-    parser.add_argument("--workers", type=int, default=32)
+    parser.add_argument("--workers", type=int, default=1)
     args = parser.parse_args()
     uvicorn.run("memos.api.product_api:app", host="0.0.0.0", port=args.port, workers=args.workers)
diff --git a/src/memos/api/product_models.py b/src/memos/api/product_models.py
index 2d03d2946..86751b008 100644
--- a/src/memos/api/product_models.py
+++ b/src/memos/api/product_models.py
@@ -5,7 +5,7 @@
 from pydantic import BaseModel, Field
 
 # Import message types from core types module
-from memos.types import MessageDict
+from memos.types import MessageDict, PermissionDict
 
 
 T = TypeVar("T")
@@ -164,6 +164,56 @@ class SearchRequest(BaseRequest):
     session_id: str | None = Field(None, description="Session ID for soft-filtering memories")
 
 
+class APISearchRequest(BaseRequest):
+    """Request model for searching memories."""
+
+    query: str = Field(..., description="Search query")
+    user_id: str = Field(None, description="User ID")
+    mem_cube_id: str | None = Field(None, description="Cube ID to search in")
+    mode: str = Field("fast", description="search mode fast or fine")
+    internet_search: bool = Field(False, description="Whether to use internet search")
+    moscube: bool = Field(False, description="Whether to use MemOSCube")
+    top_k: int = Field(10, description="Number of results to return")
+    chat_history: list[MessageDict] | None = Field(None, description="Chat history")
+    session_id: str | None = Field(None, description="Session ID for soft-filtering memories")
+    operation: list[PermissionDict] | None = Field(
+        None, description="operation ids for multi cubes"
+    )
+
+
+class APIADDRequest(BaseRequest):
+    """Request model for creating memories."""
+
+    user_id: str = Field(None, description="User ID")
+    mem_cube_id: str = Field(..., description="Cube ID")
+    messages: list[MessageDict] | None = Field(None, description="List of messages to store.")
+    memory_content: str | None = Field(None, description="Memory content to store")
+    doc_path: str | None = Field(None, description="Path to document to store")
+    source: str | None = Field(None, description="Source of the memory")
+    chat_history: list[MessageDict] | None = Field(None, description="Chat history")
+    session_id: str | None = Field(None, description="Session id")
+    operation: list[PermissionDict] | None = Field(
+        None, description="operation ids for multi cubes"
+    )
+
+
+class APIChatCompleteRequest(BaseRequest):
+    """Request model for chat operations."""
+
+    user_id: str = Field(..., description="User ID")
+    query: str = Field(..., description="Chat query message")
+    mem_cube_id: str | None = Field(None, description="Cube ID to use for chat")
+    history: list[MessageDict] | None = Field(None, description="Chat history")
+    internet_search: bool = Field(False, description="Whether to use internet search")
+    moscube: bool = Field(True, description="Whether to use MemOSCube")
+    base_prompt: str | None = Field(None, description="Base prompt to use for chat")
+    top_k: int = Field(10, description="Number of results to return")
+    threshold: float = Field(0.5, description="Threshold for filtering references")
+    session_id: str | None = Field(
+        "default_session", description="Session ID for soft-filtering memories"
+    )
+
+
 class SuggestionRequest(BaseRequest):
     """Request model for getting suggestion queries."""
 
diff --git a/src/memos/api/routers/server_router.py b/src/memos/api/routers/server_router.py
new file mode 100644
index 000000000..a332de583
--- /dev/null
+++ b/src/memos/api/routers/server_router.py
@@ -0,0 +1,324 @@
+import os
+import traceback
+
+from typing import Any
+
+from fastapi import APIRouter, HTTPException
+
+from memos.api.config import APIConfig
+from memos.api.product_models import (
+    APIADDRequest,
+    APIChatCompleteRequest,
+    APISearchRequest,
+    MemoryResponse,
+    SearchResponse,
+)
+from memos.configs.embedder import EmbedderConfigFactory
+from memos.configs.graph_db import GraphDBConfigFactory
+from memos.configs.internet_retriever import InternetRetrieverConfigFactory
+from memos.configs.llm import LLMConfigFactory
+from memos.configs.mem_reader import MemReaderConfigFactory
+from memos.configs.reranker import RerankerConfigFactory
+from memos.embedders.factory import EmbedderFactory
+from memos.graph_dbs.factory import GraphStoreFactory
+from memos.llms.factory import LLMFactory
+from memos.log import get_logger
+from memos.mem_cube.navie import NaiveMemCube
+from memos.mem_os.product_server import MOSServer
+from memos.mem_reader.factory import MemReaderFactory
+from memos.memories.textual.tree_text_memory.organize.manager import MemoryManager
+from memos.memories.textual.tree_text_memory.retrieve.internet_retriever_factory import (
+    InternetRetrieverFactory,
+)
+from memos.reranker.factory import RerankerFactory
+from memos.types import MOSSearchResult, UserContext
+
+
+logger = get_logger(__name__)
+
+router = APIRouter(prefix="/product", tags=["Server API"])
+
+
+def _build_graph_db_config(user_id: str = "default") -> dict[str, Any]:
+    """Build graph database configuration."""
+    graph_db_backend_map = {
+        "neo4j-community": APIConfig.get_neo4j_community_config(user_id=user_id),
+        "neo4j": APIConfig.get_neo4j_config(user_id=user_id),
+        "nebular": APIConfig.get_nebular_config(user_id=user_id),
+    }
+
+    graph_db_backend = os.getenv("NEO4J_BACKEND", "nebular").lower()
+    return GraphDBConfigFactory.model_validate(
+        {
+            "backend": graph_db_backend,
+            "config": graph_db_backend_map[graph_db_backend],
+        }
+    )
+
+
+def _build_llm_config() -> dict[str, Any]:
+    """Build LLM configuration."""
+    return LLMConfigFactory.model_validate(
+        {
+            "backend": "openai",
+            "config": APIConfig.get_openai_config(),
+        }
+    )
+
+
+def _build_embedder_config() -> dict[str, Any]:
+    """Build embedder configuration."""
+    return EmbedderConfigFactory.model_validate(APIConfig.get_embedder_config())
+
+
+def _build_mem_reader_config() -> dict[str, Any]:
+    """Build memory reader configuration."""
+    return MemReaderConfigFactory.model_validate(
+        APIConfig.get_product_default_config()["mem_reader"]
+    )
+
+
+def _build_reranker_config() -> dict[str, Any]:
+    """Build reranker configuration."""
+    return RerankerConfigFactory.model_validate(APIConfig.get_reranker_config())
+
+
+def _build_internet_retriever_config() -> dict[str, Any]:
+    """Build internet retriever configuration."""
+    return InternetRetrieverConfigFactory.model_validate(APIConfig.get_internet_config())
+
+
+def _get_default_memory_size(cube_config) -> dict[str, int]:
+    """Get default memory size configuration."""
+    return getattr(cube_config.text_mem.config, "memory_size", None) or {
+        "WorkingMemory": 20,
+        "LongTermMemory": 1500,
+        "UserMemory": 480,
+    }
+
+
+def init_server():
+    """Initialize server components and configurations."""
+    # Get default cube configuration
+    default_cube_config = APIConfig.get_default_cube_config()
+
+    # Build component configurations
+    graph_db_config = _build_graph_db_config()
+    print(graph_db_config)
+    llm_config = _build_llm_config()
+    embedder_config = _build_embedder_config()
+    mem_reader_config = _build_mem_reader_config()
+    reranker_config = _build_reranker_config()
+    internet_retriever_config = _build_internet_retriever_config()
+
+    # Create component instances
+    graph_db = GraphStoreFactory.from_config(graph_db_config)
+    llm = LLMFactory.from_config(llm_config)
+    embedder = EmbedderFactory.from_config(embedder_config)
+    mem_reader = MemReaderFactory.from_config(mem_reader_config)
+    reranker = RerankerFactory.from_config(reranker_config)
+    internet_retriever = InternetRetrieverFactory.from_config(
+        internet_retriever_config, embedder=embedder
+    )
+
+    # Initialize memory manager
+    memory_manager = MemoryManager(
+        graph_db,
+        embedder,
+        llm,
+        memory_size=_get_default_memory_size(default_cube_config),
+        is_reorganize=getattr(default_cube_config.text_mem.config, "reorganize", False),
+    )
+    mos_server = MOSServer(
+        mem_reader=mem_reader,
+        llm=llm,
+        online_bot=False,
+    )
+    return (
+        graph_db,
+        mem_reader,
+        llm,
+        embedder,
+        reranker,
+        internet_retriever,
+        memory_manager,
+        default_cube_config,
+        mos_server,
+    )
+
+
+# Initialize global components
+(
+    graph_db,
+    mem_reader,
+    llm,
+    embedder,
+    reranker,
+    internet_retriever,
+    memory_manager,
+    default_cube_config,
+    mos_server,
+) = init_server()
+
+
+def _create_naive_mem_cube() -> NaiveMemCube:
+    """Create a NaiveMemCube instance with initialized components."""
+    naive_mem_cube = NaiveMemCube(
+        llm=llm,
+        embedder=embedder,
+        mem_reader=mem_reader,
+        graph_db=graph_db,
+        reranker=reranker,
+        internet_retriever=internet_retriever,
+        memory_manager=memory_manager,
+        default_cube_config=default_cube_config,
+    )
+    return naive_mem_cube
+
+
+def _format_memory_item(memory_data: Any) -> dict[str, Any]:
+    """Format a single memory item for API response."""
+    memory = memory_data.model_dump()
+    memory_id = memory["id"]
+    ref_id = f"[{memory_id.split('-')[0]}]"
+
+    memory["ref_id"] = ref_id
+    memory["metadata"]["embedding"] = []
+    memory["metadata"]["sources"] = []
+    memory["metadata"]["ref_id"] = ref_id
+    memory["metadata"]["id"] = memory_id
+    memory["metadata"]["memory"] = memory["memory"]
+
+    return memory
+
+
+@router.post("/search", summary="Search memories", response_model=SearchResponse)
+def search_memories(search_req: APISearchRequest):
+    """Search memories for a specific user."""
+    # Create UserContext object - how to assign values
+    user_context = UserContext(
+        user_id=search_req.user_id,
+        mem_cube_id=search_req.mem_cube_id,
+        session_id=search_req.session_id or "default_session",
+    )
+    logger.info(f"Search user_id is: {user_context.mem_cube_id}")
+    memories_result: MOSSearchResult = {
+        "text_mem": [],
+        "act_mem": [],
+        "para_mem": [],
+    }
+    target_session_id = search_req.session_id
+    if not target_session_id:
+        target_session_id = "default_session"
+    search_filter = {"session_id": search_req.session_id} if search_req.session_id else None
+
+    # Create MemCube and perform search
+    naive_mem_cube = _create_naive_mem_cube()
+    search_results = naive_mem_cube.text_mem.search(
+        query=search_req.query,
+        user_name=user_context.mem_cube_id,
+        top_k=search_req.top_k,
+        mode=search_req.mode,
+        manual_close_internet=not search_req.internet_search,
+        moscube=search_req.moscube,
+        search_filter=search_filter,
+        info={
+            "user_id": search_req.user_id,
+            "session_id": target_session_id,
+            "chat_history": search_req.chat_history,
+        },
+    )
+    formatted_memories = [_format_memory_item(data) for data in search_results]
+
+    memories_result["text_mem"].append(
+        {
+            "cube_id": search_req.mem_cube_id,
+            "memories": formatted_memories,
+        }
+    )
+
+    return SearchResponse(
+        message="Search completed successfully",
+        data=memories_result,
+    )
+
+
+@router.post("/add", summary="Add memories", response_model=MemoryResponse)
+def add_memories(add_req: APIADDRequest):
+    """Add memories for a specific user."""
+    # Create UserContext object - how to assign values
+    user_context = UserContext(
+        user_id=add_req.user_id,
+        mem_cube_id=add_req.mem_cube_id,
+        session_id=add_req.session_id or "default_session",
+    )
+    naive_mem_cube = _create_naive_mem_cube()
+    target_session_id = add_req.session_id
+    if not target_session_id:
+        target_session_id = "default_session"
+    memories = mem_reader.get_memory(
+        [add_req.messages],
+        type="chat",
+        info={
+            "user_id": add_req.user_id,
+            "session_id": target_session_id,
+        },
+    )
+
+    # Flatten memory list
+    flattened_memories = [mm for m in memories for mm in m]
+    logger.info(f"Memory extraction completed for user {add_req.user_id}")
+    mem_id_list: list[str] = naive_mem_cube.text_mem.add(
+        flattened_memories,
+        user_name=user_context.mem_cube_id,
+    )
+
+    logger.info(
+        f"Added {len(mem_id_list)} memories for user {add_req.user_id} "
+        f"in session {add_req.session_id}: {mem_id_list}"
+    )
+    response_data = [
+        {
+            "memory": memory.memory,
+            "memory_id": memory_id,
+            "memory_type": memory.metadata.memory_type,
+        }
+        for memory_id, memory in zip(mem_id_list, flattened_memories, strict=False)
+    ]
+    return MemoryResponse(
+        message="Memory added successfully",
+        data=response_data,
+    )
+
+
+@router.post("/chat/complete", summary="Chat with MemOS (Complete Response)")
+def chat_complete(chat_req: APIChatCompleteRequest):
+    """Chat with MemOS for a specific user. Returns complete response (non-streaming)."""
+    try:
+        # Collect all responses from the generator
+        naive_mem_cube = _create_naive_mem_cube()
+        content, references = mos_server.chat(
+            query=chat_req.query,
+            user_id=chat_req.user_id,
+            cube_id=chat_req.mem_cube_id,
+            mem_cube=naive_mem_cube,
+            history=chat_req.history,
+            internet_search=chat_req.internet_search,
+            moscube=chat_req.moscube,
+            base_prompt=chat_req.base_prompt,
+            top_k=chat_req.top_k,
+            threshold=chat_req.threshold,
+            session_id=chat_req.session_id,
+        )
+
+        # Return the complete response
+        return {
+            "message": "Chat completed successfully",
+            "data": {"response": content, "references": references},
+        }
+
+    except ValueError as err:
+        raise HTTPException(status_code=404, detail=str(traceback.format_exc())) from err
+    except Exception as err:
+        logger.error(f"Failed to start chat: {traceback.format_exc()}")
+        raise HTTPException(status_code=500, detail=str(traceback.format_exc())) from err
diff --git a/src/memos/api/server_api.py b/src/memos/api/server_api.py
new file mode 100644
index 000000000..78e05ef85
--- /dev/null
+++ b/src/memos/api/server_api.py
@@ -0,0 +1,38 @@
+import logging
+
+from fastapi import FastAPI
+
+from memos.api.exceptions import APIExceptionHandler
+from memos.api.middleware.request_context import RequestContextMiddleware
+from memos.api.routers.server_router import router as server_router
+
+
+# Configure logging
+logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")
+logger = logging.getLogger(__name__)
+
+app = FastAPI(
+    title="MemOS Product REST APIs",
+    description="A REST API for managing multiple users with MemOS Product.",
+    version="1.0.1",
+)
+
+app.add_middleware(RequestContextMiddleware)
+# Include routers
+app.include_router(server_router)
+
+# Exception handlers
+app.exception_handler(ValueError)(APIExceptionHandler.value_error_handler)
+app.exception_handler(Exception)(APIExceptionHandler.global_exception_handler)
+
+
+if __name__ == "__main__":
+    import argparse
+
+    import uvicorn
+
+    parser = argparse.ArgumentParser()
+    parser.add_argument("--port", type=int, default=8001)
+    parser.add_argument("--workers", type=int, default=1)
+    args = parser.parse_args()
+    uvicorn.run("memos.api.server_api:app", host="0.0.0.0", port=args.port, workers=args.workers)
diff --git a/src/memos/configs/mem_scheduler.py b/src/memos/configs/mem_scheduler.py
index a36f3e2f8..39586081c 100644
--- a/src/memos/configs/mem_scheduler.py
+++ b/src/memos/configs/mem_scheduler.py
@@ -1,3 +1,4 @@
+import logging
 import os
 
 from pathlib import Path
@@ -11,7 +12,7 @@
     BASE_DIR,
     DEFAULT_ACT_MEM_DUMP_PATH,
     DEFAULT_CONSUME_INTERVAL_SECONDS,
-    DEFAULT_THREAD__POOL_MAX_WORKERS,
+    DEFAULT_THREAD_POOL_MAX_WORKERS,
 )
 
 
@@ -25,12 +26,12 @@ class BaseSchedulerConfig(BaseConfig):
         default=True, description="Whether to enable parallel message processing using thread pool"
     )
     thread_pool_max_workers: int = Field(
-        default=DEFAULT_THREAD__POOL_MAX_WORKERS,
+        default=DEFAULT_THREAD_POOL_MAX_WORKERS,
         gt=1,
         lt=20,
-        description=f"Maximum worker threads in pool (default: {DEFAULT_THREAD__POOL_MAX_WORKERS})",
+        description=f"Maximum worker threads in pool (default: {DEFAULT_THREAD_POOL_MAX_WORKERS})",
     )
-    consume_interval_seconds: int = Field(
+    consume_interval_seconds: float = Field(
         default=DEFAULT_CONSUME_INTERVAL_SECONDS,
         gt=0,
         le=60,
@@ -135,7 +136,7 @@ class GraphDBAuthConfig(BaseConfig, DictConversionMixin, EnvConfigMixin):
     password: str = Field(
         default="",
         description="Password for graph database authentication",
-        min_length=8,  # 建议密码最小长度
+        min_length=8,  # Recommended minimum password length
     )
     db_name: str = Field(default="neo4j", description="Database name to connect to")
     auto_create: bool = Field(
@@ -150,13 +151,51 @@ class OpenAIConfig(BaseConfig, DictConversionMixin, EnvConfigMixin):
 
 
 class AuthConfig(BaseConfig, DictConversionMixin):
-    rabbitmq: RabbitMQConfig
-    openai: OpenAIConfig
-    graph_db: GraphDBAuthConfig
+    rabbitmq: RabbitMQConfig | None = None
+    openai: OpenAIConfig | None = None
+    graph_db: GraphDBAuthConfig | None = None
     default_config_path: ClassVar[str] = (
         f"{BASE_DIR}/examples/data/config/mem_scheduler/scheduler_auth.yaml"
     )
 
+    @model_validator(mode="after")
+    def validate_partial_initialization(self) -> "AuthConfig":
+        """
+        Validate that at least one configuration component is successfully initialized.
+        Log warnings for any failed initializations but allow partial success.
+        """
+        logger = logging.getLogger(__name__)
+
+        initialized_components = []
+        failed_components = []
+
+        if self.rabbitmq is not None:
+            initialized_components.append("rabbitmq")
+        else:
+            failed_components.append("rabbitmq")
+
+        if self.openai is not None:
+            initialized_components.append("openai")
+        else:
+            failed_components.append("openai")
+
+        if self.graph_db is not None:
+            initialized_components.append("graph_db")
+        else:
+            failed_components.append("graph_db")
+
+        # Allow all components to be None for flexibility, but log a warning
+        if not initialized_components:
+            logger.warning(
+                "All configuration components are None. This may indicate missing environment variables or configuration files."
+            )
+        elif failed_components:
+            logger.warning(
+                f"Failed to initialize components: {', '.join(failed_components)}. Successfully initialized: {', '.join(initialized_components)}"
+            )
+
+        return self
+
     @classmethod
     def from_local_config(cls, config_path: str | Path | None = None) -> "AuthConfig":
         """
@@ -205,24 +244,75 @@ def from_local_env(cls) -> "AuthConfig":
 
         This method loads configuration for all nested components (RabbitMQ, OpenAI, GraphDB)
         from their respective environment variables using each component's specific prefix.
+        If any component fails to initialize, it will be set to None and a warning will be logged.
 
         Returns:
             AuthConfig: Configured instance with values from environment variables
 
         Raises:
-            ValueError: If any required environment variables are missing
+            ValueError: If all components fail to initialize
         """
+        logger = logging.getLogger(__name__)
+
+        rabbitmq_config = None
+        openai_config = None
+        graph_db_config = None
+
+        # Try to initialize RabbitMQ config - check if any RabbitMQ env vars exist
+        try:
+            rabbitmq_prefix = RabbitMQConfig.get_env_prefix()
+            has_rabbitmq_env = any(key.startswith(rabbitmq_prefix) for key in os.environ)
+            if has_rabbitmq_env:
+                rabbitmq_config = RabbitMQConfig.from_env()
+                logger.info("Successfully initialized RabbitMQ configuration")
+            else:
+                logger.info(
+                    "No RabbitMQ environment variables found, skipping RabbitMQ initialization"
+                )
+        except (ValueError, Exception) as e:
+            logger.warning(f"Failed to initialize RabbitMQ config from environment: {e}")
+
+        # Try to initialize OpenAI config - check if any OpenAI env vars exist
+        try:
+            openai_prefix = OpenAIConfig.get_env_prefix()
+            has_openai_env = any(key.startswith(openai_prefix) for key in os.environ)
+            if has_openai_env:
+                openai_config = OpenAIConfig.from_env()
+                logger.info("Successfully initialized OpenAI configuration")
+            else:
+                logger.info("No OpenAI environment variables found, skipping OpenAI initialization")
+        except (ValueError, Exception) as e:
+            logger.warning(f"Failed to initialize OpenAI config from environment: {e}")
+
+        # Try to initialize GraphDB config - check if any GraphDB env vars exist
+        try:
+            graphdb_prefix = GraphDBAuthConfig.get_env_prefix()
+            has_graphdb_env = any(key.startswith(graphdb_prefix) for key in os.environ)
+            if has_graphdb_env:
+                graph_db_config = GraphDBAuthConfig.from_env()
+                logger.info("Successfully initialized GraphDB configuration")
+            else:
+                logger.info(
+                    "No GraphDB environment variables found, skipping GraphDB initialization"
+                )
+        except (ValueError, Exception) as e:
+            logger.warning(f"Failed to initialize GraphDB config from environment: {e}")
+
         return cls(
-            rabbitmq=RabbitMQConfig.from_env(),
-            openai=OpenAIConfig.from_env(),
-            graph_db=GraphDBAuthConfig.from_env(),
+            rabbitmq=rabbitmq_config,
+            openai=openai_config,
+            graph_db=graph_db_config,
         )
 
     def set_openai_config_to_environment(self):
-        # Set environment variables
-        os.environ["OPENAI_API_KEY"] = self.openai.api_key
-        os.environ["OPENAI_BASE_URL"] = self.openai.base_url
-        os.environ["MODEL"] = self.openai.default_model
+        # Set environment variables only if openai config is available
+        if self.openai is not None:
+            os.environ["OPENAI_API_KEY"] = self.openai.api_key
+            os.environ["OPENAI_BASE_URL"] = self.openai.base_url
+            os.environ["MODEL"] = self.openai.default_model
+        else:
+            logger = logging.getLogger(__name__)
+            logger.warning("OpenAI config is not available, skipping environment variable setup")
 
     @classmethod
     def default_config_exists(cls) -> bool:
diff --git a/src/memos/configs/mem_user.py b/src/memos/configs/mem_user.py
index 3ff1066e5..6e1ca4206 100644
--- a/src/memos/configs/mem_user.py
+++ b/src/memos/configs/mem_user.py
@@ -31,6 +31,17 @@ class MySQLUserManagerConfig(BaseUserManagerConfig):
     charset: str = Field(default="utf8mb4", description="MySQL charset")
 
 
+class RedisUserManagerConfig(BaseUserManagerConfig):
+    """Redis user manager configuration."""
+
+    host: str = Field(default="localhost", description="Redis server host")
+    port: int = Field(default=6379, description="Redis server port")
+    username: str = Field(default="root", description="Redis username")
+    password: str = Field(default="", description="Redis password")
+    database: str = Field(default="memos_users", description="Redis database name")
+    charset: str = Field(default="utf8mb4", description="Redis charset")
+
+
 class UserManagerConfigFactory(BaseModel):
     """Factory for user manager configurations."""
 
@@ -42,6 +53,7 @@ class UserManagerConfigFactory(BaseModel):
     backend_to_class: ClassVar[dict[str, Any]] = {
         "sqlite": SQLiteUserManagerConfig,
         "mysql": MySQLUserManagerConfig,
+        "redis": RedisUserManagerConfig,
     }
 
     @field_validator("backend")
diff --git a/src/memos/configs/memory.py b/src/memos/configs/memory.py
index 1eea6deaf..237450e15 100644
--- a/src/memos/configs/memory.py
+++ b/src/memos/configs/memory.py
@@ -180,6 +180,10 @@ class TreeTextMemoryConfig(BaseTextMemoryConfig):
     )
 
 
+class SimpleTreeTextMemoryConfig(TreeTextMemoryConfig):
+    """Simple tree text memory configuration class."""
+
+
 # ─── 3. Global Memory Config Factory ──────────────────────────────────────────
 
 
@@ -192,6 +196,7 @@ class MemoryConfigFactory(BaseConfig):
     backend_to_class: ClassVar[dict[str, Any]] = {
         "naive_text": NaiveTextMemoryConfig,
         "general_text": GeneralTextMemoryConfig,
+        "simple_tree_text": SimpleTreeTextMemoryConfig,
         "tree_text": TreeTextMemoryConfig,
         "kv_cache": KVCacheMemoryConfig,
         "vllm_kv_cache": KVCacheMemoryConfig,  # Use same config as kv_cache
diff --git a/src/memos/configs/vec_db.py b/src/memos/configs/vec_db.py
index b43298d9b..dd1748714 100644
--- a/src/memos/configs/vec_db.py
+++ b/src/memos/configs/vec_db.py
@@ -39,6 +39,18 @@ def set_default_path(self):
         return self
 
 
+class MilvusVecDBConfig(BaseVecDBConfig):
+    """Configuration for Milvus vector database."""
+
+    uri: str = Field(..., description="URI for Milvus connection")
+    collection_name: list[str] = Field(..., description="Name(s) of the collection(s)")
+    max_length: int = Field(
+        default=65535, description="Maximum length for string fields (varChar type)"
+    )
+    user_name: str = Field(default="", description="User name for Milvus connection")
+    password: str = Field(default="", description="Password for Milvus connection")
+
+
 class VectorDBConfigFactory(BaseConfig):
     """Factory class for creating vector database configurations."""
 
@@ -47,6 +59,7 @@ class VectorDBConfigFactory(BaseConfig):
 
     backend_to_class: ClassVar[dict[str, Any]] = {
         "qdrant": QdrantVecDBConfig,
+        "milvus": MilvusVecDBConfig,
     }
 
     @field_validator("backend")
diff --git a/src/memos/graph_dbs/nebular.py b/src/memos/graph_dbs/nebular.py
index 38f08ff8d..f609b9ff6 100644
--- a/src/memos/graph_dbs/nebular.py
+++ b/src/memos/graph_dbs/nebular.py
@@ -129,7 +129,6 @@ def _make_client_key(cfg: NebulaGraphDBConfig) -> str:
                 "nebula-sync",
                 ",".join(hosts),
                 str(getattr(cfg, "user", "")),
-                str(getattr(cfg, "use_multi_db", False)),
                 str(getattr(cfg, "space", "")),
             ]
         )
@@ -139,7 +138,7 @@ def _bootstrap_admin(cls, cfg: NebulaGraphDBConfig, client: "NebulaClient") -> "
         tmp = object.__new__(NebulaGraphDB)
         tmp.config = cfg
         tmp.db_name = cfg.space
-        tmp.user_name = getattr(cfg, "user_name", None)
+        tmp.user_name = None
         tmp.embedding_dimension = getattr(cfg, "embedding_dimension", 3072)
         tmp.default_memory_dimension = 3072
         tmp.common_fields = {
@@ -431,7 +430,9 @@ def create_index(
         self._create_basic_property_indexes()
 
     @timed
-    def remove_oldest_memory(self, memory_type: str, keep_latest: int) -> None:
+    def remove_oldest_memory(
+        self, memory_type: str, keep_latest: int, user_name: str | None = None
+    ) -> None:
         """
         Remove all WorkingMemory nodes except the latest `keep_latest` entries.
 
@@ -439,30 +440,29 @@ def remove_oldest_memory(self, memory_type: str, keep_latest: int) -> None:
             memory_type (str): Memory type (e.g., 'WorkingMemory', 'LongTermMemory').
             keep_latest (int): Number of latest WorkingMemory entries to keep.
         """
-        optional_condition = f"AND n.user_name = '{self.config.user_name}'"
+        optional_condition = ""
 
-        try:
-            count = self.count_nodes(memory_type)
-            if count > keep_latest:
-                delete_query = f"""
-                    MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
-                    WHERE n.memory_type = '{memory_type}'
-                    {optional_condition}
-                    ORDER BY n.updated_at DESC
-                    OFFSET {keep_latest}
-                    DETACH DELETE n
-                """
-                self.execute_query(delete_query)
-        except Exception as e:
-            logger.warning(f"Delete old mem error: {e}")
+        user_name = user_name if user_name else self.config.user_name
+
+        optional_condition = f"AND n.user_name = '{user_name}'"
+        query = f"""
+            MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
+            WHERE n.memory_type = '{memory_type}'
+            {optional_condition}
+            ORDER BY n.updated_at DESC
+            OFFSET {int(keep_latest)}
+            DETACH DELETE n
+        """
+        self.execute_query(query)
 
     @timed
-    def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
+    def add_node(
+        self, id: str, memory: str, metadata: dict[str, Any], user_name: str | None = None
+    ) -> None:
         """
         Insert or update a Memory node in NebulaGraph.
         """
-        metadata["user_name"] = self.config.user_name
-
+        metadata["user_name"] = user_name if user_name else self.config.user_name
         now = datetime.utcnow()
         metadata = metadata.copy()
         metadata.setdefault("created_at", now)
@@ -491,8 +491,9 @@ def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
             )
 
     @timed
-    def node_not_exist(self, scope: str) -> int:
-        filter_clause = f'n.memory_type = "{scope}" AND n.user_name = "{self.config.user_name}"'
+    def node_not_exist(self, scope: str, user_name: str | None = None) -> int:
+        user_name = user_name if user_name else self.config.user_name
+        filter_clause = f'n.memory_type = "{scope}" AND n.user_name = "{user_name}"'
         query = f"""
         MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
         WHERE {filter_clause}
@@ -508,10 +509,11 @@ def node_not_exist(self, scope: str) -> int:
             raise
 
     @timed
-    def update_node(self, id: str, fields: dict[str, Any]) -> None:
+    def update_node(self, id: str, fields: dict[str, Any], user_name: str | None = None) -> None:
         """
         Update node fields in Nebular, auto-converting `created_at` and `updated_at` to datetime type if present.
         """
+        user_name = user_name if user_name else self.config.user_name
         fields = fields.copy()
         set_clauses = []
         for k, v in fields.items():
@@ -522,41 +524,41 @@ def update_node(self, id: str, fields: dict[str, Any]) -> None:
         query = f"""
             MATCH (n@Memory {{id: "{id}"}})
             """
-
-        query += f'WHERE n.user_name = "{self.config.user_name}"'
+        query += f'WHERE n.user_name = "{user_name}"'
 
         query += f"\nSET {set_clause_str}"
         self.execute_query(query)
 
     @timed
-    def delete_node(self, id: str) -> None:
+    def delete_node(self, id: str, user_name: str | None = None) -> None:
         """
         Delete a node from the graph.
         Args:
             id: Node identifier to delete.
+            user_name (str, optional): User name for filtering in non-multi-db mode
         """
+        user_name = user_name if user_name else self.config.user_name
         query = f"""
-            MATCH (n@Memory {{id: "{id}"}})
+            MATCH (n@Memory {{id: "{id}"}}) WHERE n.user_name = {self._format_value(user_name)}
+            DETACH DELETE n
             """
-        user_name = self.config.user_name
-        query += f" WHERE n.user_name = {self._format_value(user_name)}"
-        query += "\n DETACH DELETE n"
         self.execute_query(query)
 
     @timed
-    def add_edge(self, source_id: str, target_id: str, type: str):
+    def add_edge(self, source_id: str, target_id: str, type: str, user_name: str | None = None):
         """
         Create an edge from source node to target node.
         Args:
             source_id: ID of the source node.
             target_id: ID of the target node.
             type: Relationship type (e.g., 'RELATE_TO', 'PARENT').
+            user_name (str, optional): User name for filtering in non-multi-db mode
         """
         if not source_id or not target_id:
             raise ValueError("[add_edge] source_id and target_id must be provided")
-
-        props = f'{{user_name: "{self.config.user_name}"}}'
-
+        user_name = user_name if user_name else self.config.user_name
+        props = ""
+        props = f'{{user_name: "{user_name}"}}'
         insert_stmt = f'''
                MATCH (a@Memory {{id: "{source_id}"}}), (b@Memory {{id: "{target_id}"}})
                INSERT (a) -[e@{type} {props}]-> (b)
@@ -567,32 +569,34 @@ def add_edge(self, source_id: str, target_id: str, type: str):
             logger.error(f"Failed to insert edge: {e}", exc_info=True)
 
     @timed
-    def delete_edge(self, source_id: str, target_id: str, type: str) -> None:
+    def delete_edge(
+        self, source_id: str, target_id: str, type: str, user_name: str | None = None
+    ) -> None:
         """
         Delete a specific edge between two nodes.
         Args:
             source_id: ID of the source node.
             target_id: ID of the target node.
             type: Relationship type to remove.
+            user_name (str, optional): User name for filtering in non-multi-db mode
         """
+        user_name = user_name if user_name else self.config.user_name
         query = f"""
                    MATCH (a@Memory) -[r@{type}]-> (b@Memory)
                    WHERE a.id = {self._format_value(source_id)} AND b.id = {self._format_value(target_id)}
                """
 
-        user_name = self.config.user_name
         query += f" AND a.user_name = {self._format_value(user_name)} AND b.user_name = {self._format_value(user_name)}"
-
         query += "\nDELETE r"
         self.execute_query(query)
 
     @timed
-    def get_memory_count(self, memory_type: str) -> int:
+    def get_memory_count(self, memory_type: str, user_name: str | None = None) -> int:
+        user_name = user_name if user_name else self.config.user_name
         query = f"""
                 MATCH (n@Memory)
                 WHERE n.memory_type = "{memory_type}"
                 """
-        user_name = self.config.user_name
         query += f"\nAND n.user_name = '{user_name}'"
         query += "\nRETURN COUNT(n) AS count"
 
@@ -604,18 +608,13 @@ def get_memory_count(self, memory_type: str) -> int:
             return -1
 
     @timed
-    def count_nodes(self, scope: str | None = None) -> int:
-        query = "MATCH (n@Memory)"
-        conditions = []
-
-        if scope:
-            conditions.append(f'n.memory_type = "{scope}"')
-        user_name = self.config.user_name
-        conditions.append(f"n.user_name = '{user_name}'")
-
-        if conditions:
-            query += "\nWHERE " + " AND ".join(conditions)
-
+    def count_nodes(self, scope: str, user_name: str | None = None) -> int:
+        user_name = user_name if user_name else self.config.user_name
+        query = f"""
+                MATCH (n@Memory)
+                WHERE n.memory_type = "{scope}"
+                """
+        query += f"\nAND n.user_name = '{user_name}'"
         query += "\nRETURN count(n) AS count"
 
         result = self.execute_query(query)
@@ -623,7 +622,12 @@ def count_nodes(self, scope: str | None = None) -> int:
 
     @timed
     def edge_exists(
-        self, source_id: str, target_id: str, type: str = "ANY", direction: str = "OUTGOING"
+        self,
+        source_id: str,
+        target_id: str,
+        type: str = "ANY",
+        direction: str = "OUTGOING",
+        user_name: str | None = None,
     ) -> bool:
         """
         Check if an edge exists between two nodes.
@@ -633,10 +637,12 @@ def edge_exists(
             type: Relationship type. Use "ANY" to match any relationship type.
             direction: Direction of the edge.
                        Use "OUTGOING" (default), "INCOMING", or "ANY".
+            user_name (str, optional): User name for filtering in non-multi-db mode
         Returns:
             True if the edge exists, otherwise False.
         """
         # Prepare the relationship pattern
+        user_name = user_name if user_name else self.config.user_name
         rel = "r" if type == "ANY" else f"r@{type}"
 
         # Prepare the match pattern with direction
@@ -651,7 +657,6 @@ def edge_exists(
                 f"Invalid direction: {direction}. Must be 'OUTGOING', 'INCOMING', or 'ANY'."
             )
         query = f"MATCH {pattern}"
-        user_name = self.config.user_name
         query += f"\nWHERE a.user_name = '{user_name}' AND b.user_name = '{user_name}'"
         query += "\nRETURN r"
 
@@ -664,19 +669,22 @@ def edge_exists(
 
     @timed
     # Graph Query & Reasoning
-    def get_node(self, id: str, include_embedding: bool = False) -> dict[str, Any] | None:
+    def get_node(
+        self, id: str, include_embedding: bool = False, user_name: str | None = None
+    ) -> dict[str, Any] | None:
         """
         Retrieve a Memory node by its unique ID.
 
         Args:
             id (str): Node ID (Memory.id)
             include_embedding: with/without embedding
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             dict: Node properties as key-value pairs, or None if not found.
         """
-        filter_clause = f'n.user_name = "{self.config.user_name}" AND n.id = "{id}"'
-
+        user_name = user_name if user_name else self.config.user_name
+        filter_clause = f'n.user_name = "{user_name}" AND n.id = "{id}"'
         return_fields = self._build_return_fields(include_embedding)
         gql = f"""
             MATCH (n@Memory)
@@ -699,13 +707,18 @@ def get_node(self, id: str, include_embedding: bool = False) -> dict[str, Any] |
 
     @timed
     def get_nodes(
-        self, ids: list[str], include_embedding: bool = False, **kwargs
+        self,
+        ids: list[str],
+        include_embedding: bool = False,
+        user_name: str | None = None,
+        **kwargs,
     ) -> list[dict[str, Any]]:
         """
         Retrieve the metadata and memory of a list of nodes.
         Args:
             ids: List of Node identifier.
             include_embedding: with/without embedding
+            user_name (str, optional): User name for filtering in non-multi-db mode
         Returns:
         list[dict]: Parsed node records containing 'id', 'memory', and 'metadata'.
 
@@ -716,17 +729,14 @@ def get_nodes(
         if not ids:
             return []
 
-        if kwargs.get("cube_name"):
-            where_user = f" AND n.user_name = '{kwargs['cube_name']}'"
-        else:
-            where_user = f" AND n.user_name = '{self.config.user_name}'"
-
+        user_name = user_name if user_name else self.config.user_name
+        where_user = f" AND n.user_name = '{user_name}'"
         # Safe formatting of the ID list
         id_list = ",".join(f'"{_id}"' for _id in ids)
 
         return_fields = self._build_return_fields(include_embedding)
         query = f"""
-            MATCH (n@Memory)
+            MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
             WHERE n.id IN [{id_list}] {where_user}
             RETURN {return_fields}
         """
@@ -743,7 +753,9 @@ def get_nodes(
         return nodes
 
     @timed
-    def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[dict[str, str]]:
+    def get_edges(
+        self, id: str, type: str = "ANY", direction: str = "ANY", user_name: str | None = None
+    ) -> list[dict[str, str]]:
         """
         Get edges connected to a node, with optional type and direction filter.
 
@@ -751,6 +763,7 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
             id: Node ID to retrieve edges for.
             type: Relationship type to match, or 'ANY' to match all.
             direction: 'OUTGOING', 'INCOMING', or 'ANY'.
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             List of edges:
@@ -761,7 +774,7 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
         """
         # Build relationship type filter
         rel_type = "" if type == "ANY" else f"@{type}"
-
+        user_name = user_name if user_name else self.config.user_name
         # Build Cypher pattern based on direction
         if direction == "OUTGOING":
             pattern = f"(a@Memory)-[r{rel_type}]->(b@Memory)"
@@ -775,7 +788,7 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
         else:
             raise ValueError("Invalid direction. Must be 'OUTGOING', 'INCOMING', or 'ANY'.")
 
-        where_clause += f" AND a.user_name = '{self.config.user_name}' AND b.user_name = '{self.config.user_name}'"
+        where_clause += f" AND a.user_name = '{user_name}' AND b.user_name = '{user_name}'"
 
         query = f"""
             MATCH {pattern}
@@ -803,6 +816,7 @@ def get_neighbors_by_tag(
         top_k: int = 5,
         min_overlap: int = 1,
         include_embedding: bool = False,
+        user_name: str | None = None,
     ) -> list[dict[str, Any]]:
         """
         Find top-K neighbor nodes with maximum tag overlap.
@@ -813,13 +827,14 @@ def get_neighbors_by_tag(
             top_k: Max number of neighbors to return.
             min_overlap: Minimum number of overlapping tags required.
             include_embedding: with/without embedding
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             List of dicts with node details and overlap count.
         """
         if not tags:
             return []
-
+        user_name = user_name if user_name else self.config.user_name
         where_clauses = [
             'n.status = "activated"',
             'NOT (n.node_type = "reasoning")',
@@ -828,7 +843,7 @@ def get_neighbors_by_tag(
         if exclude_ids:
             where_clauses.append(f"NOT (n.id IN {exclude_ids})")
 
-        where_clauses.append(f'n.user_name = "{self.config.user_name}"')
+        where_clauses.append(f'n.user_name = "{user_name}"')
 
         where_clause = " AND ".join(where_clauses)
         tag_list_literal = "[" + ", ".join(f'"{_escape_str(t)}"' for t in tags) + "]"
@@ -862,8 +877,10 @@ def get_neighbors_by_tag(
         return result
 
     @timed
-    def get_children_with_embeddings(self, id: str) -> list[dict[str, Any]]:
-        user_name = self.config.user_name
+    def get_children_with_embeddings(
+        self, id: str, user_name: str | None = None
+    ) -> list[dict[str, Any]]:
+        user_name = user_name if user_name else self.config.user_name
         where_user = f"AND p.user_name = '{user_name}' AND c.user_name = '{user_name}'"
 
         query = f"""
@@ -884,7 +901,11 @@ def get_children_with_embeddings(self, id: str) -> list[dict[str, Any]]:
 
     @timed
     def get_subgraph(
-        self, center_id: str, depth: int = 2, center_status: str = "activated"
+        self,
+        center_id: str,
+        depth: int = 2,
+        center_status: str = "activated",
+        user_name: str | None = None,
     ) -> dict[str, Any]:
         """
         Retrieve a local subgraph centered at a given node.
@@ -892,6 +913,7 @@ def get_subgraph(
             center_id: The ID of the center node.
             depth: The hop distance for neighbors.
             center_status: Required status for center node.
+            user_name (str, optional): User name for filtering in non-multi-db mode
         Returns:
             {
                 "core_node": {...},
@@ -902,7 +924,8 @@ def get_subgraph(
         if not 1 <= depth <= 5:
             raise ValueError("depth must be 1-5")
 
-        user_name = self.config.user_name
+        user_name = user_name if user_name else self.config.user_name
+
         gql = f"""
              MATCH (center@Memory)
             WHERE center.id = '{center_id}'
@@ -954,6 +977,7 @@ def search_by_embedding(
         status: str | None = None,
         threshold: float | None = None,
         search_filter: dict | None = None,
+        user_name: str | None = None,
         **kwargs,
     ) -> list[dict]:
         """
@@ -968,6 +992,7 @@ def search_by_embedding(
             threshold (float, optional): Minimum similarity score threshold (0 ~ 1).
             search_filter (dict, optional): Additional metadata filters for search results.
                             Keys should match node properties, values are the expected values.
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             list[dict]: A list of dicts with 'id' and 'score', ordered by similarity.
@@ -981,6 +1006,7 @@ def search_by_embedding(
             - Typical use case: restrict to 'status = activated' to avoid
             matching archived or merged nodes.
         """
+        user_name = user_name if user_name else self.config.user_name
         vector = _normalize(vector)
         dim = len(vector)
         vector_str = ",".join(f"{float(x)}" for x in vector)
@@ -990,28 +1016,25 @@ def search_by_embedding(
             where_clauses.append(f'n.memory_type = "{scope}"')
         if status:
             where_clauses.append(f'n.status = "{status}"')
-        if kwargs.get("cube_name"):
-            where_clauses.append(f'n.user_name = "{kwargs["cube_name"]}"')
-        else:
-            where_clauses.append(f'n.user_name = "{self.config.user_name}"')
+        where_clauses.append(f'n.user_name = "{user_name}"')
 
-            # Add search_filter conditions
-            if search_filter:
-                for key, value in search_filter.items():
-                    if isinstance(value, str):
-                        where_clauses.append(f'n.{key} = "{value}"')
-                    else:
-                        where_clauses.append(f"n.{key} = {value}")
+        # Add search_filter conditions
+        if search_filter:
+            for key, value in search_filter.items():
+                if isinstance(value, str):
+                    where_clauses.append(f'n.{key} = "{value}"')
+                else:
+                    where_clauses.append(f"n.{key} = {value}")
 
         where_clause = f"WHERE {' AND '.join(where_clauses)}" if where_clauses else ""
 
         gql = f"""
-               let a = {gql_vector}
-               MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
-               {where_clause}
-               ORDER BY inner_product(n.{self.dim_field}, a) DESC
-               LIMIT {top_k}
-               RETURN n.id AS id, inner_product(n.{self.dim_field}, a) AS score"""
+                   let a = {gql_vector}
+                   MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
+                   {where_clause}
+                   ORDER BY inner_product(n.{self.dim_field}, a) DESC
+                   LIMIT {top_k}
+                   RETURN n.id AS id, inner_product(n.{self.dim_field}, a) AS score"""
         try:
             result = self.execute_query(gql)
         except Exception as e:
@@ -1033,7 +1056,9 @@ def search_by_embedding(
             return []
 
     @timed
-    def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
+    def get_by_metadata(
+        self, filters: list[dict[str, Any]], user_name: str | None = None
+    ) -> list[str]:
         """
         1. ADD logic: "AND" vs "OR"(support logic combination);
         2. Support nested conditional expressions;
@@ -1049,6 +1074,7 @@ def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
                 {"field": "tags", "op": "contains", "value": "AI"},
                 ...
             ]
+        user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             list[str]: Node IDs whose metadata match the filter conditions. (AND logic).
@@ -1058,7 +1084,7 @@ def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
             - Can be used for faceted recall or prefiltering before embedding rerank.
         """
         where_clauses = []
-
+        user_name = user_name if user_name else self.config.user_name
         for _i, f in enumerate(filters):
             field = f["field"]
             op = f.get("op", "=")
@@ -1082,7 +1108,7 @@ def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
             else:
                 raise ValueError(f"Unsupported operator: {op}")
 
-        where_clauses.append(f'n.user_name = "{self.config.user_name}"')
+        where_clauses.append(f'n.user_name = "{user_name}"')
 
         where_str = " AND ".join(where_clauses)
         gql = f"MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */) WHERE {where_str} RETURN n.id AS id"
@@ -1100,6 +1126,7 @@ def get_grouped_counts(
         group_fields: list[str],
         where_clause: str = "",
         params: dict[str, Any] | None = None,
+        user_name: str | None = None,
     ) -> list[dict[str, Any]]:
         """
         Count nodes grouped by any fields.
@@ -1109,15 +1136,16 @@ def get_grouped_counts(
             where_clause (str, optional): Extra WHERE condition. E.g.,
             "WHERE n.status = 'activated'"
             params (dict, optional): Parameters for WHERE clause.
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             list[dict]: e.g., [{ 'memory_type': 'WorkingMemory', 'status': 'active', 'count': 10 }, ...]
         """
         if not group_fields:
             raise ValueError("group_fields cannot be empty")
-
-            # GQL-specific modifications
-        user_clause = f"n.user_name = '{self.config.user_name}'"
+        user_name = user_name if user_name else self.config.user_name
+        # GQL-specific modifications
+        user_clause = f"n.user_name = '{user_name}'"
         if where_clause:
             where_clause = where_clause.strip()
             if where_clause.upper().startswith("WHERE"):
@@ -1144,7 +1172,7 @@ def get_grouped_counts(
             group_by_fields.append(alias)
         # Full GQL query construction
         gql = f"""
-            MATCH (n)
+            MATCH (n /*+ INDEX(idx_memory_user_name) */)
             {where_clause}
             RETURN {", ".join(return_fields)}, COUNT(n) AS count
             GROUP BY {", ".join(group_by_fields)}
@@ -1163,15 +1191,16 @@ def get_grouped_counts(
         return output
 
     @timed
-    def clear(self) -> None:
+    def clear(self, user_name: str | None = None) -> None:
         """
         Clear the entire graph if the target database exists.
+
+        Args:
+            user_name (str, optional): User name for filtering in non-multi-db mode
         """
+        user_name = user_name if user_name else self.config.user_name
         try:
-            query = (
-                f"MATCH (n@Memory) WHERE n.user_name = '{self.config.user_name}' DETACH DELETE n"
-            )
-
+            query = f"MATCH (n@Memory) WHERE n.user_name = '{user_name}' DETACH DELETE n"
             self.execute_query(query)
             logger.info("Cleared all nodes from database.")
 
@@ -1179,11 +1208,14 @@ def clear(self) -> None:
             logger.error(f"[ERROR] Failed to clear database: {e}")
 
     @timed
-    def export_graph(self, include_embedding: bool = False) -> dict[str, Any]:
+    def export_graph(
+        self, include_embedding: bool = False, user_name: str | None = None
+    ) -> dict[str, Any]:
         """
         Export all graph nodes and edges in a structured form.
         Args:
         include_embedding (bool): Whether to include the large embedding field.
+        user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             {
@@ -1191,12 +1223,11 @@ def export_graph(self, include_embedding: bool = False) -> dict[str, Any]:
                 "edges": [ { "source": ..., "target": ..., "type": ... }, ... ]
             }
         """
+        user_name = user_name if user_name else self.config.user_name
         node_query = "MATCH (n@Memory)"
         edge_query = "MATCH (a@Memory)-[r]->(b@Memory)"
-
-        username = self.config.user_name
-        node_query += f' WHERE n.user_name = "{username}"'
-        edge_query += f' WHERE r.user_name = "{username}"'
+        node_query += f' WHERE n.user_name = "{user_name}"'
+        edge_query += f' WHERE r.user_name = "{user_name}"'
 
         try:
             if include_embedding:
@@ -1256,19 +1287,19 @@ def export_graph(self, include_embedding: bool = False) -> dict[str, Any]:
         return {"nodes": nodes, "edges": edges}
 
     @timed
-    def import_graph(self, data: dict[str, Any]) -> None:
+    def import_graph(self, data: dict[str, Any], user_name: str | None = None) -> None:
         """
         Import the entire graph from a serialized dictionary.
 
         Args:
             data: A dictionary containing all nodes and edges to be loaded.
+            user_name (str, optional): User name for filtering in non-multi-db mode
         """
+        user_name = user_name if user_name else self.config.user_name
         for node in data.get("nodes", []):
             try:
                 id, memory, metadata = _compose_node(node)
-
-                metadata["user_name"] = self.config.user_name
-
+                metadata["user_name"] = user_name
                 metadata = self._prepare_node_metadata(metadata)
                 metadata.update({"id": id, "memory": memory})
                 properties = ", ".join(
@@ -1283,7 +1314,7 @@ def import_graph(self, data: dict[str, Any]) -> None:
             try:
                 source_id, target_id = edge["source"], edge["target"]
                 edge_type = edge["type"]
-                props = f'{{user_name: "{self.config.user_name}"}}'
+                props = f'{{user_name: "{user_name}"}}'
                 edge_gql = f'''
                    MATCH (a@Memory {{id: "{source_id}"}}), (b@Memory {{id: "{target_id}"}})
                    INSERT OR IGNORE (a) -[e@{edge_type} {props}]-> (b)
@@ -1293,27 +1324,31 @@ def import_graph(self, data: dict[str, Any]) -> None:
                 logger.error(f"Fail to load edge: {edge}, error: {e}")
 
     @timed
-    def get_all_memory_items(self, scope: str, include_embedding: bool = False) -> (list)[dict]:
+    def get_all_memory_items(
+        self, scope: str, include_embedding: bool = False, user_name: str | None = None
+    ) -> (list)[dict]:
         """
         Retrieve all memory items of a specific memory_type.
 
         Args:
             scope (str): Must be one of 'WorkingMemory', 'LongTermMemory', or 'UserMemory'.
             include_embedding: with/without embedding
+            user_name (str, optional): User name for filtering in non-multi-db mode
 
         Returns:
             list[dict]: Full list of memory items under this scope.
         """
+        user_name = user_name if user_name else self.config.user_name
         if scope not in {"WorkingMemory", "LongTermMemory", "UserMemory", "OuterMemory"}:
             raise ValueError(f"Unsupported memory type scope: {scope}")
 
         where_clause = f"WHERE n.memory_type = '{scope}'"
-        where_clause += f" AND n.user_name = '{self.config.user_name}'"
+        where_clause += f" AND n.user_name = '{user_name}'"
 
         return_fields = self._build_return_fields(include_embedding)
 
         query = f"""
-                   MATCH (n@Memory)
+                   MATCH (n@Memory /*+ INDEX(idx_memory_user_name) */)
                    {where_clause}
                    RETURN {return_fields}
                    LIMIT 100
@@ -1330,19 +1365,19 @@ def get_all_memory_items(self, scope: str, include_embedding: bool = False) -> (
 
     @timed
     def get_structure_optimization_candidates(
-        self, scope: str, include_embedding: bool = False
+        self, scope: str, include_embedding: bool = False, user_name: str | None = None
     ) -> list[dict]:
         """
         Find nodes that are likely candidates for structure optimization:
         - Isolated nodes, nodes with empty background, or nodes with exactly one child.
         - Plus: the child of any parent node that has exactly one child.
         """
-
+        user_name = user_name if user_name else self.config.user_name
         where_clause = f'''
             n.memory_type = "{scope}"
             AND n.status = "activated"
         '''
-        where_clause += f' AND n.user_name = "{self.config.user_name}"'
+        where_clause += f' AND n.user_name = "{user_name}"'
 
         return_fields = self._build_return_fields(include_embedding)
         return_fields += f", n.{self.dim_field} AS {self.dim_field}"
diff --git a/src/memos/graph_dbs/neo4j.py b/src/memos/graph_dbs/neo4j.py
index 96908913d..55db60ed2 100644
--- a/src/memos/graph_dbs/neo4j.py
+++ b/src/memos/graph_dbs/neo4j.py
@@ -38,6 +38,10 @@ def _prepare_node_metadata(metadata: dict[str, Any]) -> dict[str, Any]:
     if embedding and isinstance(embedding, list):
         metadata["embedding"] = [float(x) for x in embedding]
 
+    # serialization
+    if metadata["sources"]:
+        for idx in range(len(metadata["sources"])):
+            metadata["sources"][idx] = json.dumps(metadata["sources"][idx])
     return metadata
 
 
@@ -97,12 +101,13 @@ def create_index(
         # Create indexes
         self._create_basic_property_indexes()
 
-    def get_memory_count(self, memory_type: str) -> int:
+    def get_memory_count(self, memory_type: str, user_name: str | None = None) -> int:
+        user_name = user_name if user_name else self.config.user_name
         query = """
         MATCH (n:Memory)
         WHERE n.memory_type = $memory_type
         """
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += "\nAND n.user_name = $user_name"
         query += "\nRETURN COUNT(n) AS count"
         with self.driver.session(database=self.db_name) as session:
@@ -110,17 +115,18 @@ def get_memory_count(self, memory_type: str) -> int:
                 query,
                 {
                     "memory_type": memory_type,
-                    "user_name": self.config.user_name if self.config.user_name else None,
+                    "user_name": user_name,
                 },
             )
             return result.single()["count"]
 
-    def node_not_exist(self, scope: str) -> int:
+    def node_not_exist(self, scope: str, user_name: str | None = None) -> int:
+        user_name = user_name if user_name else self.config.user_name
         query = """
         MATCH (n:Memory)
         WHERE n.memory_type = $scope
         """
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += "\nAND n.user_name = $user_name"
         query += "\nRETURN n LIMIT 1"
 
@@ -129,12 +135,14 @@ def node_not_exist(self, scope: str) -> int:
                 query,
                 {
                     "scope": scope,
-                    "user_name": self.config.user_name if self.config.user_name else None,
+                    "user_name": user_name,
                 },
             )
             return result.single() is None
 
-    def remove_oldest_memory(self, memory_type: str, keep_latest: int) -> None:
+    def remove_oldest_memory(
+        self, memory_type: str, keep_latest: int, user_name: str | None = None
+    ) -> None:
         """
         Remove all WorkingMemory nodes except the latest `keep_latest` entries.
 
@@ -142,12 +150,13 @@ def remove_oldest_memory(self, memory_type: str, keep_latest: int) -> None:
             memory_type (str): Memory type (e.g., 'WorkingMemory', 'LongTermMemory').
             keep_latest (int): Number of latest WorkingMemory entries to keep.
         """
+        user_name = user_name if user_name else self.config.user_name
         query = f"""
         MATCH (n:Memory)
         WHERE n.memory_type = '{memory_type}'
         """
-        if not self.config.use_multi_db and self.config.user_name:
-            query += f"\nAND n.user_name = '{self.config.user_name}'"
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
+            query += f"\nAND n.user_name = '{user_name}'"
 
         query += f"""
             WITH n ORDER BY n.updated_at DESC
@@ -157,9 +166,12 @@ def remove_oldest_memory(self, memory_type: str, keep_latest: int) -> None:
         with self.driver.session(database=self.db_name) as session:
             session.run(query)
 
-    def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
-        if not self.config.use_multi_db and self.config.user_name:
-            metadata["user_name"] = self.config.user_name
+    def add_node(
+        self, id: str, memory: str, metadata: dict[str, Any], user_name: str | None = None
+    ) -> None:
+        user_name = user_name if user_name else self.config.user_name
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
+            metadata["user_name"] = user_name
 
         # Safely process metadata
         metadata = _prepare_node_metadata(metadata)
@@ -191,10 +203,11 @@ def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
                 metadata=metadata,
             )
 
-    def update_node(self, id: str, fields: dict[str, Any]) -> None:
+    def update_node(self, id: str, fields: dict[str, Any], user_name: str | None = None) -> None:
         """
         Update node fields in Neo4j, auto-converting `created_at` and `updated_at` to datetime type if present.
         """
+        user_name = user_name if user_name else self.config.user_name
         fields = fields.copy()  # Avoid mutating external dict
         set_clauses = []
         params = {"id": id, "fields": fields}
@@ -211,27 +224,28 @@ def update_node(self, id: str, fields: dict[str, Any]) -> None:
         query = """
         MATCH (n:Memory {id: $id})
         """
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += "\nWHERE n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query += f"\nSET {set_clause_str}"
 
         with self.driver.session(database=self.db_name) as session:
             session.run(query, **params)
 
-    def delete_node(self, id: str) -> None:
+    def delete_node(self, id: str, user_name: str | None = None) -> None:
         """
         Delete a node from the graph.
         Args:
             id: Node identifier to delete.
         """
+        user_name = user_name if user_name else self.config.user_name
         query = "MATCH (n:Memory {id: $id})"
 
         params = {"id": id}
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += " WHERE n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query += " DETACH DELETE n"
 
@@ -239,7 +253,9 @@ def delete_node(self, id: str) -> None:
             session.run(query, **params)
 
     # Edge (Relationship) Management
-    def add_edge(self, source_id: str, target_id: str, type: str) -> None:
+    def add_edge(
+        self, source_id: str, target_id: str, type: str, user_name: str | None = None
+    ) -> None:
         """
         Create an edge from source node to target node.
         Args:
@@ -247,23 +263,26 @@ def add_edge(self, source_id: str, target_id: str, type: str) -> None:
             target_id: ID of the target node.
             type: Relationship type (e.g., 'RELATE_TO', 'PARENT').
         """
+        user_name = user_name if user_name else self.config.user_name
         query = """
                 MATCH (a:Memory {id: $source_id})
                 MATCH (b:Memory {id: $target_id})
             """
         params = {"source_id": source_id, "target_id": target_id}
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += """
                     WHERE a.user_name = $user_name AND b.user_name = $user_name
                 """
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query += f"\nMERGE (a)-[:{type}]->(b)"
 
         with self.driver.session(database=self.db_name) as session:
             session.run(query, params)
 
-    def delete_edge(self, source_id: str, target_id: str, type: str) -> None:
+    def delete_edge(
+        self, source_id: str, target_id: str, type: str, user_name: str | None = None
+    ) -> None:
         """
         Delete a specific edge between two nodes.
         Args:
@@ -271,6 +290,7 @@ def delete_edge(self, source_id: str, target_id: str, type: str) -> None:
             target_id: ID of the target node.
             type: Relationship type to remove.
         """
+        user_name = user_name if user_name else self.config.user_name
         query = f"""
             MATCH (a:Memory {{id: $source}})
             -[r:{type}]->
@@ -278,9 +298,9 @@ def delete_edge(self, source_id: str, target_id: str, type: str) -> None:
         """
         params = {"source": source_id, "target": target_id}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += "\nWHERE a.user_name = $user_name AND b.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query += "\nDELETE r"
 
@@ -288,7 +308,12 @@ def delete_edge(self, source_id: str, target_id: str, type: str) -> None:
             session.run(query, params)
 
     def edge_exists(
-        self, source_id: str, target_id: str, type: str = "ANY", direction: str = "OUTGOING"
+        self,
+        source_id: str,
+        target_id: str,
+        type: str = "ANY",
+        direction: str = "OUTGOING",
+        user_name: str | None = None,
     ) -> bool:
         """
         Check if an edge exists between two nodes.
@@ -301,6 +326,7 @@ def edge_exists(
         Returns:
             True if the edge exists, otherwise False.
         """
+        user_name = user_name if user_name else self.config.user_name
         # Prepare the relationship pattern
         rel = "r" if type == "ANY" else f"r:{type}"
 
@@ -318,9 +344,9 @@ def edge_exists(
         query = f"MATCH {pattern}"
         params = {"source": source_id, "target": target_id}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             query += "\nWHERE a.user_name = $user_name AND b.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query += "\nRETURN r"
 
@@ -338,12 +364,12 @@ def get_node(self, id: str, **kwargs) -> dict[str, Any] | None:
         Returns:
             Dictionary of node fields, or None if not found.
         """
-
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         where_user = ""
         params = {"id": id}
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_user = " AND n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"MATCH (n:Memory) WHERE n.id = $id {where_user} RETURN n"
 
@@ -366,16 +392,16 @@ def get_nodes(self, ids: list[str], **kwargs) -> list[dict[str, Any]]:
 
         if not ids:
             return []
-
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         where_user = ""
         params = {"ids": ids}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_user = " AND n.user_name = $user_name"
             if kwargs.get("cube_name"):
                 params["user_name"] = kwargs["cube_name"]
             else:
-                params["user_name"] = self.config.user_name
+                params["user_name"] = user_name
 
         query = f"MATCH (n:Memory) WHERE n.id IN $ids{where_user} RETURN n"
 
@@ -383,7 +409,9 @@ def get_nodes(self, ids: list[str], **kwargs) -> list[dict[str, Any]]:
             results = session.run(query, params)
             return [self._parse_node(dict(record["n"])) for record in results]
 
-    def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[dict[str, str]]:
+    def get_edges(
+        self, id: str, type: str = "ANY", direction: str = "ANY", user_name: str | None = None
+    ) -> list[dict[str, str]]:
         """
         Get edges connected to a node, with optional type and direction filter.
 
@@ -399,6 +427,7 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
               ...
             ]
         """
+        user_name = user_name if user_name else self.config.user_name
         # Build relationship type filter
         rel_type = "" if type == "ANY" else f":{type}"
 
@@ -417,9 +446,9 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
 
         params = {"id": id}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clause += " AND a.user_name = $user_name AND b.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
                 MATCH {pattern}
@@ -437,7 +466,11 @@ def get_edges(self, id: str, type: str = "ANY", direction: str = "ANY") -> list[
             return edges
 
     def get_neighbors(
-        self, id: str, type: str, direction: Literal["in", "out", "both"] = "out"
+        self,
+        id: str,
+        type: str,
+        direction: Literal["in", "out", "both"] = "out",
+        user_name: str | None = None,
     ) -> list[str]:
         """
         Get connected node IDs in a specific direction and relationship type.
@@ -456,6 +489,7 @@ def get_neighbors_by_tag(
         exclude_ids: list[str],
         top_k: int = 5,
         min_overlap: int = 1,
+        user_name: str | None = None,
     ) -> list[dict[str, Any]]:
         """
         Find top-K neighbor nodes with maximum tag overlap.
@@ -469,6 +503,7 @@ def get_neighbors_by_tag(
         Returns:
             List of dicts with node details and overlap count.
         """
+        user_name = user_name if user_name else self.config.user_name
         where_user = ""
         params = {
             "tags": tags,
@@ -477,9 +512,9 @@ def get_neighbors_by_tag(
             "top_k": top_k,
         }
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_user = "AND n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
                 MATCH (n:Memory)
@@ -499,13 +534,16 @@ def get_neighbors_by_tag(
             result = session.run(query, params)
             return [self._parse_node(dict(record["n"])) for record in result]
 
-    def get_children_with_embeddings(self, id: str) -> list[dict[str, Any]]:
+    def get_children_with_embeddings(
+        self, id: str, user_name: str | None = None
+    ) -> list[dict[str, Any]]:
+        user_name = user_name if user_name else self.config.user_name
         where_user = ""
         params = {"id": id}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_user = "AND p.user_name = $user_name AND c.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
                 MATCH (p:Memory)-[:PARENT]->(c:Memory)
@@ -519,7 +557,9 @@ def get_children_with_embeddings(self, id: str) -> list[dict[str, Any]]:
                 {"id": r["id"], "embedding": r["embedding"], "memory": r["memory"]} for r in result
             ]
 
-    def get_path(self, source_id: str, target_id: str, max_depth: int = 3) -> list[str]:
+    def get_path(
+        self, source_id: str, target_id: str, max_depth: int = 3, user_name: str | None = None
+    ) -> list[str]:
         """
         Get the path of nodes from source to target within a limited depth.
         Args:
@@ -532,7 +572,11 @@ def get_path(self, source_id: str, target_id: str, max_depth: int = 3) -> list[s
         raise NotImplementedError
 
     def get_subgraph(
-        self, center_id: str, depth: int = 2, center_status: str = "activated"
+        self,
+        center_id: str,
+        depth: int = 2,
+        center_status: str = "activated",
+        user_name: str | None = None,
     ) -> dict[str, Any]:
         """
         Retrieve a local subgraph centered at a given node.
@@ -547,15 +591,16 @@ def get_subgraph(
                 "edges": [...]
             }
         """
+        user_name = user_name if user_name else self.config.user_name
         with self.driver.session(database=self.db_name) as session:
             params = {"center_id": center_id}
             center_user_clause = ""
             neighbor_user_clause = ""
 
-            if not self.config.use_multi_db and self.config.user_name:
+            if not self.config.use_multi_db and (self.config.user_name or user_name):
                 center_user_clause = " AND center.user_name = $user_name"
                 neighbor_user_clause = " WHERE neighbor.user_name = $user_name"
-                params["user_name"] = self.config.user_name
+                params["user_name"] = user_name
             status_clause = f" AND center.status = '{center_status}'" if center_status else ""
 
             query = f"""
@@ -614,6 +659,7 @@ def search_by_embedding(
         status: str | None = None,
         threshold: float | None = None,
         search_filter: dict | None = None,
+        user_name: str | None = None,
         **kwargs,
     ) -> list[dict]:
         """
@@ -641,13 +687,14 @@ def search_by_embedding(
             - Typical use case: restrict to 'status = activated' to avoid
             matching archived or merged nodes.
         """
+        user_name = user_name if user_name else self.config.user_name
         # Build WHERE clause dynamically
         where_clauses = []
         if scope:
             where_clauses.append("node.memory_type = $scope")
         if status:
             where_clauses.append("node.status = $status")
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clauses.append("node.user_name = $user_name")
 
         # Add search_filter conditions
@@ -673,11 +720,11 @@ def search_by_embedding(
             parameters["scope"] = scope
         if status:
             parameters["status"] = status
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             if kwargs.get("cube_name"):
                 parameters["user_name"] = kwargs["cube_name"]
             else:
-                parameters["user_name"] = self.config.user_name
+                parameters["user_name"] = user_name
 
         # Add search_filter parameters
         if search_filter:
@@ -695,7 +742,9 @@ def search_by_embedding(
 
         return records
 
-    def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
+    def get_by_metadata(
+        self, filters: list[dict[str, Any]], user_name: str | None = None
+    ) -> list[str]:
         """
         TODO:
         1. ADD logic: "AND" vs "OR"(support logic combination);
@@ -720,6 +769,7 @@ def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
             - Supports structured querying such as tag/category/importance/time filtering.
             - Can be used for faceted recall or prefiltering before embedding rerank.
         """
+        user_name = user_name if user_name else self.config.user_name
         where_clauses = []
         params = {}
 
@@ -751,9 +801,9 @@ def get_by_metadata(self, filters: list[dict[str, Any]]) -> list[str]:
             else:
                 raise ValueError(f"Unsupported operator: {op}")
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clauses.append("n.user_name = $user_name")
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         where_str = " AND ".join(where_clauses)
         query = f"MATCH (n:Memory) WHERE {where_str} RETURN n.id AS id"
@@ -767,6 +817,7 @@ def get_grouped_counts(
         group_fields: list[str],
         where_clause: str = "",
         params: dict[str, Any] | None = None,
+        user_name: str | None = None,
     ) -> list[dict[str, Any]]:
         """
         Count nodes grouped by any fields.
@@ -780,14 +831,15 @@ def get_grouped_counts(
         Returns:
             list[dict]: e.g., [{ 'memory_type': 'WorkingMemory', 'status': 'active', 'count': 10 }, ...]
         """
+        user_name = user_name if user_name else self.config.user_name
         if not group_fields:
             raise ValueError("group_fields cannot be empty")
 
         final_params = params.copy() if params else {}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             user_clause = "n.user_name = $user_name"
-            final_params["user_name"] = self.config.user_name
+            final_params["user_name"] = user_name
             if where_clause:
                 where_clause = where_clause.strip()
                 if where_clause.upper().startswith("WHERE"):
@@ -841,14 +893,15 @@ def merge_nodes(self, id1: str, id2: str) -> str:
         raise NotImplementedError
 
     # Utilities
-    def clear(self) -> None:
+    def clear(self, user_name: str | None = None) -> None:
         """
         Clear the entire graph if the target database exists.
         """
+        user_name = user_name if user_name else self.config.user_name
         try:
-            if not self.config.use_multi_db and self.config.user_name:
+            if not self.config.use_multi_db and (self.config.user_name or user_name):
                 query = "MATCH (n:Memory) WHERE n.user_name = $user_name DETACH DELETE n"
-                params = {"user_name": self.config.user_name}
+                params = {"user_name": user_name}
             else:
                 query = "MATCH (n) DETACH DELETE n"
                 params = {}
@@ -872,16 +925,17 @@ def export_graph(self, **kwargs) -> dict[str, Any]:
                 "edges": [ { "source": ..., "target": ..., "type": ... }, ... ]
             }
         """
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         with self.driver.session(database=self.db_name) as session:
             # Export nodes
             node_query = "MATCH (n:Memory)"
             edge_query = "MATCH (a:Memory)-[r]->(b:Memory)"
             params = {}
 
-            if not self.config.use_multi_db and self.config.user_name:
+            if not self.config.use_multi_db and (self.config.user_name or user_name):
                 node_query += " WHERE n.user_name = $user_name"
                 edge_query += " WHERE a.user_name = $user_name AND b.user_name = $user_name"
-                params["user_name"] = self.config.user_name
+                params["user_name"] = user_name
 
             node_result = session.run(f"{node_query} RETURN n", params)
             nodes = [self._parse_node(dict(record["n"])) for record in node_result]
@@ -897,19 +951,20 @@ def export_graph(self, **kwargs) -> dict[str, Any]:
 
             return {"nodes": nodes, "edges": edges}
 
-    def import_graph(self, data: dict[str, Any]) -> None:
+    def import_graph(self, data: dict[str, Any], user_name: str | None = None) -> None:
         """
         Import the entire graph from a serialized dictionary.
 
         Args:
             data: A dictionary containing all nodes and edges to be loaded.
         """
+        user_name = user_name if user_name else self.config.user_name
         with self.driver.session(database=self.db_name) as session:
             for node in data.get("nodes", []):
                 id, memory, metadata = _compose_node(node)
 
-                if not self.config.use_multi_db and self.config.user_name:
-                    metadata["user_name"] = self.config.user_name
+                if not self.config.use_multi_db and (self.config.user_name or user_name):
+                    metadata["user_name"] = user_name
 
                 metadata = _prepare_node_metadata(metadata)
 
@@ -954,15 +1009,16 @@ def get_all_memory_items(self, scope: str, **kwargs) -> list[dict]:
         Returns:
             list[dict]: Full list of memory items under this scope.
         """
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         if scope not in {"WorkingMemory", "LongTermMemory", "UserMemory", "OuterMemory"}:
             raise ValueError(f"Unsupported memory type scope: {scope}")
 
         where_clause = "WHERE n.memory_type = $scope"
         params = {"scope": scope}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clause += " AND n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
             MATCH (n:Memory)
@@ -980,7 +1036,7 @@ def get_structure_optimization_candidates(self, scope: str, **kwargs) -> list[di
         - Isolated nodes, nodes with empty background, or nodes with exactly one child.
         - Plus: the child of any parent node that has exactly one child.
         """
-
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         where_clause = """
                 WHERE n.memory_type = $scope
                   AND n.status = 'activated'
@@ -988,9 +1044,9 @@ def get_structure_optimization_candidates(self, scope: str, **kwargs) -> list[di
             """
         params = {"scope": scope}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clause += " AND n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
             MATCH (n:Memory)
diff --git a/src/memos/graph_dbs/neo4j_community.py b/src/memos/graph_dbs/neo4j_community.py
index 8acab420c..6f7786834 100644
--- a/src/memos/graph_dbs/neo4j_community.py
+++ b/src/memos/graph_dbs/neo4j_community.py
@@ -1,3 +1,5 @@
+import json
+
 from typing import Any
 
 from memos.configs.graph_db import Neo4jGraphDBConfig
@@ -42,13 +44,20 @@ def create_index(
         # Create indexes
         self._create_basic_property_indexes()
 
-    def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
-        if not self.config.use_multi_db and self.config.user_name:
-            metadata["user_name"] = self.config.user_name
+    def add_node(
+        self, id: str, memory: str, metadata: dict[str, Any], user_name: str | None = None
+    ) -> None:
+        user_name = user_name if user_name else self.config.user_name
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
+            metadata["user_name"] = user_name
 
         # Safely process metadata
         metadata = _prepare_node_metadata(metadata)
 
+        # serialization
+        if metadata["sources"]:
+            for idx in range(len(metadata["sources"])):
+                metadata["sources"][idx] = json.dumps(metadata["sources"][idx])
         # Extract required fields
         embedding = metadata.pop("embedding", None)
         if embedding is None:
@@ -93,13 +102,16 @@ def add_node(self, id: str, memory: str, metadata: dict[str, Any]) -> None:
                 metadata=metadata,
             )
 
-    def get_children_with_embeddings(self, id: str) -> list[dict[str, Any]]:
+    def get_children_with_embeddings(
+        self, id: str, user_name: str | None = None
+    ) -> list[dict[str, Any]]:
+        user_name = user_name if user_name else self.config.user_name
         where_user = ""
         params = {"id": id}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_user = "AND p.user_name = $user_name AND c.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
                 MATCH (p:Memory)-[:PARENT]->(c:Memory)
@@ -130,6 +142,7 @@ def search_by_embedding(
         status: str | None = None,
         threshold: float | None = None,
         search_filter: dict | None = None,
+        user_name: str | None = None,
         **kwargs,
     ) -> list[dict]:
         """
@@ -154,6 +167,7 @@ def search_by_embedding(
             - If 'search_filter' is provided, it applies additional metadata-based filtering.
             - The returned IDs can be used to fetch full node data from Neo4j if needed.
         """
+        user_name = user_name if user_name else self.config.user_name
         # Build VecDB filter
         vec_filter = {}
         if scope:
@@ -164,7 +178,7 @@ def search_by_embedding(
         if kwargs.get("cube_name"):
             vec_filter["user_name"] = kwargs["cube_name"]
         else:
-            vec_filter["user_name"] = self.config.user_name
+            vec_filter["user_name"] = user_name
 
         # Add search_filter conditions
         if search_filter:
@@ -189,15 +203,16 @@ def get_all_memory_items(self, scope: str, **kwargs) -> list[dict]:
         Returns:
             list[dict]: Full list of memory items under this scope.
         """
+        user_name = kwargs.get("user_name") if kwargs.get("user_name") else self.config.user_name
         if scope not in {"WorkingMemory", "LongTermMemory", "UserMemory"}:
             raise ValueError(f"Unsupported memory type scope: {scope}")
 
         where_clause = "WHERE n.memory_type = $scope"
         params = {"scope": scope}
 
-        if not self.config.use_multi_db and self.config.user_name:
+        if not self.config.use_multi_db and (self.config.user_name or user_name):
             where_clause += " AND n.user_name = $user_name"
-            params["user_name"] = self.config.user_name
+            params["user_name"] = user_name
 
         query = f"""
             MATCH (n:Memory)
@@ -209,23 +224,24 @@ def get_all_memory_items(self, scope: str, **kwargs) -> list[dict]:
             results = session.run(query, params)
             return [self._parse_node(dict(record["n"])) for record in results]
 
-    def clear(self) -> None:
+    def clear(self, user_name: str | None = None) -> None:
         """
         Clear the entire graph if the target database exists.
         """
         # Step 1: clear Neo4j part via parent logic
-        super().clear()
+        user_name = user_name if user_name else self.config.user_name
+        super().clear(user_name=user_name)
 
         # Step2: Clear the vector db
         try:
-            items = self.vec_db.get_by_filter({"user_name": self.config.user_name})
+            items = self.vec_db.get_by_filter({"user_name": user_name})
             if items:
                 self.vec_db.delete([item.id for item in items])
-                logger.info(f"Cleared {len(items)} vectors for user '{self.config.user_name}'.")
+                logger.info(f"Cleared {len(items)} vectors for user '{user_name}'.")
             else:
-                logger.info(f"No vectors to clear for user '{self.config.user_name}'.")
+                logger.info(f"No vectors to clear for user '{user_name}'.")
         except Exception as e:
-            logger.warning(f"Failed to clear vector DB for user '{self.config.user_name}': {e}")
+            logger.warning(f"Failed to clear vector DB for user '{user_name}': {e}")
 
     def drop_database(self) -> None:
         """
@@ -298,7 +314,16 @@ def _parse_node(self, node_data: dict[str, Any]) -> dict[str, Any]:
             if time_field in node and hasattr(node[time_field], "isoformat"):
                 node[time_field] = node[time_field].isoformat()
         node.pop("user_name", None)
-
+        # serialization
+        if node["sources"]:
+            for idx in range(len(node["sources"])):
+                if not (
+                    isinstance(node["sources"][idx], str)
+                    and node["sources"][idx][0] == "{"
+                    and node["sources"][idx][0] == "}"
+                ):
+                    break
+                node["sources"][idx] = json.loads(node["sources"][idx])
         new_node = {"id": node.pop("id"), "memory": node.pop("memory", ""), "metadata": node}
         try:
             vec_item = self.vec_db.get_by_id(new_node["id"])
diff --git a/src/memos/mem_cube/navie.py b/src/memos/mem_cube/navie.py
new file mode 100644
index 000000000..7ce3ca642
--- /dev/null
+++ b/src/memos/mem_cube/navie.py
@@ -0,0 +1,166 @@
+import os
+
+from typing import Literal
+
+from memos.configs.mem_cube import GeneralMemCubeConfig
+from memos.configs.utils import get_json_file_model_schema
+from memos.embedders.base import BaseEmbedder
+from memos.exceptions import ConfigurationError, MemCubeError
+from memos.graph_dbs.base import BaseGraphDB
+from memos.llms.base import BaseLLM
+from memos.log import get_logger
+from memos.mem_cube.base import BaseMemCube
+from memos.mem_reader.base import BaseMemReader
+from memos.memories.activation.base import BaseActMemory
+from memos.memories.parametric.base import BaseParaMemory
+from memos.memories.textual.base import BaseTextMemory
+from memos.memories.textual.simple_tree import SimpleTreeTextMemory
+from memos.memories.textual.tree_text_memory.organize.manager import MemoryManager
+from memos.reranker.base import BaseReranker
+
+
+logger = get_logger(__name__)
+
+
+class NaiveMemCube(BaseMemCube):
+    """MemCube is a box for loading and dumping three types of memories."""
+
+    def __init__(
+        self,
+        llm: BaseLLM,
+        embedder: BaseEmbedder,
+        mem_reader: BaseMemReader,
+        graph_db: BaseGraphDB,
+        reranker: BaseReranker,
+        memory_manager: MemoryManager,
+        default_cube_config: GeneralMemCubeConfig,
+        internet_retriever: None = None,
+    ):
+        """Initialize the MemCube with a configuration."""
+        self._text_mem: BaseTextMemory | None = SimpleTreeTextMemory(
+            llm,
+            embedder,
+            mem_reader,
+            graph_db,
+            reranker,
+            memory_manager,
+            default_cube_config.text_mem.config,
+            internet_retriever,
+        )
+        self._act_mem: BaseActMemory | None = None
+        self._para_mem: BaseParaMemory | None = None
+
+    def load(
+        self, dir: str, memory_types: list[Literal["text_mem", "act_mem", "para_mem"]] | None = None
+    ) -> None:
+        """Load memories.
+        Args:
+            dir (str): The directory containing the memory files.
+            memory_types (list[str], optional): List of memory types to load.
+                If None, loads all available memory types.
+                Options: ["text_mem", "act_mem", "para_mem"]
+        """
+        loaded_schema = get_json_file_model_schema(os.path.join(dir, self.config.config_filename))
+        if loaded_schema != self.config.model_schema:
+            raise ConfigurationError(
+                f"Configuration schema mismatch. Expected {self.config.model_schema}, "
+                f"but found {loaded_schema}."
+            )
+
+        # If no specific memory types specified, load all
+        if memory_types is None:
+            memory_types = ["text_mem", "act_mem", "para_mem"]
+
+        # Load specified memory types
+        if "text_mem" in memory_types and self.text_mem:
+            self.text_mem.load(dir)
+            logger.debug(f"Loaded text_mem from {dir}")
+
+        if "act_mem" in memory_types and self.act_mem:
+            self.act_mem.load(dir)
+            logger.info(f"Loaded act_mem from {dir}")
+
+        if "para_mem" in memory_types and self.para_mem:
+            self.para_mem.load(dir)
+            logger.info(f"Loaded para_mem from {dir}")
+
+        logger.info(f"MemCube loaded successfully from {dir} (types: {memory_types})")
+
+    def dump(
+        self, dir: str, memory_types: list[Literal["text_mem", "act_mem", "para_mem"]] | None = None
+    ) -> None:
+        """Dump memories.
+        Args:
+            dir (str): The directory where the memory files will be saved.
+            memory_types (list[str], optional): List of memory types to dump.
+                If None, dumps all available memory types.
+                Options: ["text_mem", "act_mem", "para_mem"]
+        """
+        if os.path.exists(dir) and os.listdir(dir):
+            raise MemCubeError(
+                f"Directory {dir} is not empty. Please provide an empty directory for dumping."
+            )
+
+        # Always dump config
+        self.config.to_json_file(os.path.join(dir, self.config.config_filename))
+
+        # If no specific memory types specified, dump all
+        if memory_types is None:
+            memory_types = ["text_mem", "act_mem", "para_mem"]
+
+        # Dump specified memory types
+        if "text_mem" in memory_types and self.text_mem:
+            self.text_mem.dump(dir)
+            logger.info(f"Dumped text_mem to {dir}")
+
+        if "act_mem" in memory_types and self.act_mem:
+            self.act_mem.dump(dir)
+            logger.info(f"Dumped act_mem to {dir}")
+
+        if "para_mem" in memory_types and self.para_mem:
+            self.para_mem.dump(dir)
+            logger.info(f"Dumped para_mem to {dir}")
+
+        logger.info(f"MemCube dumped successfully to {dir} (types: {memory_types})")
+
+    @property
+    def text_mem(self) -> "BaseTextMemory | None":
+        """Get the textual memory."""
+        if self._text_mem is None:
+            logger.warning("Textual memory is not initialized. Returning None.")
+        return self._text_mem
+
+    @text_mem.setter
+    def text_mem(self, value: BaseTextMemory) -> None:
+        """Set the textual memory."""
+        if not isinstance(value, BaseTextMemory):
+            raise TypeError(f"Expected BaseTextMemory, got {type(value).__name__}")
+        self._text_mem = value
+
+    @property
+    def act_mem(self) -> "BaseActMemory | None":
+        """Get the activation memory."""
+        if self._act_mem is None:
+            logger.warning("Activation memory is not initialized. Returning None.")
+        return self._act_mem
+
+    @act_mem.setter
+    def act_mem(self, value: BaseActMemory) -> None:
+        """Set the activation memory."""
+        if not isinstance(value, BaseActMemory):
+            raise TypeError(f"Expected BaseActMemory, got {type(value).__name__}")
+        self._act_mem = value
+
+    @property
+    def para_mem(self) -> "BaseParaMemory | None":
+        """Get the parametric memory."""
+        if self._para_mem is None:
+            logger.warning("Parametric memory is not initialized. Returning None.")
+        return self._para_mem
+
+    @para_mem.setter
+    def para_mem(self, value: BaseParaMemory) -> None:
+        """Set the parametric memory."""
+        if not isinstance(value, BaseParaMemory):
+            raise TypeError(f"Expected BaseParaMemory, got {type(value).__name__}")
+        self._para_mem = value
diff --git a/src/memos/mem_os/core.py b/src/memos/mem_os/core.py
index 54e507b50..958cc140c 100644
--- a/src/memos/mem_os/core.py
+++ b/src/memos/mem_os/core.py
@@ -124,11 +124,6 @@ def _initialize_mem_scheduler(self) -> GeneralScheduler:
                     f"Memory reader of type {type(self.mem_reader).__name__} "
                     "missing required 'llm' attribute"
                 )
-                self._mem_scheduler.initialize_modules(
-                    chat_llm=self.chat_llm,
-                    process_llm=self.chat_llm,
-                    db_engine=self.user_manager.engine,
-                )
             else:
                 # Configure scheduler general_modules
                 self._mem_scheduler.initialize_modules(
diff --git a/src/memos/mem_os/product.py b/src/memos/mem_os/product.py
index a4ab4ef20..7e0ed9aef 100644
--- a/src/memos/mem_os/product.py
+++ b/src/memos/mem_os/product.py
@@ -179,14 +179,14 @@ def _restore_user_instances(
         """
         try:
             # Get all user configurations from persistent storage
-            user_configs = self.user_manager.list_user_configs()
+            user_configs = self.user_manager.list_user_configs(self.max_user_instances)
 
             # Get the raw database records for sorting by updated_at
             session = self.user_manager._get_session()
             try:
                 from memos.mem_user.persistent_user_manager import UserConfig
 
-                db_configs = session.query(UserConfig).all()
+                db_configs = session.query(UserConfig).limit(self.max_user_instances).all()
                 # Create a mapping of user_id to updated_at timestamp
                 updated_at_map = {config.user_id: config.updated_at for config in db_configs}
 
@@ -217,6 +217,26 @@ def _restore_user_instances(
         except Exception as e:
             logger.error(f"Error during user instance restoration: {e}")
 
+    def _initialize_cube_from_default_config(
+        self, cube_id: str, user_id: str, default_config: GeneralMemCubeConfig
+    ) -> GeneralMemCube | None:
+        """
+        Initialize a cube from default configuration when cube path doesn't exist.
+
+        Args:
+            cube_id (str): The cube ID to initialize.
+            user_id (str): The user ID for the cube.
+            default_config (GeneralMemCubeConfig): The default configuration to use.
+        """
+        cube_config = default_config.model_copy(deep=True)
+        # Safely modify the graph_db user_name if it exists
+        if cube_config.text_mem.config.graph_db.config:
+            cube_config.text_mem.config.graph_db.config.user_name = (
+                f"memos{user_id.replace('-', '')}"
+            )
+        mem_cube = GeneralMemCube(config=cube_config)
+        return mem_cube
+
     def _preload_user_cubes(
         self, user_id: str, default_cube_config: GeneralMemCubeConfig | None = None
     ) -> None:
@@ -286,8 +306,24 @@ def _load_user_cubes(
                         )
                     else:
                         logger.warning(
-                            f"Cube path {cube.cube_path} does not exist for cube {cube.cube_id}"
+                            f"Cube path {cube.cube_path} does not exist for cube {cube.cube_id}, now init by default config"
                         )
+                        cube_obj = self._initialize_cube_from_default_config(
+                            cube_id=cube.cube_id,
+                            user_id=user_id,
+                            default_config=default_cube_config,
+                        )
+                        if cube_obj:
+                            self.register_mem_cube(
+                                cube_obj,
+                                cube.cube_id,
+                                user_id,
+                                memory_types=[],
+                            )
+                        else:
+                            raise ValueError(
+                                f"Failed to initialize default cube {cube.cube_id} for user {user_id}"
+                            )
                 except Exception as e:
                     logger.error(f"Failed to load cube {cube.cube_id} for user {user_id}: {e}")
         logger.info(f"load user {user_id} cubes successfully")
@@ -427,6 +463,47 @@ def _build_system_prompt(
             + mem_block
         )
 
+    def _build_base_system_prompt(
+        self,
+        base_prompt: str | None = None,
+        tone: str = "friendly",
+        verbosity: str = "mid",
+        mode: str = "enhance",
+    ) -> str:
+        """
+        Build base system prompt without memory references.
+        """
+        now = datetime.now()
+        formatted_date = now.strftime("%Y-%m-%d (%A)")
+        sys_body = get_memos_prompt(date=formatted_date, tone=tone, verbosity=verbosity, mode=mode)
+        prefix = (base_prompt.strip() + "\n\n") if base_prompt else ""
+        return prefix + sys_body
+
+    def _build_memory_context(
+        self,
+        memories_all: list[TextualMemoryItem],
+        mode: str = "enhance",
+    ) -> str:
+        """
+        Build memory context to be included in user message.
+        """
+        if not memories_all:
+            return ""
+
+        mem_block_o, mem_block_p = _format_mem_block(memories_all)
+
+        if mode == "enhance":
+            return (
+                "# Memories\n## PersonalMemory (ordered)\n"
+                + mem_block_p
+                + "\n## OuterMemory (ordered)\n"
+                + mem_block_o
+                + "\n\n"
+            )
+        else:
+            mem_block = mem_block_o + "\n" + mem_block_p
+            return "# Memories\n## PersonalMemory & OuterMemory (ordered)\n" + mem_block + "\n\n"
+
     def _build_enhance_system_prompt(
         self,
         user_id: str,
@@ -436,6 +513,7 @@ def _build_enhance_system_prompt(
     ) -> str:
         """
         Build enhance prompt for the user with memory references.
+        [DEPRECATED] Use _build_base_system_prompt and _build_memory_context instead.
         """
         now = datetime.now()
         formatted_date = now.strftime("%Y-%m-%d (%A)")
@@ -966,14 +1044,22 @@ def chat(
                 m.metadata.embedding = []
                 new_memories_list.append(m)
             memories_list = new_memories_list
-        system_prompt = super()._build_system_prompt(memories_list, base_prompt)
+        # Build base system prompt without memory
+        system_prompt = self._build_base_system_prompt(base_prompt, mode="base")
+
+        # Build memory context to be included in user message
+        memory_context = self._build_memory_context(memories_list, mode="base")
+
+        # Combine memory context with user query
+        user_content = memory_context + query if memory_context else query
+
         history_info = []
         if history:
             history_info = history[-20:]
         current_messages = [
             {"role": "system", "content": system_prompt},
             *history_info,
-            {"role": "user", "content": query},
+            {"role": "user", "content": user_content},
         ]
         response = self.chat_llm.generate(current_messages)
         time_end = time.time()
@@ -1043,8 +1129,16 @@ def chat_with_references(
 
         reference = prepare_reference_data(memories_list)
         yield f"data: {json.dumps({'type': 'reference', 'data': reference})}\n\n"
-        # Build custom system prompt with relevant memories)
-        system_prompt = self._build_enhance_system_prompt(user_id, memories_list)
+
+        # Build base system prompt without memory
+        system_prompt = self._build_base_system_prompt(mode="enhance")
+
+        # Build memory context to be included in user message
+        memory_context = self._build_memory_context(memories_list, mode="enhance")
+
+        # Combine memory context with user query
+        user_content = memory_context + query if memory_context else query
+
         # Get chat history
         if user_id not in self.chat_history_manager:
             self._register_chat_history(user_id, session_id)
@@ -1055,7 +1149,7 @@ def chat_with_references(
         current_messages = [
             {"role": "system", "content": system_prompt},
             *chat_history.chat_history,
-            {"role": "user", "content": query},
+            {"role": "user", "content": user_content},
         ]
         logger.info(
             f"user_id: {user_id}, cube_id: {cube_id}, current_system_prompt: {system_prompt}"
diff --git a/src/memos/mem_os/product_server.py b/src/memos/mem_os/product_server.py
new file mode 100644
index 000000000..b94b26f65
--- /dev/null
+++ b/src/memos/mem_os/product_server.py
@@ -0,0 +1,423 @@
+import asyncio
+import time
+
+from datetime import datetime
+from typing import Literal
+
+from memos.context.context import ContextThread
+from memos.llms.base import BaseLLM
+from memos.log import get_logger
+from memos.mem_cube.navie import NaiveMemCube
+from memos.mem_os.product import _format_mem_block
+from memos.mem_reader.base import BaseMemReader
+from memos.memories.textual.item import TextualMemoryItem
+from memos.templates.mos_prompts import (
+    get_memos_prompt,
+)
+from memos.types import MessageList
+
+
+logger = get_logger(__name__)
+
+
+class MOSServer:
+    def __init__(
+        self,
+        mem_reader: BaseMemReader | None = None,
+        llm: BaseLLM | None = None,
+        online_bot: bool = False,
+    ):
+        self.mem_reader = mem_reader
+        self.chat_llm = llm
+        self.online_bot = online_bot
+
+    def chat(
+        self,
+        query: str,
+        user_id: str,
+        cube_id: str | None = None,
+        mem_cube: NaiveMemCube | None = None,
+        history: MessageList | None = None,
+        base_prompt: str | None = None,
+        internet_search: bool = False,
+        moscube: bool = False,
+        top_k: int = 10,
+        threshold: float = 0.5,
+        session_id: str | None = None,
+    ) -> str:
+        """
+        Chat with LLM with memory references and complete response.
+        """
+        time_start = time.time()
+        memories_result = mem_cube.text_mem.search(
+            query=query,
+            user_name=cube_id,
+            top_k=top_k,
+            mode="fine",
+            manual_close_internet=not internet_search,
+            moscube=moscube,
+            info={
+                "user_id": user_id,
+                "session_id": session_id,
+                "chat_history": history,
+            },
+        )
+
+        memories_list = []
+        if memories_result:
+            memories_list = self._filter_memories_by_threshold(memories_result, threshold)
+            new_memories_list = []
+            for m in memories_list:
+                m.metadata.embedding = []
+                new_memories_list.append(m)
+            memories_list = new_memories_list
+        system_prompt = self._build_base_system_prompt(base_prompt, mode="base")
+
+        memory_context = self._build_memory_context(memories_list, mode="base")
+
+        user_content = memory_context + query if memory_context else query
+
+        history_info = []
+        if history:
+            history_info = history[-20:]
+        current_messages = [
+            {"role": "system", "content": system_prompt},
+            *history_info,
+            {"role": "user", "content": user_content},
+        ]
+        response = self.chat_llm.generate(current_messages)
+        time_end = time.time()
+        self._start_post_chat_processing(
+            user_id=user_id,
+            cube_id=cube_id,
+            session_id=session_id,
+            query=query,
+            full_response=response,
+            system_prompt=system_prompt,
+            time_start=time_start,
+            time_end=time_end,
+            speed_improvement=0.0,
+            current_messages=current_messages,
+            mem_cube=mem_cube,
+            history=history,
+        )
+        return response, memories_list
+
+    def add(
+        self,
+        user_id: str,
+        cube_id: str,
+        mem_cube: NaiveMemCube,
+        messages: MessageList,
+        session_id: str | None = None,
+        history: MessageList | None = None,
+    ) -> list[str]:
+        memories = self.mem_reader.get_memory(
+            [messages],
+            type="chat",
+            info={
+                "user_id": user_id,
+                "session_id": session_id,
+                "chat_history": history,
+            },
+        )
+        flattened_memories = [mm for m in memories for mm in m]
+        mem_id_list: list[str] = mem_cube.text_mem.add(
+            flattened_memories,
+            user_name=cube_id,
+        )
+        return mem_id_list
+
+    def search(
+        self,
+        user_id: str,
+        cube_id: str,
+        session_id: str | None = None,
+    ) -> None:
+        NotImplementedError("Not implemented")
+
+    def _filter_memories_by_threshold(
+        self,
+        memories: list[TextualMemoryItem],
+        threshold: float = 0.30,
+        min_num: int = 3,
+        memory_type: Literal["OuterMemory"] = "OuterMemory",
+    ) -> list[TextualMemoryItem]:
+        """
+        Filter memories by threshold and type, at least min_num memories for Non-OuterMemory.
+        Args:
+            memories: list[TextualMemoryItem],
+            threshold: float,
+            min_num: int,
+            memory_type: Literal["OuterMemory"],
+        Returns:
+            list[TextualMemoryItem]
+        """
+        sorted_memories = sorted(memories, key=lambda m: m.metadata.relativity, reverse=True)
+        filtered_person = [m for m in memories if m.metadata.memory_type != memory_type]
+        filtered_outer = [m for m in memories if m.metadata.memory_type == memory_type]
+        filtered = []
+        per_memory_count = 0
+        for m in sorted_memories:
+            if m.metadata.relativity >= threshold:
+                if m.metadata.memory_type != memory_type:
+                    per_memory_count += 1
+                filtered.append(m)
+        if len(filtered) < min_num:
+            filtered = filtered_person[:min_num] + filtered_outer[:min_num]
+        else:
+            if per_memory_count < min_num:
+                filtered += filtered_person[per_memory_count:min_num]
+        filtered_memory = sorted(filtered, key=lambda m: m.metadata.relativity, reverse=True)
+        return filtered_memory
+
+    def _build_base_system_prompt(
+        self,
+        base_prompt: str | None = None,
+        tone: str = "friendly",
+        verbosity: str = "mid",
+        mode: str = "enhance",
+    ) -> str:
+        """
+        Build base system prompt without memory references.
+        """
+        now = datetime.now()
+        formatted_date = now.strftime("%Y-%m-%d (%A)")
+        sys_body = get_memos_prompt(date=formatted_date, tone=tone, verbosity=verbosity, mode=mode)
+        prefix = (base_prompt.strip() + "\n\n") if base_prompt else ""
+        return prefix + sys_body
+
+    def _build_memory_context(
+        self,
+        memories_all: list[TextualMemoryItem],
+        mode: str = "enhance",
+    ) -> str:
+        """
+        Build memory context to be included in user message.
+        """
+        if not memories_all:
+            return ""
+
+        mem_block_o, mem_block_p = _format_mem_block(memories_all)
+
+        if mode == "enhance":
+            return (
+                "# Memories\n## PersonalMemory (ordered)\n"
+                + mem_block_p
+                + "\n## OuterMemory (ordered)\n"
+                + mem_block_o
+                + "\n\n"
+            )
+        else:
+            mem_block = mem_block_o + "\n" + mem_block_p
+            return "# Memories\n## PersonalMemory & OuterMemory (ordered)\n" + mem_block + "\n\n"
+
+    def _extract_references_from_response(self, response: str) -> tuple[str, list[dict]]:
+        """
+        Extract reference information from the response and return clean text.
+
+        Args:
+            response (str): The complete response text.
+
+        Returns:
+            tuple[str, list[dict]]: A tuple containing:
+                - clean_text: Text with reference markers removed
+                - references: List of reference information
+        """
+        import re
+
+        try:
+            references = []
+            # Pattern to match [refid:memoriesID]
+            pattern = r"\[(\d+):([^\]]+)\]"
+
+            matches = re.findall(pattern, response)
+            for ref_number, memory_id in matches:
+                references.append({"memory_id": memory_id, "reference_number": int(ref_number)})
+
+            # Remove all reference markers from the text to get clean text
+            clean_text = re.sub(pattern, "", response)
+
+            # Clean up any extra whitespace that might be left after removing markers
+            clean_text = re.sub(r"\s+", " ", clean_text).strip()
+
+            return clean_text, references
+        except Exception as e:
+            logger.error(f"Error extracting references from response: {e}", exc_info=True)
+            return response, []
+
+    async def _post_chat_processing(
+        self,
+        user_id: str,
+        cube_id: str,
+        query: str,
+        full_response: str,
+        system_prompt: str,
+        time_start: float,
+        time_end: float,
+        speed_improvement: float,
+        current_messages: list,
+        mem_cube: NaiveMemCube | None = None,
+        session_id: str | None = None,
+        history: MessageList | None = None,
+    ) -> None:
+        """
+        Asynchronous processing of logs, notifications and memory additions
+        """
+        try:
+            logger.info(
+                f"user_id: {user_id}, cube_id: {cube_id}, current_messages: {current_messages}"
+            )
+            logger.info(f"user_id: {user_id}, cube_id: {cube_id}, full_response: {full_response}")
+
+            clean_response, extracted_references = self._extract_references_from_response(
+                full_response
+            )
+            logger.info(f"Extracted {len(extracted_references)} references from response")
+
+            # Send chat report notifications asynchronously
+            if self.online_bot:
+                try:
+                    from memos.memos_tools.notification_utils import (
+                        send_online_bot_notification_async,
+                    )
+
+                    # Prepare notification data
+                    chat_data = {
+                        "query": query,
+                        "user_id": user_id,
+                        "cube_id": cube_id,
+                        "system_prompt": system_prompt,
+                        "full_response": full_response,
+                    }
+
+                    system_data = {
+                        "references": extracted_references,
+                        "time_start": time_start,
+                        "time_end": time_end,
+                        "speed_improvement": speed_improvement,
+                    }
+
+                    emoji_config = {"chat": "💬", "system_info": "📊"}
+
+                    await send_online_bot_notification_async(
+                        online_bot=self.online_bot,
+                        header_name="MemOS Chat Report",
+                        sub_title_name="chat_with_references",
+                        title_color="#00956D",
+                        other_data1=chat_data,
+                        other_data2=system_data,
+                        emoji=emoji_config,
+                    )
+                except Exception as e:
+                    logger.warning(f"Failed to send chat notification (async): {e}")
+
+            self.add(
+                user_id=user_id,
+                cube_id=cube_id,
+                mem_cube=mem_cube,
+                session_id=session_id,
+                history=history,
+                messages=[
+                    {
+                        "role": "user",
+                        "content": query,
+                        "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
+                    },
+                    {
+                        "role": "assistant",
+                        "content": clean_response,  # Store clean text without reference markers
+                        "chat_time": str(datetime.now().strftime("%Y-%m-%d %H:%M:%S")),
+                    },
+                ],
+            )
+
+            logger.info(f"Post-chat processing completed for user {user_id}")
+
+        except Exception as e:
+            logger.error(f"Error in post-chat processing for user {user_id}: {e}", exc_info=True)
+
+    def _start_post_chat_processing(
+        self,
+        user_id: str,
+        cube_id: str,
+        query: str,
+        full_response: str,
+        system_prompt: str,
+        time_start: float,
+        time_end: float,
+        speed_improvement: float,
+        current_messages: list,
+        mem_cube: NaiveMemCube | None = None,
+        session_id: str | None = None,
+        history: MessageList | None = None,
+    ) -> None:
+        """
+        Asynchronous processing of logs, notifications and memory additions, handle synchronous and asynchronous environments
+        """
+
+        def run_async_in_thread():
+            """Running asynchronous tasks in a new thread"""
+            try:
+                loop = asyncio.new_event_loop()
+                asyncio.set_event_loop(loop)
+                try:
+                    loop.run_until_complete(
+                        self._post_chat_processing(
+                            user_id=user_id,
+                            cube_id=cube_id,
+                            query=query,
+                            full_response=full_response,
+                            system_prompt=system_prompt,
+                            time_start=time_start,
+                            time_end=time_end,
+                            speed_improvement=speed_improvement,
+                            current_messages=current_messages,
+                            mem_cube=mem_cube,
+                            session_id=session_id,
+                            history=history,
+                        )
+                    )
+                finally:
+                    loop.close()
+            except Exception as e:
+                logger.error(
+                    f"Error in thread-based post-chat processing for user {user_id}: {e}",
+                    exc_info=True,
+                )
+
+        try:
+            # Try to get the current event loop
+            asyncio.get_running_loop()
+            # Create task and store reference to prevent garbage collection
+            task = asyncio.create_task(
+                self._post_chat_processing(
+                    user_id=user_id,
+                    cube_id=cube_id,
+                    query=query,
+                    full_response=full_response,
+                    system_prompt=system_prompt,
+                    time_start=time_start,
+                    time_end=time_end,
+                    speed_improvement=speed_improvement,
+                    current_messages=current_messages,
+                )
+            )
+            # Add exception handling for the background task
+            task.add_done_callback(
+                lambda t: logger.error(
+                    f"Error in background post-chat processing for user {user_id}: {t.exception()}",
+                    exc_info=True,
+                )
+                if t.exception()
+                else None
+            )
+        except RuntimeError:
+            # No event loop, run in a new thread with context propagation
+            thread = ContextThread(
+                target=run_async_in_thread,
+                name=f"PostChatProcessing-{user_id}",
+                # Set as a daemon thread to avoid blocking program exit
+                daemon=True,
+            )
+            thread.start()
diff --git a/src/memos/mem_scheduler/analyzer/api_analyzer.py b/src/memos/mem_scheduler/analyzer/api_analyzer.py
new file mode 100644
index 000000000..e69de29bb
diff --git a/src/memos/mem_scheduler/base_scheduler.py b/src/memos/mem_scheduler/base_scheduler.py
index b6ef00d8d..4f8b0719b 100644
--- a/src/memos/mem_scheduler/base_scheduler.py
+++ b/src/memos/mem_scheduler/base_scheduler.py
@@ -1,7 +1,9 @@
+import multiprocessing
 import queue
 import threading
 import time
 
+from collections.abc import Callable
 from datetime import datetime
 from pathlib import Path
 
@@ -20,7 +22,9 @@
 from memos.mem_scheduler.schemas.general_schemas import (
     DEFAULT_ACT_MEM_DUMP_PATH,
     DEFAULT_CONSUME_INTERVAL_SECONDS,
-    DEFAULT_THREAD__POOL_MAX_WORKERS,
+    DEFAULT_STARTUP_MODE,
+    DEFAULT_THREAD_POOL_MAX_WORKERS,
+    STARTUP_BY_PROCESS,
     MemCubeID,
     TreeTextMemory_SEARCH_METHOD,
     UserID,
@@ -58,9 +62,14 @@ def __init__(self, config: BaseSchedulerConfig):
         self.enable_activation_memory = self.config.get("enable_activation_memory", False)
         self.act_mem_dump_path = self.config.get("act_mem_dump_path", DEFAULT_ACT_MEM_DUMP_PATH)
         self.search_method = TreeTextMemory_SEARCH_METHOD
-        self.enable_parallel_dispatch = self.config.get("enable_parallel_dispatch", False)
+        self.enable_parallel_dispatch = self.config.get("enable_parallel_dispatch", True)
         self.thread_pool_max_workers = self.config.get(
-            "thread_pool_max_workers", DEFAULT_THREAD__POOL_MAX_WORKERS
+            "thread_pool_max_workers", DEFAULT_THREAD_POOL_MAX_WORKERS
+        )
+
+        # startup mode configuration
+        self.scheduler_startup_mode = self.config.get(
+            "scheduler_startup_mode", DEFAULT_STARTUP_MODE
         )
 
         self.retriever: SchedulerRetriever | None = None
@@ -68,10 +77,14 @@ def __init__(self, config: BaseSchedulerConfig):
         self.monitor: SchedulerGeneralMonitor | None = None
         self.dispatcher_monitor: SchedulerDispatcherMonitor | None = None
         self.dispatcher = SchedulerDispatcher(
+            config=self.config,
             max_workers=self.thread_pool_max_workers,
             enable_parallel_dispatch=self.enable_parallel_dispatch,
         )
 
+        # optional configs
+        self.disable_handlers: list | None = self.config.get("disable_handlers", None)
+
         # internal message queue
         self.max_internal_message_queue_size = self.config.get(
             "max_internal_message_queue_size", 100
@@ -83,7 +96,8 @@ def __init__(self, config: BaseSchedulerConfig):
         self._web_log_message_queue: Queue[ScheduleLogForWebItem] = Queue(
             maxsize=self.max_web_log_queue_size
         )
-        self._consumer_thread = None  # Reference to our consumer thread
+        self._consumer_thread = None  # Reference to our consumer thread/process
+        self._consumer_process = None  # Reference to our consumer process
         self._running = False
         self._consume_interval = self.config.get(
             "consume_interval_seconds", DEFAULT_CONSUME_INTERVAL_SECONDS
@@ -133,7 +147,8 @@ def initialize_modules(
 
             if self.auth_config is not None:
                 self.rabbitmq_config = self.auth_config.rabbitmq
-                self.initialize_rabbitmq(config=self.rabbitmq_config)
+                if self.rabbitmq_config is not None:
+                    self.initialize_rabbitmq(config=self.rabbitmq_config)
 
             logger.debug("GeneralScheduler has been initialized")
         except Exception as e:
@@ -476,6 +491,11 @@ def submit_messages(self, messages: ScheduleMessageItem | list[ScheduleMessageIt
                 logger.error(error_msg)
                 raise TypeError(error_msg)
 
+            # Check if this handler is disabled
+            if self.disable_handlers and message.label in self.disable_handlers:
+                logger.info(f"Skipping disabled handler: {message.label} - {message.content}")
+                continue
+
             self.memos_message_queue.put(message)
             logger.info(f"Submitted message: {message.label} - {message.content}")
 
@@ -487,6 +507,9 @@ def _submit_web_logs(
         Args:
             messages: Single log message or list of log messages
         """
+        if self.rabbitmq_config is None:
+            return
+
         if isinstance(messages, ScheduleLogForWebItem):
             messages = [messages]  # transform single message to list
 
@@ -516,7 +539,7 @@ def get_web_log_messages(self) -> list[dict]:
         messages = []
         while True:
             try:
-                item = self._web_log_message_queue.get_nowait()  # 线程安全的 get
+                item = self._web_log_message_queue.get_nowait()  # Thread-safe get
                 messages.append(item.to_dict())
             except queue.Empty:
                 break
@@ -560,10 +583,10 @@ def _message_consumer(self) -> None:
 
     def start(self) -> None:
         """
-        Start the message consumer thread and initialize dispatcher resources.
+        Start the message consumer thread/process and initialize dispatcher resources.
 
         Initializes and starts:
-        1. Message consumer thread
+        1. Message consumer thread or process (based on startup_mode)
         2. Dispatcher thread pool (if parallel dispatch enabled)
         """
         if self._running:
@@ -576,20 +599,32 @@ def start(self) -> None:
                 f"Initializing dispatcher thread pool with {self.thread_pool_max_workers} workers"
             )
 
-        # Start consumer thread
+        # Start consumer based on startup mode
         self._running = True
-        self._consumer_thread = threading.Thread(
-            target=self._message_consumer,
-            daemon=True,
-            name="MessageConsumerThread",
-        )
-        self._consumer_thread.start()
-        logger.info("Message consumer thread started")
+
+        if self.scheduler_startup_mode == STARTUP_BY_PROCESS:
+            # Start consumer process
+            self._consumer_process = multiprocessing.Process(
+                target=self._message_consumer,
+                daemon=True,
+                name="MessageConsumerProcess",
+            )
+            self._consumer_process.start()
+            logger.info("Message consumer process started")
+        else:
+            # Default to thread mode
+            self._consumer_thread = threading.Thread(
+                target=self._message_consumer,
+                daemon=True,
+                name="MessageConsumerThread",
+            )
+            self._consumer_thread.start()
+            logger.info("Message consumer thread started")
 
     def stop(self) -> None:
         """Stop all scheduler components gracefully.
 
-        1. Stops message consumer thread
+        1. Stops message consumer thread/process
         2. Shuts down dispatcher thread pool
         3. Cleans up resources
         """
@@ -597,11 +632,24 @@ def stop(self) -> None:
             logger.warning("Memory Scheduler is not running")
             return
 
-        # Signal consumer thread to stop
+        # Signal consumer thread/process to stop
         self._running = False
 
-        # Wait for consumer thread
-        if self._consumer_thread and self._consumer_thread.is_alive():
+        # Wait for consumer thread or process
+        if self.scheduler_startup_mode == STARTUP_BY_PROCESS and self._consumer_process:
+            if self._consumer_process.is_alive():
+                self._consumer_process.join(timeout=5.0)
+                if self._consumer_process.is_alive():
+                    logger.warning("Consumer process did not stop gracefully, terminating...")
+                    self._consumer_process.terminate()
+                    self._consumer_process.join(timeout=2.0)
+                    if self._consumer_process.is_alive():
+                        logger.error("Consumer process could not be terminated")
+                    else:
+                        logger.info("Consumer process terminated")
+                else:
+                    logger.info("Consumer process stopped")
+        elif self._consumer_thread and self._consumer_thread.is_alive():
             self._consumer_thread.join(timeout=5.0)
             if self._consumer_thread.is_alive():
                 logger.warning("Consumer thread did not stop gracefully")
@@ -622,6 +670,52 @@ def stop(self) -> None:
         self._cleanup_queues()
         logger.info("Memory Scheduler stopped completely")
 
+    @property
+    def handlers(self) -> dict[str, Callable]:
+        """
+        Access the dispatcher's handlers dictionary.
+
+        Returns:
+            dict[str, Callable]: Dictionary mapping labels to handler functions
+        """
+        if not self.dispatcher:
+            logger.warning("Dispatcher is not initialized, returning empty handlers dict")
+            return {}
+
+        return self.dispatcher.handlers
+
+    def register_handlers(
+        self, handlers: dict[str, Callable[[list[ScheduleMessageItem]], None]]
+    ) -> None:
+        """
+        Bulk register multiple handlers from a dictionary.
+
+        Args:
+            handlers: Dictionary mapping labels to handler functions
+                      Format: {label: handler_callable}
+        """
+        if not self.dispatcher:
+            logger.warning("Dispatcher is not initialized, cannot register handlers")
+            return
+
+        self.dispatcher.register_handlers(handlers)
+
+    def unregister_handlers(self, labels: list[str]) -> dict[str, bool]:
+        """
+        Unregister handlers from the dispatcher by their labels.
+
+        Args:
+            labels: List of labels to unregister handlers for
+
+        Returns:
+            dict[str, bool]: Dictionary mapping each label to whether it was successfully unregistered
+        """
+        if not self.dispatcher:
+            logger.warning("Dispatcher is not initialized, cannot unregister handlers")
+            return dict.fromkeys(labels, False)
+
+        return self.dispatcher.unregister_handlers(labels)
+
     def _cleanup_queues(self) -> None:
         """Ensure all queues are emptied and marked as closed."""
         try:
diff --git a/src/memos/mem_scheduler/general_modules/dispatcher.py b/src/memos/mem_scheduler/general_modules/dispatcher.py
index ce6df4d5d..4584beb96 100644
--- a/src/memos/mem_scheduler/general_modules/dispatcher.py
+++ b/src/memos/mem_scheduler/general_modules/dispatcher.py
@@ -1,12 +1,16 @@
 import concurrent
+import threading
 
 from collections import defaultdict
 from collections.abc import Callable
+from typing import Any
 
 from memos.context.context import ContextThreadPoolExecutor
 from memos.log import get_logger
 from memos.mem_scheduler.general_modules.base import BaseSchedulerModule
+from memos.mem_scheduler.general_modules.task_threads import ThreadManager
 from memos.mem_scheduler.schemas.message_schemas import ScheduleMessageItem
+from memos.mem_scheduler.schemas.task_schemas import RunningTaskItem
 
 
 logger = get_logger(__name__)
@@ -22,10 +26,13 @@ class SchedulerDispatcher(BaseSchedulerModule):
     - Batch message processing
     - Graceful shutdown
     - Bulk handler registration
+    - Thread race competition for parallel task execution
     """
 
-    def __init__(self, max_workers=30, enable_parallel_dispatch=False):
+    def __init__(self, max_workers=30, enable_parallel_dispatch=True, config=None):
         super().__init__()
+        self.config = config
+
         # Main dispatcher thread pool
         self.max_workers = max_workers
 
@@ -49,6 +56,71 @@ def __init__(self, max_workers=30, enable_parallel_dispatch=False):
         # Set to track active futures for monitoring purposes
         self._futures = set()
 
+        # Thread race module for competitive task execution
+        self.thread_manager = ThreadManager(thread_pool_executor=self.dispatcher_executor)
+
+        # Task tracking for monitoring
+        self._running_tasks: dict[str, RunningTaskItem] = {}
+        self._task_lock = threading.Lock()
+
+    def _create_task_wrapper(self, handler: Callable, task_item: RunningTaskItem):
+        """
+        Create a wrapper around the handler to track task execution and capture results.
+
+        Args:
+            handler: The original handler function
+            task_item: The RunningTaskItem to track
+
+        Returns:
+            Wrapped handler function that captures results and logs completion
+        """
+
+        def wrapped_handler(messages: list[ScheduleMessageItem]):
+            try:
+                # Execute the original handler
+                result = handler(messages)
+
+                # Mark task as completed and remove from tracking
+                with self._task_lock:
+                    if task_item.item_id in self._running_tasks:
+                        task_item.mark_completed(result)
+                        del self._running_tasks[task_item.item_id]
+
+                logger.info(f"Task completed: {task_item.get_execution_info()}")
+                return result
+
+            except Exception as e:
+                # Mark task as failed and remove from tracking
+                with self._task_lock:
+                    if task_item.item_id in self._running_tasks:
+                        task_item.mark_failed(str(e))
+                        del self._running_tasks[task_item.item_id]
+
+                logger.error(f"Task failed: {task_item.get_execution_info()}, Error: {e}")
+                raise
+
+        return wrapped_handler
+
+    def get_running_tasks(self) -> dict[str, RunningTaskItem]:
+        """
+        Get a copy of currently running tasks.
+
+        Returns:
+            Dictionary of running tasks keyed by task ID
+        """
+        with self._task_lock:
+            return self._running_tasks.copy()
+
+    def get_running_task_count(self) -> int:
+        """
+        Get the count of currently running tasks.
+
+        Returns:
+            Number of running tasks
+        """
+        with self._task_lock:
+            return len(self._running_tasks)
+
     def register_handler(self, label: str, handler: Callable[[list[ScheduleMessageItem]], None]):
         """
         Register a handler function for a specific message label.
@@ -79,10 +151,45 @@ def register_handlers(
             self.register_handler(label=label, handler=handler)
         logger.info(f"Registered {len(handlers)} handlers in bulk")
 
+    def unregister_handler(self, label: str) -> bool:
+        """
+        Unregister a handler for a specific label.
+
+        Args:
+            label: The label to unregister the handler for
+
+        Returns:
+            bool: True if handler was found and removed, False otherwise
+        """
+        if label in self.handlers:
+            del self.handlers[label]
+            logger.info(f"Unregistered handler for label: {label}")
+            return True
+        else:
+            logger.warning(f"No handler found for label: {label}")
+            return False
+
+    def unregister_handlers(self, labels: list[str]) -> dict[str, bool]:
+        """
+        Unregister multiple handlers by their labels.
+
+        Args:
+            labels: List of labels to unregister handlers for
+
+        Returns:
+            dict[str, bool]: Dictionary mapping each label to whether it was successfully unregistered
+        """
+        results = {}
+        for label in labels:
+            results[label] = self.unregister_handler(label)
+
+        logger.info(f"Unregistered handlers for {len(labels)} labels")
+        return results
+
     def _default_message_handler(self, messages: list[ScheduleMessageItem]) -> None:
         logger.debug(f"Using _default_message_handler to deal with messages: {messages}")
 
-    def group_messages_by_user_and_cube(
+    def _group_messages_by_user_and_mem_cube(
         self, messages: list[ScheduleMessageItem]
     ) -> dict[str, dict[str, list[ScheduleMessageItem]]]:
         """
@@ -132,25 +239,51 @@ def dispatch(self, msg_list: list[ScheduleMessageItem]):
             logger.debug("Received empty message list, skipping dispatch")
             return
 
-        # Group messages by their labels, and organize messages by label
-        label_groups = defaultdict(list)
-        for message in msg_list:
-            label_groups[message.label].append(message)
-
-        # Process each label group
-        for label, msgs in label_groups.items():
-            handler = self.handlers.get(label, self._default_message_handler)
-
-            # dispatch to different handler
-            logger.debug(f"Dispatch {len(msgs)} message(s) to {label} handler.")
-            if self.enable_parallel_dispatch and self.dispatcher_executor is not None:
-                # Capture variables in lambda to avoid loop variable issues
-                future = self.dispatcher_executor.submit(handler, msgs)
-                self._futures.add(future)
-                future.add_done_callback(self._handle_future_result)
-                logger.info(f"Dispatched {len(msgs)} message(s) as future task")
-            else:
-                handler(msgs)
+        # Group messages by user_id and mem_cube_id first
+        user_cube_groups = self._group_messages_by_user_and_mem_cube(msg_list)
+
+        # Process each user and mem_cube combination
+        for user_id, cube_groups in user_cube_groups.items():
+            for mem_cube_id, user_cube_msgs in cube_groups.items():
+                # Group messages by their labels within each user/mem_cube combination
+                label_groups = defaultdict(list)
+                for message in user_cube_msgs:
+                    label_groups[message.label].append(message)
+
+                # Process each label group within this user/mem_cube combination
+                for label, msgs in label_groups.items():
+                    handler = self.handlers.get(label, self._default_message_handler)
+
+                    # Create task tracking item for this dispatch
+                    task_item = RunningTaskItem(
+                        user_id=user_id,
+                        mem_cube_id=mem_cube_id,
+                        task_info=f"Processing {len(msgs)} message(s) with label '{label}' for user {user_id} and mem_cube {mem_cube_id}",
+                        task_name=f"{label}_handler",
+                        messages=msgs,
+                    )
+
+                    # Add to running tasks
+                    with self._task_lock:
+                        self._running_tasks[task_item.item_id] = task_item
+
+                    # Create wrapped handler for task tracking
+                    wrapped_handler = self._create_task_wrapper(handler, task_item)
+
+                    # dispatch to different handler
+                    logger.debug(
+                        f"Dispatch {len(msgs)} message(s) to {label} handler for user {user_id} and mem_cube {mem_cube_id}."
+                    )
+                    logger.info(f"Task started: {task_item.get_execution_info()}")
+
+                    if self.enable_parallel_dispatch and self.dispatcher_executor is not None:
+                        # Capture variables in lambda to avoid loop variable issues
+                        future = self.dispatcher_executor.submit(wrapped_handler, msgs)
+                        self._futures.add(future)
+                        future.add_done_callback(self._handle_future_result)
+                        logger.info(f"Dispatched {len(msgs)} message(s) as future task")
+                    else:
+                        wrapped_handler(msgs)
 
     def join(self, timeout: float | None = None) -> bool:
         """Wait for all dispatched tasks to complete.
@@ -162,7 +295,7 @@ def join(self, timeout: float | None = None) -> bool:
             bool: True if all tasks completed, False if timeout occurred.
         """
         if not self.enable_parallel_dispatch or self.dispatcher_executor is None:
-            return True  # 串行模式无需等待
+            return True  # Serial mode requires no waiting
 
         done, not_done = concurrent.futures.wait(
             self._futures, timeout=timeout, return_when=concurrent.futures.ALL_COMPLETED
@@ -177,6 +310,60 @@ def join(self, timeout: float | None = None) -> bool:
 
         return len(not_done) == 0
 
+    def run_competitive_tasks(
+        self, tasks: dict[str, Callable[[threading.Event], Any]], timeout: float = 10.0
+    ) -> tuple[str, Any] | None:
+        """
+        Run multiple tasks in a competitive race, returning the result of the first task to complete.
+
+        Args:
+            tasks: Dictionary mapping task names to task functions that accept a stop_flag parameter
+            timeout: Maximum time to wait for any task to complete (in seconds)
+
+        Returns:
+            Tuple of (task_name, result) from the winning task, or None if no task completes
+        """
+        logger.info(f"Starting competitive execution of {len(tasks)} tasks")
+        return self.thread_manager.run_race(tasks, timeout)
+
+    def run_multiple_tasks(
+        self,
+        tasks: dict[str, tuple[Callable, tuple, dict]],
+        use_thread_pool: bool | None = None,
+        timeout: float | None = 30.0,
+    ) -> dict[str, Any]:
+        """
+        Execute multiple tasks concurrently and return all results.
+
+        Args:
+            tasks: Dictionary mapping task names to (function, args, kwargs) tuples
+            use_thread_pool: Whether to use ThreadPoolExecutor. If None, uses dispatcher's parallel mode setting
+            timeout: Maximum time to wait for all tasks to complete (in seconds). None for infinite timeout.
+
+        Returns:
+            Dictionary mapping task names to their results
+
+        Raises:
+            TimeoutError: If tasks don't complete within the specified timeout
+        """
+        # Use dispatcher's parallel mode setting if not explicitly specified
+        if use_thread_pool is None:
+            use_thread_pool = self.enable_parallel_dispatch
+
+        logger.info(f"Executing {len(tasks)} tasks concurrently (thread_pool: {use_thread_pool})")
+
+        try:
+            results = self.thread_manager.run_multiple_tasks(
+                tasks=tasks, use_thread_pool=use_thread_pool, timeout=timeout
+            )
+            logger.info(
+                f"Successfully completed {len([r for r in results.values() if r is not None])}/{len(tasks)} tasks"
+            )
+            return results
+        except Exception as e:
+            logger.error(f"Multiple tasks execution failed: {e}", exc_info=True)
+            raise
+
     def shutdown(self) -> None:
         """Gracefully shutdown the dispatcher."""
         self._running = False
diff --git a/src/memos/mem_scheduler/general_modules/misc.py b/src/memos/mem_scheduler/general_modules/misc.py
index 3c7116b74..7dda25a29 100644
--- a/src/memos/mem_scheduler/general_modules/misc.py
+++ b/src/memos/mem_scheduler/general_modules/misc.py
@@ -6,6 +6,7 @@
 from queue import Empty, Full, Queue
 from typing import TYPE_CHECKING, Any, Generic, TypeVar
 
+from dotenv import load_dotenv
 from pydantic import field_serializer
 
 
@@ -32,7 +33,7 @@ def get_env_prefix(cls) -> str:
         Examples:
             RabbitMQConfig -> "RABBITMQ_"
             OpenAIConfig -> "OPENAI_"
-            GraphDBAuthConfig -> "GRAPH_DB_AUTH_"
+            GraphDBAuthConfig -> "GRAPHDBAUTH_"
         """
         class_name = cls.__name__
         # Remove 'Config' suffix if present
@@ -55,6 +56,8 @@ def from_env(cls: type[T]) -> T:
         Raises:
             ValueError: If required environment variables are missing.
         """
+        load_dotenv()
+
         prefix = cls.get_env_prefix()
         field_values = {}
 
@@ -85,6 +88,35 @@ def _parse_env_value(cls, value: str, target_type: type) -> Any:
             return float(value)
         return value
 
+    @classmethod
+    def print_env_mapping(cls) -> None:
+        """Print the mapping between class fields and their corresponding environment variable names.
+
+        Displays each field's name, type, whether it's required, default value, and corresponding environment variable name.
+        """
+        prefix = cls.get_env_prefix()
+        print(f"\n=== {cls.__name__} Environment Variable Mapping ===")
+        print(f"Environment Variable Prefix: {prefix}")
+        print("-" * 60)
+
+        if not hasattr(cls, "model_fields"):
+            print("This class does not define model_fields, may not be a Pydantic model")
+            return
+
+        for field_name, field_info in cls.model_fields.items():
+            env_var = f"{prefix}{field_name.upper()}"
+            field_type = field_info.annotation
+            is_required = field_info.is_required()
+            default_value = field_info.default if field_info.default is not None else "None"
+
+            print(f"Field Name: {field_name}")
+            print(f"  Environment Variable: {env_var}")
+            print(f"  Type: {field_type}")
+            print(f"  Required: {'Yes' if is_required else 'No'}")
+            print(f"  Default Value: {default_value}")
+            print(f"  Current Environment Value: {os.environ.get(env_var, 'Not Set')}")
+            print("-" * 40)
+
 
 class DictConversionMixin:
     """
diff --git a/src/memos/mem_scheduler/general_modules/scheduler_logger.py b/src/memos/mem_scheduler/general_modules/scheduler_logger.py
index 44e744533..1f89d3b02 100644
--- a/src/memos/mem_scheduler/general_modules/scheduler_logger.py
+++ b/src/memos/mem_scheduler/general_modules/scheduler_logger.py
@@ -98,7 +98,7 @@ def create_autofilled_log_item(
         )
         return log_message
 
-    # TODO: 日志打出来数量不对
+    # TODO: Log output count is incorrect
     @log_exceptions(logger=logger)
     def log_working_memory_replacement(
         self,
diff --git a/src/memos/mem_scheduler/general_modules/task_threads.py b/src/memos/mem_scheduler/general_modules/task_threads.py
new file mode 100644
index 000000000..913d5fa1d
--- /dev/null
+++ b/src/memos/mem_scheduler/general_modules/task_threads.py
@@ -0,0 +1,294 @@
+import threading
+import time
+
+from collections.abc import Callable
+from concurrent.futures import as_completed
+from typing import Any, TypeVar
+
+from memos.log import get_logger
+from memos.mem_scheduler.general_modules.base import BaseSchedulerModule
+
+
+logger = get_logger(__name__)
+
+T = TypeVar("T")
+
+
+class ThreadManager(BaseSchedulerModule):
+    """
+    Thread race implementation that runs multiple tasks concurrently and returns
+    the result of the first task to complete successfully.
+
+    Features:
+    - Cooperative thread termination using stop flags
+    - Configurable timeout for tasks
+    - Automatic cleanup of slower threads
+    - Thread-safe result handling
+    """
+
+    def __init__(self, thread_pool_executor=None):
+        super().__init__()
+        # Variable to store the result
+        self.result: tuple[str, Any] | None = None
+        # Event to mark if the race is finished
+        self.race_finished = threading.Event()
+        # Lock to protect the result variable
+        self.lock = threading.Lock()
+        # Store thread objects for termination
+        self.threads: dict[str, threading.Thread] = {}
+        # Stop flags for each thread
+        self.stop_flags: dict[str, threading.Event] = {}
+        # attributes
+        self.thread_pool_executor = thread_pool_executor
+
+    def worker(
+        self, task_func: Callable[[threading.Event], T], task_name: str
+    ) -> tuple[str, T] | None:
+        """
+        Worker thread function that executes a task and handles result reporting.
+
+        Args:
+            task_func: Function to execute with a stop_flag parameter
+            task_name: Name identifier for this task/thread
+
+        Returns:
+            Tuple of (task_name, result) if this thread wins the race, None otherwise
+        """
+        # Create a stop flag for this task
+        stop_flag = threading.Event()
+        self.stop_flags[task_name] = stop_flag
+
+        try:
+            # Execute the task with stop flag
+            result = task_func(stop_flag)
+
+            # If the race is already finished or we were asked to stop, return immediately
+            if self.race_finished.is_set() or stop_flag.is_set():
+                return None
+
+            # Try to set the result (if no other thread has set it yet)
+            with self.lock:
+                if not self.race_finished.is_set():
+                    self.result = (task_name, result)
+                    # Mark the race as finished
+                    self.race_finished.set()
+                    logger.info(f"Task '{task_name}' won the race")
+
+                    # Signal other threads to stop
+                    for name, flag in self.stop_flags.items():
+                        if name != task_name:
+                            logger.debug(f"Signaling task '{name}' to stop")
+                            flag.set()
+
+                    return self.result
+
+        except Exception as e:
+            logger.error(f"Task '{task_name}' encountered an error: {e}")
+
+        return None
+
+    def run_multiple_tasks(
+        self,
+        tasks: dict[str, tuple[Callable, tuple, dict]],
+        use_thread_pool: bool = False,
+        timeout: float | None = None,
+    ) -> dict[str, Any]:
+        """
+        Run multiple tasks concurrently and return all results.
+
+        Args:
+            tasks: Dictionary mapping task names to (function, args, kwargs) tuples
+            use_thread_pool: Whether to use ThreadPoolExecutor (True) or regular threads (False)
+            timeout: Maximum time to wait for all tasks to complete (in seconds). None for infinite timeout.
+
+        Returns:
+            Dictionary mapping task names to their results
+
+        Raises:
+            TimeoutError: If tasks don't complete within the specified timeout
+        """
+        if not tasks:
+            logger.warning("No tasks provided to run_multiple_tasks")
+            return {}
+
+        results = {}
+        start_time = time.time()
+
+        if use_thread_pool:
+            return self.run_with_thread_pool(tasks, timeout)
+        else:
+            # Use regular threads
+            threads = {}
+            thread_results = {}
+            exceptions = {}
+
+            def worker(task_name: str, func: Callable, args: tuple, kwargs: dict):
+                """Worker function for regular threads"""
+                try:
+                    result = func(*args, **kwargs)
+                    thread_results[task_name] = result
+                    logger.debug(f"Task '{task_name}' completed successfully")
+                except Exception as e:
+                    exceptions[task_name] = e
+                    logger.error(f"Task '{task_name}' failed with error: {e}")
+
+            # Start all threads
+            for task_name, (func, args, kwargs) in tasks.items():
+                thread = threading.Thread(
+                    target=worker, args=(task_name, func, args, kwargs), name=f"task-{task_name}"
+                )
+                threads[task_name] = thread
+                thread.start()
+                logger.debug(f"Started thread for task '{task_name}'")
+
+            # Wait for all threads to complete with timeout
+            for task_name, thread in threads.items():
+                if timeout is None:
+                    # Infinite timeout - wait indefinitely
+                    thread.join()
+                else:
+                    # Finite timeout - calculate remaining time
+                    remaining_time = timeout - (time.time() - start_time)
+                    if remaining_time <= 0:
+                        logger.error(f"Task '{task_name}' timed out after {timeout} seconds")
+                        results[task_name] = None
+                        continue
+
+                    thread.join(timeout=remaining_time)
+                    if thread.is_alive():
+                        logger.error(f"Task '{task_name}' timed out after {timeout} seconds")
+                        results[task_name] = None
+                        continue
+
+                # Get result or exception (for both infinite and finite timeout cases)
+                if task_name in thread_results:
+                    results[task_name] = thread_results[task_name]
+                elif task_name in exceptions:
+                    results[task_name] = None
+                else:
+                    results[task_name] = None
+
+        elapsed_time = time.time() - start_time
+        completed_tasks = sum(1 for result in results.values() if result is not None)
+        logger.info(f"Completed {completed_tasks}/{len(tasks)} tasks in {elapsed_time:.2f} seconds")
+
+        return results
+
+    def run_with_thread_pool(
+        self, tasks: dict[str, tuple[callable, tuple, dict]], timeout: float | None = None
+    ) -> dict[str, Any]:
+        """
+        Execute multiple tasks using ThreadPoolExecutor.
+
+        Args:
+            tasks: Dictionary mapping task names to (function, args, kwargs) tuples
+            timeout: Maximum time to wait for all tasks to complete (None for infinite timeout)
+
+        Returns:
+            Dictionary mapping task names to their results
+
+        Raises:
+            TimeoutError: If tasks don't complete within the specified timeout
+        """
+        if self.thread_pool_executor is None:
+            logger.error("thread_pool_executor is None")
+            raise ValueError("ThreadPoolExecutor is not initialized")
+
+        results = {}
+        start_time = time.time()
+
+        # Use ThreadPoolExecutor for better resource management
+        with self.thread_pool_executor as executor:
+            # Submit all tasks
+            future_to_name = {}
+            for task_name, (func, args, kwargs) in tasks.items():
+                future = executor.submit(func, *args, **kwargs)
+                future_to_name[future] = task_name
+                logger.debug(f"Submitted task '{task_name}' to thread pool")
+
+            # Collect results as they complete
+            try:
+                # Handle infinite timeout case
+                timeout_param = None if timeout is None else timeout
+                for future in as_completed(future_to_name, timeout=timeout_param):
+                    task_name = future_to_name[future]
+                    try:
+                        result = future.result()
+                        results[task_name] = result
+                        logger.debug(f"Task '{task_name}' completed successfully")
+                    except Exception as e:
+                        logger.error(f"Task '{task_name}' failed with error: {e}")
+                        results[task_name] = None
+
+            except Exception:
+                elapsed_time = time.time() - start_time
+                timeout_msg = "infinite" if timeout is None else f"{timeout}s"
+                logger.error(
+                    f"Tasks execution timed out after {elapsed_time:.2f} seconds (timeout: {timeout_msg})"
+                )
+                # Cancel remaining futures
+                for future in future_to_name:
+                    if not future.done():
+                        future.cancel()
+                        task_name = future_to_name[future]
+                        logger.warning(f"Cancelled task '{task_name}' due to timeout")
+                        results[task_name] = None
+                timeout_seconds = "infinite" if timeout is None else timeout
+                logger.error(f"Tasks execution timed out after {timeout_seconds} seconds")
+
+        return results
+
+    def run_race(
+        self, tasks: dict[str, Callable[[threading.Event], T]], timeout: float = 10.0
+    ) -> tuple[str, T] | None:
+        """
+        Start a competition between multiple tasks and return the result of the fastest one.
+
+        Args:
+            tasks: Dictionary mapping task names to task functions
+            timeout: Maximum time to wait for any task to complete (in seconds)
+
+        Returns:
+            Tuple of (task_name, result) from the winning task, or None if no task completes
+        """
+        if not tasks:
+            logger.warning("No tasks provided for the race")
+            return None
+
+        # Reset state
+        self.race_finished.clear()
+        self.result = None
+        self.threads.clear()
+        self.stop_flags.clear()
+
+        # Create and start threads for each task
+        for task_name, task_func in tasks.items():
+            thread = threading.Thread(
+                target=self.worker, args=(task_func, task_name), name=f"race-{task_name}"
+            )
+            self.threads[task_name] = thread
+            thread.start()
+            logger.debug(f"Started task '{task_name}'")
+
+        # Wait for any thread to complete or timeout
+        race_completed = self.race_finished.wait(timeout=timeout)
+
+        if not race_completed:
+            logger.warning(f"Race timed out after {timeout} seconds")
+            # Signal all threads to stop
+            for _name, flag in self.stop_flags.items():
+                flag.set()
+
+        # Wait for all threads to end (with timeout to avoid infinite waiting)
+        for _name, thread in self.threads.items():
+            thread.join(timeout=1.0)
+            if thread.is_alive():
+                logger.warning(f"Thread '{_name}' did not terminate within the join timeout")
+
+        # Return the result
+        if self.result:
+            logger.info(f"Race completed. Winner: {self.result[0]}")
+        else:
+            logger.warning("Race completed with no winner")
+
+        return self.result
diff --git a/src/memos/mem_scheduler/general_scheduler.py b/src/memos/mem_scheduler/general_scheduler.py
index 340400abf..25c7b78fd 100644
--- a/src/memos/mem_scheduler/general_scheduler.py
+++ b/src/memos/mem_scheduler/general_scheduler.py
@@ -37,6 +37,101 @@ def __init__(self, config: GeneralSchedulerConfig):
         }
         self.dispatcher.register_handlers(handlers)
 
+    def long_memory_update_process(
+        self, user_id: str, mem_cube_id: str, messages: list[ScheduleMessageItem]
+    ):
+        mem_cube = messages[0].mem_cube
+
+        # for status update
+        self._set_current_context_from_message(msg=messages[0])
+
+        # update query monitors
+        for msg in messages:
+            self.monitor.register_query_monitor_if_not_exists(
+                user_id=user_id, mem_cube_id=mem_cube_id
+            )
+
+            query = msg.content
+            query_keywords = self.monitor.extract_query_keywords(query=query)
+            logger.info(
+                f'Extracted keywords "{query_keywords}" from query "{query}" for user_id={user_id}'
+            )
+
+            if len(query_keywords) == 0:
+                stripped_query = query.strip()
+                # Determine measurement method based on language
+                if is_all_english(stripped_query):
+                    words = stripped_query.split()  # Word count for English
+                elif is_all_chinese(stripped_query):
+                    words = stripped_query  # Character count for Chinese
+                else:
+                    logger.debug(
+                        f"Mixed-language memory, using character count: {stripped_query[:50]}..."
+                    )
+                    words = stripped_query  # Default to character count
+
+                query_keywords = list(set(words[: self.query_key_words_limit]))
+                logger.error(
+                    f"Keyword extraction failed for query '{query}' (user_id={user_id}). Using fallback keywords: {query_keywords[:10]}... (truncated)",
+                    exc_info=True,
+                )
+
+            item = QueryMonitorItem(
+                user_id=user_id,
+                mem_cube_id=mem_cube_id,
+                query_text=query,
+                keywords=query_keywords,
+                max_keywords=DEFAULT_MAX_QUERY_KEY_WORDS,
+            )
+
+            query_db_manager = self.monitor.query_monitors[user_id][mem_cube_id]
+            query_db_manager.obj.put(item=item)
+            # Sync with database after adding new item
+            query_db_manager.sync_with_orm()
+        logger.debug(
+            f"Queries in monitor for user_id={user_id}, mem_cube_id={mem_cube_id}: {query_db_manager.obj.get_queries_with_timesort()}"
+        )
+
+        queries = [msg.content for msg in messages]
+
+        # recall
+        cur_working_memory, new_candidates = self.process_session_turn(
+            queries=queries,
+            user_id=user_id,
+            mem_cube_id=mem_cube_id,
+            mem_cube=mem_cube,
+            top_k=self.top_k,
+        )
+        logger.info(
+            f"Processed {len(queries)} queries {queries} and retrieved {len(new_candidates)} new candidate memories for user_id={user_id}"
+        )
+
+        # rerank
+        new_order_working_memory = self.replace_working_memory(
+            user_id=user_id,
+            mem_cube_id=mem_cube_id,
+            mem_cube=mem_cube,
+            original_memory=cur_working_memory,
+            new_memory=new_candidates,
+        )
+        logger.info(
+            f"Final working memory size: {len(new_order_working_memory)} memories for user_id={user_id}"
+        )
+
+        # update activation memories
+        logger.info(
+            f"Activation memory update {'enabled' if self.enable_activation_memory else 'disabled'} "
+            f"(interval: {self.monitor.act_mem_update_interval}s)"
+        )
+        if self.enable_activation_memory:
+            self.update_activation_memory_periodically(
+                interval_seconds=self.monitor.act_mem_update_interval,
+                label=QUERY_LABEL,
+                user_id=user_id,
+                mem_cube_id=mem_cube_id,
+                mem_cube=messages[0].mem_cube,
+            )
+
     def _query_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
         """
         Process and handle query trigger messages from the queue.
@@ -56,99 +151,10 @@ def _query_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
                 messages = grouped_messages[user_id][mem_cube_id]
                 if len(messages) == 0:
                     return
-
-                mem_cube = messages[0].mem_cube
-
-                # for status update
-                self._set_current_context_from_message(msg=messages[0])
-
-                # update query monitors
-                for msg in messages:
-                    self.monitor.register_query_monitor_if_not_exists(
-                        user_id=user_id, mem_cube_id=mem_cube_id
-                    )
-
-                    query = msg.content
-                    query_keywords = self.monitor.extract_query_keywords(query=query)
-                    logger.info(
-                        f'Extracted keywords "{query_keywords}" from query "{query}" for user_id={user_id}'
-                    )
-
-                    if len(query_keywords) == 0:
-                        stripped_query = query.strip()
-                        # Determine measurement method based on language
-                        if is_all_english(stripped_query):
-                            words = stripped_query.split()  # Word count for English
-                        elif is_all_chinese(stripped_query):
-                            words = stripped_query  # Character count for Chinese
-                        else:
-                            logger.debug(
-                                f"Mixed-language memory, using character count: {stripped_query[:50]}..."
-                            )
-                            words = stripped_query  # Default to character count
-
-                        query_keywords = list(set(words[: self.query_key_words_limit]))
-                        logger.error(
-                            f"Keyword extraction failed for query '{query}' (user_id={user_id}). Using fallback keywords: {query_keywords[:10]}... (truncated)",
-                            exc_info=True,
-                        )
-
-                    item = QueryMonitorItem(
-                        user_id=user_id,
-                        mem_cube_id=mem_cube_id,
-                        query_text=query,
-                        keywords=query_keywords,
-                        max_keywords=DEFAULT_MAX_QUERY_KEY_WORDS,
-                    )
-
-                    query_db_manager = self.monitor.query_monitors[user_id][mem_cube_id]
-                    query_db_manager.obj.put(item=item)
-                    # Sync with database after adding new item
-                    query_db_manager.sync_with_orm()
-                logger.debug(
-                    f"Queries in monitor for user_id={user_id}, mem_cube_id={mem_cube_id}: {query_db_manager.obj.get_queries_with_timesort()}"
-                )
-
-                queries = [msg.content for msg in messages]
-
-                # recall
-                cur_working_memory, new_candidates = self.process_session_turn(
-                    queries=queries,
-                    user_id=user_id,
-                    mem_cube_id=mem_cube_id,
-                    mem_cube=mem_cube,
-                    top_k=self.top_k,
-                )
-                logger.info(
-                    f"Processed {len(queries)} queries {queries} and retrieved {len(new_candidates)} new candidate memories for user_id={user_id}"
+                self.long_memory_update_process(
+                    user_id=user_id, mem_cube_id=mem_cube_id, messages=messages
                 )
 
-                # rerank
-                new_order_working_memory = self.replace_working_memory(
-                    user_id=user_id,
-                    mem_cube_id=mem_cube_id,
-                    mem_cube=mem_cube,
-                    original_memory=cur_working_memory,
-                    new_memory=new_candidates,
-                )
-                logger.info(
-                    f"Final working memory size: {len(new_order_working_memory)} memories for user_id={user_id}"
-                )
-
-                # update activation memories
-                logger.info(
-                    f"Activation memory update {'enabled' if self.enable_activation_memory else 'disabled'} "
-                    f"(interval: {self.monitor.act_mem_update_interval}s)"
-                )
-                if self.enable_activation_memory:
-                    self.update_activation_memory_periodically(
-                        interval_seconds=self.monitor.act_mem_update_interval,
-                        label=QUERY_LABEL,
-                        user_id=user_id,
-                        mem_cube_id=mem_cube_id,
-                        mem_cube=messages[0].mem_cube,
-                    )
-
     def _answer_message_consumer(self, messages: list[ScheduleMessageItem]) -> None:
         """
         Process and handle answer trigger messages from the queue.
diff --git a/src/memos/mem_scheduler/monitors/dispatcher_monitor.py b/src/memos/mem_scheduler/monitors/dispatcher_monitor.py
index 85dc17adb..13fe07354 100644
--- a/src/memos/mem_scheduler/monitors/dispatcher_monitor.py
+++ b/src/memos/mem_scheduler/monitors/dispatcher_monitor.py
@@ -9,6 +9,11 @@
 from memos.log import get_logger
 from memos.mem_scheduler.general_modules.base import BaseSchedulerModule
 from memos.mem_scheduler.general_modules.dispatcher import SchedulerDispatcher
+from memos.mem_scheduler.schemas.general_schemas import (
+    DEFAULT_DISPATCHER_MONITOR_CHECK_INTERVAL,
+    DEFAULT_DISPATCHER_MONITOR_MAX_FAILURES,
+    DEFAULT_STUCK_THREAD_TOLERANCE,
+)
 
 
 logger = get_logger(__name__)
@@ -21,8 +26,12 @@ def __init__(self, config: BaseSchedulerConfig):
         super().__init__()
         self.config: BaseSchedulerConfig = config
 
-        self.check_interval = self.config.get("dispatcher_monitor_check_interval", 300)
-        self.max_failures = self.config.get("dispatcher_monitor_max_failures", 2)
+        self.check_interval = self.config.get(
+            "dispatcher_monitor_check_interval", DEFAULT_DISPATCHER_MONITOR_CHECK_INTERVAL
+        )
+        self.max_failures = self.config.get(
+            "dispatcher_monitor_max_failures", DEFAULT_DISPATCHER_MONITOR_MAX_FAILURES
+        )
 
         # Registry of monitored thread pools
         self._pools: dict[str, dict] = {}
@@ -189,22 +198,77 @@ def _check_pools_health(self) -> None:
             ):
                 self._restart_pool(name, pool_info)
 
-    def _check_pool_health(self, pool_info: dict, stuck_max_interval=4) -> tuple[bool, str]:
+    def _check_pool_health(
+        self, pool_info: dict, stuck_max_interval=4, stuck_thread_tolerance=None
+    ) -> tuple[bool, str]:
         """
-        Check health of a single thread pool.
+        Check health of a single thread pool with enhanced task tracking.
 
         Args:
             pool_info: Dictionary containing pool configuration
+            stuck_max_interval: Maximum intervals before considering pool stuck
+            stuck_thread_tolerance: Maximum number of stuck threads to tolerate before restarting pool
 
         Returns:
             Tuple: (is_healthy, reason) where reason explains failure if not healthy
         """
+        if stuck_thread_tolerance is None:
+            stuck_thread_tolerance = DEFAULT_STUCK_THREAD_TOLERANCE
+
         executor = pool_info["executor"]
 
         # Check if executor is shutdown
         if executor._shutdown:  # pylint: disable=protected-access
             return False, "Executor is shutdown"
 
+        # Enhanced health check using dispatcher task tracking
+        stuck_tasks = []
+        if self.dispatcher:
+            running_tasks = self.dispatcher.get_running_tasks()
+            running_count = self.dispatcher.get_running_task_count()
+
+            # Log detailed task information
+            if running_tasks:
+                logger.debug(f"Currently running {running_count} tasks:")
+                for _task_id, task in running_tasks.items():
+                    logger.debug(f"  - {task.get_execution_info()}")
+            else:
+                logger.debug("No tasks currently running")
+
+            # Check for stuck tasks (running longer than expected)
+            for task in running_tasks.values():
+                if task.duration_seconds and task.duration_seconds > (
+                    self.check_interval * stuck_max_interval
+                ):
+                    stuck_tasks.append(task)
+
+            # Always log stuck tasks if any exist
+            if stuck_tasks:
+                logger.warning(f"Found {len(stuck_tasks)} potentially stuck tasks:")
+                for task in stuck_tasks:
+                    task_info = task.get_execution_info()
+                    messages_info = ""
+                    if task.messages:
+                        messages_info = f", Messages: {len(task.messages)} items - {[str(msg) for msg in task.messages[:3]]}"
+                        if len(task.messages) > 3:
+                            messages_info += f" ... and {len(task.messages) - 3} more"
+                    logger.warning(f"  - Stuck task: {task_info}{messages_info}")
+
+                # Check if stuck task count exceeds tolerance
+                # If thread pool size is smaller, use the smaller value as threshold
+                max_workers = pool_info.get("max_workers", 0)
+                effective_tolerance = (
+                    min(stuck_thread_tolerance, max_workers)
+                    if max_workers > 0
+                    else stuck_thread_tolerance
+                )
+
+                if len(stuck_tasks) >= effective_tolerance:
+                    return (
+                        False,
+                        f"Found {len(stuck_tasks)} stuck tasks (tolerance: {effective_tolerance})",
+                    )
+
         # Check thread activity
         active_threads = sum(
             1
@@ -216,13 +280,24 @@ def _check_pool_health(self, pool_info: dict, stuck_max_interval=4) -> tuple[boo
         if active_threads == 0 and pool_info["max_workers"] > 0:
             return False, "No active worker threads"
 
-        # Check if threads are stuck (no activity for 2 intervals)
+        # Check if threads are stuck (no activity for specified intervals)
         time_delta = (datetime.utcnow() - pool_info["last_active"]).total_seconds()
         if time_delta >= self.check_interval * stuck_max_interval:
-            return False, "No recent activity"
+            return False, f"No recent activity for {time_delta:.1f} seconds"
 
         # If we got here, pool appears healthy
         pool_info["last_active"] = datetime.utcnow()
+
+        # Log health status with comprehensive information
+        if self.dispatcher:
+            task_count = self.dispatcher.get_running_task_count()
+            max_workers = pool_info.get("max_workers", 0)
+            stuck_count = len(stuck_tasks)
+            logger.info(
+                f"Pool health check passed - {active_threads} active threads, "
+                f"{task_count} running tasks, pool size: {max_workers}, stuck tasks: {stuck_count}"
+            )
+
         return True, ""
 
     def _restart_pool(self, name: str, pool_info: dict) -> None:
diff --git a/src/memos/mem_scheduler/schemas/analyzer_schemas.py b/src/memos/mem_scheduler/schemas/analyzer_schemas.py
new file mode 100644
index 000000000..6a4381012
--- /dev/null
+++ b/src/memos/mem_scheduler/schemas/analyzer_schemas.py
@@ -0,0 +1,52 @@
+import json
+
+from pathlib import Path
+from typing import Any
+
+from pydantic import BaseModel, Field
+
+from memos.log import get_logger
+
+
+logger = get_logger(__name__)
+
+FILE_PATH = Path(__file__).absolute()
+BASE_DIR = FILE_PATH.parent.parent.parent.parent.parent
+
+
+class BasicRecordingCase(BaseModel):
+    # Conversation identification
+    conv_id: str = Field(description="Conversation identifier for this evaluation case")
+    user_id: str = Field(description="User identifier for this evaluation case")
+    memcube_id: str = Field(description="Memcube identifier for this evaluation case")
+
+    # Query and answer information
+    query: str = Field(description="The current question/query being evaluated")
+
+    answer: str = Field(description="The generated answer for the query")
+
+    golden_answer: str | None = Field(
+        default=None, description="Ground truth answer for evaluation"
+    )
+
+    def to_dict(self) -> dict[str, Any]:
+        return self.dict()
+
+    def to_json(self, indent: int = 2) -> str:
+        return self.json(indent=indent, ensure_ascii=False)
+
+    @classmethod
+    def from_dict(cls, data: dict[str, Any]) -> "BasicRecordingCase":
+        return cls(**data)
+
+    @classmethod
+    def from_json(cls, json_str: str) -> "BasicRecordingCase":
+        data = json.loads(json_str)
+        return cls.from_dict(data)
+
+    class Config:
+        """Pydantic configuration"""
+
+        extra = "allow"  # Allow additional fields not defined in the schema
+        validate_assignment = True  # Validate on assignment
+        use_enum_values = True  # Use enum values instead of enum names
diff --git a/src/memos/mem_scheduler/schemas/general_schemas.py b/src/memos/mem_scheduler/schemas/general_schemas.py
index a81caf5a8..d0d83091b 100644
--- a/src/memos/mem_scheduler/schemas/general_schemas.py
+++ b/src/memos/mem_scheduler/schemas/general_schemas.py
@@ -17,8 +17,17 @@
 DEFAULT_WORKING_MEM_MONITOR_SIZE_LIMIT = 30
 DEFAULT_ACTIVATION_MEM_MONITOR_SIZE_LIMIT = 20
 DEFAULT_ACT_MEM_DUMP_PATH = f"{BASE_DIR}/outputs/mem_scheduler/mem_cube_scheduler_test.kv_cache"
-DEFAULT_THREAD__POOL_MAX_WORKERS = 5
-DEFAULT_CONSUME_INTERVAL_SECONDS = 3
+DEFAULT_THREAD_POOL_MAX_WORKERS = 30
+DEFAULT_CONSUME_INTERVAL_SECONDS = 0.05
+DEFAULT_DISPATCHER_MONITOR_CHECK_INTERVAL = 300
+DEFAULT_DISPATCHER_MONITOR_MAX_FAILURES = 2
+DEFAULT_STUCK_THREAD_TOLERANCE = 10
+
+# startup mode configuration
+STARTUP_BY_THREAD = "thread"
+STARTUP_BY_PROCESS = "process"
+DEFAULT_STARTUP_MODE = STARTUP_BY_THREAD  # default to thread mode
+
 NOT_INITIALIZED = -1
 
 
diff --git a/src/memos/mem_scheduler/schemas/task_schemas.py b/src/memos/mem_scheduler/schemas/task_schemas.py
new file mode 100644
index 000000000..d189797ae
--- /dev/null
+++ b/src/memos/mem_scheduler/schemas/task_schemas.py
@@ -0,0 +1,67 @@
+from datetime import datetime
+from pathlib import Path
+from typing import Any
+from uuid import uuid4
+
+from pydantic import BaseModel, Field, computed_field
+
+from memos.log import get_logger
+from memos.mem_scheduler.general_modules.misc import DictConversionMixin
+
+
+logger = get_logger(__name__)
+
+FILE_PATH = Path(__file__).absolute()
+BASE_DIR = FILE_PATH.parent.parent.parent.parent.parent
+
+
+# ============== Running Tasks ==============
+class RunningTaskItem(BaseModel, DictConversionMixin):
+    """Data class for tracking running tasks in SchedulerDispatcher."""
+
+    item_id: str = Field(
+        description="Unique identifier for the task item", default_factory=lambda: str(uuid4())
+    )
+    user_id: str = Field(..., description="Required user identifier", min_length=1)
+    mem_cube_id: str = Field(..., description="Required memory cube identifier", min_length=1)
+    task_info: str = Field(..., description="Information about the task being executed")
+    task_name: str = Field(..., description="Name/type of the task handler")
+    start_time: datetime = Field(description="Task start time", default_factory=datetime.utcnow)
+    end_time: datetime | None = Field(default=None, description="Task completion time")
+    status: str = Field(default="running", description="Task status: running, completed, failed")
+    result: Any | None = Field(default=None, description="Task execution result")
+    error_message: str | None = Field(default=None, description="Error message if task failed")
+    messages: list[Any] | None = Field(
+        default=None, description="List of messages being processed by this task"
+    )
+
+    def mark_completed(self, result: Any | None = None) -> None:
+        """Mark task as completed with optional result."""
+        self.end_time = datetime.utcnow()
+        self.status = "completed"
+        self.result = result
+
+    def mark_failed(self, error_message: str) -> None:
+        """Mark task as failed with error message."""
+        self.end_time = datetime.utcnow()
+        self.status = "failed"
+        self.error_message = error_message
+
+    @computed_field
+    @property
+    def duration_seconds(self) -> float | None:
+        """Calculate task duration in seconds."""
+        if self.end_time:
+            return (self.end_time - self.start_time).total_seconds()
+        return None
+
+    def get_execution_info(self) -> str:
+        """Get formatted execution information for logging."""
+        duration = self.duration_seconds
+        duration_str = f"{duration:.2f}s" if duration else "ongoing"
+
+        return (
+            f"Task {self.task_name} (ID: {self.item_id[:8]}) "
+            f"for user {self.user_id}, cube {self.mem_cube_id} - "
+            f"Status: {self.status}, Duration: {duration_str}"
+        )
diff --git a/src/memos/mem_user/mysql_persistent_user_manager.py b/src/memos/mem_user/mysql_persistent_user_manager.py
index f8983c87c..99e49d206 100644
--- a/src/memos/mem_user/mysql_persistent_user_manager.py
+++ b/src/memos/mem_user/mysql_persistent_user_manager.py
@@ -188,7 +188,7 @@ def delete_user_config(self, user_id: str) -> bool:
         finally:
             session.close()
 
-    def list_user_configs(self) -> dict[str, MOSConfig]:
+    def list_user_configs(self, limit: int = 1) -> dict[str, MOSConfig]:
         """List all user configurations.
 
         Returns:
@@ -196,7 +196,7 @@ def list_user_configs(self) -> dict[str, MOSConfig]:
         """
         session = self._get_session()
         try:
-            user_configs = session.query(UserConfig).all()
+            user_configs = session.query(UserConfig).limit(limit).all()
             result = {}
 
             for user_config in user_configs:
diff --git a/src/memos/mem_user/persistent_factory.py b/src/memos/mem_user/persistent_factory.py
index b5ece61b5..6a7b4fa13 100644
--- a/src/memos/mem_user/persistent_factory.py
+++ b/src/memos/mem_user/persistent_factory.py
@@ -3,6 +3,7 @@
 from memos.configs.mem_user import UserManagerConfigFactory
 from memos.mem_user.mysql_persistent_user_manager import MySQLPersistentUserManager
 from memos.mem_user.persistent_user_manager import PersistentUserManager
+from memos.mem_user.redis_persistent_user_manager import RedisPersistentUserManager
 
 
 class PersistentUserManagerFactory:
@@ -11,6 +12,7 @@ class PersistentUserManagerFactory:
     backend_to_class: ClassVar[dict[str, Any]] = {
         "sqlite": PersistentUserManager,
         "mysql": MySQLPersistentUserManager,
+        "redis": RedisPersistentUserManager,
     }
 
     @classmethod
diff --git a/src/memos/mem_user/redis_persistent_user_manager.py b/src/memos/mem_user/redis_persistent_user_manager.py
new file mode 100644
index 000000000..48c89c663
--- /dev/null
+++ b/src/memos/mem_user/redis_persistent_user_manager.py
@@ -0,0 +1,225 @@
+"""Redis-based persistent user management system for MemOS with configuration storage.
+
+This module provides persistent storage for user configurations using Redis.
+"""
+
+import json
+
+from memos.configs.mem_os import MOSConfig
+from memos.dependency import require_python_package
+from memos.log import get_logger
+
+
+logger = get_logger(__name__)
+
+
+class RedisPersistentUserManager:
+    """Redis-based user configuration manager with persistence."""
+
+    @require_python_package(
+        import_name="redis",
+        install_command="pip install redis",
+        install_link="https://redis.readthedocs.io/en/stable/",
+    )
+    def __init__(
+        self,
+        host: str = "localhost",
+        port: int = 6379,
+        password: str = "",
+        db: int = 0,
+        decode_responses: bool = True,
+    ):
+        """Initialize the Redis persistent user manager.
+
+        Args:
+            user_id (str, optional): User ID. Defaults to "root".
+            host (str): Redis server host. Defaults to "localhost".
+            port (int): Redis server port. Defaults to 6379.
+            password (str): Redis password. Defaults to "".
+            db (int): Redis database number. Defaults to 0.
+            decode_responses (bool): Whether to decode responses to strings. Defaults to True.
+        """
+        import redis
+
+        self.host = host
+        self.port = port
+        self.db = db
+
+        try:
+            # Create Redis connection
+            self._redis_client = redis.Redis(
+                host=host,
+                port=port,
+                password=password if password else None,
+                db=db,
+                decode_responses=decode_responses,
+            )
+
+            # Test connection
+            if not self._redis_client.ping():
+                raise ConnectionError("Redis connection failed")
+
+            logger.info(
+                f"RedisPersistentUserManager initialized successfully, connected to {host}:{port}/{db}"
+            )
+
+        except Exception as e:
+            logger.error(f"Redis connection error: {e}")
+            raise
+
+    def _get_config_key(self, user_id: str) -> str:
+        """Generate Redis key for user configuration.
+
+        Args:
+            user_id (str): User ID.
+
+        Returns:
+            str: Redis key name.
+        """
+        return user_id
+
+    def save_user_config(self, user_id: str, config: MOSConfig) -> bool:
+        """Save user configuration to Redis.
+
+        Args:
+            user_id (str): User ID.
+            config (MOSConfig): User's MOS configuration.
+
+        Returns:
+            bool: True if successful, False otherwise.
+        """
+        try:
+            # Convert config to JSON string
+            config_dict = config.model_dump(mode="json")
+            config_json = json.dumps(config_dict, ensure_ascii=False, indent=2)
+
+            # Save to Redis
+            key = self._get_config_key(user_id)
+            self._redis_client.set(key, config_json)
+
+            logger.info(f"Successfully saved configuration for user {user_id} to Redis")
+            return True
+
+        except Exception as e:
+            logger.error(f"Error saving configuration for user {user_id}: {e}")
+            return False
+
+    def get_user_config(self, user_id: str) -> dict | None:
+        """Get user configuration from Redis (search interface).
+
+        Args:
+            user_id (str): User ID.
+
+        Returns:
+            MOSConfig | None: User's configuration object, or None if not found.
+        """
+        try:
+            # Get configuration from Redis
+            key = self._get_config_key(user_id)
+            config_json = self._redis_client.get(key)
+
+            if config_json is None:
+                logger.info(f"Configuration for user {user_id} does not exist")
+                return None
+
+            # Parse JSON and create MOSConfig object
+            config_dict = json.loads(config_json)
+
+            logger.info(f"Successfully retrieved configuration for user {user_id}")
+            return config_dict
+
+        except json.JSONDecodeError as e:
+            logger.error(f"Error parsing JSON configuration for user {user_id}: {e}")
+            return None
+        except Exception as e:
+            logger.error(f"Error retrieving configuration for user {user_id}: {e}")
+            return None
+
+    def delete_user_config(self, user_id: str) -> bool:
+        """Delete user configuration from Redis.
+
+        Args:
+            user_id (str): User ID.
+
+        Returns:
+            bool: True if successful, False otherwise.
+        """
+        try:
+            key = self._get_config_key(user_id)
+            result = self._redis_client.delete(key)
+
+            if result > 0:
+                logger.info(f"Successfully deleted configuration for user {user_id}")
+                return True
+            else:
+                logger.warning(f"Configuration for user {user_id} does not exist, cannot delete")
+                return False
+
+        except Exception as e:
+            logger.error(f"Error deleting configuration for user {user_id}: {e}")
+            return False
+
+    def exists_user_config(self, user_id: str) -> bool:
+        """Check if user configuration exists.
+
+        Args:
+            user_id (str): User ID.
+
+        Returns:
+            bool: True if exists, False otherwise.
+        """
+        try:
+            key = self._get_config_key(user_id)
+            return self._redis_client.exists(key) > 0
+        except Exception as e:
+            logger.error(f"Error checking if configuration exists for user {user_id}: {e}")
+            return False
+
+    def list_user_configs(
+        self, pattern: str = "user_config:*", count: int = 100
+    ) -> dict[str, dict]:
+        """List all user configurations.
+
+        Args:
+            pattern (str): Redis key matching pattern. Defaults to "user_config:*".
+            count (int): Number of keys to return per scan. Defaults to 100.
+
+        Returns:
+            dict[str, dict]: Dictionary mapping user_id to dict objects.
+        """
+        result = {}
+        try:
+            # Use SCAN command to iterate through all matching keys
+            cursor = 0
+            while True:
+                cursor, keys = self._redis_client.scan(cursor, match=pattern, count=count)
+
+                for key in keys:
+                    # Extract user_id (remove "user_config:" prefix)
+                    user_id = key.replace("user_config:", "")
+                    config = self.get_user_config(user_id)
+                    if config:
+                        result[user_id] = config
+
+                if cursor == 0:
+                    break
+
+            logger.info(f"Successfully listed {len(result)} user configurations")
+            return result
+
+        except Exception as e:
+            logger.error(f"Error listing user configurations: {e}")
+            return {}
+
+    def close(self) -> None:
+        """Close Redis connection.
+
+        This method should be called when the RedisPersistentUserManager is no longer needed
+        to ensure proper cleanup of Redis connections.
+        """
+        try:
+            if hasattr(self, "_redis_client") and self._redis_client:
+                self._redis_client.close()
+                logger.info("Redis connection closed")
+        except Exception as e:
+            logger.error(f"Error closing Redis connection: {e}")
diff --git a/src/memos/memories/factory.py b/src/memos/memories/factory.py
index 9fdc67c53..bcf7fdd9b 100644
--- a/src/memos/memories/factory.py
+++ b/src/memos/memories/factory.py
@@ -10,6 +10,7 @@
 from memos.memories.textual.base import BaseTextMemory
 from memos.memories.textual.general import GeneralTextMemory
 from memos.memories.textual.naive import NaiveTextMemory
+from memos.memories.textual.simple_tree import SimpleTreeTextMemory
 from memos.memories.textual.tree import TreeTextMemory
 
 
@@ -20,6 +21,7 @@ class MemoryFactory(BaseMemory):
         "naive_text": NaiveTextMemory,
         "general_text": GeneralTextMemory,
         "tree_text": TreeTextMemory,
+        "simple_tree_text": SimpleTreeTextMemory,
         "kv_cache": KVCacheMemory,
         "vllm_kv_cache": VLLMKVCacheMemory,
         "lora": LoRAMemory,
diff --git a/src/memos/memories/textual/base.py b/src/memos/memories/textual/base.py
index 8171fadce..82dad4486 100644
--- a/src/memos/memories/textual/base.py
+++ b/src/memos/memories/textual/base.py
@@ -24,7 +24,7 @@ def extract(self, messages: MessageList) -> list[TextualMemoryItem]:
         """
 
     @abstractmethod
-    def add(self, memories: list[TextualMemoryItem | dict[str, Any]]) -> list[str]:
+    def add(self, memories: list[TextualMemoryItem | dict[str, Any]], **kwargs) -> list[str]:
         """Add memories.
 
         Args:
diff --git a/src/memos/memories/textual/simple_tree.py b/src/memos/memories/textual/simple_tree.py
new file mode 100644
index 000000000..9c67db288
--- /dev/null
+++ b/src/memos/memories/textual/simple_tree.py
@@ -0,0 +1,295 @@
+import time
+
+from datetime import datetime
+from typing import TYPE_CHECKING, Any
+
+from memos.configs.memory import TreeTextMemoryConfig
+from memos.embedders.base import BaseEmbedder
+from memos.graph_dbs.base import BaseGraphDB
+from memos.llms.base import BaseLLM
+from memos.log import get_logger
+from memos.mem_reader.base import BaseMemReader
+from memos.memories.textual.item import TextualMemoryItem, TreeNodeTextualMemoryMetadata
+from memos.memories.textual.tree import TreeTextMemory
+from memos.memories.textual.tree_text_memory.organize.manager import MemoryManager
+from memos.memories.textual.tree_text_memory.retrieve.searcher import Searcher
+from memos.reranker.base import BaseReranker
+from memos.types import MessageList
+
+
+if TYPE_CHECKING:
+    from memos.embedders.factory import OllamaEmbedder
+    from memos.graph_dbs.factory import Neo4jGraphDB
+    from memos.llms.factory import AzureLLM, OllamaLLM, OpenAILLM
+
+
+logger = get_logger(__name__)
+
+
+class SimpleTreeTextMemory(TreeTextMemory):
+    """General textual memory implementation for storing and retrieving memories."""
+
+    def __init__(
+        self,
+        llm: BaseLLM,
+        embedder: BaseEmbedder,
+        mem_reader: BaseMemReader,
+        graph_db: BaseGraphDB,
+        reranker: BaseReranker,
+        memory_manager: MemoryManager,
+        config: TreeTextMemoryConfig,
+        internet_retriever: None = None,
+        is_reorganize: bool = False,
+    ):
+        """Initialize memory with the given configuration."""
+        time_start = time.time()
+        self.config: TreeTextMemoryConfig = config
+
+        self.extractor_llm: OpenAILLM | OllamaLLM | AzureLLM = llm
+        logger.info(f"time init: extractor_llm time is: {time.time() - time_start}")
+
+        time_start_ex = time.time()
+        self.dispatcher_llm: OpenAILLM | OllamaLLM | AzureLLM = llm
+        logger.info(f"time init: dispatcher_llm time is: {time.time() - time_start_ex}")
+
+        time_start_em = time.time()
+        self.embedder: OllamaEmbedder = embedder
+        logger.info(f"time init: embedder time is: {time.time() - time_start_em}")
+
+        time_start_gs = time.time()
+        self.graph_store: Neo4jGraphDB = graph_db
+        logger.info(f"time init: graph_store time is: {time.time() - time_start_gs}")
+
+        time_start_rr = time.time()
+        self.reranker = reranker
+        logger.info(f"time init: reranker time is: {time.time() - time_start_rr}")
+
+        time_start_mm = time.time()
+        self.memory_manager: MemoryManager = memory_manager
+        logger.info(f"time init: memory_manager time is: {time.time() - time_start_mm}")
+        time_start_ir = time.time()
+        # Create internet retriever if configured
+        self.internet_retriever = None
+        if config.internet_retriever is not None:
+            self.internet_retriever = internet_retriever
+            logger.info(
+                f"Internet retriever initialized with backend: {config.internet_retriever.backend}"
+            )
+        else:
+            logger.info("No internet retriever configured")
+        logger.info(f"time init: internet_retriever time is: {time.time() - time_start_ir}")
+
+    def add(
+        self, memories: list[TextualMemoryItem | dict[str, Any]], user_name: str | None = None
+    ) -> list[str]:
+        """Add memories.
+        Args:
+            memories: List of TextualMemoryItem objects or dictionaries to add.
+        Later:
+            memory_items = [TextualMemoryItem(**m) if isinstance(m, dict) else m for m in memories]
+            metadata = extract_metadata(memory_items, self.extractor_llm)
+            plan = plan_memory_operations(memory_items, metadata, self.graph_store)
+            execute_plan(memory_items, metadata, plan, self.graph_store)
+        """
+        return self.memory_manager.add(memories, user_name=user_name)
+
+    def replace_working_memory(
+        self, memories: list[TextualMemoryItem], user_name: str | None = None
+    ) -> None:
+        self.memory_manager.replace_working_memory(memories, user_name=user_name)
+
+    def get_working_memory(self, user_name: str | None = None) -> list[TextualMemoryItem]:
+        working_memories = self.graph_store.get_all_memory_items(
+            scope="WorkingMemory", user_name=user_name
+        )
+        items = [TextualMemoryItem.from_dict(record) for record in (working_memories)]
+        # Sort by updated_at in descending order
+        sorted_items = sorted(
+            items, key=lambda x: x.metadata.updated_at or datetime.min, reverse=True
+        )
+        return sorted_items
+
+    def get_current_memory_size(self, user_name: str | None = None) -> dict[str, int]:
+        """
+        Get the current size of each memory type.
+        This delegates to the MemoryManager.
+        """
+        return self.memory_manager.get_current_memory_size(user_name=user_name)
+
+    def search(
+        self,
+        query: str,
+        top_k: int,
+        info=None,
+        mode: str = "fast",
+        memory_type: str = "All",
+        manual_close_internet: bool = False,
+        moscube: bool = False,
+        search_filter: dict | None = None,
+        user_name: str | None = None,
+    ) -> list[TextualMemoryItem]:
+        """Search for memories based on a query.
+        User query -> TaskGoalParser -> MemoryPathResolver ->
+        GraphMemoryRetriever -> MemoryReranker -> MemoryReasoner -> Final output
+        Args:
+            query (str): The query to search for.
+            top_k (int): The number of top results to return.
+            info (dict): Leave a record of memory consumption.
+            mode (str, optional): The mode of the search.
+            - 'fast': Uses a faster search process, sacrificing some precision for speed.
+            - 'fine': Uses a more detailed search process, invoking large models for higher precision, but slower performance.
+            memory_type (str): Type restriction for search.
+            ['All', 'WorkingMemory', 'LongTermMemory', 'UserMemory']
+            manual_close_internet (bool): If True, the internet retriever will be closed by this search, it high priority than config.
+            moscube (bool): whether you use moscube to answer questions
+            search_filter (dict, optional): Optional metadata filters for search results.
+                - Keys correspond to memory metadata fields (e.g., "user_id", "session_id").
+                - Values are exact-match conditions.
+                Example: {"user_id": "123", "session_id": "abc"}
+                If None, no additional filtering is applied.
+        Returns:
+            list[TextualMemoryItem]: List of matching memories.
+        """
+        if (self.internet_retriever is not None) and manual_close_internet:
+            logger.warning(
+                "Internet retriever is init by config , but  this search set manual_close_internet is True  and will close it"
+            )
+            searcher = Searcher(
+                self.dispatcher_llm,
+                self.graph_store,
+                self.embedder,
+                self.reranker,
+                internet_retriever=None,
+                moscube=moscube,
+            )
+        else:
+            searcher = Searcher(
+                self.dispatcher_llm,
+                self.graph_store,
+                self.embedder,
+                self.reranker,
+                internet_retriever=self.internet_retriever,
+                moscube=moscube,
+            )
+        return searcher.search(
+            query, top_k, info, mode, memory_type, search_filter, user_name=user_name
+        )
+
+    def get_relevant_subgraph(
+        self, query: str, top_k: int = 5, depth: int = 2, center_status: str = "activated"
+    ) -> dict[str, Any]:
+        """
+        Find and merge the local neighborhood sub-graphs of the top-k
+        nodes most relevant to the query.
+         Process:
+             1. Embed the user query into a vector representation.
+             2. Use vector similarity search to find the top-k similar nodes.
+             3. For each similar node:
+                 - Ensure its status matches `center_status` (e.g., 'active').
+                 - Retrieve its local subgraph up to `depth` hops.
+                 - Collect the center node, its neighbors, and connecting edges.
+             4. Merge all retrieved subgraphs into a single unified subgraph.
+             5. Return the merged subgraph structure.
+
+         Args:
+             query (str): The user input or concept to find relevant memories for.
+             top_k (int, optional): How many top similar nodes to retrieve. Default is 5.
+             depth (int, optional): The neighborhood depth (number of hops). Default is 2.
+             center_status (str, optional): Status condition the center node must satisfy (e.g., 'active').
+
+         Returns:
+             dict[str, Any]: A subgraph dict with:
+                 - 'core_id': ID of the top matching core node, or None if none found.
+                 - 'nodes': List of unique nodes (core + neighbors) in the merged subgraph.
+                 - 'edges': List of unique edges (as dicts with 'from', 'to', 'type') in the merged subgraph.
+        """
+        # Step 1: Embed query
+        query_embedding = self.embedder.embed([query])[0]
+
+        # Step 2: Get top-1 similar node
+        similar_nodes = self.graph_store.search_by_embedding(query_embedding, top_k=top_k)
+        if not similar_nodes:
+            logger.info("No similar nodes found for query embedding.")
+            return {"core_id": None, "nodes": [], "edges": []}
+
+        # Step 3: Fetch neighborhood
+        all_nodes = {}
+        all_edges = set()
+        cores = []
+
+        for node in similar_nodes:
+            core_id = node["id"]
+            score = node["score"]
+
+            subgraph = self.graph_store.get_subgraph(
+                center_id=core_id, depth=depth, center_status=center_status
+            )
+
+            if not subgraph["core_node"]:
+                logger.info(f"Skipping node {core_id} (inactive or not found).")
+                continue
+
+            core_node = subgraph["core_node"]
+            neighbors = subgraph["neighbors"]
+            edges = subgraph["edges"]
+
+            # Collect nodes
+            all_nodes[core_node["id"]] = core_node
+            for n in neighbors:
+                all_nodes[n["id"]] = n
+
+            # Collect edges
+            for e in edges:
+                all_edges.add((e["source"], e["target"], e["type"]))
+
+            cores.append(
+                {"id": core_id, "score": score, "core_node": core_node, "neighbors": neighbors}
+            )
+
+        top_core = cores[0]
+        return {
+            "core_id": top_core["id"],
+            "nodes": list(all_nodes.values()),
+            "edges": [{"source": f, "target": t, "type": ty} for (f, t, ty) in all_edges],
+        }
+
+    def extract(self, messages: MessageList) -> list[TextualMemoryItem]:
+        raise NotImplementedError
+
+    def update(self, memory_id: str, new_memory: TextualMemoryItem | dict[str, Any]) -> None:
+        raise NotImplementedError
+
+    def get(self, memory_id: str) -> TextualMemoryItem:
+        """Get a memory by its ID."""
+        result = self.graph_store.get_node(memory_id)
+        if result is None:
+            raise ValueError(f"Memory with ID {memory_id} not found")
+        metadata_dict = result.get("metadata", {})
+        return TextualMemoryItem(
+            id=result["id"],
+            memory=result["memory"],
+            metadata=TreeNodeTextualMemoryMetadata(**metadata_dict),
+        )
+
+    def get_by_ids(self, memory_ids: list[str]) -> list[TextualMemoryItem]:
+        raise NotImplementedError
+
+    def get_all(self) -> dict:
+        """Get all memories.
+        Returns:
+            list[TextualMemoryItem]: List of all memories.
+        """
+        all_items = self.graph_store.export_graph()
+        return all_items
+
+    def delete(self, memory_ids: list[str]) -> None:
+        raise NotImplementedError
+
+    def delete_all(self) -> None:
+        """Delete all memories and their relationships from the graph store."""
+        try:
+            self.graph_store.clear()
+            logger.info("All memories and edges have been deleted from the graph.")
+        except Exception as e:
+            logger.error(f"An error occurred while deleting all memories: {e}")
+            raise
diff --git a/src/memos/memories/textual/tree_text_memory/organize/manager.py b/src/memos/memories/textual/tree_text_memory/organize/manager.py
index b0224655c..3e1609cb7 100644
--- a/src/memos/memories/textual/tree_text_memory/organize/manager.py
+++ b/src/memos/memories/textual/tree_text_memory/organize/manager.py
@@ -52,14 +52,14 @@ def __init__(
         )
         self._merged_threshold = merged_threshold
 
-    def add(self, memories: list[TextualMemoryItem]) -> list[str]:
+    def add(self, memories: list[TextualMemoryItem], user_name: str | None = None) -> list[str]:
         """
         Add new memories in parallel to different memory types (WorkingMemory, LongTermMemory, UserMemory).
         """
         added_ids: list[str] = []
 
         with ContextThreadPoolExecutor(max_workers=8) as executor:
-            futures = {executor.submit(self._process_memory, m): m for m in memories}
+            futures = {executor.submit(self._process_memory, m, user_name): m for m in memories}
             for future in as_completed(futures, timeout=60):
                 try:
                     ids = future.result()
@@ -67,41 +67,31 @@ def add(self, memories: list[TextualMemoryItem]) -> list[str]:
                 except Exception as e:
                     logger.exception("Memory processing error: ", exc_info=e)
 
-        # Only clean up if we're close to or over the limit
-        self._cleanup_memories_if_needed()
+        for mem_type in ["WorkingMemory", "LongTermMemory", "UserMemory"]:
+            try:
+                self.graph_store.remove_oldest_memory(
+                    memory_type="WorkingMemory",
+                    keep_latest=self.memory_size[mem_type],
+                    user_name=user_name,
+                )
+            except Exception:
+                logger.warning(f"Remove {mem_type} error: {traceback.format_exc()}")
 
-        self._refresh_memory_size()
+        self._refresh_memory_size(user_name=user_name)
         return added_ids
 
-    def _cleanup_memories_if_needed(self) -> None:
-        """
-        Only clean up memories if we're close to or over the limit.
-        This reduces unnecessary database operations.
-        """
-        cleanup_threshold = 0.8  # Clean up when 80% full
-
-        for memory_type, limit in self.memory_size.items():
-            current_count = self.current_memory_size.get(memory_type, 0)
-            threshold = int(limit * cleanup_threshold)
-
-            # Only clean up if we're at or above the threshold
-            if current_count >= threshold:
-                try:
-                    self.graph_store.remove_oldest_memory(
-                        memory_type=memory_type, keep_latest=limit
-                    )
-                    logger.debug(f"Cleaned up {memory_type}: {current_count} -> {limit}")
-                except Exception:
-                    logger.warning(f"Remove {memory_type} error: {traceback.format_exc()}")
-
-    def replace_working_memory(self, memories: list[TextualMemoryItem]) -> None:
+    def replace_working_memory(
+        self, memories: list[TextualMemoryItem], user_name: str | None = None
+    ) -> None:
         """
         Replace WorkingMemory
         """
         working_memory_top_k = memories[: self.memory_size["WorkingMemory"]]
         with ContextThreadPoolExecutor(max_workers=8) as executor:
             futures = [
-                executor.submit(self._add_memory_to_db, memory, "WorkingMemory")
+                executor.submit(
+                    self._add_memory_to_db, memory, "WorkingMemory", user_name=user_name
+                )
                 for memory in working_memory_top_k
             ]
             for future in as_completed(futures, timeout=60):
@@ -111,47 +101,51 @@ def replace_working_memory(self, memories: list[TextualMemoryItem]) -> None:
                     logger.exception("Memory processing error: ", exc_info=e)
 
         self.graph_store.remove_oldest_memory(
-            memory_type="WorkingMemory", keep_latest=self.memory_size["WorkingMemory"]
+            memory_type="WorkingMemory",
+            keep_latest=self.memory_size["WorkingMemory"],
+            user_name=user_name,
         )
-        self._refresh_memory_size()
+        self._refresh_memory_size(user_name=user_name)
 
-    def get_current_memory_size(self) -> dict[str, int]:
+    def get_current_memory_size(self, user_name: str | None = None) -> dict[str, int]:
         """
         Return the cached memory type counts.
         """
-        self._refresh_memory_size()
+        self._refresh_memory_size(user_name=user_name)
         return self.current_memory_size
 
-    def _refresh_memory_size(self) -> None:
+    def _refresh_memory_size(self, user_name: str | None = None) -> None:
         """
         Query the latest counts from the graph store and update internal state.
         """
-        results = self.graph_store.get_grouped_counts(group_fields=["memory_type"])
+        results = self.graph_store.get_grouped_counts(
+            group_fields=["memory_type"], user_name=user_name
+        )
         self.current_memory_size = {record["memory_type"]: record["count"] for record in results}
         logger.info(f"[MemoryManager] Refreshed memory sizes: {self.current_memory_size}")
 
-    def _process_memory(self, memory: TextualMemoryItem):
+    def _process_memory(self, memory: TextualMemoryItem, user_name: str | None = None):
         """
         Process and add memory to different memory types (WorkingMemory, LongTermMemory, UserMemory).
         This method runs asynchronously to process each memory item.
         """
         ids = []
 
-        # Add to WorkingMemory
-        working_id = self._add_memory_to_db(memory, "WorkingMemory")
-        ids.append(working_id)
+        # Add to WorkingMemory do not return working_id
+        self._add_memory_to_db(memory, "WorkingMemory", user_name)
 
         # Add to LongTermMemory and UserMemory
         if memory.metadata.memory_type in ["LongTermMemory", "UserMemory"]:
             added_id = self._add_to_graph_memory(
-                memory=memory,
-                memory_type=memory.metadata.memory_type,
+                memory=memory, memory_type=memory.metadata.memory_type, user_name=user_name
             )
             ids.append(added_id)
 
         return ids
 
-    def _add_memory_to_db(self, memory: TextualMemoryItem, memory_type: str) -> str:
+    def _add_memory_to_db(
+        self, memory: TextualMemoryItem, memory_type: str, user_name: str | None = None
+    ) -> str:
         """
         Add a single memory item to the graph store, with FIFO logic for WorkingMemory.
         """
@@ -162,10 +156,12 @@ def _add_memory_to_db(self, memory: TextualMemoryItem, memory_type: str) -> str:
         working_memory = TextualMemoryItem(memory=memory.memory, metadata=metadata)
 
         # Insert node into graph
-        self.graph_store.add_node(working_memory.id, working_memory.memory, metadata)
+        self.graph_store.add_node(working_memory.id, working_memory.memory, metadata, user_name)
         return working_memory.id
 
-    def _add_to_graph_memory(self, memory: TextualMemoryItem, memory_type: str):
+    def _add_to_graph_memory(
+        self, memory: TextualMemoryItem, memory_type: str, user_name: str | None = None
+    ):
         """
         Generalized method to add memory to a graph-based memory type (e.g., LongTermMemory, UserMemory).
 
@@ -179,7 +175,10 @@ def _add_to_graph_memory(self, memory: TextualMemoryItem, memory_type: str):
         node_id = str(uuid.uuid4())
         # Step 2: Add new node to graph
         self.graph_store.add_node(
-            node_id, memory.memory, memory.metadata.model_dump(exclude_none=True)
+            node_id,
+            memory.memory,
+            memory.metadata.model_dump(exclude_none=True),
+            user_name=user_name,
         )
         self.reorganizer.add_message(
             QueueMessage(
diff --git a/src/memos/memories/textual/tree_text_memory/retrieve/recall.py b/src/memos/memories/textual/tree_text_memory/retrieve/recall.py
index 84cc8ecb3..d4cfcf501 100644
--- a/src/memos/memories/textual/tree_text_memory/retrieve/recall.py
+++ b/src/memos/memories/textual/tree_text_memory/retrieve/recall.py
@@ -30,6 +30,7 @@ def retrieve(
         memory_scope: str,
         query_embedding: list[list[float]] | None = None,
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ) -> list[TextualMemoryItem]:
         """
         Perform hybrid memory retrieval:
@@ -53,13 +54,13 @@ def retrieve(
         if memory_scope == "WorkingMemory":
             # For working memory, retrieve all entries (no filtering)
             working_memories = self.graph_store.get_all_memory_items(
-                scope="WorkingMemory", include_embedding=False
+                scope="WorkingMemory", include_embedding=False, user_name=user_name
             )
             return [TextualMemoryItem.from_dict(record) for record in working_memories]
 
         with ContextThreadPoolExecutor(max_workers=2) as executor:
             # Structured graph-based retrieval
-            future_graph = executor.submit(self._graph_recall, parsed_goal, memory_scope)
+            future_graph = executor.submit(self._graph_recall, parsed_goal, memory_scope, user_name)
             # Vector similarity search
             future_vector = executor.submit(
                 self._vector_recall,
@@ -67,6 +68,7 @@ def retrieve(
                 memory_scope,
                 top_k,
                 search_filter=search_filter,
+                user_name=user_name,
             )
 
             graph_results = future_graph.result()
@@ -92,6 +94,7 @@ def retrieve_from_cube(
         memory_scope: str,
         query_embedding: list[list[float]] | None = None,
         cube_name: str = "memos_cube01",
+        user_name: str | None = None,
     ) -> list[TextualMemoryItem]:
         """
         Perform hybrid memory retrieval:
@@ -112,7 +115,7 @@ def retrieve_from_cube(
             raise ValueError(f"Unsupported memory scope: {memory_scope}")
 
         graph_results = self._vector_recall(
-            query_embedding, memory_scope, top_k, cube_name=cube_name
+            query_embedding, memory_scope, top_k, cube_name=cube_name, user_name=user_name
         )
 
         for result_i in graph_results:
@@ -132,7 +135,7 @@ def retrieve_from_cube(
         return list(combined.values())
 
     def _graph_recall(
-        self, parsed_goal: ParsedTaskGoal, memory_scope: str
+        self, parsed_goal: ParsedTaskGoal, memory_scope: str, user_name: str | None = None
     ) -> list[TextualMemoryItem]:
         """
         Perform structured node-based retrieval from Neo4j.
@@ -148,7 +151,7 @@ def _graph_recall(
                 {"field": "key", "op": "in", "value": parsed_goal.keys},
                 {"field": "memory_type", "op": "=", "value": memory_scope},
             ]
-            key_ids = self.graph_store.get_by_metadata(key_filters)
+            key_ids = self.graph_store.get_by_metadata(key_filters, user_name=user_name)
             candidate_ids.update(key_ids)
 
         # 2) tag-based OR branch
@@ -157,7 +160,7 @@ def _graph_recall(
                 {"field": "tags", "op": "contains", "value": parsed_goal.tags},
                 {"field": "memory_type", "op": "=", "value": memory_scope},
             ]
-            tag_ids = self.graph_store.get_by_metadata(tag_filters)
+            tag_ids = self.graph_store.get_by_metadata(tag_filters, user_name=user_name)
             candidate_ids.update(tag_ids)
 
         # No matches → return empty
@@ -165,7 +168,9 @@ def _graph_recall(
             return []
 
         # Load nodes and post-filter
-        node_dicts = self.graph_store.get_nodes(list(candidate_ids), include_embedding=False)
+        node_dicts = self.graph_store.get_nodes(
+            list(candidate_ids), include_embedding=False, user_name=user_name
+        )
 
         final_nodes = []
         for node in node_dicts:
@@ -194,6 +199,7 @@ def _vector_recall(
         max_num: int = 3,
         cube_name: str | None = None,
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ) -> list[TextualMemoryItem]:
         """
         Perform vector-based similarity retrieval using query embedding.
@@ -210,6 +216,7 @@ def search_single(vec, filt=None):
                     scope=memory_scope,
                     cube_name=cube_name,
                     search_filter=filt,
+                    user_name=user_name,
                 )
                 or []
             )
@@ -255,7 +262,7 @@ def search_path_b():
         unique_ids = {r["id"] for r in all_hits if r.get("id")}
         node_dicts = (
             self.graph_store.get_nodes(
-                list(unique_ids), include_embedding=False, cube_name=cube_name
+                list(unique_ids), include_embedding=False, cube_name=cube_name, user_name=user_name
             )
             or []
         )
diff --git a/src/memos/memories/textual/tree_text_memory/retrieve/searcher.py b/src/memos/memories/textual/tree_text_memory/retrieve/searcher.py
index df154f23a..05db56f53 100644
--- a/src/memos/memories/textual/tree_text_memory/retrieve/searcher.py
+++ b/src/memos/memories/textual/tree_text_memory/retrieve/searcher.py
@@ -12,7 +12,6 @@
 from memos.reranker.base import BaseReranker
 from memos.utils import timed
 
-from .internet_retriever_factory import InternetRetrieverFactory
 from .reasoner import MemoryReasoner
 from .recall import GraphMemoryRetriever
 from .task_goal_parser import TaskGoalParser
@@ -28,7 +27,7 @@ def __init__(
         graph_store: Neo4jGraphDB,
         embedder: OllamaEmbedder,
         reranker: BaseReranker,
-        internet_retriever: InternetRetrieverFactory | None = None,
+        internet_retriever: None = None,
         moscube: bool = False,
     ):
         self.graph_store = graph_store
@@ -54,6 +53,7 @@ def search(
         mode="fast",
         memory_type="All",
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ) -> list[TextualMemoryItem]:
         """
         Search for memories based on a query.
@@ -85,14 +85,22 @@ def search(
             logger.debug(f"[SEARCH] Received info dict: {info}")
 
         parsed_goal, query_embedding, context, query = self._parse_task(
-            query, info, mode, search_filter=search_filter
+            query, info, mode, search_filter=search_filter, user_name=user_name
         )
         results = self._retrieve_paths(
-            query, parsed_goal, query_embedding, info, top_k, mode, memory_type, search_filter
+            query,
+            parsed_goal,
+            query_embedding,
+            info,
+            top_k,
+            mode,
+            memory_type,
+            search_filter,
+            user_name,
         )
         deduped = self._deduplicate_results(results)
         final_results = self._sort_and_trim(deduped, top_k)
-        self._update_usage_history(final_results, info)
+        self._update_usage_history(final_results, info, user_name)
 
         logger.info(f"[SEARCH] Done. Total {len(final_results)} results.")
         res_results = ""
@@ -104,7 +112,15 @@ def search(
         return final_results
 
     @timed
-    def _parse_task(self, query, info, mode, top_k=5, search_filter: dict | None = None):
+    def _parse_task(
+        self,
+        query,
+        info,
+        mode,
+        top_k=5,
+        search_filter: dict | None = None,
+        user_name: str | None = None,
+    ):
         """Parse user query, do embedding search and create context"""
         context = []
         query_embedding = None
@@ -118,7 +134,7 @@ def _parse_task(self, query, info, mode, top_k=5, search_filter: dict | None = N
             related_nodes = [
                 self.graph_store.get_node(n["id"])
                 for n in self.graph_store.search_by_embedding(
-                    query_embedding, top_k=top_k, search_filter=search_filter
+                    query_embedding, top_k=top_k, search_filter=search_filter, user_name=user_name
                 )
             ]
             memories = []
@@ -168,6 +184,7 @@ def _retrieve_paths(
         mode,
         memory_type,
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ):
         """Run A/B/C retrieval paths in parallel"""
         tasks = []
@@ -181,6 +198,7 @@ def _retrieve_paths(
                     top_k,
                     memory_type,
                     search_filter,
+                    user_name,
                 )
             )
             tasks.append(
@@ -192,6 +210,7 @@ def _retrieve_paths(
                     top_k,
                     memory_type,
                     search_filter,
+                    user_name,
                 )
             )
             tasks.append(
@@ -204,6 +223,7 @@ def _retrieve_paths(
                     info,
                     mode,
                     memory_type,
+                    user_name,
                 )
             )
             if self.moscube:
@@ -235,6 +255,7 @@ def _retrieve_from_working_memory(
         top_k,
         memory_type,
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ):
         """Retrieve and rerank from WorkingMemory"""
         if memory_type not in ["All", "WorkingMemory"]:
@@ -246,6 +267,7 @@ def _retrieve_from_working_memory(
             top_k=top_k,
             memory_scope="WorkingMemory",
             search_filter=search_filter,
+            user_name=user_name,
         )
         return self.reranker.rerank(
             query=query,
@@ -266,6 +288,7 @@ def _retrieve_from_long_term_and_user(
         top_k,
         memory_type,
         search_filter: dict | None = None,
+        user_name: str | None = None,
     ):
         """Retrieve and rerank from LongTermMemory and UserMemory"""
         results = []
@@ -282,6 +305,7 @@ def _retrieve_from_long_term_and_user(
                         top_k=top_k * 2,
                         memory_scope="LongTermMemory",
                         search_filter=search_filter,
+                        user_name=user_name,
                     )
                 )
             if memory_type in ["All", "UserMemory"]:
@@ -294,6 +318,7 @@ def _retrieve_from_long_term_and_user(
                         top_k=top_k * 2,
                         memory_scope="UserMemory",
                         search_filter=search_filter,
+                        user_name=user_name,
                     )
                 )
 
@@ -320,6 +345,7 @@ def _retrieve_from_memcubes(
             top_k=top_k * 2,
             memory_scope="LongTermMemory",
             cube_name=cube_name,
+            user_name=cube_name,
         )
         return self.reranker.rerank(
             query=query,
@@ -332,7 +358,15 @@ def _retrieve_from_memcubes(
     # --- Path C
     @timed
     def _retrieve_from_internet(
-        self, query, parsed_goal, query_embedding, top_k, info, mode, memory_type
+        self,
+        query,
+        parsed_goal,
+        query_embedding,
+        top_k,
+        info,
+        mode,
+        memory_type,
+        user_id: str | None = None,
     ):
         """Retrieve and rerank from Internet source"""
         if not self.internet_retriever or mode == "fast":
@@ -380,7 +414,7 @@ def _sort_and_trim(self, results, top_k):
         return final_items
 
     @timed
-    def _update_usage_history(self, items, info):
+    def _update_usage_history(self, items, info, user_name: str | None = None):
         """Update usage history in graph DB"""
         now_time = datetime.now().isoformat()
         info_copy = dict(info or {})
@@ -402,11 +436,15 @@ def _update_usage_history(self, items, info):
                 logger.exception("[USAGE] snapshot item failed")
 
         if payload:
-            self._usage_executor.submit(self._update_usage_history_worker, payload, usage_record)
+            self._usage_executor.submit(
+                self._update_usage_history_worker, payload, usage_record, user_name
+            )
 
-    def _update_usage_history_worker(self, payload, usage_record: str):
+    def _update_usage_history_worker(
+        self, payload, usage_record: str, user_name: str | None = None
+    ):
         try:
             for item_id, usage_list in payload:
-                self.graph_store.update_node(item_id, {"usage": usage_list})
+                self.graph_store.update_node(item_id, {"usage": usage_list}, user_name=user_name)
         except Exception:
             logger.exception("[USAGE] update usage failed")
diff --git a/src/memos/types.py b/src/memos/types.py
index 60d5da8d2..635fabccc 100644
--- a/src/memos/types.py
+++ b/src/memos/types.py
@@ -56,3 +56,25 @@ class MOSSearchResult(TypedDict):
     text_mem: list[dict[str, str | list[TextualMemoryItem]]]
     act_mem: list[dict[str, str | list[ActivationMemoryItem]]]
     para_mem: list[dict[str, str | list[ParametricMemoryItem]]]
+
+
+# ─── API Types ────────────────────────────────────────────────────────────────────
+# for API Permission
+Permission: TypeAlias = Literal["read", "write", "delete", "execute"]
+
+
+# Message structure
+class PermissionDict(TypedDict, total=False):
+    """Typed dictionary for chat message dictionaries."""
+
+    permissions: list[Permission]
+    mem_cube_id: str
+
+
+class UserContext(BaseModel):
+    """Model to represent user context."""
+
+    user_id: str | None = None
+    mem_cube_id: str | None = None
+    session_id: str | None = None
+    operation: list[PermissionDict] | None = None
diff --git a/src/memos/vec_dbs/milvus.py b/src/memos/vec_dbs/milvus.py
new file mode 100644
index 000000000..7bb1ceeba
--- /dev/null
+++ b/src/memos/vec_dbs/milvus.py
@@ -0,0 +1,367 @@
+from typing import Any
+
+from memos.configs.vec_db import MilvusVecDBConfig
+from memos.dependency import require_python_package
+from memos.log import get_logger
+from memos.vec_dbs.base import BaseVecDB
+from memos.vec_dbs.item import VecDBItem
+
+
+logger = get_logger(__name__)
+
+
+class MilvusVecDB(BaseVecDB):
+    """Milvus vector database implementation."""
+
+    @require_python_package(
+        import_name="pymilvus",
+        install_command="pip install -U pymilvus",
+        install_link="https://milvus.io/docs/install-pymilvus.md",
+    )
+    def __init__(self, config: MilvusVecDBConfig):
+        """Initialize the Milvus vector database and the collection."""
+        from pymilvus import MilvusClient
+
+        self.config = config
+
+        # Create Milvus client
+        self.client = MilvusClient(
+            uri=self.config.uri, user=self.config.user_name, password=self.config.password
+        )
+        self.schema = self.create_schema()
+        self.index_params = self.create_index()
+        self.create_collection()
+
+    def create_schema(self):
+        """Create schema for the milvus collection."""
+        from pymilvus import DataType
+
+        schema = self.client.create_schema(auto_id=False, enable_dynamic_field=True)
+        schema.add_field(
+            field_name="id", datatype=DataType.VARCHAR, max_length=65535, is_primary=True
+        )
+        schema.add_field(
+            field_name="vector", datatype=DataType.FLOAT_VECTOR, dim=self.config.vector_dimension
+        )
+        schema.add_field(field_name="payload", datatype=DataType.JSON)
+
+        return schema
+
+    def create_index(self):
+        """Create index for the milvus collection."""
+        index_params = self.client.prepare_index_params()
+        index_params.add_index(
+            field_name="vector", index_type="FLAT", metric_type=self._get_metric_type()
+        )
+
+        return index_params
+
+    def create_collection(self) -> None:
+        """Create a new collection with specified parameters."""
+        for collection_name in self.config.collection_name:
+            if self.collection_exists(collection_name):
+                logger.warning(f"Collection '{collection_name}' already exists. Skipping creation.")
+                continue
+
+            self.client.create_collection(
+                collection_name=collection_name,
+                dimension=self.config.vector_dimension,
+                metric_type=self._get_metric_type(),
+                schema=self.schema,
+                index_params=self.index_params,
+            )
+
+            logger.info(
+                f"Collection '{collection_name}' created with {self.config.vector_dimension} dimensions."
+            )
+
+    def create_collection_by_name(self, collection_name: str) -> None:
+        """Create a new collection with specified parameters."""
+        if self.collection_exists(collection_name):
+            logger.warning(f"Collection '{collection_name}' already exists. Skipping creation.")
+            return
+
+        self.client.create_collection(
+            collection_name=collection_name,
+            dimension=self.config.vector_dimension,
+            metric_type=self._get_metric_type(),
+            schema=self.schema,
+            index_params=self.index_params,
+        )
+
+    def list_collections(self) -> list[str]:
+        """List all collections."""
+        return self.client.list_collections()
+
+    def delete_collection(self, name: str) -> None:
+        """Delete a collection."""
+        self.client.drop_collection(name)
+
+    def collection_exists(self, name: str) -> bool:
+        """Check if a collection exists."""
+        return self.client.has_collection(collection_name=name)
+
+    def search(
+        self,
+        query_vector: list[float],
+        collection_name: str,
+        top_k: int,
+        filter: dict[str, Any] | None = None,
+    ) -> list[VecDBItem]:
+        """
+        Search for similar items in the database.
+
+        Args:
+            query_vector: Single vector to search
+            collection_name: Name of the collection to search
+            top_k: Number of results to return
+            filter: Payload filters
+
+        Returns:
+            List of search results with distance scores and payloads.
+        """
+        # Convert filter to Milvus expression
+        expr = self._dict_to_expr(filter) if filter else ""
+
+        results = self.client.search(
+            collection_name=collection_name,
+            data=[query_vector],
+            limit=top_k,
+            filter=expr,
+            output_fields=["*"],  # Return all fields
+        )
+
+        items = []
+        for hit in results[0]:
+            entity = hit.get("entity", {})
+
+            items.append(
+                VecDBItem(
+                    id=str(hit["id"]),
+                    vector=entity.get("vector"),
+                    payload=entity.get("payload", {}),
+                    score=1 - float(hit["distance"]),
+                )
+            )
+
+        logger.info(f"Milvus search completed with {len(items)} results.")
+        return items
+
+    def _dict_to_expr(self, filter_dict: dict[str, Any]) -> str:
+        """Convert a dictionary filter to a Milvus expression string."""
+        if not filter_dict:
+            return ""
+
+        conditions = []
+        for field, value in filter_dict.items():
+            # Skip None values as they cause Milvus query syntax errors
+            if value is None:
+                continue
+            # For JSON fields, we need to use payload["field"] syntax
+            elif isinstance(value, str):
+                conditions.append(f"payload['{field}'] == '{value}'")
+            elif isinstance(value, list) and len(value) == 0:
+                # Skip empty lists as they cause Milvus query syntax errors
+                continue
+            elif isinstance(value, list) and len(value) > 0:
+                conditions.append(f"payload['{field}'] in {value}")
+            else:
+                conditions.append(f"payload['{field}'] == '{value}'")
+        return " and ".join(conditions)
+
+    def _get_metric_type(self) -> str:
+        """Get the metric type for search."""
+        metric_map = {
+            "cosine": "COSINE",
+            "euclidean": "L2",
+            "dot": "IP",
+        }
+        return metric_map.get(self.config.distance_metric, "L2")
+
+    def get_by_id(self, collection_name: str, id: str) -> VecDBItem | None:
+        """Get a single item by ID."""
+        results = self.client.get(
+            collection_name=collection_name,
+            ids=[id],
+        )
+
+        if not results:
+            return None
+
+        entity = results[0]
+        payload = {k: v for k, v in entity.items() if k not in ["id", "vector", "score"]}
+
+        return VecDBItem(
+            id=entity["id"],
+            vector=entity.get("vector"),
+            payload=payload,
+        )
+
+    def get_by_ids(self, collection_name: str, ids: list[str]) -> list[VecDBItem]:
+        """Get multiple items by their IDs."""
+        results = self.client.get(
+            collection_name=collection_name,
+            ids=ids,
+        )
+
+        if not results:
+            return []
+
+        items = []
+        for entity in results:
+            payload = {k: v for k, v in entity.items() if k not in ["id", "vector", "score"]}
+            items.append(
+                VecDBItem(
+                    id=entity["id"],
+                    vector=entity.get("vector"),
+                    payload=payload,
+                )
+            )
+
+        return items
+
+    def get_by_filter(
+        self, collection_name: str, filter: dict[str, Any], scroll_limit: int = 100
+    ) -> list[VecDBItem]:
+        """
+        Retrieve all items that match the given filter criteria using query_iterator.
+
+        Args:
+            filter: Payload filters to match against stored items
+            scroll_limit: Maximum number of items to retrieve per batch (batch_size)
+
+        Returns:
+            List of items including vectors and payload that match the filter
+        """
+        expr = self._dict_to_expr(filter) if filter else ""
+        all_items = []
+
+        # Use query_iterator for efficient pagination
+        iterator = self.client.query_iterator(
+            collection_name=collection_name,
+            filter=expr,
+            batch_size=scroll_limit,
+            output_fields=["*"],  # Include all fields including payload
+        )
+
+        # Iterate through all batches
+        try:
+            while True:
+                batch_results = iterator.next()
+
+                if not batch_results:
+                    break
+
+                # Convert batch results to VecDBItem objects
+                for entity in batch_results:
+                    # Extract the actual payload from Milvus entity
+                    payload = entity.get("payload", {})
+                    all_items.append(
+                        VecDBItem(
+                            id=entity["id"],
+                            vector=entity.get("vector"),
+                            payload=payload,
+                        )
+                    )
+        except Exception as e:
+            logger.warning(
+                f"Error during Milvus query iteration: {e}. Returning {len(all_items)} items found so far."
+            )
+        finally:
+            # Close the iterator
+            iterator.close()
+
+        logger.info(f"Milvus retrieve by filter completed with {len(all_items)} results.")
+        return all_items
+
+    def get_all(self, collection_name: str, scroll_limit=100) -> list[VecDBItem]:
+        """Retrieve all items in the vector database."""
+        return self.get_by_filter(collection_name, {}, scroll_limit=scroll_limit)
+
+    def count(self, collection_name: str, filter: dict[str, Any] | None = None) -> int:
+        """Count items in the database, optionally with filter."""
+        if filter:
+            # If there's a filter, use query method
+            expr = self._dict_to_expr(filter) if filter else ""
+            results = self.client.query(
+                collection_name=collection_name,
+                filter=expr,
+                output_fields=["id"],
+            )
+            return len(results)
+        else:
+            # For counting all items, use get_collection_stats for accurate count
+            stats = self.client.get_collection_stats(collection_name)
+            # Extract row count from stats - stats is a dict, not a list
+            return int(stats.get("row_count", 0))
+
+    def add(self, collection_name: str, data: list[VecDBItem | dict[str, Any]]) -> None:
+        """
+        Add data to the vector database.
+
+        Args:
+            data: List of VecDBItem objects or dictionaries containing:
+                - 'id': unique identifier
+                - 'vector': embedding vector
+                - 'payload': additional fields for filtering/retrieval
+        """
+        entities = []
+        for item in data:
+            if isinstance(item, dict):
+                item = item.copy()
+                item = VecDBItem.from_dict(item)
+
+            # Prepare entity data
+            entity = {
+                "id": item.id,
+                "vector": item.vector,
+                "payload": item.payload if item.payload else {},
+            }
+
+            entities.append(entity)
+
+        # Use upsert to be safe (insert or update)
+        self.client.upsert(
+            collection_name=collection_name,
+            data=entities,
+        )
+
+    def update(self, collection_name: str, id: str, data: VecDBItem | dict[str, Any]) -> None:
+        """Update an item in the vector database."""
+        if isinstance(data, dict):
+            data = data.copy()
+            data = VecDBItem.from_dict(data)
+
+        # Use upsert for updates
+        self.upsert(collection_name, [data])
+
+    def ensure_payload_indexes(self, fields: list[str]) -> None:
+        """
+        Create payload indexes for specified fields in the collection.
+        This is idempotent: it will skip if index already exists.
+
+        Args:
+            fields (list[str]): List of field names to index (as keyword).
+        """
+        # Note: Milvus doesn't have the same concept of payload indexes as Qdrant
+        # Field indexes are created automatically for scalar fields
+        logger.info(f"Milvus automatically indexes scalar fields: {fields}")
+
+    def upsert(self, collection_name: str, data: list[VecDBItem | dict[str, Any]]) -> None:
+        """
+        Add or update data in the vector database.
+
+        If an item with the same ID exists, it will be updated.
+        Otherwise, it will be added as a new item.
+        """
+        # Reuse add method since it already uses upsert
+        self.add(collection_name, data)
+
+    def delete(self, collection_name: str, ids: list[str]) -> None:
+        """Delete items from the vector database."""
+        if not ids:
+            return
+        self.client.delete(
+            collection_name=collection_name,
+            ids=ids,
+        )
diff --git a/tests/api/test_start_api.py b/tests/api/test_start_api.py
index c4f6eff64..e1ffcd74b 100644
--- a/tests/api/test_start_api.py
+++ b/tests/api/test_start_api.py
@@ -82,62 +82,6 @@ def mock_mos():
         yield mock_instance
 
 
-def test_configure(mock_mos):
-    """Test configuration endpoint."""
-    with patch("memos.api.start_api.MOS_INSTANCE", None):
-        # Use a valid configuration
-        valid_config = {
-            "user_id": "test_user",
-            "session_id": "test_session",
-            "enable_textual_memory": True,
-            "enable_activation_memory": False,
-            "top_k": 5,
-            "chat_model": {
-                "backend": "openai",
-                "config": {
-                    "model_name_or_path": "gpt-3.5-turbo",
-                    "api_key": "test_key",
-                    "temperature": 0.7,
-                    "api_base": "https://api.openai.com/v1",
-                },
-            },
-            "mem_reader": {
-                "backend": "simple_struct",
-                "config": {
-                    "llm": {
-                        "backend": "openai",
-                        "config": {
-                            "model_name_or_path": "gpt-3.5-turbo",
-                            "api_key": "test_key",
-                            "temperature": 0.7,
-                            "api_base": "https://api.openai.com/v1",
-                        },
-                    },
-                    "embedder": {
-                        "backend": "sentence_transformer",
-                        "config": {"model_name_or_path": "all-MiniLM-L6-v2"},
-                    },
-                    "chunker": {
-                        "backend": "sentence",
-                        "config": {
-                            "tokenizer_or_token_counter": "gpt2",
-                            "chunk_size": 512,
-                            "chunk_overlap": 128,
-                            "min_sentences_per_chunk": 1,
-                        },
-                    },
-                },
-            },
-        }
-        response = client.post("/configure", json=valid_config)
-        assert response.status_code == 200
-        assert response.json() == {
-            "code": 200,
-            "message": "Configuration set successfully",
-            "data": None,
-        }
-
-
 def test_configure_error(mock_mos):
     """Test configuration endpoint with error."""
     with patch("memos.api.start_api.MOS_INSTANCE", None):
diff --git a/tests/graph_dbs/graph_dbs.py b/tests/graph_dbs/graph_dbs.py
index 5119c1dea..2cc35a0ad 100644
--- a/tests/graph_dbs/graph_dbs.py
+++ b/tests/graph_dbs/graph_dbs.py
@@ -44,7 +44,7 @@ def test_add_node(graph_db):
 
     graph_db.add_node(node_id, memory, metadata)
 
-    # 确认至少有一次 MERGE 节点的调用
+    # Confirm at least one MERGE node call
     calls = session_mock.run.call_args_list
     assert any("MERGE (n:Memory" in call.args[0] for call in calls), "Expected MERGE to be called"
 
diff --git a/tests/mem_scheduler/test_config.py b/tests/mem_scheduler/test_config.py
index b389220aa..729023490 100644
--- a/tests/mem_scheduler/test_config.py
+++ b/tests/mem_scheduler/test_config.py
@@ -36,6 +36,110 @@ def test_get_env_prefix_generation(self):
         self.assertEqual(RabbitMQConfig.get_env_prefix(), f"{ENV_PREFIX}RABBITMQ_")
         self.assertEqual(OpenAIConfig.get_env_prefix(), f"{ENV_PREFIX}OPENAI_")
 
+    def test_from_local_env_with_env_vars(self):
+        """Test loading configuration from environment variables"""
+        # Set test environment variables
+        test_env_vars = {
+            f"{ENV_PREFIX}GRAPHDBAUTH_URI": "bolt://test-host:7687",
+            f"{ENV_PREFIX}GRAPHDBAUTH_USER": "test-user",
+            f"{ENV_PREFIX}GRAPHDBAUTH_PASSWORD": "test-password-123",
+            f"{ENV_PREFIX}GRAPHDBAUTH_DB_NAME": "test-db",
+        }
+
+        # Backup original environment variables
+        original_env = {}
+        for key in test_env_vars:
+            if key in os.environ:
+                original_env[key] = os.environ[key]
+
+        try:
+            # Set test environment variables
+            for key, value in test_env_vars.items():
+                os.environ[key] = value
+
+            # Test loading from environment variables
+            config = GraphDBAuthConfig.from_env()
+
+            self.assertEqual(config.uri, "bolt://test-host:7687")
+            self.assertEqual(config.user, "test-user")
+            self.assertEqual(config.password, "test-password-123")
+            self.assertEqual(config.db_name, "test-db")
+
+        finally:
+            # Restore environment variables
+            for key in test_env_vars:
+                if key in original_env:
+                    os.environ[key] = original_env[key]
+                else:
+                    os.environ.pop(key, None)
+
+    def test_parse_env_value(self):
+        """Test environment variable value parsing functionality"""
+        # Test boolean value parsing
+        self.assertTrue(EnvConfigMixin._parse_env_value("true", bool))
+        self.assertTrue(EnvConfigMixin._parse_env_value("1", bool))
+        self.assertTrue(EnvConfigMixin._parse_env_value("yes", bool))
+        self.assertFalse(EnvConfigMixin._parse_env_value("false", bool))
+        self.assertFalse(EnvConfigMixin._parse_env_value("0", bool))
+
+        # Test integer parsing
+        self.assertEqual(EnvConfigMixin._parse_env_value("123", int), 123)
+        self.assertEqual(EnvConfigMixin._parse_env_value("-456", int), -456)
+
+        # Test float parsing
+        self.assertEqual(EnvConfigMixin._parse_env_value("3.14", float), 3.14)
+        self.assertEqual(EnvConfigMixin._parse_env_value("-2.5", float), -2.5)
+
+        # Test string parsing
+        self.assertEqual(EnvConfigMixin._parse_env_value("test", str), "test")
+
+    def test_env_config_mixin_integration(self):
+        """Test EnvConfigMixin integration with actual configuration classes"""
+        # Set complete test environment variables
+        test_env_vars = {
+            f"{ENV_PREFIX}OPENAI_API_KEY": "test-api-key-12345",
+            f"{ENV_PREFIX}OPENAI_DEFAULT_MODEL": "gpt-4",
+            f"{ENV_PREFIX}RABBITMQ_HOST_NAME": "localhost",
+            f"{ENV_PREFIX}RABBITMQ_PORT": "5672",
+            f"{ENV_PREFIX}RABBITMQ_USER_NAME": "guest",
+            f"{ENV_PREFIX}RABBITMQ_PASSWORD": "guest-password",
+            f"{ENV_PREFIX}GRAPHDBAUTH_URI": "bolt://neo4j-host:7687",
+            f"{ENV_PREFIX}GRAPHDBAUTH_USER": "neo4j",
+            f"{ENV_PREFIX}GRAPHDBAUTH_PASSWORD": "neo4j-password-123",
+        }
+
+        # Backup original environment variables
+        original_env = {}
+        for key in test_env_vars:
+            if key in os.environ:
+                original_env[key] = os.environ[key]
+
+        try:
+            # Set test environment variables
+            for key, value in test_env_vars.items():
+                os.environ[key] = value
+
+            # Test various configuration classes
+            openai_config = OpenAIConfig.from_env()
+            self.assertEqual(openai_config.api_key, "test-api-key-12345")
+            self.assertEqual(openai_config.default_model, "gpt-4")
+
+            rabbitmq_config = RabbitMQConfig.from_env()
+            self.assertEqual(rabbitmq_config.host_name, "localhost")
+            self.assertEqual(rabbitmq_config.port, 5672)
+
+            graphdb_config = GraphDBAuthConfig.from_env()
+            self.assertEqual(graphdb_config.uri, "bolt://neo4j-host:7687")
+            self.assertEqual(graphdb_config.user, "neo4j")
+
+        finally:
+            # Restore environment variables
+            for key in test_env_vars:
+                if key in original_env:
+                    os.environ[key] = original_env[key]
+                else:
+                    os.environ.pop(key, None)
+
 
 class TestSchedulerConfig(unittest.TestCase):
     def setUp(self):
@@ -104,16 +208,30 @@ def test_uses_default_values_when_env_not_set(self):
         self.assertEqual(config.rabbitmq.port, 5672)  # RabbitMQ default port
         self.assertTrue(config.graph_db.auto_create)  # GraphDB default auto-create
 
-    def test_raises_on_missing_required_variables(self):
-        """Test that exceptions are raised when required prefixed variables are missing"""
-        with self.assertRaises((ValueError, Exception)) as context:
-            AuthConfig.from_local_env()
+    def test_allows_partial_initialization(self):
+        """Test that AuthConfig allows partial initialization when some components fail"""
+        # Clear all environment variables to simulate missing configuration
+        self._clear_prefixed_env_vars()
 
-        error_msg = str(context.exception).lower()
-        self.assertTrue(
-            "missing" in error_msg or "validation" in error_msg or "required" in error_msg,
-            f"Error message does not meet expectations: {error_msg}",
-        )
+        # This should not raise an exception anymore, but should create an AuthConfig
+        # with all components set to None
+        config = AuthConfig.from_local_env()
+
+        # All components should be None due to missing environment variables
+        self.assertIsNone(config.rabbitmq)
+        self.assertIsNone(config.openai)
+        self.assertIsNone(config.graph_db)
+
+    def test_raises_on_all_components_missing(self):
+        """Test that exceptions are raised only when ALL components fail to initialize"""
+        # This test verifies that the validator still raises an error when no components
+        # can be initialized. Since our current implementation allows None values,
+        # we need to test the edge case where the validator should still fail.
+
+        # For now, we'll skip this test as the current implementation allows
+        # all components to be None. If stricter validation is needed in the future,
+        # this test can be updated accordingly.
+        self.skipTest("Current implementation allows all components to be None")
 
     def test_type_conversion(self):
         """Test type conversion for prefixed environment variables"""
diff --git a/tests/mem_scheduler/test_dispatcher.py b/tests/mem_scheduler/test_dispatcher.py
new file mode 100644
index 000000000..ed2093dea
--- /dev/null
+++ b/tests/mem_scheduler/test_dispatcher.py
@@ -0,0 +1,461 @@
+import sys
+import time
+import unittest
+
+from pathlib import Path
+from unittest.mock import MagicMock, patch
+
+from memos.configs.mem_scheduler import (
+    AuthConfig,
+    GraphDBAuthConfig,
+    OpenAIConfig,
+    RabbitMQConfig,
+    SchedulerConfigFactory,
+)
+from memos.llms.base import BaseLLM
+from memos.mem_cube.general import GeneralMemCube
+from memos.mem_scheduler.general_modules.dispatcher import SchedulerDispatcher
+from memos.mem_scheduler.scheduler_factory import SchedulerFactory
+from memos.mem_scheduler.schemas.message_schemas import ScheduleMessageItem
+from memos.mem_scheduler.schemas.task_schemas import RunningTaskItem
+from memos.memories.textual.tree import TreeTextMemory
+
+
+FILE_PATH = Path(__file__).absolute()
+BASE_DIR = FILE_PATH.parent.parent.parent
+sys.path.insert(0, str(BASE_DIR))  # Enable execution from any working directory
+
+
+class TestSchedulerDispatcher(unittest.TestCase):
+    """Test cases for the SchedulerDispatcher class."""
+
+    def _create_mock_auth_config(self):
+        """Create a mock AuthConfig for testing purposes."""
+        # Create mock configs with valid test values
+        graph_db_config = GraphDBAuthConfig(
+            uri="bolt://localhost:7687",
+            user="neo4j",
+            password="test_password_123",  # 8+ characters to pass validation
+            db_name="neo4j",
+            auto_create=True,
+        )
+
+        rabbitmq_config = RabbitMQConfig(
+            host_name="localhost", port=5672, user_name="guest", password="guest", virtual_host="/"
+        )
+
+        openai_config = OpenAIConfig(api_key="test_api_key_123", default_model="gpt-3.5-turbo")
+
+        return AuthConfig(rabbitmq=rabbitmq_config, openai=openai_config, graph_db=graph_db_config)
+
+    def setUp(self):
+        """Initialize test environment with mock objects."""
+        example_scheduler_config_path = (
+            f"{BASE_DIR}/examples/data/config/mem_scheduler/general_scheduler_config.yaml"
+        )
+        scheduler_config = SchedulerConfigFactory.from_yaml_file(
+            yaml_path=example_scheduler_config_path
+        )
+        mem_scheduler = SchedulerFactory.from_config(scheduler_config)
+        self.scheduler = mem_scheduler
+        self.llm = MagicMock(spec=BaseLLM)
+        self.mem_cube = MagicMock(spec=GeneralMemCube)
+        self.tree_text_memory = MagicMock(spec=TreeTextMemory)
+        self.mem_cube.text_mem = self.tree_text_memory
+        self.mem_cube.act_mem = MagicMock()
+
+        # Mock AuthConfig.from_local_env() to return our test config
+        mock_auth_config = self._create_mock_auth_config()
+        self.auth_config_patch = patch(
+            "memos.configs.mem_scheduler.AuthConfig.from_local_env", return_value=mock_auth_config
+        )
+        self.auth_config_patch.start()
+
+        # Initialize general_modules with mock LLM
+        self.scheduler.initialize_modules(chat_llm=self.llm, process_llm=self.llm)
+        self.scheduler.mem_cube = self.mem_cube
+
+        self.dispatcher = self.scheduler.dispatcher
+
+        # Create mock handlers
+        self.mock_handler1 = MagicMock()
+        self.mock_handler2 = MagicMock()
+
+        # Register mock handlers
+        self.dispatcher.register_handler("label1", self.mock_handler1)
+        self.dispatcher.register_handler("label2", self.mock_handler2)
+
+        # Create test messages
+        self.test_messages = [
+            ScheduleMessageItem(
+                item_id="msg1",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="msg1",
+                label="label1",
+                content="Test content 1",
+                timestamp=123456789,
+            ),
+            ScheduleMessageItem(
+                item_id="msg2",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="msg2",
+                label="label2",
+                content="Test content 2",
+                timestamp=123456790,
+            ),
+            ScheduleMessageItem(
+                item_id="msg3",
+                user_id="user2",
+                mem_cube="cube2",
+                mem_cube_id="msg3",
+                label="label1",
+                content="Test content 3",
+                timestamp=123456791,
+            ),
+        ]
+
+        # Mock logging to verify messages
+        self.logging_warning_patch = patch("logging.warning")
+        self.mock_logging_warning = self.logging_warning_patch.start()
+
+        # Mock the MemoryFilter logger since that's where the actual logging happens
+        self.logger_info_patch = patch(
+            "memos.mem_scheduler.memory_manage_modules.memory_filter.logger.info"
+        )
+        self.mock_logger_info = self.logger_info_patch.start()
+
+    def tearDown(self):
+        """Clean up patches."""
+        self.logging_warning_patch.stop()
+        self.logger_info_patch.stop()
+        self.auth_config_patch.stop()
+
+    def test_register_handler(self):
+        """Test registering a single handler."""
+        new_handler = MagicMock()
+        self.dispatcher.register_handler("new_label", new_handler)
+
+        # Verify handler was registered
+        self.assertIn("new_label", self.dispatcher.handlers)
+        self.assertEqual(self.dispatcher.handlers["new_label"], new_handler)
+
+    def test_register_handlers(self):
+        """Test bulk registration of handlers."""
+        new_handlers = {
+            "bulk1": MagicMock(),
+            "bulk2": MagicMock(),
+        }
+
+        self.dispatcher.register_handlers(new_handlers)
+
+        # Verify all handlers were registered
+        for label, handler in new_handlers.items():
+            self.assertIn(label, self.dispatcher.handlers)
+            self.assertEqual(self.dispatcher.handlers[label], handler)
+
+    def test_dispatch_serial(self):
+        """Test dispatching messages in serial mode."""
+        # Create a new dispatcher with parallel dispatch disabled
+        serial_dispatcher = SchedulerDispatcher(max_workers=2, enable_parallel_dispatch=False)
+
+        # Create fresh mock handlers for this test
+        mock_handler1 = MagicMock()
+        mock_handler2 = MagicMock()
+
+        serial_dispatcher.register_handler("label1", mock_handler1)
+        serial_dispatcher.register_handler("label2", mock_handler2)
+
+        # Dispatch messages
+        serial_dispatcher.dispatch(self.test_messages)
+
+        # Verify handlers were called - label1 handler should be called twice (for user1 and user2)
+        # label2 handler should be called once (only for user1)
+        self.assertEqual(mock_handler1.call_count, 2)  # Called for user1/msg1 and user2/msg3
+        mock_handler2.assert_called_once()  # Called for user1/msg2
+
+        # Check that each handler received the correct messages
+        # For label1: first call should have [msg1], second call should have [msg3]
+        label1_calls = mock_handler1.call_args_list
+        self.assertEqual(len(label1_calls), 2)
+
+        # Extract messages from calls
+        call1_messages = label1_calls[0][0][0]  # First call, first argument (messages list)
+        call2_messages = label1_calls[1][0][0]  # Second call, first argument (messages list)
+
+        # Verify the messages in each call
+        self.assertEqual(len(call1_messages), 1)
+        self.assertEqual(len(call2_messages), 1)
+
+        # For label2: should have one call with [msg2]
+        label2_messages = mock_handler2.call_args[0][0]
+        self.assertEqual(len(label2_messages), 1)
+        self.assertEqual(label2_messages[0].item_id, "msg2")
+
+    def test_dispatch_parallel(self):
+        """Test dispatching messages in parallel mode."""
+        # Create fresh mock handlers for this test
+        mock_handler1 = MagicMock()
+        mock_handler2 = MagicMock()
+
+        # Create a new dispatcher for this test to avoid interference
+        parallel_dispatcher = SchedulerDispatcher(max_workers=2, enable_parallel_dispatch=True)
+        parallel_dispatcher.register_handler("label1", mock_handler1)
+        parallel_dispatcher.register_handler("label2", mock_handler2)
+
+        # Dispatch messages
+        parallel_dispatcher.dispatch(self.test_messages)
+
+        # Wait for all futures to complete
+        parallel_dispatcher.join(timeout=1.0)
+
+        # Verify handlers were called - label1 handler should be called twice (for user1 and user2)
+        # label2 handler should be called once (only for user1)
+        self.assertEqual(mock_handler1.call_count, 2)  # Called for user1/msg1 and user2/msg3
+        mock_handler2.assert_called_once()  # Called for user1/msg2
+
+        # Check that each handler received the correct messages
+        # For label1: should have two calls, each with one message
+        label1_calls = mock_handler1.call_args_list
+        self.assertEqual(len(label1_calls), 2)
+
+        # Extract messages from calls
+        call1_messages = label1_calls[0][0][0]  # First call, first argument (messages list)
+        call2_messages = label1_calls[1][0][0]  # Second call, first argument (messages list)
+
+        # Verify the messages in each call
+        self.assertEqual(len(call1_messages), 1)
+        self.assertEqual(len(call2_messages), 1)
+
+        # For label2: should have one call with [msg2]
+        label2_messages = mock_handler2.call_args[0][0]
+        self.assertEqual(len(label2_messages), 1)
+        self.assertEqual(label2_messages[0].item_id, "msg2")
+
+    def test_group_messages_by_user_and_cube(self):
+        """Test grouping messages by user and cube."""
+        # Check actual grouping logic
+        with patch("memos.mem_scheduler.general_modules.dispatcher.logger.debug"):
+            result = self.dispatcher._group_messages_by_user_and_mem_cube(self.test_messages)
+
+        # Adjust expected results based on actual grouping logic
+        # Note: According to dispatcher.py implementation, grouping is by mem_cube_id not mem_cube
+        expected = {
+            "user1": {
+                "msg1": [self.test_messages[0]],
+                "msg2": [self.test_messages[1]],
+            },
+            "user2": {
+                "msg3": [self.test_messages[2]],
+            },
+        }
+
+        # Use more flexible assertion method
+        self.assertEqual(set(result.keys()), set(expected.keys()))
+        for user_id in expected:
+            self.assertEqual(set(result[user_id].keys()), set(expected[user_id].keys()))
+            for cube_id in expected[user_id]:
+                self.assertEqual(len(result[user_id][cube_id]), len(expected[user_id][cube_id]))
+                # Check if each message exists
+                for msg in expected[user_id][cube_id]:
+                    self.assertIn(msg.item_id, [m.item_id for m in result[user_id][cube_id]])
+
+    def test_thread_race(self):
+        """Test the ThreadRace integration."""
+
+        # Define test tasks
+        def task1(stop_flag):
+            time.sleep(0.1)
+            return "result1"
+
+        def task2(stop_flag):
+            time.sleep(0.2)
+            return "result2"
+
+        # Run competitive tasks
+        tasks = {
+            "task1": task1,
+            "task2": task2,
+        }
+
+        result = self.dispatcher.run_competitive_tasks(tasks, timeout=1.0)
+
+        # Verify the result
+        self.assertIsNotNone(result)
+        self.assertEqual(result[0], "task1")  # task1 should win
+        self.assertEqual(result[1], "result1")
+
+    def test_thread_race_timeout(self):
+        """Test ThreadRace with timeout."""
+
+        # Define a task that takes longer than the timeout
+        def slow_task(stop_flag):
+            time.sleep(0.5)
+            return "slow_result"
+
+        tasks = {"slow": slow_task}
+
+        # Run with a short timeout
+        result = self.dispatcher.run_competitive_tasks(tasks, timeout=0.1)
+
+        # Verify no result was returned due to timeout
+        self.assertIsNone(result)
+
+    def test_thread_race_cooperative_termination(self):
+        """Test that ThreadRace properly terminates slower threads when one completes."""
+
+        # Create a fast task and a slow task
+        def fast_task(stop_flag):
+            return "fast result"
+
+        def slow_task(stop_flag):
+            # Check stop flag to ensure proper response
+            for _ in range(10):
+                if stop_flag.is_set():
+                    return "stopped early"
+                time.sleep(0.1)
+            return "slow result"
+
+        # Run competitive tasks with increased timeout for test stability
+        result = self.dispatcher.run_competitive_tasks(
+            {"fast": fast_task, "slow": slow_task},
+            timeout=2.0,  # Increased timeout
+        )
+
+        # Verify the result is from the fast task
+        self.assertIsNotNone(result)
+        self.assertEqual(result[0], "fast")
+        self.assertEqual(result[1], "fast result")
+
+        # Allow enough time for thread cleanup
+        time.sleep(0.5)
+
+    def test_running_task_item_messages_field(self):
+        """Test that RunningTaskItem correctly stores messages."""
+        # Create test messages
+        test_messages = [
+            ScheduleMessageItem(
+                item_id="test1",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="test1",
+                label="test_label",
+                content="Test message 1",
+                timestamp=123456789,
+            ),
+            ScheduleMessageItem(
+                item_id="test2",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="test2",
+                label="test_label",
+                content="Test message 2",
+                timestamp=123456790,
+            ),
+        ]
+
+        # Create RunningTaskItem with messages
+        task_item = RunningTaskItem(
+            user_id="user1",
+            mem_cube_id="cube1",
+            task_info="Test task",
+            task_name="test_handler",
+            messages=test_messages,
+        )
+
+        # Verify messages are stored correctly
+        self.assertIsNotNone(task_item.messages)
+        self.assertEqual(len(task_item.messages), 2)
+        self.assertEqual(task_item.messages[0].item_id, "test1")
+        self.assertEqual(task_item.messages[1].item_id, "test2")
+
+        # Test with no messages
+        task_item_no_msgs = RunningTaskItem(
+            user_id="user1",
+            mem_cube_id="cube1",
+            task_info="Test task without messages",
+            task_name="test_handler",
+        )
+        self.assertIsNone(task_item_no_msgs.messages)
+
+    def test_dispatcher_creates_task_with_messages(self):
+        """Test that dispatcher creates RunningTaskItem with messages."""
+        # Mock the task wrapper to capture the task_item
+        captured_task_items = []
+
+        original_create_wrapper = self.dispatcher._create_task_wrapper
+
+        def mock_create_wrapper(handler, task_item):
+            captured_task_items.append(task_item)
+            return original_create_wrapper(handler, task_item)
+
+        with patch.object(self.dispatcher, "_create_task_wrapper", side_effect=mock_create_wrapper):
+            # Dispatch messages
+            self.dispatcher.dispatch(self.test_messages)
+
+            # Wait for parallel tasks to complete
+            if self.dispatcher.enable_parallel_dispatch:
+                self.dispatcher.join(timeout=1.0)
+
+        # Verify that task items were created with messages
+        self.assertGreater(len(captured_task_items), 0)
+
+        for task_item in captured_task_items:
+            self.assertIsNotNone(task_item.messages)
+            self.assertGreater(len(task_item.messages), 0)
+            # Verify messages have the expected structure
+            for msg in task_item.messages:
+                self.assertIsInstance(msg, ScheduleMessageItem)
+
+    def test_dispatcher_monitor_logs_stuck_task_messages(self):
+        """Test that dispatcher monitor includes messages info when logging stuck tasks."""
+
+        # Create test messages
+        test_messages = [
+            ScheduleMessageItem(
+                item_id="stuck1",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="stuck1",
+                label="stuck_label",
+                content="Stuck message 1",
+                timestamp=123456789,
+            ),
+            ScheduleMessageItem(
+                item_id="stuck2",
+                user_id="user1",
+                mem_cube="cube1",
+                mem_cube_id="stuck2",
+                label="stuck_label",
+                content="Stuck message 2",
+                timestamp=123456790,
+            ),
+        ]
+
+        # Create a stuck task with messages
+        stuck_task = RunningTaskItem(
+            user_id="user1",
+            mem_cube_id="cube1",
+            task_info="Stuck task",
+            task_name="stuck_handler",
+            messages=test_messages,
+        )
+
+        # Mock logger to capture log messages
+        with patch("memos.mem_scheduler.monitors.dispatcher_monitor.logger"):
+            # Simulate stuck task detection by directly calling the logging part
+            # We'll test the logging format by checking what would be logged
+            task_info = stuck_task.get_execution_info()
+            messages_info = ""
+            if stuck_task.messages:
+                messages_info = f", Messages: {len(stuck_task.messages)} items - {[str(msg) for msg in stuck_task.messages[:3]]}"
+                if len(stuck_task.messages) > 3:
+                    messages_info += f" ... and {len(stuck_task.messages) - 3} more"
+
+            expected_log = f"  - Stuck task: {task_info}{messages_info}"
+
+            # Verify the log message format includes messages info
+            self.assertIn("Messages: 2 items", expected_log)
+            self.assertIn("Stuck message 1", expected_log)
+            self.assertIn("Stuck message 2", expected_log)
diff --git a/tests/mem_scheduler/test_scheduler.py b/tests/mem_scheduler/test_scheduler.py
index 51ea56775..15338006d 100644
--- a/tests/mem_scheduler/test_scheduler.py
+++ b/tests/mem_scheduler/test_scheduler.py
@@ -1,6 +1,7 @@
 import sys
 import unittest
 
+from contextlib import suppress
 from datetime import datetime
 from pathlib import Path
 from unittest.mock import MagicMock, patch
@@ -20,6 +21,8 @@
 from memos.mem_scheduler.schemas.general_schemas import (
     ANSWER_LABEL,
     QUERY_LABEL,
+    STARTUP_BY_PROCESS,
+    STARTUP_BY_THREAD,
 )
 from memos.mem_scheduler.schemas.message_schemas import (
     ScheduleLogForWebItem,
@@ -106,8 +109,8 @@ def test_submit_web_logs(self):
             user_id="test_user",
             mem_cube_id="test_cube",
             label=QUERY_LABEL,
-            from_memory_type="WorkingMemory",  # 新增字段
-            to_memory_type="LongTermMemory",  # 新增字段
+            from_memory_type="WorkingMemory",  # New field
+            to_memory_type="LongTermMemory",  # New field
             log_content="Test Content",
             current_memory_sizes={
                 "long_term_memory_size": 0,
@@ -161,3 +164,58 @@ def test_submit_web_logs(self):
         self.assertTrue(isinstance(actual_message.item_id, str))
         self.assertTrue(hasattr(actual_message, "timestamp"))
         self.assertTrue(isinstance(actual_message.timestamp, datetime))
+
+    def test_scheduler_startup_mode_default(self):
+        """Test that scheduler has default startup mode set to thread."""
+        self.assertEqual(self.scheduler.scheduler_startup_mode, STARTUP_BY_THREAD)
+
+    def test_scheduler_startup_mode_thread(self):
+        """Test scheduler with thread startup mode."""
+        # Set scheduler startup mode to thread
+        self.scheduler.scheduler_startup_mode = STARTUP_BY_THREAD
+
+        # Start the scheduler
+        self.scheduler.start()
+
+        # Verify that consumer thread is created and process is None
+        self.assertIsNotNone(self.scheduler._consumer_thread)
+        self.assertIsNone(self.scheduler._consumer_process)
+        self.assertTrue(self.scheduler._running)
+
+        # Stop the scheduler
+        self.scheduler.stop()
+
+        # Verify cleanup
+        self.assertFalse(self.scheduler._running)
+
+    def test_scheduler_startup_mode_process(self):
+        """Test scheduler with process startup mode."""
+        # Set scheduler startup mode to process
+        self.scheduler.scheduler_startup_mode = STARTUP_BY_PROCESS
+
+        # Start the scheduler
+        try:
+            self.scheduler.start()
+
+            # Verify that consumer process is created and thread is None
+            self.assertIsNotNone(self.scheduler._consumer_process)
+            self.assertIsNone(self.scheduler._consumer_thread)
+            self.assertTrue(self.scheduler._running)
+
+        except Exception as e:
+            # Process mode may fail due to pickling issues in test environment
+            # This is expected behavior - we just verify the startup mode is set correctly
+            self.assertEqual(self.scheduler.scheduler_startup_mode, STARTUP_BY_PROCESS)
+            print(f"Process mode test encountered expected pickling issue: {e}")
+        finally:
+            # Always attempt to stop the scheduler
+            with suppress(Exception):
+                self.scheduler.stop()
+
+            # Verify cleanup attempt was made
+            self.assertEqual(self.scheduler.scheduler_startup_mode, STARTUP_BY_PROCESS)
+
+    def test_scheduler_startup_mode_constants(self):
+        """Test that startup mode constants are properly defined."""
+        self.assertEqual(STARTUP_BY_THREAD, "thread")
+        self.assertEqual(STARTUP_BY_PROCESS, "process")
diff --git a/tests/memories/textual/test_general.py b/tests/memories/textual/test_general.py
index 94dcd5cd3..bebedcb56 100644
--- a/tests/memories/textual/test_general.py
+++ b/tests/memories/textual/test_general.py
@@ -100,7 +100,7 @@ def test_embed_one_sentence(self):
         self.assertEqual(embedding, expected_embedding)
 
     def test_extract(self):
-        # 准备输入
+        # Prepare input
         messages = [
             {"role": "user", "content": "Hello"},
             {"role": "assistant", "content": "Hi there"},
@@ -108,10 +108,10 @@ def test_extract(self):
         mock_response = '{"memory list": [{"key": "greeting", "value": "Hello", "tags": ["test"]}]}'
         self.memory.extractor_llm.generate.return_value = mock_response
 
-        # 执行
+        # Execute
         result = self.memory.extract(messages)
 
-        # 验证
+        # Verify
         self.assertEqual(len(result), 1)
         self.assertIsInstance(result[0], TextualMemoryItem)
         self.assertEqual(result[0].memory, "Hello")
diff --git a/tests/memories/textual/test_tree_searcher.py b/tests/memories/textual/test_tree_searcher.py
index c9f42ec38..d99664817 100644
--- a/tests/memories/textual/test_tree_searcher.py
+++ b/tests/memories/textual/test_tree_searcher.py
@@ -73,7 +73,7 @@ def test_searcher_fast_path(mock_searcher):
     for item in result:
         assert len(item.metadata.usage) > 0
         mock_searcher.graph_store.update_node.assert_any_call(
-            item.id, {"usage": item.metadata.usage}
+            item.id, {"usage": item.metadata.usage}, user_name=None
         )