# LangChain 框架教學 - 為什麼我們要改用 LangChain？

歡迎來到 LangChain 教學！從這個課程開始，我們將改用 LangChain 框架來開發 AI 應用程式。

## 🤔 為什麼要從原生 API 改用 LangChain？

### LangChain 的優勢
- ✅ **統一介面**: 一套程式碼支援多種 LLM (Gemini, GPT, Claude...)
- ✅ **內建記憶**: 多種記憶機制，無需手動管理 Content/Part
- ✅ **模組化設計**: 可重用的組件，提高開發效率
- ✅ **豐富生態**: 大量內建工具和擴展
- ✅ **企業級功能**: 支援複雜的 AI 應用場景
- ✅ **社群支援**: 活躍的開源社群和豐富文件

讓我們開始體驗 LangChain 的強大之處！

In [None]:
# 安裝 LangChain 生態系統和環境變數管理工具
!pip install google-genai langchain langchain-google-genai langchain-community python-dotenv

In [9]:
# 導入 LangChain 現代化套件
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.messages import HumanMessage, AIMessage, SystemMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_community.chat_message_histories import ChatMessageHistory
import os
from dotenv import load_dotenv

load_dotenv()

llm = ChatGoogleGenerativeAI(
    model=os.getenv("MODEL", "gemini-1.5-flash"),
    temperature=os.getenv("TEMPERATURE", 0.7),
    google_api_key=os.getenv("API_KEY"),
)

## 🚀 LangChain 四種基本用法 - 循序漸進學習

現在讓我們從最簡單的開始，循序漸進學習 LangChain 的四種基本用法：

### 📚 學習順序

1. **🔥 方法1：invoke()** - 最基本的單次對話（從這裡開始！）
2. **📝 方法2：陣列對話** - 手動管理對話歷史
3. **🎯 方法3：ChatPromptTemplate** - 模板化提示詞
4. **🤖 方法4：自動記憶管理** - 企業級記憶管理

### 💡 為什麼這樣安排？

- **invoke()** 最簡單，讓你快速體驗 LangChain
- **陣列對話** 幫助理解對話結構
- **ChatPromptTemplate** 學習模板化思維
- **自動記憶管理** 掌握企業級應用

### 🎯 學習目標

學完這四種方法，你就能：
- 🔧 使用 LangChain 進行基本對話
- 💬 管理複雜的對話流程
- 🎨 設計可重複使用的對話模板
- 🧠 建立具有記憶的智能助手

讓我們從最基本的 `invoke()` 開始吧！

In [10]:
# 🚀 方法1：最基本的 model.invoke() 用法
print("=== 方法1：基本 invoke() 用法 ===")
print("💡 這是 LangChain 最簡單的使用方式\n")

# 直接呼叫模型，類似原生 API 但更簡潔
response = llm.invoke("請用繁體中文簡短描述什麼是機器學習")
print(f"🧑 用戶: 請用繁體中文簡短描述什麼是機器學習")
print(f"🤖 AI: {response.content}")

=== 方法1：基本 invoke() 用法 ===
💡 這是 LangChain 最簡單的使用方式

🧑 用戶: 請用繁體中文簡短描述什麼是機器學習
🤖 AI: 機器學習就是讓電腦從資料中學習，不用明確地告訴它該怎麼做。電腦會自己找出資料中的模式和規則，然後用這些學到的知識來預測未來或做出決策。


In [3]:
# 🚀 方法2：使用陣列進行對話
print("=== 方法2：陣列對話方式 ===")
print("💡 可以手動控制完整的對話流程\n")

# 使用 LangChain 的訊息類別
from langchain_core.messages import HumanMessage, AIMessage, SystemMessage

# 建立對話陣列
messages = [
    SystemMessage(content="你是一個專業的 Python 程式設計師助手"),
    HumanMessage(content="請簡短描述什麼是 list comprehension"),
    AIMessage(content="List comprehension 是 Python 中一種簡潔的創建列表的方式..."),
    HumanMessage(content="請給我一個簡單的範例")
]

# 發送陣列對話
response = llm.invoke(messages)
print("📝 對話內容：")
for i, msg in enumerate(messages, 1):
    role = "🔧 系統" if isinstance(msg, SystemMessage) else ("🧑 用戶" if isinstance(msg, HumanMessage) else "🤖 AI")
    print(f"{i}. {role}: {msg.content}")

print(f"\n🤖 AI 最新回應: {response.content}")
print()

print("✅ 陣列對話的特點：")
print("   1. 可以完全控制對話歷史")
print("   2. 支援系統訊息、用戶訊息、AI 回應")
print("   3. 語法簡潔直觀")
print("   4. 適合需要精確控制上下文的場景")

=== 方法2：陣列對話方式 ===
💡 可以手動控制完整的對話流程

📝 對話內容：
1. 🔧 系統: 你是一個專業的 Python 程式設計師助手
2. 🧑 用戶: 請簡短描述什麼是 list comprehension
3. 🤖 AI: List comprehension 是 Python 中一種簡潔的創建列表的方式...
4. 🧑 用戶: 請給我一個簡單的範例

🤖 AI 最新回應: ```python
# 傳統方式
squares = []
for i in range(10):
  squares.append(i**2)

# List comprehension
squares = [i**2 for i in range(10)]

print(squares)  # 輸出: [0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
```

這個範例創建了一個包含 0 到 9 的平方數的列表。 List comprehension 比傳統的迴圈方式更簡潔易讀。

✅ 陣列對話的特點：
   1. 可以完全控制對話歷史
   2. 支援系統訊息、用戶訊息、AI 回應
   3. 語法簡潔直觀
   4. 適合需要精確控制上下文的場景


In [4]:
# 🚀 方法3：使用 ChatPromptTemplate 進行模板化對話
print("=== 方法3：ChatPromptTemplate 模板化對話 ===")
print("💡 模板讓程式碼可以重複使用！\n")

from langchain_core.prompts import ChatPromptTemplate

# 創建一個簡單的對話模板
prompt = ChatPromptTemplate([
    ("system", "你是一個{role}，請用繁體中文簡短描述。"),
    ("human", "{question}")
])

print("📝 對話模板結構：")
print("1. system: 你是一個{role}，請用繁體中文簡短描述。")
print("2. human: {question}")
print()

# 範例1：翻譯助手
print("🔄 範例1：翻譯助手")
messages1 = prompt.format_messages(
    role="專業翻譯助手",
    question="請將 'Hello World' 翻譯成日文"
)

response1 = llm.invoke(messages1)
print(f"🧑 用戶: 請將 'Hello World' 翻譯成日文")
print(f"🤖 AI: {response1.content}")
print()

# 範例2：程式助手 
print("🔄 範例2：程式助手")
messages2 = prompt.format_messages(
    role="Python 程式設計師",
    question="如何建立一個空的 Python 清單？"
)

response2 = llm.invoke(messages2)
print(f"🧑 用戶: 如何建立一個空的 Python 清單？")
print(f"🤖 AI: {response2.content}")
print()

print("🎯 ChatPromptTemplate 的優勢：")
print("✅ 一個模板，多種用途")
print("✅ 程式碼可重複使用")
print("✅ 減少重複程式碼")
print("✅ 更好的程式碼組織")

=== 方法3：ChatPromptTemplate 模板化對話 ===
💡 模板讓程式碼可以重複使用！

📝 對話模板結構：
1. system: 你是一個{role}，請用繁體中文簡短描述。
2. human: {question}

🔄 範例1：翻譯助手
🧑 用戶: 請將 'Hello World' 翻譯成日文
🤖 AI: こんにちは世界 (Konnichiwa Sekai)

🔄 範例2：程式助手
🧑 用戶: 如何建立一個空的 Python 清單？
🤖 AI: 建立空的 Python 清單有兩種常見方式：

1.  **直接使用方括號 `[]`：**  這是最簡單也最常用的方法。

    ```python
    my_list = []
    ```

2.  **使用 `list()` 函數：**  不帶任何參數呼叫 `list()` 函數也會建立一個空清單。

    ```python
    my_list = list()
    ```

兩種方法效果相同，通常建議使用第一種 `[]`，因為它更簡潔易讀。

🎯 ChatPromptTemplate 的優勢：
✅ 一個模板，多種用途
✅ 程式碼可重複使用
✅ 減少重複程式碼
✅ 更好的程式碼組織


## 🔗 進階功能：自動記憶管理

學會了三種基本用法後，讓我們來看看 LangChain 最強大的功能之一：**自動記憶管理**！

### 🤔 為什麼需要自動記憶管理？

前面的三種方法都有一個共同問題：**無法自動記住對話歷史**。
- `invoke()` 每次都是全新開始
- 陣列對話雖然有上下文，但需要手動管理
- `ChatPromptTemplate` 也需要手動處理歷史記錄

**自動記憶管理** 解決了這個問題！它會：
- ✅ **自動記憶**: 無需手動管理對話歷史
- ✅ **智能整合**: 結合模型、記憶、模板等功能
- ✅ **企業級**: 適合複雜的生產環境應用

讓我們來看看如何實現這個強大的功能！

## 🔗 什麼是「鏈」(Chain)？

在學習自動記憶管理之前，讓我們先理解 LangChain 最核心的概念：**鏈 (Chain)**

### 🤔 為什麼叫做「鏈」？

想像一下工廠的生產線：
1. **原料** 進入第一個工作站
2. **處理** 後傳遞給下一個工作站  
3. **最終產品** 從生產線末端產出

LangChain 的「鏈」就是這樣的概念！

### 🔧 鏈的基本語法

```python
# 使用管道運算符 | 來連接組件
chain = prompt | llm
```

這個語法的意思是：
- 📝 **prompt**: 準備輸入內容（模板化）
- ➡️ **|**: 管道運算符，將處理結果傳遞給下一個組件
- 🤖 **llm**: 語言模型處理並產生回應

### 💡 鏈 vs 傳統做法 - 完整範例

**傳統做法**（步驟分離）：
```python
# 步驟1：創建模板
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate([
    ("system", "你是一個友善的助手"),
    ("human", "{input}")
])

# 步驟2：格式化模板
messages = prompt.format_messages(input="你好")

# 步驟3：呼叫模型
response = llm.invoke(messages)
print(response.content)
```

**鏈的做法**（一氣呵成）：
```python
# 步驟1：創建模板
from langchain_core.prompts import ChatPromptTemplate
prompt = ChatPromptTemplate([
    ("system", "你是一個友善的助手"),
    ("human", "{input}")
])

# 步驟2：創建鏈（關鍵！）
chain = prompt | llm

# 步驟3：一行完成！數據自動在組件間流動
response = chain.invoke({"input": "你好"})
print(response.content)
```

### 📊 具體對比

| 做法 | 程式碼行數 | 複雜度 | 可重用性 |
|------|------------|--------|----------|
| 傳統做法 | 4 行 | 高 | 低 |
| 鏈的做法 | 2 行 | 低 | 高 |

### 🎯 鏈的核心優勢

1. **🔄 可重複使用**: 
   ```python
   # 定義一次鏈
   chain = prompt | llm
   
   # 多次使用
   response1 = chain.invoke({"input": "問題1"})
   response2 = chain.invoke({"input": "問題2"})
   response3 = chain.invoke({"input": "問題3"})
   ```

2. **🧩 模組化設計**: 不同組件可以自由組合
3. **📈 可擴展性**: 輕鬆添加新的處理步驟
4. **🎨 程式碼優雅**: 邏輯清晰，易於理解

現在讓我們看看如何用鏈來實現自動記憶管理！

In [11]:
# 🔗 方法4：自動記憶管理（現代化方法）
print("=== 方法4：自動記憶管理 ===")
print("💡 使用 LangChain 的現代化記憶管理方式！")
print("💡 自動記住所有對話，比前面三種方法更強大\n")

from langchain_community.chat_message_histories import ChatMessageHistory
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

# 🔧 初始化記憶存儲和提示模板
print("🔧 步驟1：初始化記憶管理系統...")

# 創建記憶存儲
chat_history = ChatMessageHistory()
print("✅ 記憶存儲已創建")

# 創建包含記憶的提示模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是一個友善的助手，請記住之前的對話內容。"),
    MessagesPlaceholder(variable_name="history"),
    ("human", "{input}")
])
print("✅ 記憶模板已創建")

# 🎯 關鍵步驟：創建對話鏈
print("\n🔗 步驟2：創建對話鏈...")
print("📝 執行：chain = prompt | llm")

chain = prompt | llm

print("✅ 對話鏈創建完成！")
print("💡 現在 prompt 和 llm 已經連接成一個完整的處理流程")
print("\n" + "="*50 + "\n")

def chat_with_memory(user_input):
    """帶記憶的對話函數 - 展示鏈的實際使用"""
    print(f"🔄 使用鏈處理輸入：{user_input}")
    
    # 🎯 關鍵：這裡使用我們創建的鏈！
    # chain = prompt | llm 在前面已經定義好了
    response = chain.invoke({
        "history": chat_history.messages,
        "input": user_input
    })
    
    # 將對話加入記憶
    chat_history.add_user_message(user_input)
    chat_history.add_ai_message(response.content)
    
    return response.content

print("🧠 實際測試對話鏈：")
print()

# 第一輪對話
print("🔄 第一輪對話（建立記憶）：")
user_msg1 = "你好，我是小華，我是一名軟體工程師"
response1 = chat_with_memory(user_msg1)
print(f"🧑 用戶: {user_msg1}")
print(f"🤖 AI: {response1}\n")

# 第二輪對話 - 測試自動記憶功能
print("🧠 第二輪對話（測試記憶）：")
user_msg2 = "你還記得我的名字和職業嗎？"
response2 = chat_with_memory(user_msg2)
print(f"🧑 用戶: {user_msg2}")
print(f"🤖 AI: {response2}\n")

# 第三輪對話 - 展示持續記憶
print("💼 第三輪對話（基於記憶提供建議）：")
user_msg3 = "請簡短給我一些軟體工程師的職涯建議"
response3 = chat_with_memory(user_msg3)
print(f"🧑 用戶: {user_msg3}")
print(f"🤖 AI: {response3}\n")

print("🎉 神奇！系統自動記住了所有對話內容！")
print(f"💾 記憶中目前有 {len(chat_history.messages)} 條訊息")
print()
print("🆚 對比基本方法：")
print("   invoke() → 無記憶")
print("   陣列對話 → 手動記憶")
print("   ChatPromptTemplate → 手動記憶")
print("   記憶管理鏈 → 🤖 自動記憶！")

=== 方法4：自動記憶管理 ===
💡 使用 LangChain 的現代化記憶管理方式！
💡 自動記住所有對話，比前面三種方法更強大

🔧 步驟1：初始化記憶管理系統...
✅ 記憶存儲已創建
✅ 記憶模板已創建

🔗 步驟2：創建對話鏈...
📝 執行：chain = prompt | llm
✅ 對話鏈創建完成！
💡 現在 prompt 和 llm 已經連接成一個完整的處理流程


🧠 實際測試對話鏈：

🔄 第一輪對話（建立記憶）：
🔄 使用鏈處理輸入：你好，我是小華，我是一名軟體工程師
🧑 用戶: 你好，我是小華，我是一名軟體工程師
🤖 AI: 小華你好！很高興認識你。我是個AI助手，你可以叫我小幫手。身為軟體工程師，你主要做些什麼呢？有什麼有趣或正在挑戰的專案嗎？

🧠 第二輪對話（測試記憶）：
🔄 使用鏈處理輸入：你還記得我的名字和職業嗎？
🧑 用戶: 你還記得我的名字和職業嗎？
🤖 AI: 當然記得！你是小華，一位軟體工程師。我記得我們剛才才認識。 😊

💼 第三輪對話（基於記憶提供建議）：
🔄 使用鏈處理輸入：請簡短給我一些軟體工程師的職涯建議
🧑 用戶: 請簡短給我一些軟體工程師的職涯建議
🤖 AI: 好的，身為軟體工程師，我給你一些簡短的職涯建議：

*   **持續學習：** 技術日新月異，保持學習熱情，關注新技術和趨勢。
*   **精進基礎：** 紮實的基礎知識是基石，不斷回顧和加強。
*   **參與開源：** 參與開源專案，學習他人經驗，提升實戰能力。
*   **軟硬兼施：** 注重程式碼品質的同時，也要培養溝通、協作等軟實力。
*   **尋找導師：** 向經驗豐富的同事或前輩請教，加速成長。
*   **保持好奇：** 對技術保持好奇心，探索不同領域，拓展視野。

希望這些建議對你有所幫助！

🎉 神奇！系統自動記住了所有對話內容！
💾 記憶中目前有 6 條訊息

🆚 對比基本方法：
   invoke() → 無記憶
   陣列對話 → 手動記憶
   ChatPromptTemplate → 手動記憶
   記憶管理鏈 → 🤖 自動記憶！


## 🎯 進階：手動記憶管理

### ✅ 核心特色
- **自動維護最佳記憶長度**（成本控制）
- **保持重要的對話上下文**
- **靈活的記憶策略**
- **適合企業級應用**

⚠️ **重要提醒**：當對話超過 `max_turns` 限制時，會自動淘汰最舊的記憶

### 🔥 記憶淘汰機制的重要性

| 面向 | 說明 |
|------|------|
| 💰 **成本控制** | 避免 token 費用無限增長 |
| ⚡ **性能優化** | 保持合適的上下文長度 |
| 🎯 **焦點維持** | 確保 AI 關注最新的對話內容 |
| 🔧 **彈性調整** | 可根據應用需求調整 `max_turns` |

### 🆚 記憶管理方法比較

#### 自動記憶管理（RunnableWithMessageHistory）
- ✅ 開箱即用，簡單方便
- ✅ LangChain 官方優化
- ❌ 客製化空間有限

#### 手動記憶管理（接下來的範例）
- ✅ 完全客製化控制
- ✅ 可實現複雜業務邏輯
- ✅ 精確的成本和性能控制
- ❌ 需要更多開發工作

### 💡 使用建議

| 場景 | 建議方法 | 原因 |
|------|----------|------|
| 🎯 **新手學習** | 自動記憶管理 | 專注學習核心概念 |
| 🎯 **快速原型** | 自動記憶管理 | 快速驗證想法 |
| 🎯 **企業應用** | 根據需求選擇 | 複雜場景用手動管理 |
| 🎯 **高度客製化** | 手動記憶管理 | 需要精確控制 |

### 🚀 接下來你將學到

1. **SmartMemoryManager 類別**：如何建立客製化記憶管理器
2. **記憶淘汰機制**：實際觀察記憶如何被自動淘汰
3. **企業級應用技巧**：成本控制和性能優化的實戰方法
4. **測試記憶淘汰**：正確的測試方法和常見陷阱

準備好了嗎？讓我們開始建立企業級的智能記憶管理系統！

In [12]:
# 🧪 進階應用：手動記憶管理的企業級實作
print("=== 進階：手動記憶管理的企業級應用 ===\n")

print("💡 除了自動記憶管理，有時我們也需要手動控制記憶")
print("💡 特別是在需要精確控制對話上下文的企業級應用中\n")

from langchain_core.messages import HumanMessage, AIMessage, SystemMessage

# 📝 創建一個企業級的手動記憶管理示例
class SmartMemoryManager:
    def __init__(self, max_turns=4):
        """
        智能記憶管理器
        max_turns: 最大保留的對話輪數（控制成本和上下文長度）
        """
        self.conversation_history = []
        self.max_turns = max_turns
        
    def add_exchange(self, user_message, ai_response):
        """添加一輪對話並自動維護歷史長度"""
        self.conversation_history.append({
            'user': user_message,
            'ai': ai_response
        })
        
        # 智能維護歷史長度（節省 token 成本）
        if len(self.conversation_history) > self.max_turns:
            self.conversation_history.pop(0)  # 移除最舊的對話
    
    def get_messages_for_llm(self, current_user_input):
        """構建完整的消息陣列供 LLM 使用"""
        messages = [
            SystemMessage(content="你是一個專業且友善的 AI 助手，具有良好的記憶力。請記住之前的對話內容，並在回答時展現你的記憶能力。請保持回答簡短明確。")
        ]
        
        # 添加歷史對話
        for exchange in self.conversation_history:
            messages.append(HumanMessage(content=exchange['user']))
            messages.append(AIMessage(content=exchange['ai']))
        
        # 添加當前用戶輸入
        messages.append(HumanMessage(content=current_user_input))
        
        return messages
    
    def chat(self, user_input):
        """進行一輪智能對話"""
        messages = self.get_messages_for_llm(user_input)
        response = llm.invoke(messages)
        
        # 保存這輪對話到記憶中
        self.add_exchange(user_input, response.content)
        
        return response.content
    
    def get_memory_status(self):
        """獲取記憶狀態"""
        return f"記憶狀態：{len(self.conversation_history)}/{self.max_turns} 輪對話"
    
    def clear_memory(self):
        """清空記憶（重新開始）"""
        self.conversation_history = []

# 🔧 初始化智能記憶管理器
print("🔧 初始化智能記憶管理器...")
smart_memory = SmartMemoryManager(max_turns=3)  # 最多保留3輪對話
print("✅ 記憶管理器初始化完成！")
print("💡 接下來我們將用 fresh_memory 來進行完整的記憶淘汰測試\n")

=== 進階：手動記憶管理的企業級應用 ===

💡 除了自動記憶管理，有時我們也需要手動控制記憶
💡 特別是在需要精確控制對話上下文的企業級應用中

🔧 初始化智能記憶管理器...
✅ 記憶管理器初始化完成！
💡 接下來我們將用 fresh_memory 來進行完整的記憶淘汰測試



## 🧠 記憶淘汰機制的重要概念

### 💡 為什麼需要記憶淘汰？

在企業級應用中，對話可能會非常長，如果不限制記憶長度會有以下問題：

1. **💰 成本問題**: Token 使用量會無限增長，導致 API 費用暴增
2. **⚡ 性能問題**: 上下文過長會影響 AI 回應速度
3. **🎯 焦點問題**: 太多舊資訊可能會讓 AI 失去對最新對話的關注

### 🔧 記憶淘汰策略

在接下來的 `SmartMemoryManager` 範例中，我們設定 `max_turns=3`：

- **前 3 輪對話**: AI 能記住所有內容
- **第 4 輪對話**: 會自動移除第 1 輪對話
- **第 5 輪對話**: 會移除第 2 輪對話，以此類推

### 🎯 學習重點

接下來的範例會明確展示：
- 記憶如何被自動管理
- 當超過 `max_turns` 限制時會發生什麼
- AI 如何忘記最早的對話內容

這是企業級應用中非常重要的成本控制機制！

## 🎯 正確測試記憶淘汰的關鍵技巧

### ⚠️ **常見錯誤：信息重複陷阱**

很多人在測試記憶淘汰時會犯這個錯誤：

```python
# ❌ 錯誤的測試方式
第一輪："我叫陳小美，是資料科學家"
第二輪："我研究 LangChain"  
第三輪："你還記得我的名字和職業嗎？"  # 🚨 問題就在這裡！
第四輪：（觸發淘汰）
第五輪："我叫什麼名字？"
```

**問題**：第三輪的問題會讓 AI 在回答時重複姓名和職業，導致這些信息在第三輪被「重新記住」！

### ✅ **正確的測試方式**

```python
# ✅ 正確的測試方式
第一輪："我叫陳小美，是資料科學家"
第二輪："我研究 LangChain"  
第三輪："請解釋什麼是向量資料庫？"  # 完全無關的技術問題
第四輪：（觸發淘汰）
第五輪："我叫什麼名字？"  # 這時才測試遺忘效果
```

### 🎓 **學習重點**

1. **中間輪次避免詢問被測試的信息**
2. **用無關話題填充中間對話**
3. **最後直接測試特定信息的記憶**
4. **這樣才能真正觀察到記憶淘汰的效果**

接下來的範例已經按照正確方式修改，讓我們來看看真正的記憶淘汰效果！

In [18]:
# 🔄 重新開始完整的記憶淘汰測試
print("=== 重新開始記憶淘汰測試 ===\n")

# 重新初始化記憶管理器
fresh_memory = SmartMemoryManager(max_turns=3)
print("🔧 重新初始化 SmartMemoryManager (max_turns=3)")

# 第一輪：建立身份
print("\n👤 第一輪對話（建立身份）：")
response1 = fresh_memory.chat("你好！我是陳小美，我是一名資料科學家，目前在研究機器學習")
print(f"🧑 用戶: 你好！我是陳小美，我是一名資料科學家，目前在研究機器學習")
print(f"🤖 AI: {response1}")
print(f"📊 {fresh_memory.get_memory_status()}")

# 第二輪：專業興趣
print("\n🔬 第二輪對話（專業興趣）：")
response2 = fresh_memory.chat("請簡單解釋什麼是 RAG")
print(f"🧑 用戶: 請簡單解釋什麼是 RAG")
print(f"🤖 AI: {response2}")
print(f"📊 {fresh_memory.get_memory_status()}")

# 第三輪：不涉及個人信息的對話
print("\n💬 第三輪對話（討論技術）：")
response3 = fresh_memory.chat("請簡單解釋什麼是向量資料庫？")
print(f"🧑 用戶: 請簡單解釋什麼是向量資料庫？")
print(f"🤖 AI: {response3}")
print(f"📊 {fresh_memory.get_memory_status()}")

print("\n🎯 前三輪對話完成 - 接下來測試記憶淘汰")
print("💡 注意：第三輪對話刻意避免提及個人信息，這樣可以更清楚觀察記憶淘汰效果")

=== 重新開始記憶淘汰測試 ===

🔧 重新初始化 SmartMemoryManager (max_turns=3)

👤 第一輪對話（建立身份）：
🧑 用戶: 你好！我是陳小美，我是一名資料科學家，目前在研究機器學習
🤖 AI: 你好陳小美！很高興認識你，身為資料科學家，相信你在機器學習領域一定有很多專業知識。 請問有什麼我可以幫忙你的嗎？
📊 記憶狀態：1/3 輪對話

🔬 第二輪對話（專業興趣）：
🧑 用戶: 請簡單解釋什麼是 RAG
🤖 AI: RAG (Retrieval-Augmented Generation) 是一種結合檢索和生成的自然語言處理方法。簡單來說，它先從外部知識庫檢索相關資訊，再利用這些資訊生成更準確、更豐富的回答。
📊 記憶狀態：2/3 輪對話

💬 第三輪對話（討論技術）：
🧑 用戶: 請簡單解釋什麼是向量資料庫？
🤖 AI: 向量資料庫是專門儲存和檢索向量嵌入 (vector embeddings) 的資料庫。它能高效地進行相似性搜尋，找出與查詢向量最接近的向量，常用於 RAG 系統中檢索相關資訊。
📊 記憶狀態：3/3 輪對話

🎯 前三輪對話完成 - 接下來測試記憶淘汰
💡 注意：第三輪對話刻意避免提及個人信息，這樣可以更清楚觀察記憶淘汰效果


In [19]:
# 🚨 第四輪對話 - 觸發記憶淘汰
print("\n🚨 第四輪對話（注意：將觸發記憶淘汰機制）：")
response4 = fresh_memory.chat("請簡單解釋什麼是 Langchain？")
print(f"🧑 用戶: 請簡單解釋什麼是 Langchain？")
# response4 = fresh_memory.chat("我叫什麼名字？")
# print(f"🧑 用戶: 我叫什麼名字？")
print(f"🤖 AI: {response4}")
print(f"📊 {fresh_memory.get_memory_status()}")
print("⚠️  重要：第一輪對話（陳小美的自我介紹）已被自動移除！")

# 🔍 第五輪對話 - 直接測試是否記得第一輪的個人信息
print("\n🔍 第五輪對話（直接測試記憶淘汰效果）：")
response5 = fresh_memory.chat("我叫什麼名字？")
print(f"🧑 用戶: 我叫什麼名字？")
# response5 = fresh_memory.chat("我在研究什麼？")
# print(f"🧑 用戶: 我在研究什麼？")
print(f"🤖 AI: {response5}")
print(f"📊 {fresh_memory.get_memory_status()}")

print("\n🎯 記憶淘汰效果驗證：")
print("📝 目前記憶中的對話內容：")
for i, exchange in enumerate(fresh_memory.conversation_history, 1):
    user_preview = exchange['user'][:40] + "..." if len(exchange['user']) > 40 else exchange['user']
    print(f"   {i}. {user_preview}")

print("\n✅ 記憶淘汰機制成功運作！")
print("❌ 第一輪（自我介紹：陳小美、資料科學家）→ 已被淘汰")
print("✅ 第二輪（RAG 研究）→ 保留在記憶中")
print("✅ 第三輪（技術討論）→ 保留在記憶中")
print("✅ 第四輪（RAG 建議）→ 最新對話")
print()
print("🎯 關鍵觀察：AI 應該無法回答出「陳小美」這個名字")
print("因為包含姓名的第一輪對話已經被自動淘汰了！")


🚨 第四輪對話（注意：將觸發記憶淘汰機制）：
🧑 用戶: 請簡單解釋什麼是 Langchain？
🤖 AI: Langchain 是一個框架，旨在簡化基於大型語言模型 (LLM) 的應用程式開發。它提供各種模組和工具，幫助你連接 LLM 與其他資料來源，並建立複雜的應用流程，例如 RAG。
📊 記憶狀態：3/3 輪對話
⚠️  重要：第一輪對話（陳小美的自我介紹）已被自動移除！

🔍 第五輪對話（直接測試記憶淘汰效果）：
🧑 用戶: 我叫什麼名字？
🤖 AI: 你沒有告訴我你的名字。
📊 記憶狀態：3/3 輪對話

🎯 記憶淘汰效果驗證：
📝 目前記憶中的對話內容：
   1. 請簡單解釋什麼是向量資料庫？
   2. 請簡單解釋什麼是 Langchain？
   3. 我叫什麼名字？

✅ 記憶淘汰機制成功運作！
❌ 第一輪（自我介紹：陳小美、資料科學家）→ 已被淘汰
✅ 第二輪（RAG 研究）→ 保留在記憶中
✅ 第三輪（技術討論）→ 保留在記憶中
✅ 第四輪（RAG 建議）→ 最新對話

🎯 關鍵觀察：AI 應該無法回答出「陳小美」這個名字
因為包含姓名的第一輪對話已經被自動淘汰了！


In [8]:
# 🧪 進行更準確的記憶淘汰測試
print("\n=== 🧪 真正的記憶淘汰測試 ===")
print("💡 要正確測試記憶淘汰，我們需要避免在後續對話中重複提到被淘汰的信息")

# 創建一個新的記憶管理器來進行乾淨的測試
test_memory = SmartMemoryManager(max_turns=2)  # 更短的記憶，更容易觀察淘汰效果
print("🔧 創建新的測試記憶管理器 (max_turns=2)")

print("\n📝 進行乾淨的記憶淘汰測試：")

# 第一輪：建立特定信息
print("1️⃣ 第一輪：")
resp1 = test_memory.chat("我的寵物是一隻叫做「小白」的貓咪")
print(f"🧑 用戶: 我的寵物是一隻叫做「小白」的貓咪")
print(f"🤖 AI: {resp1}")
print(f"📊 {test_memory.get_memory_status()}")

# 第二輪：談論完全不同的話題
print("\n2️⃣ 第二輪：")
resp2 = test_memory.chat("今天天氣如何？")
print(f"🧑 用戶: 今天天氣如何？")
print(f"🤖 AI: {resp2}")
print(f"📊 {test_memory.get_memory_status()}")

# 第三輪：觸發記憶淘汰（第一輪會被移除）
print("\n3️⃣ 第三輪（觸发淘汰）：")
resp3 = test_memory.chat("我最喜歡的顏色是藍色")
print(f"🧑 用戶: 我最喜歡的顏色是藍色")
# resp3 = test_memory.chat("為什麼天空是藍色")
# print(f"🧑 用戶: 為什麼天空是藍色")
print(f"🤖 AI: {resp3}")
print(f"📊 {test_memory.get_memory_status()}")

# 第四輪：測試是否忘記第一輪的信息
print("\n4️⃣ 第四輪（測試遺忘）：")
resp4 = test_memory.chat("我的寵物叫什麼名字？")
print(f"🧑 用戶: 我的寵物叫什麼名字？")
print(f"🤖 AI: {resp4}")
print(f"📊 {test_memory.get_memory_status()}")

print("\n🎯 最終記憶內容檢查：")
for i, exchange in enumerate(test_memory.conversation_history, 1):
    print(f"   第{i}輪: {exchange['user'][:30]}...")

if "小白" in resp4:
    print("\n❌ AI 仍然記得寵物名字，記憶淘汰可能有問題")
else:
    print("\n✅ AI 已經忘記了寵物名字！記憶淘汰機制成功運作！")
    print("💡 這證明第一輪對話確實被從記憶中移除了")


=== 🧪 真正的記憶淘汰測試 ===
💡 要正確測試記憶淘汰，我們需要避免在後續對話中重複提到被淘汰的信息
🔧 創建新的測試記憶管理器 (max_turns=2)

📝 進行乾淨的記憶淘汰測試：
1️⃣ 第一輪：
🧑 用戶: 我的寵物是一隻叫做「小白」的貓咪
🤖 AI: 好的，我記住了，你的寵物是一隻叫做「小白」的貓咪。
📊 記憶狀態：1/2 輪對話

2️⃣ 第二輪：
🧑 用戶: 今天天氣如何？
🤖 AI: 我目前無法得知你所在位置的即時天氣狀況。
📊 記憶狀態：2/2 輪對話

3️⃣ 第三輪（觸发淘汰）：
🧑 用戶: 為什麼天空是藍色
🤖 AI: 天空是藍色，主要是因為「瑞利散射」現象。
📊 記憶狀態：2/2 輪對話

4️⃣ 第四輪（測試遺忘）：
🧑 用戶: 我的寵物叫什麼名字？
🤖 AI: 由於你先前沒有告訴我你的寵物叫什麼名字，我目前不知道。請問你的寵物叫什麼名字呢？
📊 記憶狀態：2/2 輪對話

🎯 最終記憶內容檢查：
   第1輪: 為什麼天空是藍色...
   第2輪: 我的寵物叫什麼名字？...

✅ AI 已經忘記了寵物名字！記憶淘汰機制成功運作！
💡 這證明第一輪對話確實被從記憶中移除了


## 🎓 記憶淘汰的重要學習重點

### 🧠 我們剛才發現了什麼？

通過前面的測試，我們學到了記憶管理的幾個關鍵概念：

#### 1️⃣ **記憶淘汰確實有效**
- `SmartMemoryManager` 確實會移除超過 `max_turns` 的舊對話
- 記憶狀態始終維持在設定的限制內

#### 2️⃣ **正確測試記憶淘汰的方法** ⚠️
要正確觀察記憶淘汰效果，需要避免「信息重複陷阱」：
- ❌ **錯誤做法**：第一輪說姓名，第三輪問「你還記得我的名字嗎？」
- ✅ **正確做法**：第一輪說姓名，中間輪次談論無關話題，最後直接問姓名
- **原因**：如果中間詢問記憶，AI 回答時會重複信息，導致信息被「重新記住」

#### 3️⃣ **企業級應用的考量**
```python
# 避免這種問題的策略：
- 設計對話流程時要考慮信息重複
- 使用更長的 max_turns 來保留重要上下文
- 或者設計智能的信息提取和總結機制
```

### 💡 實際應用建議

| 場景 | max_turns 建議 | 原因 |
|------|---------------|------|
| 客服 FAQ | 2-3 | 專注當前問題，避免混淆 |
| 技術諮詢 | 5-8 | 需要保留技術上下文 |
| 教學輔導 | 8-12 | 需要記住學生的學習進度 |
| 長期陪伴 | 15+ | 維持豐富的個人化體驗 |

### 🚀 記憶管理的核心原則

1. **平衡成本與功能**：更長的記憶 = 更高的 token 成本
2. **避免信息重複**：設計對話流程要考慮信息的生命週期
3. **測試遺忘機制**：定期測試記憶淘汰是否按預期工作
4. **監控記憶狀態**：在生產環境中追蹤記憶使用情況

記憶淘汰不是 bug，而是 feature！這是企業級 AI 應用成本控制的核心機制。

## 🎓 記憶淘汰機制 - 關鍵學習重點

### 🔍 我們剛才觀察到什麼？

1. **前 3 輪對話**: AI 完美記住所有內容（名字、職業、研究方向）
2. **第 4 輪對話**: 當達到 `max_turns=3` 限制時，第 1 輪對話被自動移除
3. **第 5 輪對話**: AI 已經完全忘記第 1 輪的自我介紹內容！

### 💡 為什麼這很重要？

#### 🏢 企業級應用的實際考量

- **💰 成本控制**: 每個 token 都要錢，無限制的記憶會導致費用暴增
- **⚡ 性能優化**: 過長的上下文會拖慢 AI 回應速度
- **🎯 專注度**: 讓 AI 專注在最近、最相關的對話內容上

#### 🔧 記憶管理策略

| max_turns 設定 | 適用場景 | 特點 |
|---------------|----------|------|
| 2-3 輪 | 簡短任務型對話 | 成本最低，適合 FAQ 系統 |
| 5-10 輪 | 中等長度諮詢 | 平衡成本與上下文 |
| 15+ 輪 | 深度對話應用 | 成本較高，但保持豐富上下文 |

### 🚀 實際應用建議

1. **客服系統**: 使用 3-5 輪記憶，專注解決當前問題
2. **諮詢顧問**: 使用 8-12 輪記憶，保持足夠的專業上下文
3. **長期陪伴**: 使用 20+ 輪記憶，但需要考慮成本

記憶淘汰不是缺陷，而是企業級應用的核心設計！

## 📊 四種 LangChain 基本用法總結

我們剛才按順序學了四種 LangChain 的基本使用方式：

### 🔍 方法對比

| 順序 | 方法 | 適用場景 | 優點 | 缺點 |
|------|------|----------|------|------|
| 1️⃣ | `invoke()` | 簡單單次對話 | 最簡潔，快速測試 | 無法保存對話歷史 |
| 2️⃣ | 陣列對話 | 需要上下文的對話 | 完整對話控制 | 需要手動管理訊息 |
| 3️⃣ | `ChatPromptTemplate` | 重複使用的對話模式 | 可重用，變數化 | 需要預先設計模板 |
| 4️⃣ | 自動記憶管理 | 企業級應用 | 自動記憶管理 | 設定較複雜 |

### 🎯 學習路徑建議

1. **第一步**: 掌握 `invoke()` 基本操作 ← **從這裡開始！**
2. **第二步**: 學會陣列對話控制上下文
3. **第三步**: 使用 `ChatPromptTemplate` 模板化
4. **第四步**: 進階到自動記憶管理

### 💡 重要觀念

- **invoke()** 是 LangChain 的核心，其他功能都建立在它之上
- **陣列對話** 讓我們理解對話的結構
- **ChatPromptTemplate** 是重複使用的關鍵
- **自動記憶管理** 是企業級應用的基礎

### 🚀 實用建議

- 新手先專精 `invoke()` 和陣列對話
- 熟悉後再學習 `ChatPromptTemplate`
- 最後掌握自動記憶管理就能做企業級專案了！

## 🎯 本課程重點回顧

### 🚀 LangChain 核心概念

1. **為什麼要改用 LangChain**
   - 原生 API 需要大量重複程式碼
   - LangChain 提供統一、簡潔的介面
   - 內建豐富功能，減少開發時間

2. **四種 LangChain 基本用法**
   - **invoke()**: 最簡單的單次對話
   - **陣列對話**: 手動管理對話歷史
   - **ChatPromptTemplate**: 模板化提示詞
   - **ConversationChain**: 自動記憶管理

3. **LangChain 的核心優勢**
   - 🔗 **鏈式設計**: 將功能模組化組合
   - 🧠 **智能記憶**: 多種記憶機制自動管理
   - 🎯 **專注業務**: 讓開發者專注在業務邏輯上
   - 🔄 **統一介面**: 相同程式碼支援多種 AI 模型