## LLM 調用

In [15]:
import json
import os
from typing import Any, Dict, List, Optional

import psycopg2
from langchain.embeddings.base import Embeddings
from langchain.messages import (AIMessageChunk, HumanMessage, SystemMessage,
                                ToolMessage)
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.tools import tool
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_ollama import OllamaEmbeddings
from langchain_openai import ChatOpenAI
from langchain_postgres.vectorstores import PGVector
from openai import OpenAI
from pydantic import BaseModel, Field

from src.config.constant import (EMBEDDING_MODEL, OLLAMA_LOCAL, OLLAMA_URL,
                                 PG_COLLECTION, PROJECT_ROOT, SYSTEM_PROMPT)
from src.database import postgreSQL_conn as pgc
from src.database.postgreSQL_conn import DB_NAME, PASSWORD, PG_HOST, PORT, USER

In [16]:
# 建立embedding連線
embeddings = OllamaEmbeddings(
    model=EMBEDDING_MODEL,
    base_url=OLLAMA_URL
)

# 載入向量資料庫
pg_url = pgc.connect_to_pgSQL()
vector_store = PGVector(
        embeddings=embeddings,
        collection_name=PG_COLLECTION,
        connection=pg_url,
        use_jsonb=True,
    )

In [None]:
# 建立embedding類別
class LmStudioEmbeddings(Embeddings):
    def __init__(self, model_name, url):
        self.model_name = model_name
        self.url = url
        self.client = OpenAI(base_url=url, api_key="lm-studio")

    def embed_query(self, text: str):
        response = self.client.embeddings.create(input=text,model=self.model_name)
        return response.data[0].embedding

    def embed_documents(self, texts: list[str]):
        # 回傳多個文件的 embedding
        response = self.client.embeddings.create(input=texts,model=self.model_name)
        return [x.embedding for x in response.data]
        # return [self.model.encode(t).tolist() for t in texts]


class stream_chat_bot:
    def __init__(self, llm, tools):
        self.llm = llm
        # 初始化對話機器人，傳入 LLM 與可用工具列表
        self.tools = tools
        # 將 LLM 綁定（bind）工具，使其具備自動呼叫工具的能力
        self.llm_with_tools = llm.bind_tools(tools)

        # 系統提示詞（System Prompt），用來設定 LLM 的角色與行為
        system_prompt = SYSTEM_PROMPT
        # 初始化訊息列表，第一條訊息是系統指令
        self.message = [SystemMessage(system_prompt)]

        # 將 LLM 的回應解析為純文字格式的工具
        self.str_parser = StrOutputParser()

    def _rephrase_query(self, user_input):
        """
        中間層 LLM：將使用者原始輸入轉換為更精準的查詢語句。
        """
        rephrase_prompt = ChatPromptTemplate.from_messages([
            ("system", """你是一個提問優化專家。請分析使用者的輸入與對話歷史，
            將其轉換為一個『獨立、完整、精準且簡潔』的問題，以便讓後續的搜尋系統能精確執行。

            規則：
            1. 保留所有關鍵資訊（如：遊戲名稱、日期、特定術語）。
            2. 修復錯字或語意不明之處。
            3. 如果使用者使用了代名詞（如：他、這件事），請根據歷史紀錄替換成具體內容。
            4. 直接輸出優化後的提問文字，不要包含額外的解釋。"""),
            # 傳入部分歷史紀錄增加上下文理解力
            ("placeholder", "{history}"),
            ("human", "{input}")
        ])

        # 使用原始 LLM 進行快速轉換
        rephrase_chain = rephrase_prompt | self.llm | self.str_parser

        # 取最近的 3 條紀錄作為參考，避免太長
        history_context = self.message[-3:] if len(self.message) > 1 else []

        refined_query = rephrase_chain.invoke({
            "history": history_context,
            "input": user_input
        })
        return refined_query

    def _summarize_history(self):
        """
        執行摘要邏輯：保留 System Prompt 與最新的 2 條訊息，
        將其餘的歷史紀錄壓縮成一段摘要。
        """
        if len(self.message) <= 3:
            return

        keep_latest = 2
        to_summarize = self.message[1:-keep_latest]
        recent_messages = self.message[-keep_latest:]

        summary_prompt = ChatPromptTemplate.from_messages([
            ("system", "你是一個專業的對話秘書。請將下方的對話紀錄精簡壓縮，保留核心重點，減少約 30% 總長度，並以繁體中文撰寫。"),
            ("placeholder", "{content}")
        ])

        summary_chain = summary_prompt | self.llm | self.str_parser
        summary_text = summary_chain.invoke({"content": to_summarize})

        self.message = [
            SystemMessage(content=self.system_prompt_content),
            HumanMessage(content=f"這是先前的對話摘要：{summary_text}"),
            *recent_messages
        ]
        print(f"\n✨ [系統通知]: 歷史紀錄已精簡完成。")


    def chat_generator(self, text, display_data=False):
        """
        主對話生成函式（生成器形式）。
        逐步執行 LLM 回應與工具調用，並即時回傳每一步的結果。
        """
        # 若對話紀錄超過三項，進行摘要
        if len(self.message) > 3:
            self._summarize_history()

        # 進行問題轉譯
        refined_text = self._rephrase_query(text)

        # 將轉役內容加入訊息列表
        self.message.append(HumanMessage(refined_text))

        while True:
            # 呼叫 LLM，傳入完整訊息歷史
            final_ai_message = AIMessageChunk(content="")
            for chunk in self.llm_with_tools.stream(self.message):
                final_ai_message += chunk
                if hasattr(chunk, 'content') and chunk.content:
                    yield self.str_parser.invoke(chunk)

            response = final_ai_message

            # 將 LLM 回應加入訊息列表
            self.message.append(response)

            # 檢查 LLM 是否要求呼叫工具
            is_tools_call = False
            for tool_call in response.tool_calls:
                is_tools_call = True

                if display_data:
                    # # 顯示 LLM 要執行的工具名稱與參數
                    msg = f'[執行]: {tool_call["name"]}({tool_call["args"]})\n-----------\n' #完整訊息
                    yield msg  # 使用 yield 讓結果能即時顯示在輸出中

                # 實際執行工具（根據工具名稱動態呼叫對應物件）
                tool_result = globals()[tool_call['name']].invoke(tool_call['args'])

                if display_data:
                    # # 顯示工具執行結果
                    msg = f'[結果]: {tool_result}\n-----------\n'
                    yield msg

                # 將工具執行結果封裝成 ToolMessage 回傳給 LLM
                tool_message = ToolMessage(
                    content=str(tool_result),          # 工具執行的文字結果
                    name=tool_call["name"],            # 工具名稱
                    tool_call_id=tool_call["id"],      # 工具呼叫 ID（讓 LLM 知道對應哪個呼叫）
                )
                # 將工具回傳結果加入訊息列表，提供 LLM 下一輪參考
                self.message.append(tool_message)

            # 若這一輪沒有任何工具呼叫，表示 LLM 已經生成最終回覆
            if not is_tools_call:
                break


    def chat(self, text, print_output=False):
        """
        封裝版對話函式。
        會收集 chat_generator 的所有輸出，並組合成完整的回覆字串。
        """
        msg = ''
        # 逐步取得 chat_generator 的產出內容
        for chunk in self.chat_generator(text):
            msg += f"{chunk}"
            if print_output:
                print(chunk, end='')
        # 回傳最終組合的對話內容
        return msg

In [18]:
class FewGameInput(BaseModel):
    question: str = Field(description="查詢的問題文字")
    k: int = Field(default=2, description="要回傳的文件數量")


@tool(args_schema=FewGameInput)
def few_game_rag(question, n=10, k=2):
    """
    當使用者詢問關於『特定 1-2 款遊戲』的詳細資訊時使用。
    例如：某款遊戲的背景故事、具體玩法機制、硬體配備要求等。
    這會提供非常完整的文本資料。

    Args:
        question (str): 查詢的問題文字。
        n (int): 搜尋子文件的數量。
        k (int): 要回傳的文件數量，預設為 2。若有需要可以增加查詢筆數。

    Returns:
        documents: 檢索到的相似文件列表。
    """
    # 檢索子文件
    child_docs = vector_store.similarity_search(question, k=n)

    # 提取父文件id
    unique_parent_ids = list(dict.fromkeys([
        doc.metadata["parent_id"] for doc in child_docs if "parent_id" in doc.metadata
    ]))

    target_ids = unique_parent_ids[:k]
    if not target_ids:
        return []

    # 批次查詢父文件
    parent_documents = vector_store.similarity_search(
        query="",
        k=len(target_ids),
        filter={"doc_id": {"$in": target_ids}} # 假設支援 $in 運算子
    )

    return parent_documents

In [19]:
"""選擇主要LLM"""

model_select = input("請選擇使用模型:(1.地端gemma3-12b / 2.免費gemini-3-flash / 3.付費gemini-3-flash)")
if str(model_select) == "1":
    model_name = 'gemma-3-12b-it'

    base_url = 'http://192.168.0.109:1234/v1'

    llm = ChatOpenAI(
        model=model_name,
        openai_api_key="not-needed",
        openai_api_base=base_url
    )

elif str(model_select) == "2":
    API_KEY = os.getenv("GOOGLE_API")
    model_name = 'gemini-3-flash-preview'

    llm = ChatGoogleGenerativeAI(
        model=model_name,
        google_api_key=API_KEY
    )

elif str(model_select) == "3":
    PRICE_API_KEY = os.getenv("GOOGLE_API_PRICE")
    model_name = 'gemini-3-flash-preview'

    llm = ChatGoogleGenerativeAI(
        model=model_name,
        google_api_key=PRICE_API_KEY
    )

else:
    print("請輸入1, 2 或 3 選擇使用模型")

In [20]:
tools = [few_game_rag]
bot = stream_chat_bot(llm, tools)

In [21]:
for x in bot.chat_generator("半條命2的評價如何", display_data=False):
    print(x, end='')

《戰慄時空 2》(Half-Life 2) 是電子遊戲史上最具代表性且評價極高的作品之一。以下是根據 Steam 資料庫與相關紀錄為您整理的詳細資訊：

### 1. 媒體評分
*   **Metacritic 分數**：**96 / 100**。
*   此分數代表了媒體的一致盛讚，並使其長期穩居史上評分最高的 PC 遊戲之一。

### 2. 玩家評價
*   **Steam 評價狀態**：**壓倒性好評 (Overwhelmingly Positive)**。
*   **好評率**：高達 **97.7%**。
*   **評論數**：累積超過 19 萬則玩家評論，顯示其在推出多年後依然深受社群喜愛。

### 3. 電子遊戲史上的影響力與地位
《戰慄時空 2》被廣泛認為是「為下一代遊戲奠定框架」的里程碑（PC Gamer 語），其主要貢獻與地位包含：
*   **物理引擎的革新**：引入了 Source 引擎與高度互動的物理系統（如著名的「重力槍」），讓環境互動不再只是視覺效果，而是玩法與解謎的核心。
*   **敘事手法**：延承了一代「無過場動畫」的沉浸式敘事傳統，讓玩家始終透過主角高登·弗里曼的視角體驗故事，極大提升了代入感。
*   **世界觀塑造**：其精緻的世界觀構建（如 17 號城、合成人）與壓抑的烏托邦氛圍，成為了第一人稱射擊遊戲（FPS）敘事的新基準。
*   **技術遺產**：作為 Source 引擎的首發作品，它催生了無數經典的 Mod（如《絕對武力：次世代》與《傳送門》的前身），對後世遊戲開發有著極深遠的影響。

這款遊戲不僅是 Valve 的巔峰之作，更是許多玩家心中不可動搖的經典神作。如果您對這款遊戲的其他細節（如硬體需求或 DLC 內容）感興趣，隨時歡迎詢問！