## 參考教學

- [Implementing RAG in LangChain with Chroma: A Step-by-Step Guide](https://medium.com/@callumjmac/implementing-rag-in-langchain-with-chroma-a-step-by-step-guide-16fc21815339)
- [rag-tutorial-v2](https://github.com/pixegami/rag-tutorial-v2)
- [LangChain: Q&A with RAG](https://python.langchain.com/v0.1/docs/use_cases/question_answering/quickstart/)
- [LangChain: Retrievers](https://python.langchain.com/v0.2/docs/how_to/#retrievers)

## 安裝基礎的模組（Install Base Dependencies）

In [1]:
%pip install --quiet python-dotenv langchain langchain_community langchain_chroma langchain_experimental

Note: you may need to restart the kernel to use updated packages.


## 載入 APY Keys

In [64]:
import os
from dotenv import load_dotenv

load_dotenv()

True

## LangSmith (Optional)
程式監視與除錯

In [65]:
import getpass
import os

if "LANGCHAIN_TRACING_V2" not in os.environ:
    os.environ["LANGCHAIN_TRACING_V2"] = "true"
#os.environ["LANGCHAIN_PROJECT"]="<your-project>"  # if not specified, defaults to "default"
if "LANGCHAIN_API_KEY" not in os.environ:
    os.environ["LANGCHAIN_API_KEY"] = getpass.getpass("Provide your LangChain Key")

## LLM 模型（LLM Model）

### Gemini Pro

In [3]:
%pip install --quiet langchain-google-genai pillow

Note: you may need to restart the kernel to use updated packages.


In [66]:
import getpass
import os
from langchain_google_genai import ChatGoogleGenerativeAI

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("Provide your Google API Key")

llm_google = ChatGoogleGenerativeAI(model="gemini-1.5-flash-latest", temperature=0)

In [4]:
result = llm_google.invoke("用繁體中文說一個笑話")
print(result.content)

有一天，小明問爸爸：「爸爸，結婚證書有什麼用？」

爸爸想了想，說：「結婚證書就像捕魚許可證。」

小明不解地問：「為什麼？」

爸爸笑着說：「因為有了結婚證書，你就可以釣到一個老婆，然後一輩子都不能釣其他的魚了！」 



### Groq

In [8]:
%pip install --quiet langchain_groq

I0000 00:00:1721795891.634062   51307 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721795891.634308   51307 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [4]:
import getpass
import os

if "GROQ_API_KEY" not in os.environ:
    os.environ["GROQ_API_KEY"] = getpass.getpass("Provide your Groq API Key")

from langchain_groq import ChatGroq

llm_groq_llama3 = ChatGroq(model="llama3-8b-8192")

In [5]:
llm_groq_llama3.invoke("Hello, who are you").content

"Nice to meet you! I am LLaMA, an AI assistant developed by Meta AI that can understand and respond to human input in a conversational manner. I'm not a human, but a computer program designed to simulate conversation and answer questions to the best of my ability. I can chat with you about a wide range of topics, from science and history to entertainment and culture. I can also help with tasks such as language translation, text summarization, and generating creative writing. What would you like to talk about or ask me?"

### Together LLM

In [None]:
%pip install --quiet  langchain-together

In [4]:
from langchain_together import ChatTogether

if "TOGETHER_API_KEY" not in os.environ:
    os.environ["TOGETHER_API_KEY"] = getpass.getpass("Provide your TogetherAI API Key")

llm_together = ChatTogether(
    model="meta-llama/Llama-3-70b-chat-hf",
    temperature=0,
)

In [5]:
llm_together.invoke("你是一位詩人，為我寫一個浪漫的中文詩句，只用繁體中文回答").content

'柔軟的月光，悄悄地灑落在你的肩膊，\n像是一絲絲的戀情，溫柔地纏繞著我的心；\n你的眼睛，如同星星般閃爍，照亮了我的生命，\n在你的愛情裡，我找到了一個溫暖的家。'

### Ollama LLM

In [26]:
%pip install --quiet langchain_ollama

I0000 00:00:1721806859.893387   95794 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721806859.893680   95794 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [3]:
from langchain_ollama import ChatOllama

llm_ollama = ChatOllama(
    #model="llama3:8b-instruct-q5_K_M", 
    model="yabi/breeze-7b-instruct-v1_0_q6_k",
    temperature=0
    )

In [49]:
llm_ollama.invoke("講一個笑話，只用繁體中文作答").content

'有一個小孩問老師：「老師，你的頭髮是不是假的？」\n\n老師回答：「不假！」\n\n小孩繼續問：「那為什麼你每天早上都要梳理？」\n\n老師笑著說：「因為我頭髮真的假的！」\n\n（哈哈，希望這個笑話能夠讓您笑起來！）'

### Fireworks LLM

In [34]:
%pip install -q langchain-fireworks

I0000 00:00:1721808765.743661   95794 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721808765.744014   95794 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [29]:
from langchain_fireworks import ChatFireworks

if "FIREWORKS_API_KEY" not in os.environ:
    os.environ["FIREWORKS_API_KEY"] = getpass.getpass("Provide your Fireworks API Key")

llm_fireworks = ChatFireworks(
    model="accounts/fireworks/models/llama-v3p1-70b-instruct",
    temperature=0,
)

In [46]:
llm_fireworks.invoke("Hello").content

'Hello! How can I assist you today?'

### Set LLM Model

In [67]:
llm_model = llm_google

## 嵌入模型（Embeding Model）

### HuggingFace

In [16]:
%pip install --quiet huggingface_hub sentence_transformers langchain-huggingface

I0000 00:00:1721796516.529888   51307 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721796516.530253   51307 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [115]:
import getpass
import os
from langchain_huggingface import HuggingFaceEmbeddings

if "HF_TOKEN" not in os.environ:
    os.environ["HF_TOKEN"] = getpass.getpass("Provide your HuggingFace ACCESS TOKEN")

# BCE Model developed by Youdao.com 
model_name = "maidalun1020/bce-embedding-base_v1"
#model_name = "thenlper/gte-large-zh"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'batch_size': 64, 'normalize_embeddings': True}
embed_hf = HuggingFaceEmbeddings(model_name=model_name,
                                 model_kwargs=model_kwargs,
                                 encode_kwargs=encode_kwargs)

### Google Embedding

In [11]:
%pip install --quiet langchain-google-genai

I0000 00:00:1721795975.418210   51307 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721795975.418627   51307 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [15]:
import getpass
import os
from langchain_google_genai import GoogleGenerativeAIEmbeddings

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("Provide your Google API Key")

embed_google = GoogleGenerativeAIEmbeddings(model="models/text-embedding-004")

### Together Embedding

In [12]:
%pip install --quiet  langchain-together

I0000 00:00:1721795979.481370   51307 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1721795979.482026   51307 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers


Note: you may need to restart the kernel to use updated packages.


In [5]:
from langchain_together.embeddings import TogetherEmbeddings

if "TOGETHER_API_KEY" not in os.environ:
    os.environ["TOGETHER_API_KEY"] = getpass.getpass("Provide your TogetherAI API Key")

embed_together = TogetherEmbeddings(model="hazyresearch/M2-BERT-2k-Retrieval-Encoder-V1")

### Ollama Embedding

In [5]:
%pip install --quiet langchain_ollama


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.1[0m[39;49m -> [0m[32;49m24.1.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [6]:
from langchain_ollama import OllamaEmbeddings

embed_ollama = OllamaEmbeddings(model="nomic-embed-text")

### Cohere Embedding

In [6]:
%pip install --quiet langchain-cohere

Note: you may need to restart the kernel to use updated packages.


In [111]:
from langchain_cohere import CohereEmbeddings

embed_cohere = CohereEmbeddings(model="embed-multilingual-v3.0") 


### Set the Embedding Model

In [116]:
embedding_model = embed_hf

## 載入文件來源（Load Documents）

### PDF + TXT + Markdown 檔案

In [12]:
%pip install --quiet pypdf unstructured pdfminer.six pillow_heif matplotlib unstructured_inference

I0000 00:00:1722759117.855434  196154 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1722759117.855803  196154 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers



[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.1.2[0m[39;49m -> [0m[32;49m24.2[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m
Note: you may need to restart the kernel to use updated packages.


In [117]:
from langchain_community.document_loaders import TextLoader, PyPDFLoader, UnstructuredMarkdownLoader
from langchain.schema import Document
import textwrap

DATA_PATH = "docs"

def load_files(dir=DATA_PATH):
    pages = []
    path = os.path.join(os.getcwd(), dir)

    for filename in os.listdir(path):
        if filename.endswith(".pdf"):
            loader = PyPDFLoader(path + '/' + filename)
            pages.extend(loader.load())
        elif filename.endswith(".txt"):
            loader = TextLoader(path + '/' + filename)
            pages.extend(loader.load())
        elif filename.endswith(".md"):
            loader = UnstructuredMarkdownLoader(path + '/' + filename)
            pages.extend(loader.load())
        else:
            print(f"Unsupported file type: {filename}")
        
    return pages

def load_files2(dir=DATA_PATH):
    docs = []
    path = os.path.join(os.getcwd(), dir)

    for filename in os.listdir(path):
        if filename.endswith(".pdf"):
            loader = PyPDFLoader(path + '/' + filename)
            pdf_pages = loader.load()
            doc = merge_pages_contenct(pdf_pages)
            docs.extend(doc)
        elif filename.endswith(".txt"):
            loader = TextLoader(path + '/' + filename)
            docs.extend(loader.load())
        elif filename.endswith(".md"):
            loader = UnstructuredMarkdownLoader(path + '/' + filename)
            docs.extend(loader.load())
        else:
            print(f"Unsupported file type: {filename}")
        
    return docs

def merge_pages_contenct(pages):
    merged_content = ""
    doc = []
    for page in pages:
        merged_content += page.page_content + "\n"

    doc = yield Document(page_content=merged_content, metadata={'source': page.metadata['source']})
    return doc


def pprint_result(result):
    print("Answer: " + "\n".join(textwrap.wrap(result)))

def pretty_print_docs(docs):
    print(
        f"\n{'-' * 100}\n".join(
            [f"Document {i+1}:\n\n" + d.page_content for i, d in enumerate(docs)]
        )
    )

all_pages = load_files2()
print(f"Pages: {len(all_pages)}")

Pages: 26


In [118]:
#print(f"\n".join(str(page.metadata) for page in all_pages[:3]))
pprint_result(all_pages[0].page_content[:2000])

Answer: 法規名稱：勞工退休金條例施行細則  修正日期：民國 110 年 07 月 12 日  第 一 章 總則  第 1 條
本細則依勞工退休金條例（以下簡稱本條例）第五十七條規定訂定之。  第 2 條  1 雇主依本條例第六條第一項規定申報提繳退休金時，應填具勞工
退休金提繳單位申請書（以下簡稱提繳單位申請書）及勞工退休金提繳申報表（以下簡稱提繳申報表）各一份送勞動部勞工保險局（以下簡稱勞保局）。  2
前項已參加勞工保險或就業保險者，得免填提繳單位申請書，其提繳單位編號由勞保局逕行編列。  第 3 條  1 雇主依本條例第六條第一項規定申報
提繳退休金時，除政府機關、公立學校及使用政府機關（構）提供之線上申請系統辦理者外，應檢附雇主國民身分證影本，或負責人國民身分證影本及下列證件
影本：  一、工廠：工廠登記有關證明文件。  二、礦場：礦場登記證、採礦或探礦執照。  三、鹽場、農場、牧場、林場、茶場等：登記證書。
四、交通事業：運輸業許可證或有關證明文件。  五、公用事業：事業執照或有關證明文件。  六、公司、行號：公司登記證明文件或商業登記證明文件。
七、私立學校、新聞事業、文化事業、公益事業、合作事業、漁業、職業訓練機構及各業人民團體：立案或登記證明書。
八、其他事業單位：目的事業主管機關核發之許可或證明文件。  2
不能取得前項各款規定之證件者，應檢附稅捐稽徵機關核發之扣繳單位設立（變更）登記或使用統一發票購票證辦理。  3
依第一項規定應檢附負責人國民身分證影本者，負責人非本國籍時，以居留證或護照影本為之。  第 4 條  1
有下列資料變更時，雇主應於三十日內向勞保局申請：  一、事業單位之名稱、登記地址或通訊地址變更。  二、負責人變更。  2
未依前項規定辦理變更手續者，勞保局得依勞工保險或就業保險之投保單位變更資料或相關機關登記之資料逕予變更。  第 4-1 條  1
雇主為本條例第七條第一項第二款至第四款人員申報提繳退休金時，應檢附其在我國居留證影本。  2
依本條例第七條第二項規定自願提繳退休金者，準用前項規定。  第 4-2 條
本條例第七條第二項第二款所稱自營作業者，指有下列情形之一，並獲致報酬，且未僱用有酬人員幫同工作者：  一、自己經營或合夥經營事業。
二、獨立從事勞動或技藝工作。  第 二 章 制度之適用及銜接  第 5 條

## 切割文字（Split Text)

In [129]:
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.schema import Document

def split_text(docs: list[Document]):
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=500, 
        chunk_overlap=120, 
        add_start_index=True,
        separators=[
            "\uff0e",  # Fullwidth full stop "．"
            "\u3002",  # Ideographic full stop "。"
            "\uff0c",  # Fullwidth comma "，"
        ],
    )
    splits = text_splitter.split_documents(docs)
    return splits

def split_text2(docs: list[Document]):
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=500, 
        chunk_overlap=125, 
        add_start_index=True,
        separators=[
            "第 .+ 章 .+\n\n",
            "第 [123456789-]+ 條\n\n",
            "\uff0e",  # Fullwidth full stop "．"
            "\u3002",  # Ideographic full stop "。"
            "\uff0c",  # Fullwidth comma "，"
        ],
        is_separator_regex=True,
    )
    splits = text_splitter.split_documents(docs)
    return splits



all_chunks = split_text2(all_pages)
print(f"Chunks: {len(all_chunks)}")

Chunks: 945


In [130]:
pretty_print_docs(all_chunks[:30])

Document 1:

法規名稱：勞工退休金條例施行細則

修正日期：民國 110 年 07 月 12 日
----------------------------------------------------------------------------------------------------
Document 2:

第 一 章 總則

第 1 條

本細則依勞工退休金條例（以下簡稱本條例）第五十七條規定訂定之。

第 2 條

1 雇主依本條例第六條第一項規定申報提繳退休金時，應填具勞工退休金提繳單位申請書（以下簡稱提繳單位申請書）及勞工退休金提繳申報表（以下簡稱提繳申報表）各一份送勞動部勞工保險局（以下簡稱勞保局）。

2 前項已參加勞工保險或就業保險者，得免填提繳單位申請書，其提繳單位編號由勞保局逕行編列。
----------------------------------------------------------------------------------------------------
Document 3:

第 3 條

1 雇主依本條例第六條第一項規定申報提繳退休金時，除政府機關、公立學校及使用政府機關（構）提供之線上申請系統辦理者外，應檢附雇主國民身分證影本，或負責人國民身分證影本及下列證件影本：

一、工廠：工廠登記有關證明文件。

二、礦場：礦場登記證、採礦或探礦執照。

三、鹽場、農場、牧場、林場、茶場等：登記證書。

四、交通事業：運輸業許可證或有關證明文件。

五、公用事業：事業執照或有關證明文件。

六、公司、行號：公司登記證明文件或商業登記證明文件。

七、私立學校、新聞事業、文化事業、公益事業、合作事業、漁業、職業訓練機構及各業人民團體：立案或登記證明書。

八、其他事業單位：目的事業主管機關核發之許可或證明文件。

2 不能取得前項各款規定之證件者，應檢附稅捐稽徵機關核發之扣繳單位設立（變更）登記或使用統一發票購票證辦理。

3 依第一項規定應檢附負責人國民身分證影本者，負責人非本國籍時，以居留證或護照影本為之。
---------------------------------------------------------------------------------------------

## 儲存向量庫（Store Vector DB）

### Chroma DB

In [42]:
from langchain_chroma import Chroma
from langchain.schema import Document

DB_PATH = "vector_db"
def save_to_chroma(chunks: list[Document]):
    persist_directory = DB_PATH
    db = Chroma.from_documents(collection_name="full_docs", documents=chunks, embedding=embedding_model, persist_directory=persist_directory)

    # Calculate Page IDs.
    #chunks_with_ids = calculate_chunk_ids(chunks)
    # Added the Title into the meta-data
    chunks_with_ids = calculate_chunk_ids2(chunks)

    # Add or Update the documents.
    existing_items = db.get(include=[])  # IDs are always included by default
    existing_ids = set(existing_items["ids"])
    print(f"Number of existing documents in DB: {len(existing_ids)}")

    # Only add documents that don't exist in the DB.
    new_chunks = []
    for chunk in chunks_with_ids:
        if chunk.metadata["id"] not in existing_ids:
            new_chunks.append(chunk)

    if len(new_chunks):
        print(f"👉 Adding new documents: {len(new_chunks)}")
        new_chunk_ids = [chunk.metadata["id"] for chunk in new_chunks]
        db.add_documents(new_chunks, ids=new_chunk_ids)
    else:
        print("✅ No new documents to add")

def calculate_chunk_ids(chunks: list[Document]):

    # This will create IDs like "data/monopoly.pdf:6:2"
    # Page Source : Page Number : Chunk Index

    last_page_id = None
    current_chunk_index = 0

    for chunk in chunks:
        source = chunk.metadata.get("source")
        page = chunk.metadata.get("page")
        current_page_id = f"{source}:{page}"

        # If the page ID is the same as the last one, increment the index.
        if current_page_id == last_page_id:
            current_chunk_index += 1
        else:
            current_chunk_index = 0

        # Calculate the chunk ID.
        chunk_id = f"{current_page_id}:{current_chunk_index}"
        last_page_id = current_page_id

        # Add it to the page meta-data.
        chunk.metadata["id"] = chunk_id

    return chunks

def calculate_chunk_ids2(chunks: list[Document]):

    # This will create IDs like "data/monopoly.pdf:6:2"
    # Page Source : Page Number : Chunk Index

    last_page_id = None
    current_chunk_index = 0

    for chunk in chunks:
        source = chunk.metadata.get("source")
        page = chunk.metadata.get("page")
        current_page_id = f"{source}:{page}"

        # If the page ID is the same as the last one, increment the index.
        if current_page_id == last_page_id:
            current_chunk_index += 1
        else:
            current_chunk_index = 0

        # Calculate the chunk ID.
        chunk_id = f"{current_page_id}:{current_chunk_index}"
        last_page_id = current_page_id

        # Add it to the page meta-data.
        chunk.metadata["id"] = chunk_id

        # Add Title into the meta-data
        title=os.path.splitext(os.path.basename(source))[0]
        chunk.metadata["title"] = title

    return chunks

def clear_database(db_path):
    import shutil
    if os.path.exists(db_path):
        shutil.rmtree(db_path)


## 載入與儲存（Load & Save）

### Chunking

In [43]:
#pages = load_files()
#chunks = split_text(pages)
#print(f"Pages: {len(pages)}")
docs = load_files2()
chunks = split_text(docs)
print(f"Docs: {len(docs)}")

print(f"Chunks: {len(chunks)}")

Pages: 22
Chunks: 440


### Storing to Vector DB

In [44]:
import time

clear_database(DB_PATH)
time.sleep(5)
if not os.path.exists(DB_PATH):
    save_to_chroma(chunks)

Number of existing documents in DB: 440
👉 Adding new documents: 440


## 檢索（Retrieval）

全域變數與通用函式

In [45]:
from langchain_community.callbacks import get_openai_callback
from langchain_chroma import Chroma
import textwrap, random

# Prepare the database
db = Chroma(collection_name="full_docs", persist_directory=DB_PATH, embedding_function=embedding_model)

rag_template_1 = """
### 指令
你是台灣人力資源法律的專家，熟悉就業法規、工作場所政策、員工權利和爭議解決的問題諮詢。所有回答請依據下面法規條文的內容來回答，
提供具體的例子、相關的法律參考和實用建議，以確保遵守法律並實踐人力資源法的最佳做法。
如果內容中查不到與問題相關的法條資訊，就回答：資料中查不到相關資訊。你只回答人資法律相關問題，如果非法律問題請說：你無法回答。

### 法規條文
{context}

### 問題
問題：{question}

### 回答
回答："""

rag_template_2 = """
### 指令
你是台灣人力資源法律的專家，熟悉就業法規、工作場所政策、員工權利和爭議解決的問題諮詢。所有回答請依據下面法規條文的內容來回答，
提供具體的例子、相關的法律參考和實用建議，以確保遵守法律並實踐人力資源法的最佳做法。
如果內容中查不到與問題相關的法條資訊，就回答：資料中查不到相關資訊。你只回答人資法律相關問題，如果非法律問題請說：你無法回答。

### 法規條文
{context}

### 問題
回答問題前請先參考上述相關的法規條文：{question}

### 回答
回答："""

rag_template_3 = """
### 指令
你是台灣人力資源法律的專家，熟悉就業法規、工作場所政策、員工權利和爭議解決的問題諮詢。所有回答請依據下面法規條文的內容來回答，
提供相關的法律參考和實用建議，以確保遵守法律並實踐人力資源法的最佳做法。
如果內容中查不到與問題相關的法條資訊，就回答：資料中查不到相關資訊。你只回答人資法律相關問題，如果非法律問題請說：你無法回答。

### 法規條文
{context}

### 問題
回答問題前請先參考上述相關的法規條文：{question}

### 回答
回答："""

questions_list = [
    "產假可以請多久？雇主能拒絕嗎？有錢可以領嗎？",
    "在公司已經任職15年，依規定一年應該會有幾天的特休假？",
    "申請生育給付要準備哪些文件？",
    "育嬰留停有哪些規定事項要注意？",
    "介紹奬金及競賽奬金是否須納入工資之範疇",
    "當勞資雙方發生爭議，雙方要如何進行調解",
    "流產是否可以申請生育給付？",
    "員工上班途中發生了交通事故，這個屬於職業傷害的範圍嗎？如果是，要如何申請傷害補助？",
    "勞保被保險人如果生病或受傷住院了，怎樣申請傷病給付？",
    "勞基法有哪些關於特休假的規定",
    "員工在例假日可以加班嗎，如何算加班費？",
    "生育給付的請領資格及給付標準各如何？",
]

def test_chain(chain):
    random.shuffle(questions_list)
    selected_questions = questions_list[:3]
    for question in selected_questions:
        print("-" * 40)
        print(f"Question: {question}\n")
        with get_openai_callback() as cb:
            pprint_result(chain().invoke(question))
            print(f'\nTotal Tokens: {cb.total_tokens}\n')

def format_docs(docs):
    return "\n".join("法規名稱： " + os.path.basename(str(doc.metadata['source'])).split('.', 1)[0] + 
                       "\n" + str(doc.page_content) + "\n----" for doc in docs)

### Retriever: Vectordb
- MMR: Maximum Marginal Relevance Retrieval

In [85]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from IPython.display import Markdown
from langchain.chains import RetrievalQA

def query_11(query_text):
    retriever = db.as_retriever(search_type="similarity", search_kwargs={"k": 3})
    custom_prompt = PromptTemplate.from_template(rag_template_1)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    
    return rag_chain.invoke(query_text)

def query_12(query_text):
    restrieved_data = db.similarity_search_with_relevance_scores(query_text,k=3)
    context_text = "\n".join([doc.page_content + "\n----" for doc, _score in restrieved_data])
    custom_prompt = PromptTemplate.from_template(rag_template_1)
    rag_chain = (
        custom_prompt
        | llm_model
        | StrOutputParser()
    )    
    return rag_chain.invoke({"context": context_text, "question": query_text})
    

def query_13(query_text):
    retriever = db.as_retriever(search_type="similarity_score_threshold", search_kwargs={"k": 6, "score_threshold": 0.5})
    custom_prompt = PromptTemplate.from_template(rag_template_2)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain.invoke(query_text)

def query_14(query_text):
    retriever = db.as_retriever(search_type="mmr")
    custom_prompt = PromptTemplate.from_template(rag_template_2)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain.invoke(query_text)  # Format the output: Markdown(outputs)

## NOTE: The RetrievalQA has been deprecated since version 0.1.0
def query_15(query_text):
    retriever = db.as_retriever(search_type="mmr", search_kwargs={"k": 4, "score_threshold": 0.5})
    qa = RetrievalQA.from_chain_type(
        llm=llm_model, 
        retriever=retriever, 
        #verbose=True
    )
    return qa.invoke(query_text)  # Format the output: Markdown(outputs['result'])

# Debug: db.get(where={"source": "pdf/勞工請假規則.pdf"})
def query_16(query_text):
    retriever = db.as_retriever(search_type="mmr", search_kwargs={"filter":{"source":"pdf/勞動基準法.pdf"}})
    custom_prompt = PromptTemplate.from_template(rag_template_2)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain.invoke(query_text)  # Format the output: Markdown(outputs)


In [86]:
results = query_14("勞工可以申請最多幾天病假")
Markdown(results)

回答：

1.  **未住院**: 1 年內合計不得超過 30 日。
2.  **住院**: 2 年內合計不得超過 1 年。
3.  **未住院與住院合併**: 2 年內合計不得超過 1 年。

    *   **備註**:
        *   以上天數包含例假日。
        *   癌症（含原位癌）門診治療或懷孕期間安胎休養，併入住院傷病假計算。

*   **法規參考**: 勞工請假規則第 4 條

 


### MultiVectorRetriver (Hypothetical Queries)
- [Hypothetical Queries](https://python.langchain.com/v0.2/docs/how_to/multi_vector/#hypothetical-queries)
- [Models support function calling and JSON schema](https://python.langchain.com/v0.2/docs/integrations/chat/)

注意：只有 Groq 的模型可以支援這個檢索方式，並且初始化階段容易中斷失敗，可能是 API 免費版本的原因。

In [59]:
from typing import List
from langchain_core.pydantic_v1 import BaseModel, Field
from langchain_core.prompts import ChatPromptTemplate
from langchain.storage import InMemoryByteStore
from langchain.retrievers.multi_vector import MultiVectorRetriever
from langchain_groq import ChatGroq
import uuid

class HypotheticalQuestions(BaseModel):
    """Generate hypothetical questions."""

    questions: List[str] = Field(..., description="List of questions")

hypo_prompt = """
Generate a list of exactly 3 hypothetical questions that the below document could be used to answer:\n\n{doc}.
### Rule
- Please answer in Traditional Chinese.
"""

hypo_model = ChatGroq(model="llama3-8b-8192")

chain = (
    {"doc": lambda x: x.page_content}
    # Only asking for 3 hypothetical questions, but this could be adjusted
    | ChatPromptTemplate.from_template(hypo_prompt)
    | hypo_model.with_structured_output(
        HypotheticalQuestions
    )
    | (lambda x: x.questions)
)

# Batch chain over documents to generate hypothetical questions
hypothetical_questions = chain.batch(chunks, {"max_concurrency": 2})

# Debug for the Error code 400: 
#hypothetical_questions = chain.batch(chunks[:10], {"max_concurrency": 2})
#print(f"HYPO_QUESTIONS: {len(hypothetical_questions)}")
#hypothetical_questions[0]


# The vectorstore to use to index the child chunks
hypo_db = Chroma(
    collection_name="hypo-questions", persist_directory=DB_PATH, embedding_function=embedding_model
)

# The storage layer for the parent documents
store = InMemoryByteStore()
id_key = "doc_id"
# The retriever (empty to start)
retriever = MultiVectorRetriever(
    vectorstore=hypo_db,
    byte_store=store,
    id_key=id_key,
)
doc_ids = [str(uuid.uuid4()) for _ in chunks]

# Generate Document objects from hypothetical questions
question_docs = []
for i, question_list in enumerate(hypothetical_questions):
    question_docs.extend(
        [Document(page_content=s, metadata={id_key: doc_ids[i]}) for s in question_list]
    )
retriever.vectorstore.add_documents(question_docs)
retriever.docstore.mset(list(zip(doc_ids, chunks)))

BadRequestError: Error code: 400 - {'error': {'message': "Failed to call a function. Please adjust your prompt. See 'failed_generation' for more details.", 'type': 'invalid_request_error', 'code': 'tool_use_failed', 'failed_generation': '</tool-use>\n{\n\t"tool_calls": [\n\t\t{\n\t\t\t"id": "pending",\n\t\t\t"type": "function",\n\t\t\t"function": {\n\t\t\t\t"name": "HypotheticalQuestions"\n\t\t\t},\n\t\t\t"parameters": {\n\t\t\t\t"questions": [\n\t\t\t\t\t"根據育嬰留職停薪實施辦法，什麼是申請育嬰留職停薪的 deadline？",\n\t\t\t\t\t"如果受僱者申請育嬰留職停薪，需要提供哪些資料？",\n\t\t\t\t\t"育嬰留職停薪期間，如果受僱者仍繼續參加社會保險，是否會影響工作年資計算？"\n\t\t\t\t]\n\t\t\t}\n\t\t}\n\t]\n}\n</tool-use>'}}

In [18]:
#chain.invoke(chunks[30])
#sub_docs = retriever.vectorstore.similarity_search("產假可以請多久？雇主能拒絕嗎？有錢可以領嗎?")
#sub_docs
#results = retriever.invoke("勞工可以申請最多幾天病假?")
#pretty_print_docs(results)

Document 1:

法規名稱：勞工請假規則
修正日期：民國 112 年 05 月 01 日
第 1 條
本規則依勞動基準法（以下簡稱本法）第四十三條規定訂定之。
第 2 條
勞工結婚者給予婚假八日，工資照給。
第 3 條
勞工喪假依左列規定：
一、父母、養父母、繼父母、配偶喪亡者，給予喪假八日，工資照給。
二、祖父母、子女、配偶之父母、配偶之養父母或繼父母喪亡者，給予喪假六日，工資照給。
三、曾祖父母、兄弟姊妹、配偶之祖父母喪亡者，給予喪假三日，工資照給。
第 4 條
1   勞工因普通傷害、疾病或生理原因必須治療或休養者，得在左列規定範圍內請普通傷病假：
一、未住院者，一年內合計不得超過三十日。
二、住院者，二年內合計不得超過一年。
三、未住院傷病假與住院傷病假二年內合計不得超過一年。
2   經醫師診斷，罹患癌症（含原位癌）採門診方式治療或懷孕期間需安胎休養者，其治療或休養期
間，併入住院傷病假計算。
3   普通傷病假一年內未超過三十日部分，工資折半發給，其領有勞工保險普通傷病給付未達工資半
數者，由雇主補足之。
第 5 條
勞工普通傷病假超過前條第一項規定之期限，經以事假或特別休假抵充後仍未痊癒者，得予留職
停薪。但留職停薪期間以一年為限。
第 6 條
勞工因職業災害而致失能、傷害或疾病者，其治療、休養期間，給予公傷病假。
第 7 條
勞工因有事故必須親自處理者，得請事假，一年內合計不得超過十四日。事假期間不給工資。
第 8 條
勞工依法令規定應給予公假者，工資照給，其假期視實際需要定之。
第 9 條
----------------------------------------------------------------------------------------------------
Document 2:

雇主不得因勞工請婚假、喪假、公傷病假及公假，扣發全勤獎金；勞工因妊娠未滿三個月流產未
請產假，而請普通傷病假者，亦同。
第 10 條
勞工請假時，應於事前親自以口頭或書面敘明請假理由及日數。但遇有急病或緊急事故，得委託
他人代辦請假手續。辦理請假手續時，雇主得要求勞工提出有關證明文件。
第 11 條
雇主或勞工違反本規則之規定時，主管機關得依本法有關規定辦理。
第 12 條
本規則自發布日施行。


### MultiQueryRetriever

In [46]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from IPython.display import Markdown
from langchain.retrievers.multi_query import MultiQueryRetriever

def multiquery_retriever():
    #retriever = db.as_retriever()
    #retriever = db.as_retriever(search_type="similarity", search_kwargs={"k": 3})
    retriever = db.as_retriever(search_type="mmr")
    retriever_from_llm = MultiQueryRetriever.from_llm(
        retriever=retriever,
        llm=llm_model
    )
    return retriever_from_llm

In [None]:
# Set logging for the queries
#import logging

#logging.basicConfig()
#logging.getLogger("langchain.retrievers.multi_query").setLevel(logging.INFO)

pretty_print_docs(multiquery_retriever().get_relevant_documents(questions_list[1]))

### Parent-Document

In [14]:
import pickle

parent_coll_name = "parent_documents" 
doc_id_key = "doc_id"
doc_file = "docstore.pkl"

def save_to_pickle(obj, filename):
    with open(filename, "wb") as file:
        pickle.dump(obj, file, pickle.HIGHEST_PROTOCOL)

def load_from_pickle(filename):
    with open(filename, "rb") as file:
        return pickle.load(file)
    
def create_parent_db():
    from langchain.retrievers import ParentDocumentRetriever
    from langchain_text_splitters import RecursiveCharacterTextSplitter
    from langchain.storage import InMemoryStore
    import uuid

    docs = load_pdfs()

    # This text splitter is used to create the child documents
    child_splitter = RecursiveCharacterTextSplitter(chunk_size=400)
    # The vectorstore to use to index the child chunks
    vector_store = Chroma(
        collection_name=parent_coll_name, embedding_function=embedding_model, persist_directory=DB_PATH
    )

    # The storage layer for the parent documents
    store = InMemoryStore()

    retriever = ParentDocumentRetriever(
        vectorstore=vector_store,
        docstore=store,
        child_splitter=child_splitter,
        id_key=doc_id_key,
    )

    doc_ids = [str(uuid.uuid4()) for _ in docs]
    
    docstore_path = os.path.join(DB_PATH, doc_file)
    retriever.add_documents(docs, ids=None)
    save_to_pickle(retriever.docstore.store, docstore_path)

    print(f"Ingested Documents: {len(retriever.docstore.store)}")

def load_parent_retriever():
    """Loads the vector store and document store, initializing the retriever."""
    from langchain.retrievers import ParentDocumentRetriever
    from langchain_text_splitters import RecursiveCharacterTextSplitter
    from langchain.storage import InMemoryStore

    vector_store = Chroma(
        collection_name=parent_coll_name, embedding_function=embedding_model, persist_directory=DB_PATH
    )
    child_splitter = RecursiveCharacterTextSplitter(chunk_size=400)
    store_dict = load_from_pickle(os.path.join(DB_PATH, doc_file))
    store = InMemoryStore()
    store.mset(list(store_dict.items()))

    retriever = ParentDocumentRetriever(
        vectorstore=vector_store,
        docstore=store,
        child_splitter=child_splitter,
        id_key=doc_id_key,
    )
    return retriever

In [17]:
import time

if not os.path.exists(os.path.join(DB_PATH, doc_file)):
    create_parent_db()
    time.sleep(5)
    
result = load_parent_retriever().invoke("勞工可以申請最多幾天病假")
result

[Document(metadata={'source': 'pdf/性別平等工作法.pdf', 'page': 5}, page_content='生已盡力防止仍不免發生者，雇主不負損害賠償責任。\n2  如被害人依前項但書之規定不能受損害賠償時，法院因其聲請，得斟酌雇主與被害人之\n經濟狀況，令雇主為全部或一部之損害賠償。\n3  雇主賠償損害時，對於性騷擾行為人，有求償權。\n4  被害人因遭受性騷擾致生法律訴訟，於受司法機關通知到庭期間，雇主應給予公假。\n5  行為人因權勢性騷擾，應依第一項規定負損害賠償責任者，法院得因被害人之請求，依\n侵害情節，酌定損害額一倍至三倍之懲罰性賠償金。\n6  前項行為人為最高負責人或僱用人，被害人得請求損害額三倍至五倍之懲罰性賠償金。 \n第 28 條 \n受僱者或求職者因雇主違反第十三條第二項之義務，受有損害者，雇主應負賠償責任。 \n第 29 條 \n前三條情形，受僱者或求職者雖非財產上之損害，亦得請求賠償相當之金額。其名譽被\n侵害者，並得請求回復名譽之適當處分。 \n第 30 條 \n第二十六條至第二十八條之損害賠償請求權，自請求權人知有損害及賠償義務人時起\n，二年間不行使而消滅。自有性騷擾行為或違反各該規定之行為時起，逾十年者，亦同\n。 \n第 31 條 \n受僱者或求職者於釋明差別待遇之事實後，雇主應就差別待遇之非性別、性傾向因素\n，或該受僱者或求職者所從事工作之特定性別因素，負舉證責任。 \n第 32 條 \n雇主為處理受僱者之申訴，得建立申訴制度協調處理。 \n第 32-1 條 \n1  受僱者或求職者遭受性騷擾，應向雇主提起申訴。但有下列情形之一者，得逕向地方主\n管機關提起申訴：\n一、被申訴人屬最高負責人或僱用人。\n二、雇主未處理或不服被申訴人之雇主所為調查或懲戒結果。\n2  受僱者或求職者依前項但書規定，向地方主管機關提起申訴之期限，應依下列規定辦理\n：\n一、被申訴人非具權勢地位：自知悉性騷擾時起，逾二年提起者，不予受理；自該行為\n終了時起，逾五年者，亦同。\n二、被申訴人具權勢地位：自知悉性騷擾時起，逾三年提起者，不予受理；自該行為終\n了時起，逾七年者，亦同。\n3  有下列情形之一者，依各款規定辦理，不受前項規定之限制。但依前項規定有較長申訴\n期限者，從其規定：\n一、性騷

### ReRank

In [27]:
%pip install --quiet cohere

I0000 00:00:1722066343.391406  159606 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1722066343.391665  159606 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Note: you may need to restart the kernel to use updated packages.


In [47]:
from langchain.retrievers import ContextualCompressionRetriever
from langchain.retrievers.document_compressors import CrossEncoderReranker
from langchain_community.cross_encoders import HuggingFaceCrossEncoder
from langchain.retrievers.document_compressors import CohereRerank

rerank_model = HuggingFaceCrossEncoder(model_name="maidalun1020/bce-reranker-base_v1")

def rerank_retriever():
    retriever = db.as_retriever(search_type="mmr", search_kwargs={"k": 10})
    compressor = CrossEncoderReranker(model=rerank_model, top_n=3)
    compression_retriever = ContextualCompressionRetriever(
        base_compressor=compressor, base_retriever=retriever
    )
    return compression_retriever

def multiq_rerank_retriever():
    retriever = multiquery_retriever()
    compressor = CrossEncoderReranker(model=rerank_model, top_n=3)
    compression_retriever = ContextualCompressionRetriever(
        base_compressor=compressor, base_retriever=retriever
    )
    return compression_retriever

def multiq_rerank_cohere_retriever():
    retriever = multiquery_retriever()
    compressor = CohereRerank()
    compression_retriever = ContextualCompressionRetriever(
        base_compressor=compressor, base_retriever=retriever
    )
    return compression_retriever


In [48]:
pretty_print_docs(multiq_rerank_cohere_retriever().get_relevant_documents(questions_list[1]))

  warn_deprecated(
  warn_deprecated(


Document 1:

。
    - 依據：勞動基準法第 37 條

3. 特別休假 (簡稱：特休假)
    - 給假原則：
        6 個月至未滿 1 年：3 日， 工作滿第 1 年：7 日， 工作滿第 2 年：10 日，工作滿第 3 年：14 日，工作滿第 4 年：14 日，工作滿第 5 年：15 日，工作滿第 6 年：15 日，工作滿第 7 年：15 日，工作滿第 8 年：15 日，工作滿第 9 年：15 日，工作滿第 10 年：16 日，工作滿第 11 年：17 日，工作滿第 12 年：18 日，工作滿第 13 年：19 日，工作滿第 14 年：20 日，工作滿第 15 年：21 日，工作滿第 16 年：22 日，工作滿第 17 年：23 日，工作滿第 18 年：24 日，工作滿第 19 年：25 日，工作滿第 20 年：26 日，工作滿第 21 年：27 日，工作滿第 22 年：28 日，工作滿第 23 年：29 日，工作滿第 24 年：30 日，工作滿第 25 年以上：30 日。
    - 依據：勞動基準法第 38 條

4. 婚假
    - 給假原則：8 日
----------------------------------------------------------------------------------------------------
Document 2:

。雇主僱用勞工人數在三十人以上者，應報當地主管機關備查。 
第 37 條 
1  內政部所定應放假之紀念日、節日、勞動節及其他中央主管機關指定應放假日，均應休
假。
2  中華民國一百零五年十二月六日修正之前項規定，自一百零六年一月一日施行。 
第 38 條 
1  勞工在同一雇主或事業單位，繼續工作滿一定期間者，應依下列規定給予特別休假：
一、六個月以上一年未滿者，三日。
二、一年以上二年未滿者，七日。
三、二年以上三年未滿者，十日。
四、三年以上五年未滿者，每年十四日。
五、五年以上十年未滿者，每年十五日。
六、十年以上者，每一年加給一日，加至三十日為止。
2  前項之特別休假期日，由勞工排定之。但雇主基於企業經營上之急迫需求或勞工因個人
因素，得與他方協商調整。
3  雇主應於勞工符合第一項所定之特別休假條件時，告知勞工依前二項規定排定特別休假
。


### Hybrid Search

In [22]:
%pip install --quiet rank_bm25

I0000 00:00:1722068233.956820  197986 work_stealing_thread_pool.cc:320] WorkStealingThreadPoolImpl::PrepareFork
I0000 00:00:1722068233.957051  197986 fork_posix.cc:77] Other threads are currently calling into gRPC, skipping fork() handlers
huggingface/tokenizers: The current process just got forked, after parallelism has already been used. Disabling parallelism to avoid deadlocks...
	- Avoid using `tokenizers` before the fork if possible
	- Explicitly set the environment variable TOKENIZERS_PARALLELISM=(true | false)


Note: you may need to restart the kernel to use updated packages.


In [49]:
from langchain.retrievers import BM25Retriever, EnsembleRetriever

def hybrid_retriever(chunks):
    text_splits = chunks
    retriever = db.as_retriever(search_type="mmr", search_kwargs={"k": 5})
    keyword_retriever = BM25Retriever.from_documents(text_splits)
    keyword_retriever.k =  5
    ensemble_retriever = EnsembleRetriever(
        retrievers=[retriever,
                    keyword_retriever],
                    weights=[0.5, 0.5])
    return ensemble_retriever

def hybrid_rerank_retriever(chunks):
    text_splits = chunks
    retriever = hybrid_retriever(text_splits)
    compressor = CrossEncoderReranker(model=rerank_model, top_n=3)
    compression_retriever = ContextualCompressionRetriever(
        base_compressor=compressor, base_retriever=retriever
    )
    return compression_retriever

def hybrid_rerank_cohere_retriever(chunks):
    text_splits = chunks
    retriever = hybrid_retriever(text_splits)
    compressor = CohereRerank()
    compression_retriever = ContextualCompressionRetriever(
        base_compressor=compressor, base_retriever=retriever
    )
    return compression_retriever


In [50]:
query = questions_list[6]
print(f"Question: {query}")
pretty_print_docs(hybrid_rerank_cohere_retriever(chunks).get_relevant_documents(query))

Question: 流產是否可以申請生育給付？
Document 1:

。 
第 53 條 
1  請領各項保險給付之診斷書及出生證明書，除第六十八條、第六十九條另有規定外，應
由醫院、診所或領有執業執照之醫師出具者，方為有效。
2  出生證明書由領有執業執照之助產人員出具者，效力亦同。 
第 54 條 
1  依本條例規定請領各項保險給付，所檢附之文件為我國政府機關（構）以外製作者，應
經下列單位驗證：
一、於國外製作者，應經我國駐外使領館、代表處或辦事處驗證；其在國內由外國駐臺
使領館或授權機構製作者，應經外交部複驗。
二、於大陸地區製作者，應經行政院設立或指定機構或委託之民間團體驗證。
三、於香港或澳門製作者，應經行政院於香港或澳門設立或指定機構或委託之民間團體
驗證。
2  前項文件為外文者，應檢附經前項各款所列單位驗證或國內公證人認證之中文譯本。但
為英文者，除保險人認有需要外，得予免附。 
第 55 條 
保險給付金額以新臺幣元為單位，角以下四捨五入。 
      第 二 節 生育給付 
第 56 條 
1  依本條例第三十一條規定請領生育給付者，應備下列書件：
一、生育給付申請書及給付收據
----------------------------------------------------------------------------------------------------
Document 2:

。 
第 20 條 
1  被保險人在保險有效期間發生傷病事故，於保險效力停止後一年內，得請領同一傷病及
其引起之疾病之傷病給付、失能給付、死亡給付或職業災害醫療給付。
2  被保險人在保險有效期間懷孕，且符合本條例第三十一條第一項第一款或第二款規定之
參加保險日數，於保險效力停止後一年內，因同一懷孕事故而分娩或早產者，得請領生
育給付。 
第 20-1 條 
1  被保險人退保後，經診斷確定於保險有效期間罹患職業病者，得請領職業災害保險失能
給付。
2  前項得請領失能給付之對象、職業病種類、認定程序及給付金額計算等事項之辦法，由
中央主管機關定之。 
第 21 條 
（刪除） 
第 21-1 條 
（刪除） 
第 22 條 
同一種保險給付，不得因同一事故而重複請領。 
第 23 條 
被保險人或其受益人或其他利害關係人，為領取保險給

## 生成（Generation）

In [51]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

def multiquery_chain():
    #retriever = db.as_retriever(search_type="mmr")
    #retriever = db.as_retriever(search_type="similarity", search_kwargs={"k": 3})
    #retriever_from_llm = MultiQueryRetriever.from_llm(
    #    retriever=retriever,
    #    llm=llm_model
    #)
    #return retriever_from_llm

    retriever = multiquery_retriever()
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain

def rerank_chain():
    retriever = rerank_retriever()
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain

def multiq_rerank_chain():
    retriever = multiq_rerank_retriever()
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain

def multiq_rerank_cohere_chain():
    retriever = multiq_rerank_cohere_retriever()
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain

def hybrid_rerank_chain(chunks=chunks):
    text_splits = chunks
    retriever = hybrid_rerank_retriever(text_splits)
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain

def hybrid_rerank_cohere_chain(chunks=chunks):
    text_splits = chunks
    retriever = hybrid_rerank_cohere_retriever(text_splits)
    custom_prompt = PromptTemplate.from_template(rag_template_3)
    rag_chain = (
        {"context": retriever | format_docs, "question": RunnablePassthrough()}
        | custom_prompt
        | llm_model
        | StrOutputParser()
    )
    return rag_chain


In [52]:
test_chain(hybrid_rerank_chain)

----------------------------------------
Question: 流產是否可以申請生育給付？

Answer: 根據勞工保險條例第20條第2項，被保險人在保險有效期間懷孕，且符合參加保險日數規定，於保險效力停止後一年內，因同一懷孕事故而分娩或早產者，得
請領生育給付。  因此，流產是否可以申請生育給付，需視流產是否屬於同一懷孕事故而分娩或早產。
**實務上，流產通常不屬於同一懷孕事故而分娩或早產，因此無法申請生育給付。**  **建議：**  *
您可以諮詢勞工保險局或相關單位，以確認您的具體情況是否符合申請生育給付的條件。 *
您可以參考勞工保險條例施行細則第56條，了解申請生育給付所需的相關文件。

Total Tokens: 1560

----------------------------------------
Question: 在公司已經任職15年，依規定一年應該會有幾天的特休假？

Answer: 根據勞動基準法第38條第1項規定，勞工在同一雇主或事業單位，繼續工作滿五年以上十年未滿者，每年應給予十五天特別休假。
因此，您在公司已經任職15年，依規定一年應該會有 **15天** 的特休假。

Total Tokens: 1147

----------------------------------------
Question: 育嬰留停有哪些規定事項要注意？

Answer: 根據您提供的法規條文，育嬰留停有以下規定事項要注意：  **1. 申請資格：**  *
依家事事件法、兒童及少年福利與權益保障法相關規定與收養兒童先行共同生活之受僱者，其共同生活期間得依第一項規定申請育嬰留職停薪。  **2.
申請期間：**  * 法規條文中未明確規定育嬰留停的申請期間，但根據實務上常見的規定，通常是孩子未滿 2 歲。  **3.
留職停薪津貼：**  * 育嬰留職停薪津貼的發放，另以法律定之。  **4. 復職權利：**  *
育嬰留職停薪期滿後，申請復職時，雇主不得拒絕，除非有以下情形：     * 歇業、虧損或業務緊縮者。     *
雇主依法變更組織、解散或轉讓者。     * 不可抗力暫停工作在一個月以上者。     *
業務性質變更，有減少受僱者之必要，又無適當工作可供安置者。 *
雇主因上述原因未能使受僱

## 心得分享

### - 優化生成：不同 LLM Model 間的差異
LLM Model 的選用決定了 RAG 最終輸出的品質結果，包括文字輸出排版的美醜、上下文內容的語意理解程度與生成文字的速度延遲。

+ Google-1.5-flash: 有最佳的語意理解與輸出結果，且個人開發時，可以免費使用 API。
+ Groq llama 3/3.1: 語意理解可以接受；文字輸出排版稍顯單調。

### - 優化檢索：
#### -- 進階檢索
運用不同的檢索技巧，對於檢索結果的精確度有很大的差異。

1. 基本向量檢索：向量庫內建的基本檢索功能。不管是相似度或 MMR 哪種演算類型，檢索結果都非常不穩定，也不準確。調整文字分塊的大小，對於最終的檢索結果沒有顯著的改善。
2. Multi-Query 檢索：優化使用者的問題。以 LLM 生成多個（3-5）類似的不同提問建議，然後分別再以建議的多道問題對向量庫進行相似度檢索。此法對於那些含糊不清的提問，可以改善檢索的結果。
3. Parent-Documnet 檢索：父文件檢索。將一份文件切成不同小塊的文字，嵌入向量庫以外，在將每個小文字區塊與原始文件的關聯性，儲存至另一個父文件檔案。檢索問題時，先對向量庫裡的小區塊進行相似度檢索，然後找出原始父文件的內容，作為上下文的生成依據。相似度檢索要提高檢索精確度，嵌入時文字分塊要小；不過，缺點是過小的文字塊，無法產生對於問題完整理解的上下文。此法主要就是改善過小文字塊的缺點。
4. Rerank 檢索：重排序演算檢索。使用 Rerank 模型對向量庫相似度檢索的結果，進行語意排序並篩選出最佳的結果。不同的 Rerank 模型搭配不同的嵌入模型，都會有不的檢索結果。兩者關係沒有一定的規則或限制，精確度以實際套用的結果為主。

#### -- 比較不同的檢索
+ LLM Token 使用（多至少）：Multi-Query > Parent-Documnet > 基本向量檢索 > Rerank
+ LLM 生成延遲（慢至快）：Multi-Query > Rerank > Parent-Document > 基本向量檢索

#### -- Embedding 與 Reranking 模型
+ 這兩個模型要使用適合的支援語言，如果知識庫是中文，模型也要使用有支援中文語系的，不然檢索結果會差強人意。
+ 基本上這是兩個不同的模型，選用時要多試試，有時後排行榜的結果不一定符合你的專案特性。
