# 安裝需要的套件
* langchain：基本的langchain套件
* openai：基本的openai套件
* unstructured：讀取文字檔格式的套件
* chromadb：向量儲存資料庫
* tiktoken套件：OpenAI算token數的套件

In [1]:
!pip install langchain
!pip install langchain-community
# !pip install openai
!pip install langchain-openai
!pip install unstructured
!pip install chromadb
!pip install tiktoken
!pip install tabulate



## 將環境變數讀入

In [2]:
# 導入 ColabSecrets 用戶資料模組
from google.colab import userdata

# 設置 OpenAI API key
import os
os.environ["OPENAI_API_KEY"] = userdata.get('OPENAI_API_KEY')

### 先套用OpenAI的API
使用`langchain`中的`OpenAI`套件載入大型語言模型，載入OpenAi模型，並且設定最大輸出長度為1024。此部分會收費

In [3]:
from langchain.chat_models import ChatOpenAI
llm = ChatOpenAI(
    model_name="gpt-4o",
    temperature=0.3,
    max_tokens=512,
    )

  llm = ChatOpenAI(


### 測試沒有RAG時候的問答

In [4]:
llm.invoke("工專時期第3任校長是誰?")

AIMessage(content='工專時期第3任校長是李煥。', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 14, 'prompt_tokens': 19, 'total_tokens': 33, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o', 'system_fingerprint': 'fp_7f6be3efb0', 'finish_reason': 'stop', 'logprobs': None}, id='run-180aaec2-4f12-4c7d-81ee-97b998501e72-0')

In [5]:
llm.invoke("明新科技大學的校訓是什麼?")

AIMessage(content='明新科技大學的校訓是「誠、樸、精、毅」。', additional_kwargs={}, response_metadata={'token_usage': {'completion_tokens': 21, 'prompt_tokens': 20, 'total_tokens': 41, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4o', 'system_fingerprint': 'fp_159d8341cc', 'finish_reason': 'stop', 'logprobs': None}, id='run-10de5861-0abf-4333-a62d-78258e0befd5-0')

### 建立本機知識庫QA機器人
[Document loaders](https://python.langchain.com/docs/modules/data_connection/document_loaders/)

In [6]:
!wget https://github.com/shhuangmust/AI/raw/refs/heads/113-1/2028president.txt
!wget https://github.com/shhuangmust/AI/raw/refs/heads/113-1/must.txt

--2024-11-16 11:42:10--  https://github.com/shhuangmust/AI/raw/refs/heads/113-1/2028president.txt
Resolving github.com (github.com)... 140.82.114.3
Connecting to github.com (github.com)|140.82.114.3|:443... connected.
HTTP request sent, awaiting response... 302 Found
Location: https://raw.githubusercontent.com/shhuangmust/AI/refs/heads/113-1/2028president.txt [following]
--2024-11-16 11:42:10--  https://raw.githubusercontent.com/shhuangmust/AI/refs/heads/113-1/2028president.txt
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 310 [text/plain]
Saving to: ‘2028president.txt’


2024-11-16 11:42:10 (4.62 MB/s) - ‘2028president.txt’ saved [310/310]

--2024-11-16 11:42:10--  https://github.com/shhuangmust/AI/raw/refs/heads/113-1/must.txt
Resolving github.com (githu

In [7]:
from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
from langchain import OpenAI,VectorDBQA
from langchain.document_loaders import DirectoryLoader

# 載入資料夾中所有TXT檔案
loader = DirectoryLoader('/content/', glob='**/*.txt')

# 將資料轉成document物佚，每個檔案會為作為一個document
documents = loader.load()

# 初始化載入器
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)

# 切割加载的 document
split_docs = text_splitter.split_documents(documents)

# 初始化 openai 的 embeddings 物件
embeddings = OpenAIEmbeddings()

# 將 document 透過 openai 的 embeddings 物件計算 embedding向量資料暫時存入 Chroma 向量資料庫用於後續的搜尋
docsearch = Chroma.from_documents(split_docs, embeddings)

# 建立回答物件
qa = VectorDBQA.from_chain_type(llm=llm, chain_type="stuff", vectorstore=docsearch, return_source_documents=True)

# 進行回答
result = qa({"query": "工專時期第3任校長是誰?"})
print(result['result'])

  result = qa({"query": "工專時期第3任校長是誰?"})


工專時期第3任校長是林世明。


In [8]:
result = qa({"query": "現行明新科技大學之校訓?"})
print(result['result'])

現行明新科技大學之校訓是「堅毅、求新、創造」。


文件分割器的chunk_overlap參數，切分後每個文件裡包含幾個上一個文件結尾的內容，主要作用是為了增加每個文件的上下文關聯。比如chunk_overlap=0時，第一個文件為aaaaaa，第二個為bbbbbb；當chunk_overlap=2時，第一個文件為aaaaaa，第二個為aabbbbbb。

## 替模型加入記憶功能
「對話記憶體」（ConversationBufferMemory）用於儲存簡單的對話歷史 \
[ConversationBufferMemory](https://python.langchain.com/docs/modules/memory/types/buffer/) \
[memory_management](https://python.langchain.com/docs/use_cases/chatbots/memory_management/)


In [9]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import (
    ChatPromptTemplate,
    MessagesPlaceholder,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.chains import LLMChain
from langchain.memory import ConversationBufferMemory

# 建立記憶體實例，開啟 return_messages 是為了將記憶體指定給 chat模型
# 而 memory_key則是可以讓我們客制我們取得對話記錄時用的 key 值
memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)

# 建立 chat 語言模型
# llm_chat = ChatOpenAI()

# 提示設計
prompt_chat = ChatPromptTemplate(
    messages=[
        SystemMessagePromptTemplate.from_template(
            "你是一個友善的學習助理，你接下來會跟使用者來對話。"
        ),
        # 這裏是一個讓記憶體資料填空的地方。
        # 我們也要設定，使用chat_history 來取得對話記錄
        MessagesPlaceholder(variable_name="chat_history"),
        HumanMessagePromptTemplate.from_template("{question}")
    ]
)

conversation_chat = LLMChain(
    llm=llm,
    prompt=prompt_chat,
    verbose=True,
    memory=memory
)

  memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
  conversation_chat = LLMChain(


In [10]:
conversation_chat({
    'question': '你好'
})



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: 你是一個友善的學習助理，你接下來會跟使用者來對話。
Human: 你好[0m

[1m> Finished chain.[0m


{'question': '你好',
 'chat_history': [HumanMessage(content='你好', additional_kwargs={}, response_metadata={}),
  AIMessage(content='你好！有什麼我可以幫助你的嗎？', additional_kwargs={}, response_metadata={})],
 'text': '你好！有什麼我可以幫助你的嗎？'}

In [11]:
conversation_chat({
    'question': '你可以告訴我英國和美國的首都在哪裡嗎?'
})



[1m> Entering new LLMChain chain...[0m
Prompt after formatting:
[32;1m[1;3mSystem: 你是一個友善的學習助理，你接下來會跟使用者來對話。
Human: 你好
AI: 你好！有什麼我可以幫助你的嗎？
Human: 你可以告訴我英國和美國的首都在哪裡嗎?[0m

[1m> Finished chain.[0m


{'question': '你可以告訴我英國和美國的首都在哪裡嗎?',
 'chat_history': [HumanMessage(content='你好', additional_kwargs={}, response_metadata={}),
  AIMessage(content='你好！有什麼我可以幫助你的嗎？', additional_kwargs={}, response_metadata={}),
  HumanMessage(content='你可以告訴我英國和美國的首都在哪裡嗎?', additional_kwargs={}, response_metadata={}),
  AIMessage(content='當然可以！英國的首都是倫敦，而美國的首都則是華盛頓哥倫比亞特區（Washington, D.C.）。有其他問題嗎？', additional_kwargs={}, response_metadata={})],
 'text': '當然可以！英國的首都是倫敦，而美國的首都則是華盛頓哥倫比亞特區（Washington, D.C.）。有其他問題嗎？'}

In [12]:
#查詢記憶內容
print("chat_history:", memory.load_memory_variables({}))

chat_history: {'chat_history': [HumanMessage(content='你好', additional_kwargs={}, response_metadata={}), AIMessage(content='你好！有什麼我可以幫助你的嗎？', additional_kwargs={}, response_metadata={}), HumanMessage(content='你可以告訴我英國和美國的首都在哪裡嗎?', additional_kwargs={}, response_metadata={}), AIMessage(content='當然可以！英國的首都是倫敦，而美國的首都則是華盛頓哥倫比亞特區（Washington, D.C.）。有其他問題嗎？', additional_kwargs={}, response_metadata={})]}


## 進階記憶功能

##### ConversationBufferWindowMemory 類別
直譯為「局部窗口對話記憶體」。它的主要功能是限制在一個局部窗口內保存的對話資訊。由於 token 的運算資源有限且需消耗費用，甚至如果語言模型是我們自己架設的，同樣需要大量的運算資源，因此我們不能讓歷史對話資料無窮無盡地累積。

使用ConversationBufferWindowMemory 類別，可以只保存最近的 k 條訊息。

In [13]:
from langchain.memory import ConversationBufferWindowMemory

# 建立 ConversationBufferWindowMemory 實例, k=1 即限制一條訊息
memory_buffer_window = ConversationBufferWindowMemory(k=1)

# 更新上下文資訊
memory_buffer_window.save_context({"input": "你好！"}, {"output": "什麼事？"})
memory_buffer_window.save_context({"input": "今天天氣真好！"}, {"output": "我覺得太熱了！"})
memory_buffer_window.save_context({"input": "這是最新的訊息"}, {"output": "只會記錄這個訊息！"})
# 取得記憶體內儲存的資訊
memory_buffer_window.load_memory_variables({})

#--- 實際的輸出 ---

# {'history': 'Human: 這是最新的訊息\nAI: 只會記錄這個訊息！'}

  memory_buffer_window = ConversationBufferWindowMemory(k=1)


{'history': 'Human: 這是最新的訊息\nAI: 只會記錄這個訊息！'}

##### 使用 Vector Store 做為儲存後端的記憶單元
可以參考 VectorStoreRetrieverMemory 這樣的方法，設計我們的 LLMChain 來擷取背景資料。

值得特別提及的是，VectorStoreRetrieverMemory 不只能夠從向量資料庫中檢索相似度資料，它還會在對話過程中將我們的對話記錄保存到向量資料中。

In [14]:
# 下方是建立向量資料庫的部分
from langchain.embeddings import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.memory import VectorStoreRetrieverMemory

db_chroma = Chroma(embedding_function=OpenAIEmbeddings())

retriever = db_chroma.as_retriever(search_kwargs=dict(k=1))

memory_vs = VectorStoreRetrieverMemory(retriever=retriever, return_messages=True)

# 這裏是模擬我們已經有三個對話記錄
memory_vs.save_context({"Human": "我最喜歡的食物是披薩"}, {"AI": "這樣很棒！"})
memory_vs.save_context({"Human": "我最喜歡的運動是游泳"}, {"AI": "很高興你跟我說分享你的嗜好。"})
memory_vs.save_context({"Human": "我不喜歡上班"}, {"AI": "瞭解"})
memory_vs.save_context({"Human": "奇奇自助餐很貴"}, {"AI": "太糟糕了"})

# 使用 load_memory_varialbes 取得使用者問題相似度的歷史資料
print(memory_vs.load_memory_variables({"prompt": "我該看什麼運動節目？"}))
# print(memory_vs.load_memory_variables({"prompt": "昂貴的店家"}))

  db_chroma = Chroma(embedding_function=OpenAIEmbeddings())
  db_chroma = Chroma(embedding_function=OpenAIEmbeddings())
  memory_vs = VectorStoreRetrieverMemory(retriever=retriever, return_messages=True)


{'history': 'Human: 我最喜歡的運動是游泳\nAI: 很高興你跟我說分享你的嗜好。'}


## 整合

[Chain類別](https://python.langchain.com/docs/modules/chains/)

In [15]:
from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import CharacterTextSplitter
from langchain.document_loaders import DirectoryLoader
from langchain.prompts import PromptTemplate
from langchain.chains import ConversationChain
from langchain.memory import VectorStoreRetrieverMemory

# 載入資料夾中所有TXT檔案
loader = DirectoryLoader('/content/', glob='**/*.txt')

# 將資料轉成document物佚，每個檔案會為作為一個document
documents = loader.load()

# 初始化載入器
text_splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)

# 切割加载的 document
split_docs = text_splitter.split_documents(documents)

# 初始化 openai 的 embeddings 物件
embeddings = OpenAIEmbeddings()

# 將 document 透過 openai 的 embeddings 物件計算 embedding向量資料暫時存入 Chroma 向量資料庫用於後續的搜尋

docsearch = Chroma.from_documents(split_docs, embeddings)

# 建立檢索器
retriever = docsearch.as_retriever()

# 建立記憶體
memory_vs = VectorStoreRetrieverMemory(retriever=retriever, return_messages=True)

# 設置預設的prompt
DEFAULT_TEMPLATE = """
你是一個友善的對話機器人，下面歷史記錄是我們曾經的對話。
Human 是我，AI 是你。請根據歷史記錄中的資訊來回覆我的新問題。

歷史記錄:
{history}

Human：{input}
AI：
"""
PROMPT = PromptTemplate(
    input_variables=["history", "input"], template=DEFAULT_TEMPLATE
)
conversation_with_memory_vs = ConversationChain(
    llm=llm,
    prompt=PROMPT,
    memory=memory_vs,
    # verbose=True,
    output_key='AI'
)

  conversation_with_memory_vs = ConversationChain(


In [16]:
conversation_with_memory_vs.predict(input="2028總統候選人有誰?")

'2028台灣總統候選人有以下四位：\n\n1. 寶可夢黨｜小智｜現任寶可夢黨主席\n2. 獵人黨｜小傑｜現任獵人黨主席\n3. 烏龍派出所黨｜兩津勘吉｜現任烏龍派出所黨主席\n4. 海賊王黨｜蒙其D魯夫｜現任海賊王黨主席'

In [17]:
conversation_with_memory_vs.predict(input="我的名字叫做Kevin，很高興認識你")

'很高興認識你，Kevin！如果有任何問題或想聊的話題，隨時告訴我哦！'

In [18]:
conversation_with_memory_vs.predict(input="你還記得我叫什麼名字嗎?")

'當然記得，你的名字是Kevin！如果有其他問題或想聊的話題，隨時告訴我哦！'