這是一份結合 OpenAI Embedding API 與 ChatGPT API 的論文問答機器人,為示範用的專案。
- Ubuntu 22.04
- Pyhton 3.10
tiktoken==0.5.1
openai==0.28.0
faiss-cpu==1.7.4
- 將 OpenAI API Key 存在專案根目錄的
API.Key
裡面。- 注意:本專案會由 OpenAI 收取額外費用。
demo.count-token.py
計算 GPT-4 論文總共包含多少 Tokens 在裡面。demo.special-token.py
示範 Tiktoken 應對 Special Token 時的不同行為。step01.index.py
對論文進行索引。step02.query.py
對論文進行詢問。RESP.md
紀錄範例問答的結果。
- 將想要處理的論文放在
data
資料夾裡面。 - (Optional) 執行索引程式
step01.index.py
後,會在data
資料夾底下產生embs.npy
與chunks.json
兩個檔案。- 我已經有預先產生好並放上來。
- 修改
step02.query.py
裡面的問題並執行,等待模型生成輸出。
本論文所使用之 GPT-4 和 LongLoRA 的 Latex Source Code 皆來自 ArXiv 網站提供,版權歸屬於原作者。本專案所提供之內容僅供教學範例用途,程式碼本身為 MIT License 授權。