這是一個將資料轉換成文字的專案,可以協助你在進行 RAG 的過程中,將資料類型的檔案轉換成文字,提升轉換為向量後查詢的結果。
目前支援的檔案有:
- CSV
- JSON
在使用這個專案前,請將您的 OpenAI API Key 設定給 OPENAI_API_KEY 這個環境變數,或是參考下方的範例將 key 帶入到物件中。
from datatoword import DataToWord
data_to_word = DataToWord(
openai_api_key="sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
)- 建立 LangChain Document
from datatoword import DataToWord
with open('data.csv', 'rb') as file:
file_binary_content = file.read()
data_to_word = DataToWord()
data_to_word.create_documents(
file_name='data.csv',
file_description='這是一個測試的檔案',
file_binary_content=file_binary_content
)- 取得轉換後的內文
from datatoword import DataToWord
with open('data.csv', 'rb') as file:
file_binary_content = file.read()
data_to_word = DataToWord()
data_to_word.create_content(
file_name='data.csv',
file_description='這是一個測試的檔案',
file_binary_content=file_binary_content
)