In [4]:
import json
from langchain_community.vectorstores import FAISS
from langchain_huggingface import HuggingFaceEmbeddings
from langchain.docstore.document import Document

# 🔹 1. JSON 파일 불러오기 (파일명은 'qa_data.json'로 가정)
with open("qa_with_source.json", "r", encoding="utf-8") as f:
    qa_list = json.load(f)

# 🔹 2. Document 객체로 변환
docs = []
for item in qa_list:
    question = item.get("question", "")
    answer = item.get("answer", "")
    combined_text = f"질문: {question}\n답변: {answer}"
    docs.append(Document(page_content=combined_text, metadata={"number": item.get("number", -1)}))

# 🔹 3. 임베딩 모델 로딩
embedding_model = HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-base")

# 🔹 4. FAISS 인덱스 생성
db = FAISS.from_documents(docs, embedding_model)

# 🔹 5. 인덱스 저장
db.save_local("faiss_index")

In [5]:
db = FAISS.load_local(
    "faiss_index", 
    HuggingFaceEmbeddings(model_name="intfloat/multilingual-e5-base"),
    allow_dangerous_deserialization=True
)
# pickle 저장
import pickle
with open("faiss_index/memory_cache.pkl", "wb") as f:
    pickle.dump(db, f)

짐은 학문에 대한 탐구와 백성을 위한 정치에 큰 관심을 두어왔도다. 특히, 천문학과 음악에 대한 취미가 있었으며, 이러한 관심을 바탕으로 혼천의와 같은 과학기구를 제작하였느니라. 그에 대해 더 물을 것이 있는가?
