In [3]:
from langchain_community.vectorstores import FAISS
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

# 임베딩 모델은 지금 쓰는 거 아무거나 넣어도 괜찮음 (차원 확인만 할 거니까)
embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-mpnet-base-v2")

# 벡터 DB 로드
vector_store = FAISS.load_local(
    folder_path=".",  # ← .faiss / .pkl 파일이 있는 폴더
    embeddings=embeddings,
    allow_dangerous_deserialization=True
)

# 차원 출력
print("FAISS index dimension:", vector_store.index.d)


FAISS index dimension: 1024


총 문서 수: 708


In [12]:
import faiss

index = faiss.read_index("index.faiss")
print(f"벡터 개수: {index.ntotal}")
print(f"차원 수: {index.d}")


벡터 개수: 708
차원 수: 1024


In [1]:
from langchain.vectorstores import FAISS
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

embedding = HuggingFaceEmbeddings(model_name="nlpai-lab/KURE-v1")  # 저장 시 사용한 것과 동일한 임베딩 모델

db = FAISS.load_local(
    folder_path=".",  # index.faiss, index.pkl이 있는 폴더
    embeddings=embedding,
    allow_dangerous_deserialization=True
)

results = db.similarity_search("넌 어떤 박물관의 챗봇이야?", k=3)
for r in results:
    print(r.page_content)


  from .autonotebook import tqdm as notebook_tqdm


ValueError: Could not find document for id 219, got ID 219 not found.

In [16]:
from langchain.vectorstores import FAISS
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

embedding = HuggingFaceEmbeddings(model_name="nlpai-lab/KURE-v1")
db = FAISS.load_local(".", embedding, allow_dangerous_deserialization=True)

print("저장된 문서 수:", len(db.docstore._dict))
print("벡터 수:", db.index.ntotal)


저장된 문서 수: 708
벡터 수: 708


In [17]:
# 예시: 저장할 때
from langchain.vectorstores import FAISS
from langchain.schema import Document

docs = [Document(page_content="넌 어떤 박물관의 챗봇이야?", metadata={...})]
embedding = HuggingFaceEmbeddings(model_name="nlpai-lab/KURE-v1")
db = FAISS.from_documents(docs, embedding)
db.save_local("faiss_db")  # index.faiss + index.pkl


ValidationError: 1 validation error for Document
metadata
  Input should be a valid dictionary [type=dict_type, input_value={Ellipsis}, input_type=set]
    For further information visit https://errors.pydantic.dev/2.11/v/dict_type

In [19]:
from langchain.vectorstores import FAISS
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

embedding = HuggingFaceEmbeddings(model_name="nlpai-lab/KURE-v1")
db = FAISS.load_local(".", embedding, allow_dangerous_deserialization=True)

print("문서 수:", len(db.docstore._dict))  # metadata 포함 문서 수
print("벡터 수:", db.index.ntotal)        # 벡터 인덱스 수


문서 수: 708
벡터 수: 708


In [20]:
print("docstore keys (샘플):", list(db.docstore._dict.keys())[:5])
print("id_map 샘플:", list(db.index_to_docstore_id.items())[:5])


docstore keys (샘플): [0, 1, 2, 3, 4]
id_map 샘플: [(0, '0'), (1, '1'), (2, '2'), (3, '3'), (4, '4')]


In [21]:
# docstore 내부 dict 키를 모두 str로 변환
db.docstore._dict = {str(k): v for k, v in db.docstore._dict.items()}
db.save_local("faiss_db_fixed")  # 새 디렉토리에 저장

In [23]:
from langchain.vectorstores import FAISS
from langchain_huggingface.embeddings import HuggingFaceEmbeddings

embedding = HuggingFaceEmbeddings(model_name="nlpai-lab/KURE-v1")
db = FAISS.load_local(
    folder_path="faiss_db_fixed",
    embeddings=embedding,
    allow_dangerous_deserialization=True
)

results = db.similarity_search("넌 어떤 박물관의 챗봇이야?", k=3)
for r in results:
    print(r.page_content)


3. 미래 도서관 비전 및 가상도서관 구축·운영 방안 
차승현/한국과학기술원 문화기술대학원 교수
111
인공지능과 사서 
챗GPT에게 물어본 인공지능 시대의 도서관과 사서
이권우/도서 평론가
131
대담
뉴노멀 시대의 도서관, 그리고 사서
사회자: 박옥남/상명대학교 문헌정보학과 교수 
대담자: 오영진/서울과학기술대학교 융합교양학부 초빙조교수
정재영/서강대학교 로욜라도서관 정보봉사팀장
주영하/서울특별시교육청양천도서관 독서문화진흥과 팀장
147
추천 자료 
171
 
에필로그 
1. 챗GPT가 말한 도서관의 미래 
2. 인공지능이 그린 미래의 도서관
176
※본지에 실린 글의 내용은 집필진의 개인적인 견해로, 국립중앙도서관의 의견이 아님을 밝힙니다.


96
다
시
 
연
결
 
사
람
과
 
기
술
이
 
공
존
하
는
 
도
서
관
,
2층은 ‘미래의 가치를 연결하다’라는 주제 아래 인공지능과 빅데이터를 기반으로 무한한 
상상과 창조가 이루어지는 최첨단 미래 독서 공간의 콘셉트로 구성된 공간이다. 실감형 체
험관과 디지털 맞춤형 북큐레이션, VR 가상 독서 체험 등을 할 수 있다. 
2층에서도 역시 여러 로봇이 눈에 띈다. ‘나르미’라는 이름의 로봇은 서랍형과 선반형 
두 종류로 운영되는 도서 운반 로봇이다. 선반형은 업무용으로 활용되고 있으며, 서랍형은 
고령자나 장애인 등 거동이 불편한 이용자에게 도서를 운반해주기 위해 쓰이고 있다. 서랍
형 로봇은 엘리베이터에 탑승하여 층별 책 운반도 할 수 있다. 
장서 점검 로봇 ‘서치봇’은 낮 동안 서가에 잘못 꽂힌 도서를 밤새 점검해주는 역할을 한
다. 점검 후 데이터를 전송하면 사서들이 잘못 꽂힌 책을 바로잡는다. 일반적으로 사서들이 
장서 점검을 할 때 일주일 정도의 시간이 걸린다면, 서치봇은 1~2일 만에 소화해낸다.
그리고 기술과 예술을 결합한 디지털 갤러리 ‘명화의 세계’도 2층에서 만날 수 있다. 
2,000여 점의 명화를 소장하고 있으며, 다섯 개의 화면 속에 다양한 명화가 소개되는데 계
속 작품들이 