# FAISS

### 유사도 기반 검색 (Similarity search)

In [2]:
# Huggingface의 임베딩 모델 사용
from langchain_community.vectorstores import FAISS
from langchain_community.vectorstores.utils import DistanceStrategy
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.document_loaders import PyMuPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

loader = PyMuPDFLoader(r'E:\Portfolio\Study\hello-langchain\rag_data\300720_한일시멘트_2023.pdf')
data = loader.load()
text_splitter = RecursiveCharacterTextSplitter.from_tiktoken_encoder(
    chunk_size=1000,
    chunk_overlap=200,
    encoding_name='cl100k_base'
)

documents = text_splitter.split_documents(data)

embeddings_model = HuggingFaceEmbeddings(
    model_name='jhgan/ko-sbert-nli',
    model_kwargs={'device':'cpu'},
    encode_kwargs={'normalize_embeddings':True},
)


vectorstore = FAISS.from_documents(documents,
                                   embedding = embeddings_model,
                                   distance_strategy = DistanceStrategy.COSINE
                                  )
vectorstore

<langchain_community.vectorstores.faiss.FAISS at 0x2a5e0e753f0>

In [3]:
query = "한일시멘트의 주요 approach를 알려줘"
docs = vectorstore.similarity_search(query)
print(len(docs))
print(docs[0].page_content)

4
된 핵심이슈는 기후변화 대응 전략, 오염물질 관리, 안전하고 건강한 작업환경 구축, 친환경 사업 개
발, 소비자 만족 및 제품 품질이며, 본 보고서를 통해 이를 중심으로 하는 주요 활동 성과와 향후 계
획을 투명하게 보고하고자 합니다.
STEP 3
영향의 중대성 평가
STEP 4
우선순위 유효성 검토 및  
핵심 이슈 도출
한일의 경영활동 및 비즈니스 관계를 정리하고 지속가능경영에 영향을 미치는 이슈의 원인관계를 
파악합니다. 또한 이해관계자 집단의 정의와 식별 기준 마련 등으로 한일을 둘러싼 ESG경영 환경을 
이해하고 구체적인 정의를 마련합니다.  
한일은 이해관계자와 한일에게 영향을 미치는 ESG이슈와 영향정도를 파악하여 효율적인 ESG경영
을 추진하고자  중대성평가를 진행하고 있습니다. 중대성평가 프로세스는 2021 GRI Standards와 
ISO26000에서 제시하는 방법을 토대로 구축되어 있으며, 매년 중대성평가를 실시하여 중대 이슈를 선
정하고 이를 지속가능경영 전략에 반영하고 있습니다. 또한 중대이슈를 중심으로 보고의 충실성을 높이
고 이해관계자와 소통을 강화하고 있습니다. 
중대성 평가 
ESG 트렌드 분석
국제표준(GRI, SASB, 
UN SDGs) 및 외부 평가 
기준(MSCI, KCGS)  
분석을 통해 한일에 
요구되는 ESG이슈 파악
동종업계 벤치마킹
시멘트 분야 국내외 
경쟁사를 대상으로 
지속가능경영 주요  
이슈 및 활동 사례 조사
미디어 분석
2022년 1월 1일부터 
2023년 4월 30일까지 
언론에 노출된 내용과 
내부 홍보자료 분석을 
통해 주요 이슈와  
대외적 인식 분석
내부자료 검토
유관부서 담당자  
인터뷰 및 서면 조사 진행, 
ESG실무협의회  
안건으로 논의
주요 이슈 POOL
기후변화 대응 전략
친환경 사업 개발
오염물질 관리
수자원 관리
자원순환형 사업장 구축
생물다양성 보전
에너지 관리 및 감축
Environment
(7)
Social 
인권 경영 및 다양성 존중
인재 채용 및 육성


In [4]:
mmr_docs = vectorstore.max_marginal_relevance_search(query, k=4, fetch_k=10)
print(len(mmr_docs))
print(mmr_docs[0].page_content)

4
된 핵심이슈는 기후변화 대응 전략, 오염물질 관리, 안전하고 건강한 작업환경 구축, 친환경 사업 개
발, 소비자 만족 및 제품 품질이며, 본 보고서를 통해 이를 중심으로 하는 주요 활동 성과와 향후 계
획을 투명하게 보고하고자 합니다.
STEP 3
영향의 중대성 평가
STEP 4
우선순위 유효성 검토 및  
핵심 이슈 도출
한일의 경영활동 및 비즈니스 관계를 정리하고 지속가능경영에 영향을 미치는 이슈의 원인관계를 
파악합니다. 또한 이해관계자 집단의 정의와 식별 기준 마련 등으로 한일을 둘러싼 ESG경영 환경을 
이해하고 구체적인 정의를 마련합니다.  
한일은 이해관계자와 한일에게 영향을 미치는 ESG이슈와 영향정도를 파악하여 효율적인 ESG경영
을 추진하고자  중대성평가를 진행하고 있습니다. 중대성평가 프로세스는 2021 GRI Standards와 
ISO26000에서 제시하는 방법을 토대로 구축되어 있으며, 매년 중대성평가를 실시하여 중대 이슈를 선
정하고 이를 지속가능경영 전략에 반영하고 있습니다. 또한 중대이슈를 중심으로 보고의 충실성을 높이
고 이해관계자와 소통을 강화하고 있습니다. 
중대성 평가 
ESG 트렌드 분석
국제표준(GRI, SASB, 
UN SDGs) 및 외부 평가 
기준(MSCI, KCGS)  
분석을 통해 한일에 
요구되는 ESG이슈 파악
동종업계 벤치마킹
시멘트 분야 국내외 
경쟁사를 대상으로 
지속가능경영 주요  
이슈 및 활동 사례 조사
미디어 분석
2022년 1월 1일부터 
2023년 4월 30일까지 
언론에 노출된 내용과 
내부 홍보자료 분석을 
통해 주요 이슈와  
대외적 인식 분석
내부자료 검토
유관부서 담당자  
인터뷰 및 서면 조사 진행, 
ESG실무협의회  
안건으로 논의
주요 이슈 POOL
기후변화 대응 전략
친환경 사업 개발
오염물질 관리
수자원 관리
자원순환형 사업장 구축
생물다양성 보전
에너지 관리 및 감축
Environment
(7)
Social 
인권 경영 및 다양성 존중
인재 채용 및 육성


**FAISS 저장 및 불러오기**

In [6]:
vectorstore.save_local('./db/faiss')

In [8]:
db3 = FAISS.load_local('./db/faiss', embeddings_model, allow_dangerous_deserialization=True)