In [1]:
import os

# 경로에서 자동차 모델명을 추출하는 함수
def extract_model_name_from_path(pdf_path):
    # 상위 폴더 이름이 모델명이므로 os.path.split 사용
    folder_path = os.path.dirname(pdf_path)
    model_name = os.path.basename(folder_path)  # 상위 폴더가 모델명
    return model_name


In [4]:
import os
from langchain.vectorstores import Chroma
from langchain.document_loaders import PyPDFLoader


In [6]:
from langchain.embeddings import HuggingFaceEmbeddings

model_name = "bespin-global/klue-sroberta-base-continue-learning-by-mnr" 
model_kwargs = {'device': 'cuda'}
encode_kwargs = {'normalize_embeddings': False}
hf = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)



In [9]:


# OpenAI API를 사용한 임베딩 생성기
# embeddings = OpenAIEmbeddings()

# 경로에서 자동차 모델명을 추출하는 함수
def extract_model_name_from_path(pdf_path):
    folder_path = os.path.dirname(pdf_path)
    model_name = os.path.basename(folder_path)  # 상위 폴더가 모델명
    return model_name

# 폴더 내의 모든 PDF 파일을 로드하여 문서화하는 함수
def load_documents_from_pdfs(pdf_files):
    documents = []
    for pdf_file in pdf_files:
        loader = PyPDFLoader(pdf_file)
        documents.extend(loader.load())  # 각 PDF 파일에서 문서를 추출하여 리스트에 추가
    return documents

# 각 모델에 대해 모든 PDF를 하나의 문서 집합으로 처리하는 함수
def process_pdfs_for_model(pdf_files_by_folder):
    for foldername, pdf_files in pdf_files_by_folder.items():
        # 각 모델에 대해 폴더 내의 모든 PDF 파일을 하나의 문서 집합으로 로딩
        documents = load_documents_from_pdfs(pdf_files)
        
        # 모델명 추출 (폴더명)
        model_name = os.path.basename(foldername)
        
        # Chroma DB 생성 및 저장
        vectorstore = Chroma.from_documents(documents, embedding=hf, persist_directory=f"./{model_name}_chroma")
        vectorstore.persist()
        print(f"Vector store saved for model: {model_name}")


In [10]:
def process_pdfs_in_folders(base_directory):
    # 폴더별로 PDF 파일 수집
    pdf_files_by_folder = {}
    
    for foldername, subfolders, filenames in os.walk(base_directory):
        pdf_files = []
        for filename in filenames:
            if filename.endswith('.pdf'):
                file_path = os.path.join(foldername, filename)
                pdf_files.append(file_path)
        
        # 해당 폴더에 PDF 파일이 있으면 모델별로 저장
        if pdf_files:
            pdf_files_by_folder[foldername] = pdf_files
    
    # 모델별로 PDF 파일을 처리하고 벡터 스토어에 저장
    process_pdfs_for_model(pdf_files_by_folder)


In [21]:
base_directory = "C:\SKN02-4th-4Team\자동차 pdf"
process_pdfs_in_folders(base_directory)

Ignoring wrong pointing object 664 0 (offset 3231188)
Ignoring wrong pointing object 665 0 (offset 3268701)
Ignoring wrong pointing object 666 0 (offset 3447411)
Ignoring wrong pointing object 667 0 (offset 3526272)
Ignoring wrong pointing object 668 0 (offset 3526323)
Ignoring wrong pointing object 669 0 (offset 3526795)
Ignoring wrong pointing object 670 0 (offset 3526834)
Ignoring wrong pointing object 671 0 (offset 3526873)
Ignoring wrong pointing object 672 0 (offset 3537929)
Ignoring wrong pointing object 673 0 (offset 3547379)
Ignoring wrong pointing object 674 0 (offset 3547426)
Ignoring wrong pointing object 675 0 (offset 3547483)
Ignoring wrong pointing object 676 0 (offset 3547975)
Ignoring wrong pointing object 677 0 (offset 3548033)
Ignoring wrong pointing object 678 0 (offset 3548093)
Ignoring wrong pointing object 679 0 (offset 3548530)
Ignoring wrong pointing object 680 0 (offset 3548582)
Ignoring wrong pointing object 681 0 (offset 3548633)
Ignoring wrong pointing obje

Vector store saved for model: KGB_렉스턴
Vector store saved for model: KGB_코란도
Vector store saved for model: KGB_토레스
Vector store saved for model: KGB_티볼리에어
Vector store saved for model: 기아_K3
Vector store saved for model: 기아_K5
Vector store saved for model: 기아_니로
Vector store saved for model: 기아_레이
Vector store saved for model: 기아_모닝
Vector store saved for model: 기아_셀토스
Vector store saved for model: 르노_SM6
Vector store saved for model: 르노_아르카나
Vector store saved for model: 쉐보레_트레일블라이저
Vector store saved for model: 쉐보레_트렉스크로스오버
Vector store saved for model: 현대_베뉴
Vector store saved for model: 현대_아반떼
Vector store saved for model: 현대_아반떼N
Vector store saved for model: 현대_케스퍼
Vector store saved for model: 현대_코나


In [22]:
vectorstore_렉스턴 =Chroma(persist_directory="./KGB_렉스턴_chroma", embedding_function=hf)
vectorstore_k3 =Chroma(persist_directory="./기아_K3_chroma", embedding_function=hf)
vectorstore_sm6 =Chroma(persist_directory="./르노_SM6_chroma", embedding_function=hf)


In [40]:
vectorstore_모닝 =Chroma(persist_directory="./기아_모닝_chroma", embedding_function=hf)


In [41]:
retriever_ahsld = vectorstore_모닝.as_retriever()
retriever_ahsld.get_relevant_documents('안전벨트')

[Document(metadata={'page': 39, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_모닝\\99D0864D5EE9C8BF2D.pdf'}, page_content=''),
 Document(metadata={'page': 481, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_모닝\\99D0864D5EE9C8BF2D.pdf'}, page_content=''),
 Document(metadata={'page': 37, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_모닝\\99D0864D5EE9C8BF2D.pdf'}, page_content=''),
 Document(metadata={'page': 110, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_모닝\\99D0864D5EE9C8BF2D.pdf'}, page_content='')]

In [23]:
retriever_렉스턴 = vectorstore_렉스턴.as_retriever()
retriever_k3 = vectorstore_k3.as_retriever()

In [39]:
retriever_k3.get_relevant_documents('안전벨트')

[Document(metadata={'page': 469, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_K3\\K3_사용설명서.pdf'}, page_content=''),
 Document(metadata={'page': 449, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_K3\\K3_사용설명서.pdf'}, page_content=''),
 Document(metadata={'page': 461, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_K3\\K3_사용설명서.pdf'}, page_content=''),
 Document(metadata={'page': 3, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\기아_K3\\K3_사용설명서.pdf'}, page_content='')]

In [24]:
vectorstore_트레블 =Chroma(persist_directory="./쉐보레_트레일블라이저_chroma", embedding_function=hf)
retriever_트레블 = vectorstore_트레블.as_retriever()
retriever_트레블.get_relevant_documents("편의장치")

[Document(metadata={'page': 28, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\쉐보레_트레일블라이저\\02-seats-restraints.pdf'}, page_content='시트, 안전 시스템 83\n하단 고정 장치\n보조시트  하단부를  고정하기  위한 고리\n의 횡방향  위치는  시트에  동그란  버튼\n모양으로  표시되어  있으며 , 버튼 아래\n의 시트 쿠션 커버의  슬릿을  젖히면  보\n조시트  하단부를  고정할  수 있는 고리\n가 보입니다 .상단 고정 장치\n보조시트  상단부를  고정하기  위한 고리\n가 뒷좌석  등받이  뒤에 있습니다 .\n반드시  어린이  보조 시트가  설치되는\n착석 위치와  동일한  위치에  있는 고정\n장치를  사용하십시오 . 어린이용  보조시\n트를 상단 고정장치가  없는 위치에  고\n정하지  마십시오 .보조시트  고정 방법\n고정장치를  사용하는  방법은  다음과  같\n습니다 . 자세한  설치방법  등은 어린이\n보조시트  제조사의  메뉴얼을  참고하십\n시오.\n1.어린이  보조 시트를  고정할  뒷좌석\n시트를  선택합니다 .\n2.동그란  버튼 아래의  쿠션 슬릿을  좌\n우로 벌려 손을 넣고 하단 고리의\n위치를  확인하십시오 .\n3.하단 고정장치  근처에  장착 시 방해\n가 될 수 있는 물건들을  치우십시\n오.\n4.어린이  보조 시트를  설치하고자  하\n는 뒷좌석  시트에  올려놓고  간섭이\n있는지  확인합니다 . 앞좌석과  간섭\n이 있을 경우 앞좌석  위치를  조절하\n십시오 .\n'),
 Document(metadata={'page': 28, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\쉐보레_트레일블라이저\\06-infotainment-system.pdf'}, page_content='인포테인먼트  시스템 195\n초기 설정으로  복원\n설정 (Settings) 메뉴에서  차량 설정 항\n목을 선택하여  

In [42]:
retriever_트레블.get_relevant_documents("편의장치")

[Document(metadata={'page': 28, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\쉐보레_트레일블라이저\\02-seats-restraints.pdf'}, page_content='시트, 안전 시스템 83\n하단 고정 장치\n보조시트  하단부를  고정하기  위한 고리\n의 횡방향  위치는  시트에  동그란  버튼\n모양으로  표시되어  있으며 , 버튼 아래\n의 시트 쿠션 커버의  슬릿을  젖히면  보\n조시트  하단부를  고정할  수 있는 고리\n가 보입니다 .상단 고정 장치\n보조시트  상단부를  고정하기  위한 고리\n가 뒷좌석  등받이  뒤에 있습니다 .\n반드시  어린이  보조 시트가  설치되는\n착석 위치와  동일한  위치에  있는 고정\n장치를  사용하십시오 . 어린이용  보조시\n트를 상단 고정장치가  없는 위치에  고\n정하지  마십시오 .보조시트  고정 방법\n고정장치를  사용하는  방법은  다음과  같\n습니다 . 자세한  설치방법  등은 어린이\n보조시트  제조사의  메뉴얼을  참고하십\n시오.\n1.어린이  보조 시트를  고정할  뒷좌석\n시트를  선택합니다 .\n2.동그란  버튼 아래의  쿠션 슬릿을  좌\n우로 벌려 손을 넣고 하단 고리의\n위치를  확인하십시오 .\n3.하단 고정장치  근처에  장착 시 방해\n가 될 수 있는 물건들을  치우십시\n오.\n4.어린이  보조 시트를  설치하고자  하\n는 뒷좌석  시트에  올려놓고  간섭이\n있는지  확인합니다 . 앞좌석과  간섭\n이 있을 경우 앞좌석  위치를  조절하\n십시오 .\n'),
 Document(metadata={'page': 28, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\쉐보레_트레일블라이저\\06-infotainment-system.pdf'}, page_content='인포테인먼트  시스템 195\n초기 설정으로  복원\n설정 (Settings) 메뉴에서  차량 설정 항\n목을 선택하여  

In [38]:
vectorstore_베뉴 =Chroma(persist_directory="./현대_베뉴_chroma", embedding_function=hf)
retriever_베뉴 = vectorstore_베뉴.as_retriever(search_kwargs={'k':1})
retriever_베뉴.get_relevant_documents("뒷좌석을 어떻게접어야해")

[Document(metadata={'page': 6, 'source': 'C:\\SKN02-4th-4Team\\자동차 pdf\\현대_베뉴\\202406041717481715269.pdf'}, page_content='3-7\n031.  뒷좌석을 접을 때 간섭이 생기지 않도록 앞좌석 등\n받이를 바로 세우십시오.\n2.  뒷좌석 헤드레스트 잠금해제버튼을 눌러 뒷좌석 헤\n드레스트를 최대한 아래로 내리십시오. \n3. 접었을 때 양옆의 3점식 안전벨트가 적재화물과 간\n섭이 발생되지 않도록 양옆으로 위치 시키십시오. 경 고\n •포켓에 날카로운 물건을 넣어두면 급정차나 사고 시 \n뒷좌석 탑승자가 심하게 다칠 수 있으므로 주의하십\n시오.\n •동승석 등받이에 매달리지 마십시오. 승객 구분 시스\n템 (OCS: Occupant Classification System) 이 오작\n동 할 수 있습니다.\n ̰뒷좌석\n좌석 접는 방법\n좌석 접이 레버를 잡아 당겨 등받이를 앞으로 접으면 좌\n석 공간을 적재공간으로 넓게 사용할 수 있습니다.다시 좌석으로 사용하고자 할 때는 등받이를 딸깍하고 걸릴때까지 위로 올려 바로 세우십시오.좌석으로 사용할 때는 반드시 헤드레스트와 안전벨트를 제위치에 놓고 사용하십시오.\n 경 고\n•  좌석을 접고 펼때는 항상 차량 정지상태에서 조작하\n십시오. 운행 중에는 좌석을 조절하지 마십시오.\n•  뒷좌석을 접어놓은 뒤 화물 공간에 탑승자가 탑승하\n거나 화물칸에 탑승하는 것은 매우 위험합니다.\n•  화물을 적재하는 경우 앞좌석 높이 이상으로 적재하\n지 말고, 움직일 수 있는 화물은 고정시켜 앞으로 밀리지 않도록 하십시오. 그렇지 않으면 차량 탑승자가 화물에 의해 다칠 수 있습니다.\n•  좌석을 접고 펼때는 항상 안전벨트에 손상이 가지 \n않도록 주의하십시오.\n•  좌석을 원위치로 돌리고 나면 항상 좌석이 고정되어 \n있는지 앞 ・ 뒤로 흔들어 확인 하신 후 헤드레스트와 \n안전벨트를 제 위치에 놓고 사용하십시오.\n•  좌석 조

In [26]:
from langchain_community.chat_models import ChatOllama
llm = ChatOllama(model="llama3.1:8b",temperature=0)

In [27]:
from langchain_core.runnables import chain

In [28]:
from typing import List, Optional

from langchain_core.pydantic_v1 import BaseModel, Field


class Search(BaseModel):
    """ 차종 종류에 대해서 """

    query: str = Field(
        ...,
        description="Query to look up",
    )
    category: str = Field(
        ...,
        description="자동차 모델 분류. Should be `베뉴` or `렉스턴`.",
    )

In [29]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough


system = """You have the ability to issue search queries to get information to help answer car model information."""
prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system),
        ("human", "{question}"),
    ]
)
sturct_llm= llm.
query_analyzer = {"question": RunnablePassthrough()} | prompt | llm

SyntaxError: invalid syntax (3547287192.py, line 12)

In [30]:
retriever_mapping = {
    "베뉴": retriever_베뉴,
    "렉스턴": retriever_렉스턴,
}

In [31]:
from langchain.prompts import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

In [32]:

# 질문 분류 함수: 렉스턴 또는 베뉴로 질문을 분류
def classify_question(question: str) -> str:
    if "렉스턴" in question:
        return "렉스턴"
    elif "베뉴" in question:
        return "베뉴"
    else :
        return "베뉴"


# 질문에 맞는 리트리버 선택 함수
def get_retriever_for_question(question: str):
    category = classify_question(question)
    return retriever_mapping.get(category, retriever_mapping["베뉴"])  # 기본 리트리버 제공

# RAG 파이프라인에서 질문에 맞는 리트리버로 검색 수행
def process_question(question: str,llm):
    selected_retriever = get_retriever_for_question(question)  # 차종에 맞는 리트리버 선택
     # 선택된 리트리버로 문서 검색
   # Prompt
    prompt = ChatPromptTemplate(
        messages=[
            SystemMessagePromptTemplate.from_template(
                        """
                    너는 친절하고 기억력이 좋은 챗봇이며, 사용자의 질문에 정확하고 일관성 있게 답변할 수 있는 능력을 갖추고 있습니다. 다음 지침에 따라 질문에 답하십시오:


                    정보 누락 시 대처:
                        - 만약 필요한 정보를 찾지 못하거나 검색 결과가 충분하지 않다면, 사용자에게 해당 정보를 제공할 수 없음을 알리고, 구체적인 추가 정보를 요청하십시오.

                    답을 모를 경우:
                        - "모릅니다"라고만 답하고, 답을 지어내지 마십시오. 모르는 것은 반드시 "모릅니다"라고 답해야 합니다.
                    
                    현재 대화내용 : {chat_history}
                    이전 대화의 맥락을 참고하여 질문에 정확하고 일관성 있는 답변을 제공하십시오.
                    이전 대화가 없다면 다시 질문을 해달라고 요청하십시오.

                    다음은 실제로 사용자에게 보여질 답변입니다:
                
                    {context}를 활용해서 대답하십시오.
                """
            ),
            HumanMessagePromptTemplate.from_template("{question}"),
        ]
    )

    memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
    qa = ConversationalRetrievalChain.from_llm(llm, retriever=selected_retriever, memory=memory, combine_docs_chain_kwargs={"prompt": prompt})
    
    return qa(question)


In [33]:
process_question("렉스턴은 안전벨트가 몇개야?",llm=llm)

  return qa(question)


{'question': '렉스턴은 안전벨트가 몇개야?',
 'chat_history': [HumanMessage(content='렉스턴은 안전벨트가 몇개야?'),
  AIMessage(content='렉스턴의 경우, 앞좌석에는 2개의 안전벨트가 있습니다. 뒷좌석 1열에는 3개의 안전벨트(중앙과 양측)가 있으며, 뒷좌석 2열에는 2개의 안전벨트가 있습니다.\n\n따라서 총 7개의 안전벨트가 설치되어 있습니다.')],
 'answer': '렉스턴의 경우, 앞좌석에는 2개의 안전벨트가 있습니다. 뒷좌석 1열에는 3개의 안전벨트(중앙과 양측)가 있으며, 뒷좌석 2열에는 2개의 안전벨트가 있습니다.\n\n따라서 총 7개의 안전벨트가 설치되어 있습니다.'}

In [36]:
process_question("베뉴 뒷좌석을 어떻게 접어야해?",llm=llm)

{'question': '베뉴 뒷좌석을 어떻게 접어야해?',
 'chat_history': [HumanMessage(content='베뉴 뒷좌석을 어떻게 접어야해?'),
  AIMessage(content='베뉴의 뒷좌석은 60/40 분리식입니다. \n\n1. 좌석을 뒤로 당겨서, 분리선에 도달할 때까지 당기세요.\n2. 좌석이 분리선을 넘어서는 것을 막기 위해, 분리선에 있는 버튼을 눌러주세요.\n3. 좌석의 앞부분을 뒤로 당겨서, 분리선과 맞닿게 하세요.\n4. 좌석의 뒷부분을 앞으로 당겨서, 분리선과 맞닿게 하세요.\n\n이러면 베뉴의 뒷좌석은 60/40 분리식으로 사용할 수 있습니다.')],
 'answer': '베뉴의 뒷좌석은 60/40 분리식입니다. \n\n1. 좌석을 뒤로 당겨서, 분리선에 도달할 때까지 당기세요.\n2. 좌석이 분리선을 넘어서는 것을 막기 위해, 분리선에 있는 버튼을 눌러주세요.\n3. 좌석의 앞부분을 뒤로 당겨서, 분리선과 맞닿게 하세요.\n4. 좌석의 뒷부분을 앞으로 당겨서, 분리선과 맞닿게 하세요.\n\n이러면 베뉴의 뒷좌석은 60/40 분리식으로 사용할 수 있습니다.'}

In [59]:
from langchain.prompts import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

In [None]:
# Prompt
prompt = ChatPromptTemplate(
    messages=[
        SystemMessagePromptTemplate.from_template(
                     """
                너는 친절하고 기억력이 좋은 챗봇이며, 사용자의 질문에 정확하고 일관성 있게 답변할 수 있는 능력을 갖추고 있습니다. 다음 지침에 따라 질문에 답하십시오:


                정보 누락 시 대처:
                    - 만약 필요한 정보를 찾지 못하거나 검색 결과가 충분하지 않다면, 사용자에게 해당 정보를 제공할 수 없음을 알리고, 구체적인 추가 정보를 요청하십시오.

                답을 모를 경우:
                    - "모릅니다"라고만 답하고, 답을 지어내지 마십시오. 모르는 것은 반드시 "모릅니다"라고 답해야 합니다.
                
                현재 대화내용 : {chat_history}
                이전 대화의 맥락을 참고하여 질문에 정확하고 일관성 있는 답변을 제공하십시오.
                이전 대화가 없다면 다시 질문을 해달라고 요청하십시오.

                다음은 실제로 사용자에게 보여질 답변입니다:
            
                {context}를 활용해서 대답하십시오.
            """
        ),
        HumanMessagePromptTemplate.from_template("{question}"),
    ]
)

memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
# qa = ConversationalRetrievalChain.from_llm(llm, retriever=retriever, memory=memory, combine_docs_chain_kwargs={"prompt": prompt})

In [None]:
def llmanswer(question,llm,retriever,) 

In [56]:
qa("렉스턴 안전벨트착용법 알려줘")

{'question': '렉스턴 안전벨트착용법 알려줘',
 'chat_history': [HumanMessage(content='렉스턴 안전벨트 개수'),
  AIMessage(content='렉스턴의 안전벨트는 총 6개입니다.'),
  HumanMessage(content='렉스턴 안전벨트착용법 알려줘'),
  AIMessage(content="To wear a safety belt in a Lexus, follow these general steps. The process might be slightly different depending on the specific model year and trim of your vehicle, but I'll provide you with the most common procedure.\n\n1.  **Adjust the seat**: Before putting on the seatbelt, ensure that your seat is adjusted to a comfortable position for driving. This includes adjusting the height, lumbar support, and any other features available in your Lexus model.\n2.  **Locate the seatbelt**: The seatbelts are usually located at the sides of the seats or across the chest. In most cases, you'll find them attached to the door or the roof of the vehicle.\n3.  **Put on the lap belt**: Place the lap belt across your hips and below your waistline. It should be snug but not too tight. Make sure it's positioned c