In [7]:
from langchain.document_loaders import PyPDFLoader

loader = PyPDFLoader("content\현대_아반떼25.pdf")


In [8]:
pages =loader.load_and_split()

In [9]:
# PDF 내용을 작은 chunk 단위로 나누기
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap= 100)
splits = text_splitter.split_documents(pages)

In [10]:
from langchain.embeddings import HuggingFaceEmbeddings

# model_name = "sentence-transformers/all-mpnet-base-v2"
model_name = "bespin-global/klue-sroberta-base-continue-learning-by-mnr" 
#model_name = "jhgan/ko-sroberta-multitask" # (KorNLU 데이터셋에 학습시킨 한국어 임베딩 모델)
model_kwargs = {'device': 'cuda'}
encode_kwargs = {'normalize_embeddings': False}
hf = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

In [11]:
embedded_query = hf.embed_query("안녕!")

In [12]:
from langchain.vectorstores import Chroma

vectorstore = Chroma.from_documents(documents=splits, embedding=hf,persist_directory="./chroma_store")
#지정한 경로에 저장
# vectorstore.persist()
#리트리버로 바꿔줍니다.
retriever = vectorstore.as_retriever()

In [13]:
vectorstore.persist()

  vectorstore.persist()


In [14]:
results = retriever.get_relevant_documents("에어백")
print(results)

[Document(metadata={'page': 240, 'source': 'content\\현대_아반떼25.pdf'}, page_content='사 직영 하이테크센터나 블루핸즈에 서 점검을 받으십\n시오. 그렇지 않을 경우 브레이크가 작동되지 않아 심각한 사고가 날 수 있습니다.\n ̰바른 제동 요령\n •브레이크 페달을 2~3회에 걸쳐서 밟으면 브레이크 성능을 좋게 하는 것은 물론 뒤따르는 차에 제동 상황을 미리 알려주어 추돌 사고를 방지할 수 있습니다. \n •브레이크 페달을 밟을 때는 차가 멈추는 데 필요한 만큼의 힘으로 밟으십시오.\n •가파르거나 긴 내리막길을 내려올 때 브레이크 페달을 계속 밟으면 브레이크가 과열되어 브레이크 제동력의 급격한 저하를 일으킬 수 있으므로 저단 기어를 사용하거나 속도를 서서히 줄이면서 차례대로 저단으로 변속하는 엔진 브레이크를 함께 사용하여 속도를 줄이십시오.\n •엔진 회전수(RPM)가 필요 이상으로 올라갈 경우에는 엔진 각 부분에 무리가 생겨 엔진이 손상될 수 있으므로 주의하십시오. ̰주차 브레이크 \n작동'), Document(metadata={'page': 240, 'source': 'content\\현대_아반떼25.pdf'}, page_content='사 직영 하이테크센터나 블루핸즈에 서 점검을 받으십\n시오. 그렇지 않을 경우 브레이크가 작동되지 않아 심각한 사고가 날 수 있습니다.\n ̰바른 제동 요령\n •브레이크 페달을 2~3회에 걸쳐서 밟으면 브레이크 성능을 좋게 하는 것은 물론 뒤따르는 차에 제동 상황을 미리 알려주어 추돌 사고를 방지할 수 있습니다. \n •브레이크 페달을 밟을 때는 차가 멈추는 데 필요한 만큼의 힘으로 밟으십시오.\n •가파르거나 긴 내리막길을 내려올 때 브레이크 페달을 계속 밟으면 브레이크가 과열되어 브레이크 제동력의 급격한 저하를 일으킬 수 있으므로 저단 기어를 사용하거나 속도를 서서히 줄이면서 차례대로 저단으로 변속하는 엔진 브레이크를 함께 사용하여 속도를 줄이십시오.\n 

  results = retriever.get_relevant_documents("에어백")


meta-llama/Meta-Llama-3-8B-Instruct

In [None]:
# import os
# os.environ['HF_TOKEN']="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"

In [None]:
# from transformers import AutoTokenizer, AutoModelForCausalLM
# import torch

# model_id = "meta-llama/Meta-Llama-3-8B-Instruct"

# tokenizer = AutoTokenizer.from_pretrained(model_id)
# model = AutoModelForCausalLM.from_pretrained(
#     model_id,
#     torch_dtype=torch.bfloat16,
# )

In [15]:
from langchain_community.chat_models import ChatOllama


In [16]:
llm = ChatOllama(model="llama3.1:8b",temperature=0)

In [None]:
# llm.invoke("안녕")

In [17]:
from langchain.prompts import (
    ChatPromptTemplate,
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
)
from langchain.memory import ConversationBufferMemory
from langchain.chains import ConversationalRetrievalChain

In [18]:
# Prompt
prompt = ChatPromptTemplate(
    messages=[
        SystemMessagePromptTemplate.from_template(
                     """
                너는 친절하고 기억력이 좋은 챗봇이며, 사용자의 질문에 정확하고 일관성 있게 답변할 수 있는 능력을 갖추고 있습니다. 다음 지침에 따라 질문에 답하십시오:


                정보 누락 시 대처:
                    - 만약 필요한 정보를 찾지 못하거나 검색 결과가 충분하지 않다면, 사용자에게 해당 정보를 제공할 수 없음을 알리고, 구체적인 추가 정보를 요청하십시오.

                답을 모를 경우:
                    - "모릅니다"라고만 답하고, 답을 지어내지 마십시오. 모르는 것은 반드시 "모릅니다"라고 답해야 합니다.
                
                현재 대화내용 : {chat_history}
                이전 대화의 맥락을 참고하여 질문에 정확하고 일관성 있는 답변을 제공하십시오.
                이전 대화가 없다면 다시 질문을 해달라고 요청하십시오.

                다음은 실제로 사용자에게 보여질 답변입니다:
            
                {context}를 활용해서 대답하십시오.
            """
        ),
        HumanMessagePromptTemplate.from_template("{question}"),
    ]
)

memory = ConversationBufferMemory(memory_key="chat_history", return_messages=True)
qa = ConversationalRetrievalChain.from_llm(llm, retriever=retriever, memory=memory, combine_docs_chain_kwargs={"prompt": prompt})

In [21]:
qa("에어백이 몇개야?")

{'question': '에어백이 몇개야?',
 'chat_history': [HumanMessage(content='축거가 몇이야?'),
  AIMessage(content='사용자의 질문을 이해하지 못했습니다. 이전 대화의 맥락이 없다면 다시 질문을 해달라고 요청합니다.\n\n만약 이전 대화에서 후측방 충돌 방지 보조에 대한 설명이 있었다면, 그 내용을 참고하여 답변할 수 있습니다.'),
  HumanMessage(content='아반떄의 축거 길이가 몇이야?'),
  AIMessage(content='운전자 보조 7-20후측방 충돌방지 보조(BCA) \n일정 속도 이상으로 주행 중 후측방의 차량을 인식하여 \n충돌 위험이 판단되면 경고등과 경고음 등으로 알려줍니다. 또한 전진 출차 시 충돌 위험이 높아지면 충돌하지 않도록 제동을 도와줍니다.\n사각 지대에 위치한 차량을 인식하여 알려줍니다. \n 주 의\n경고 영역은 자차의 속도에 따라 변경됩니다. 단, 사각 \n지대에 차량이 있더라도 자차가 빠른 속도로 추월할 경우 경고를 하지 않습니다.\n후측방에서 빠른 속도로 접근하는 차량을 인식하여 알\n려줍니다.\nOHY059001OHY059001\nOHY059002OHY059002 주 의\n위험을  알려주는  시점은  고속으로  접근하는  차량의  속\n도에 따라 다를 수 있습니다.\n전진 출차 시 후측방에서 다가오는 차량과의 충돌 위험이 판단되면 충돌하지 않도록 제동을 도와줍니다. \ni 알아두기\nBCA는 Blind-Spot Collision-Avoidance Assist\n의 약자입니다.\n\n운전자 보조 7-20후측방 충돌방지 보조(BCA) \n일정 속도 이상으로 주행 중 후측방의 차량을 인식하여 \n충돌 위험이 판단되면 경고등과 경고음 등으로 알려줍\n니다. 또한 전진 출차 시 충돌 위험이 높아지면 충돌하지 않도록 제동을 도와줍니다.\n사각 지대에 위치한 차량을 인식하여 알려줍니다. \n 주 의\n경고 영역은 자차의 속도에 따라 변경됩니다. 단, 사각 