In [2]:
from AI.chain.chain_logging import langsmith
from dotenv import load_dotenv

load_dotenv()

langsmith("langchain_RAG")


LangSmith 추적을 시작합니다.
[프로젝트명]
langchain_RAG


### RAG 템플릿 실험

In [1]:
import os
from langchain import hub
from langchain_ollama import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from vectorstore_manager import (
    load_vectorstore,
    create_vectorstore,
)
from config import PDF_PATH, VECTORSTORE_PATH, MODEL_PATH
from utils import get_embeddings, format_docs_with_print


# Load or create vectorstore
if os.path.exists(VECTORSTORE_PATH):
    print("Loading existing vectorstore...")
    embeddings = get_embeddings()
    loaded_vectorstore = load_vectorstore(VECTORSTORE_PATH, embeddings)
else:
    print("Vectorstore not found. Creating a new one...")
    embeddings = get_embeddings()
    loaded_vectorstore = create_vectorstore(PDF_PATH, VECTORSTORE_PATH, embeddings)


# 단계 5: 리트리버 생성
k = 2
retriever = loaded_vectorstore.as_retriever(search_kwargs={"k": k})

# 단계 6: 프롬프트 생성
prompt = hub.pull("rlm/rag-prompt")

# 단계7: 언어모델 생성
# Ollama 모델을 불러옵니다.
llm = ChatOllama(model=MODEL_PATH, temperature=0)


# 단계 8: 체인 생성
rag_chain = (
    {"context": retriever | format_docs_with_print, "question": RunnablePassthrough()}
    | prompt
    | llm
    | StrOutputParser()
)

Vectorstore not found. Creating a new one...


  from tqdm.autonotebook import tqdm, trange


In [3]:
from chain_output_stream import stream_response

# 단계 8: 체인 실행(Run Chain)
# 문서에 대한 질의를 입력하고, 답변을 출력합니다.
# question = "구글 딥마인드 정책에 대해서 알려주세요"
# question = "미래의 AI 소프트웨어 매출 전망은 어떻게 되나요?"
# question = "YouTube 가 2024년에 의무화 한 것은 무엇인가요?"
# question = "연차는 어떻게 사용할 수 있나요?"
question = "유류비 청구는 어떻게 할 수 있나요? 제가 3박 4일로 부산에 갓다오는데 비용은 대충 어떻게 계산하죠?"

response = rag_chain.stream(question)

# 결과 출력
print(f"[HUMAN]\n{question}\n")
print("===" * 20)
# print(rag_chain["retrieved_docs"])
answer = stream_response(response, return_output=True)

[HUMAN]
유류비 청구는 어떻게 할 수 있나요? 제가 3박 4일로 부산에 갓다오는데 비용은 대충 어떻게 계산하죠?


=== Retrieved Documents ===

Document 1:
..\kisa_pdf\3_06_출장규칙(240214).pdf |  page: 14
그외지역:실비 70,000이내
 
   ※ <삭제2017.12.29>
   ※ <삭제2017.12.29.>
   ※ 자가용승용차를이용하여출장가는경우의교통비는여행구간별철도운임또는버스운임
(통상이용되는대중교통요금 )으로한다. 이때출장자는자가용승용차를이용하여출장을
이행한사실을확인할수있는증거서류인고속도로통행영수증 (왕복), 출장일에출장지소재 
주유소에서결제한신용카드매출전표 , 출장지주차영수증중1개이상의증거서류를갖추어
제출해야한다.  다만, 부득이한사유로자가용승용차를이용한경우에는연료비및통행료를  
지급할수있고이때의부득이한사유및연료비산정기준은공무원여비규정및인사혁신처  
예규를적용하며그내용은아래와같다.<개정2017.12.29., 2021.12.28., 2022.5.27., 2023.3.13.>
      업무형편상
부득이한
사유o산간오지,도서벽지등대중교통수단이 없어자가용을이용할수밖에
없는경우
o출장경로가매우복잡･
다양하여대중교통을사실상이용할수없는경우
o공무목적상부득이한심야시간대이동또는긴급한사유가있는경우
--------------------------------------------------

Document 2:
..\kisa_pdf\3_06_출장규칙(240214).pdf |  page: 28
국내 출장비 정산
출장 변동사항 출장비 정산
소 속 성 명 항 목 신청액 집행액 변동액 비 고
교통비
일  비
식  비
숙박비
계
교통비
일  비
식  비
숙박비
계
교통비
일  비
식  비
숙박비
계
교통비
일  비
식  비
숙박비
계
합 계
--------------------------------------------------


Anser: 

유류비 청구는 자가용승용차를 이용하여 출장가는 경우의 교

### 대화 내용을 기억하는 기능을 추가

In [1]:
import os
from langchain_ollama import ChatOllama
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough
from vectorstore_manager import (
    load_vectorstore,
    create_vectorstore,
    create_conversion_memory,
)
from config import PDF_PATH, VECTORSTORE_PATH, MODEL_PATH
from utils import get_embeddings, format_docs_with_print, create_prompt


# Load or create vectorstore
if os.path.exists(VECTORSTORE_PATH):
    print("Loading existing vectorstore...")
    embeddings = get_embeddings()
    loaded_vectorstore = load_vectorstore(VECTORSTORE_PATH, embeddings)
else:
    print("Vectorstore not found. Creating a new one...")
    embeddings = get_embeddings()
    loaded_vectorstore = create_vectorstore(PDF_PATH, VECTORSTORE_PATH, embeddings)

# 대화를 기억할 메모리 객체 생성
memory = create_conversion_memory("chat_history", "answer")

# 단계 5: 리트리버 생성
k = 2
retriever = loaded_vectorstore.as_retriever(search_kwargs={"k": k})

# 단계 6: 프롬프트 생성
prompt = create_prompt()

# 단계7: 언어모델 생성
# Ollama 모델을 불러옵니다.
llm = ChatOllama(model=MODEL_PATH, temperature=0)


# 단계 8: 체인 생성
# 단계 8: 체인 생성
rag_chain = (
    {
        "context": retriever | format_docs_with_print,
        "question": RunnablePassthrough(),
        "chat_history": lambda x: memory.load_memory_variables({})["chat_history"],
    }
    | prompt
    | llm
    | StrOutputParser()
)

Loading existing vectorstore...


  from tqdm.autonotebook import tqdm, trange
  memory = ConversationBufferWindowMemory(


In [4]:
from chain_output_stream import stream_response

# 단계 8: 체인 실행(Run Chain)
# 문서에 대한 질의를 입력하고, 답변을 출력합니다.
# question = "연차는 어떻게 사용할 수 있나요?"
# question = "유류비 청구는 어떻게 할 수 있나요? 제가 3박 4일로 부산에 갓다오는데 비용은 대충 어떻게 계산하죠?"
question = "아까 물어본 질문을 다시 알려주세요"

response = rag_chain.stream(question)

# 결과 출력
print(f"[HUMAN]\n{question}\n")
print("===" * 20)
answer = stream_response(response, return_output=True)

# 메모리에 대화 내용을 저장
memory.save_context({"question": question}, {"answer": answer})



[HUMAN]
아까 물어본 질문을 다시 알려주세요


=== Retrieved Documents ===

Document 1:
..\kisa_pdf\3_04_감사규칙(230605).pdf |  page: 20
[별지제8호]<개정2013.5.8>
질문서
제목:
질문사항 답변사항
홍길동귀하 홍길동귀하
다음사항에대하여 20년00월00일까지
답변하여주시기바랍니다 .다음과같이답변합니다 .
20년00월00일
소속:
20년00월00일 직급 (직책 ):
감사실장 :  성명:홍길동
--------------------------------------------------

Document 2:
..\kisa_pdf\4_46_118상담센터 상담사 보호에 관한 업무 운영지침(221223).pdf |  page: 8
3.민원요지불명
구분내용 처리프로세스 세부응대프로세스
1단계민원응대및
경고후종료①1차경고
②2차경고
③3차경고및IVR응대<1차경고>
“선생님 ,문의하실내용을말씀해주세요 .그렇지않으면내용이 
파악되지않아더이상상담진행이어렵습니다 .”
<2차경고>
“선생님 ,문의하실내용을말씀해주세요 .그렇지않으면내용이 
파악되지않아더이상상담진행이어렵습니다 .”
<3차경고>
“문의내용이파악되지않아상담이불가합니다 .통화종료하
겠습니다 .”
→멘트구사후IVR전환
<IVR경고멘트자동송출 >
문의내용이파악되지않아상담이불가합니다 .상담사의권익
보호를위하여 ,선생님의상담이 7일간제한됨을알려드립니다 .
2단계악성민원등록①상담사상담후팀장보고
②팀장내용확인후상담APP
강성민원등록(민원요지불명 )강성민원등록시,동일번호 7일간이용정지
3-1단계이용정지 IVR연결불가멘트송출<IVR연결불가멘트자동송출 >
상담사의권익보호를위하여 ,선생님의상담이제한됨을알려
드립니다 .
3-2단계정지해제이용정지 8일차해제이용정지 8일차해제
※재발시반복이용정지
4.반복‧
--------------------------------------------------


Anser: 

홍길동 귀하, 아까 물어보신 질문은 유류비 청구와 연차