## 1. 환경 설정

### (1) Env 환경변수


In [1]:

from dotenv import load_dotenv
import os

load_dotenv()

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
print(OPENAI_API_KEY[:2])

UPSTAGE_API_KEY = os.getenv("UPSTAGE_API_KEY")
print(UPSTAGE_API_KEY[30:])

TAVILY_API_KEY = os.getenv("TAVILY_API_KEY")
print(TAVILY_API_KEY[:4])

sk
NY
tvly


In [None]:
import warnings
warnings.filterwarnings("ignore")

from langchain_community.vectorstores import FAISS
from langchain_core.messages import SystemMessage
from langchain_core.messages import HumanMessage, SystemMessage, AIMessage
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough
#from langchain_core.tools import tool
from langchain.agents import tool
from langchain_community.tools import TavilySearchResults

from langchain_openai import ChatOpenAI
from langchain_upstage import UpstageEmbeddings
from langchain_upstage import ChatUpstage

# LangGraph MessagesState라는 미리 만들어진 상태를 사용
from langgraph.graph import MessagesState
from langchain_core.documents import Document
from langgraph.graph import StateGraph, START, END
from langgraph.prebuilt import ToolNode
from langgraph.prebuilt import create_react_agent

from textwrap import dedent
from typing import List, Literal, Tuple, TypedDict, Optional
from pydantic import BaseModel, Field

import gradio as gr


### (2) 기본 라이브러리
from pprint import pprint
import re
import os, json
from glob import glob
import pickle

import uuid


## 2. 법률 문서를 로드하여 벡터저장소에 저장

In [14]:

# pdf 파일 목록을 확인
pdf_files = glob(os.path.join('../data/legal', '*.pdf'))
pdf_files


['../data/legal\\개인정보 보호법(법률)(제19234호)(20240315).pdf',
 '../data/legal\\근로기준법(법률)(제18176호)(20211119).pdf',
 '../data/legal\\주택임대차보호법(법률)(제19356호)(20230719).pdf']

### 2-1. 개인정보보호법
#### PDf 문서를 가져와서 조항 별로 구분하여 정리

In [15]:

from langchain_community.document_loaders import PyPDFLoader

pdf_file = '../data/legal/개인정보 보호법(법률)(제19234호)(20240315).pdf'

loader = PyPDFLoader(pdf_file)
pages = loader.load()

print(len(pages))

print(pages[0].page_content)

print(pages[0].metadata)

print(pages[0].page_content)

def parse_law(law_text):
    # 서문 분리
    # '^'로 시작하여 '제1장' 또는 '제1조' 직전까지의 모든 텍스트를 탐색 
    preamble_pattern = r'^(.*?)(?=제1장|제1조)'
    preamble = re.search(preamble_pattern, law_text, re.DOTALL)
    if preamble:
        preamble = preamble.group(1).strip()
    
    # 장 분리 
    # '제X장' 형식의 제목과 그 뒤에 오는 모든 조항을 하나의 그룹화 
    chapter_pattern = r'(제\d+장\s+.+?)\n((?:제\d+조(?:의\d+)?(?:\(\w+\))?.*?)(?=제\d+장|부칙|$))'
    chapters = re.findall(chapter_pattern, law_text, re.DOTALL)
    
    # 부칙 분리
    # '부칙'으로 시작하는 모든 텍스트를 탐색 
    appendix_pattern = r'(부칙.*)'
    appendix = re.search(appendix_pattern, law_text, re.DOTALL)
    if appendix:
        appendix = appendix.group(1)
    
    # 파싱 결과를 저장할 딕셔너리 초기화
    parsed_law = {'서문': preamble, '장': {}, '부칙': appendix}
    
    # 각 장 내에서 조 분리
    for chapter_title, chapter_content in chapters:
        # 조 분리 패턴
        # 1. '제X조'로 시작 ('제X조의Y' 형식도 가능)
        # 2. 조 번호 뒤에 반드시 '(항목명)' 형식의 제목이 와야 함 
        # 3. 다음 조가 시작되기 전까지 또는 문서의 끝까지의 모든 내용을 포함
        article_pattern = r'(제\d+조(?:의\d+)?\s*\([^)]+\).*?)(?=제\d+조(?:의\d+)?\s*\([^)]+\)|$)'
        
        # 정규표현식을 이용해 모든 조항을 탐색 
        articles = re.findall(article_pattern, chapter_content, re.DOTALL)
        
        # 각 조항의 앞뒤 공백을 제거하고 결과 딕셔너리에 저장
        parsed_law['장'][chapter_title.strip()] = [article.strip() for article in articles]
    
    return parsed_law


# 각 페이지의 텍스트를 결합하여 재분리
text_for_delete = r"법제처\s+\d+\s+국가법령정보센터\n개인정보 보호법"

law_text = "\n".join([re.sub(text_for_delete, "", p.page_content).strip() for p in pages])

parsed_law = parse_law(law_text)

# 분할된 아이템 갯수 확인
print(len(parsed_law["장"]))
print(parsed_law)


41
법제처                                                            1                                                       국가법령정보센터
개인정보 보호법 
 
개인정보 보호법 
[시행 2024. 3. 15.] [법률 제19234호, 2023. 3. 14., 일부개정] 
개인정보보호위원회 (심사총괄담당관 - 일반 법령해석) 02-2100-3043 
개인정보보호위원회 (국제협력담당관 - 국외이전) 02-2100-2484, 2499 
개인정보보호위원회 (개인정보보호정책과 - 법령 제ㆍ개정, 아동ㆍ청소년) 02-2100-3057, 3047 
개인정보보호위원회 (신기술개인정보과 - 영상정보, 안전조치) 02-2100-3064, 3028 
개인정보보호위원회 (데이터안전정책과 - 가명정보, 개인정보안심구역) 02-2100-3088, 3074, 3058, 3079 
개인정보보호위원회 (자율보호정책과 - 보호책임자, 자율규제, 보호수준 평가, 처리방침, 영향평가) 02-2100-3083, 3089, 3087, 3096,
3086 
개인정보보호위원회 (분쟁조정과 - 분쟁조정, 손해배상책임) 1833-6972, 02-2100-3142 
개인정보보호위원회 (범정부마이데이터 추진단(전략기획팀 - 전송요구권(마이데이터)) 02-2100-3173 
       제1장 총칙
 
제1조(목적) 이 법은 개인정보의 처리 및 보호에 관한 사항을 정함으로써 개인의 자유와 권리를 보호하고, 나아가 개인
의 존엄과 가치를 구현함을 목적으로 한다. <개정 2014. 3. 24.>
 
제2조(정의) 이 법에서 사용하는 용어의 뜻은 다음과 같다. <개정 2014. 3. 24., 2020. 2. 4., 2023. 3. 14.>
1. “개인정보”란 살아 있는 개인에 관한 정보로서 다음 각 목의 어느 하나에 해당하는 정보를 말한다.
가. 성명, 주민등록번호 및 영상 등을 통하여 개인을 알아볼 수 있는 정보 
나. 

#### Langchain Document 객체에 메타데이터와 함께 정리

In [16]:

from langchain_core.documents import Document

final_docs = []
for law in parsed_law['장'].keys():
    for article in parsed_law['장'][law]:

        # metadata 내용을 정리 
        metadata = {
                "source": pdf_file,
                "chapter": law,
                "name" : "개인정보 보호법"
                }

        # metadata 내용을 본문에 추가 
        content = f"[법률정보]\n다음 조항은 {metadata['name']} {metadata['chapter']}에서 발췌한 내용입니다.\n\n[법률조항]\n{article}"

        final_docs.append(Document(page_content=content, metadata=metadata))
        
print(len(final_docs))

print(final_docs[0].page_content)
print()
print(final_docs[0].metadata)

print(final_docs[-1].page_content)
print()
print(final_docs[-1].metadata)

# 각 문서의 텍스트 길이를 확인
text_lengths = [len(d.page_content) for d in final_docs]
print(min(text_lengths), max(text_lengths))


109
[법률정보]
다음 조항은 개인정보 보호법 제1장 총칙에서 발췌한 내용입니다.

[법률조항]
제1조(목적) 이 법은 개인정보의 처리 및 보호에 관한 사항을 정함으로써 개인의 자유와 권리를 보호하고, 나아가 개인
의 존엄과 가치를 구현함을 목적으로 한다. <개정 2014. 3. 24.>

{'source': '../data/legal/개인정보 보호법(법률)(제19234호)(20240315).pdf', 'chapter': '제1장 총칙', 'name': '개인정보 보호법'}
[법률정보]
다음 조항은 개인정보 보호법 제10장 벌칙 <개정 2020. 2. 4.>에서 발췌한 내용입니다.

[법률조항]
제76조(과태료에 관한 규정 적용의 특례) 제75조의 과태료에 관한 규정을 적용할 때 제64조의2에 따라 과징금을 부과
한 행위에 대하여는 과태료를 부과할 수 없다. <개정 2023. 3. 14.>
[본조신설 2013. 8. 6.]

{'source': '../data/legal/개인정보 보호법(법률)(제19234호)(20240315).pdf', 'chapter': '제10장 벌칙 <개정 2020. 2. 4.>', 'name': '개인정보 보호법'}
116 2844


#### 벡터저장소에 인덱싱

In [None]:

from langchain_community.vectorstores import FAISS
#from langchain_ollama import OllamaEmbeddings

#embeddings_model = OllamaEmbeddings(model="bge-m3")
embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")

# FAISS 인덱스 생성
personal_db = FAISS.from_documents(
    documents=final_docs, 
    embedding=embeddings_model
)

# FAISS 인덱스 저장
os.makedirs("../db/legal_db", exist_ok=True)
personal_db.save_local("../db/legal_db/personal_law")

### 2-2. 근로기준법
#### PDf 문서를 가져와서 조항 별로 구분하여 정리

In [18]:

from langchain_community.document_loaders import PyPDFLoader

pdf_file = '../data/legal/근로기준법(법률)(제18176호)(20211119).pdf'

loader = PyPDFLoader(pdf_file)
pages = loader.load()

print(len(pages))

print(pages[0].page_content)

# 각 페이지의 텍스트를 결합하여 재분리
text_for_delete = r"법제처\s+\d+\s+국가법령정보센터\n근로기준법"

law_text = "\n".join([re.sub(text_for_delete, "", p.page_content).strip() for p in pages])

parsed_law = parse_law(law_text)

# 분할된 아이템 갯수 확인
print(len(parsed_law["장"]))
print(parsed_law)

#### 랭체인 Document 객체에 메타데이터와 함께 정리

from langchain_core.documents import Document

final_docs = []
for law in parsed_law['장'].keys():
    for article in parsed_law['장'][law]:

        # metadata 내용을 정리 
        metadata = {
                "source": pdf_file,
                "chapter": law,
                "name" : "근로기준법"
                }

        # metadata 내용을 본문에 추가 
        content = f"[법률정보]\n다음 조항은 {metadata['name']} {metadata['chapter']}에서 발췌한 내용입니다.\n\n[법률조항]\n{article}"

        final_docs.append(Document(page_content=content, metadata=metadata))
        
print(len(final_docs))

print(final_docs[0].page_content)
print()
print(final_docs[0].metadata)

print(final_docs[1].page_content)
print()
print(final_docs[1].metadata)

#### 벡터저장소에 인덱싱

# 각 문서의 텍스트 길이를 확인
text_lengths = [len(d.page_content) for d in final_docs]
print(min(text_lengths), max(text_lengths))

from langchain_community.vectorstores import FAISS
from langchain_ollama import OllamaEmbeddings

#embeddings_model = OllamaEmbeddings(model="bge-m3")
embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")

# FAISS 인덱스 생성
labor_db = FAISS.from_documents(
    documents=final_docs, 
    embedding=embeddings_model
)

# FAISS 인덱스 저장
labor_db.save_local("../db/legal_db/labor_law")


20
법제처                                                            1                                                       국가법령정보센터
근로기준법 
 
근로기준법 
[시행 2021. 11. 19.] [법률 제18176호, 2021. 5. 18., 일부개정] 
고용노동부 (근로기준정책과 - 해고, 취업규칙, 기타) 044-202-7534 
고용노동부 (근로기준정책과 - 소년) 044-202-7535 
고용노동부 (근로기준정책과 - 임금) 044-202-7548 
고용노동부 (여성고용정책과 - 여성) 044-202-7475 
고용노동부 (임금근로시간정책과 - 근로시간, 휴게) 044-202-7545 
고용노동부 (임금근로시간정책과 - 휴일, 연차휴가) 044-202-7973 
고용노동부 (임금근로시간정책과 - 제63조 적용제외, 특례업종) 044-202-7530 
고용노동부 (임금근로시간정책과 - 유연근로시간제) 044-202-7549 
       제1장 총칙
 
제1조(목적) 이 법은 헌법에 따라 근로조건의 기준을 정함으로써 근로자의 기본적 생활을 보장, 향상시키며 균형 있는
국민경제의 발전을 꾀하는 것을 목적으로 한다.
 
제2조(정의) ① 이 법에서 사용하는 용어의 뜻은 다음과 같다. <개정 2018. 3. 20., 2019. 1. 15., 2020. 5. 26.>
1. “근로자”란 직업의 종류와 관계없이 임금을 목적으로 사업이나 사업장에 근로를 제공하는 사람을 말한다.
2. “사용자”란 사업주 또는 사업 경영 담당자, 그 밖에 근로자에 관한 사항에 대하여 사업주를 위하여 행위하는 자를
말한다. 
3. “근로”란 정신노동과 육체노동을 말한다.
4. “근로계약”이란 근로자가 사용자에게 근로를 제공하고 사용자는 이에 대하여 임금을 지급하는 것을 목적으로 체
결된 계약을 말한다. 
5. “임금”이란 사용자가 근로의 대가로 근로자에게 임금, 봉급, 그 밖에 어떠한 명

### 2-3. 주택임대차보호법
#### PDf 문서를 가져와서 조항 별로 구분하여 정리

In [19]:

from langchain_community.document_loaders import PyPDFLoader

pdf_file = '../data/legal/주택임대차보호법(법률)(제19356호)(20230719).pdf'

loader = PyPDFLoader(pdf_file)
pages = loader.load()

print(len(pages))

# 파싱 함수를 수정 (장이 없이 조문으로만 구성된 경우)
def parse_law_v2(law_text):
    # 서문 분리
    preamble_pattern = r'^(.*?)(?=제1장|제1조)'
    preamble = re.search(preamble_pattern, law_text, re.DOTALL)
    if preamble:
        preamble = preamble.group(1).strip()
    
    # 장 분리 
    chapter_pattern = r'(제\d+장\s+.+?)\n((?:제\d+조(?:의\d+)?(?:\(\w+\))?.*?)(?=제\d+장|부칙|$))'
    chapters = re.findall(chapter_pattern, law_text, re.DOTALL)
    
    # 부칙 분리
    appendix_pattern = r'(부칙.*)'
    appendix = re.search(appendix_pattern, law_text, re.DOTALL)
    if appendix:
        appendix = appendix.group(1)
    
    parsed_law = {'서문': preamble, '부칙': appendix}
    
    # 조 분리 패턴
    article_pattern = r'(제\d+조(?:의\d+)?\s*\([^)]+\).*?)(?=제\d+조(?:의\d+)?\s*\([^)]+\)|$)'
    
    if chapters:  # 장이 있는 경우
        parsed_law['장'] = {}
        for chapter_title, chapter_content in chapters:
            articles = re.findall(article_pattern, chapter_content, re.DOTALL)
            parsed_law['장'][chapter_title.strip()] = [article.strip() for article in articles]
    else:  # 장이 없는 경우
        # 서문과 부칙을 제외한 본문에서 조문 추출
        main_text = re.sub(preamble_pattern, '', law_text, flags=re.DOTALL)
        main_text = re.sub(appendix_pattern, '', main_text, flags=re.DOTALL)
        articles = re.findall(article_pattern, main_text, re.DOTALL)
        parsed_law['조문'] = [article.strip() for article in articles]
    
    return parsed_law

# 각 페이지의 텍스트를 결합하여 재분리
text_for_delete = r"법제처\s+\d+\s+국가법령정보센터\n주택임대차보호법"

law_text = "\n".join([re.sub(text_for_delete, "", p.page_content).strip() for p in pages])

parsed_law = parse_law_v2(law_text)

# 분할된 아이템 갯수 확인
print(len(parsed_law["조문"]))
print(parsed_law)

#### 랭체인 Document 객체에 메타데이터와 함께 정리

from langchain_core.documents import Document

final_docs = []
for article in parsed_law['조문']:

    # metadata 내용을 정리 
    metadata = {
            "source": pdf_file,
            "name" : "주택임대차보호법"
            }

    # metadata 내용을 본문에 추가 
    content = f"[법률정보]\n다음 조항은 {metadata['name']}에서 발췌한 내용입니다.\n\n[법률조항]\n{article}"

    final_docs.append(Document(page_content=content, metadata=metadata))

print(len(final_docs))

print(final_docs[0].page_content)
print()
print(final_docs[0].metadata)

print(final_docs[1].page_content)
print()
print(final_docs[1].metadata)

#### 벡터저장소에 인덱싱

# 각 문서의 텍스트 길이를 확인
text_lengths = [len(d.page_content) for d in final_docs]
print(min(text_lengths), max(text_lengths))

from langchain_community.vectorstores import FAISS
#from langchain_ollama import OllamaEmbeddings
#embeddings_model = OllamaEmbeddings(model="bge-m3")
from langchain_upstage import UpstageEmbeddings

embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")

# FAISS 인덱스 생성
housing_db = FAISS.from_documents(
    documents=final_docs, 
    embedding=embeddings_model
)

# FAISS 인덱스 저장
housing_db.save_local("../db/legal_db/housing_law")


10
41
{'서문': '주택임대차보호법 ( 약칭: 주택임대차법 ) \n[시행 2023. 7. 19.] [법률 제19356호, 2023. 4. 18., 일부개정] \n법무부 (법무심의관실) 02-2110-3164 \n국토교통부 (주택임대차기획팀) 044-201-3348, 4178', '부칙': '부칙 <제19520호,2023. 7. 11.> \n이 법은 공포한 날부터 시행한다.', '조문': ['제1조(목적) 이 법은 주거용 건물의 임대차(賃貸借)에 관하여 「민법」에 대한 특례를 규정함으로써 국민 주거생활의 안\n정을 보장함을 목적으로 한다.\n[전문개정 2008. 3. 21.]', '제2조(적용 범위) 이 법은 주거용 건물(이하 “주택”이라 한다)의 전부 또는 일부의 임대차에 관하여 적용한다. 그 임차주\n택(賃借住宅)의 일부가 주거 외의 목적으로 사용되는 경우에도 또한 같다.\n[전문개정 2008. 3. 21.]', '제3조(대항력 등) ① 임대차는 그 등기(登記)가 없는 경우에도 임차인(賃借人)이 주택의 인도(引渡)와 주민등록을 마친\n때에는 그 다음 날부터 제삼자에 대하여 효력이 생긴다. 이 경우 전입신고를 한 때에 주민등록이 된 것으로 본다.\n② 주택도시기금을 재원으로 하여 저소득층 무주택자에게 주거생활 안정을 목적으로 전세임대주택을 지원하는 법\n인이 주택을 임차한 후 지방자치단체의 장 또는 그 법인이 선정한 입주자가 그 주택을 인도받고 주민등록을 마쳤을\n때에는 제1항을 준용한다. 이 경우 대항력이 인정되는 법인은 대통령령으로 정한다.<개정 2015. 1. 6.>\n③ 「중소기업기본법」 제2조에 따른 중소기업에 해당하는 법인이 소속 직원의 주거용으로 주택을 임차한 후 그 법\n인이 선정한 직원이 해당 주택을 인도받고 주민등록을 마쳤을 때에는 제1항을 준용한다. 임대차가 끝나기 전에 그\n직원이 변경된 경우에는 그 법인이 선정한 새로운 직원이 주택을 인도받고 주민등록을 마친 다음 날부터 제삼자에\n대하여 효력이 생긴다.<신설 2013. 8. 13.


## 3. 도구 호출
### 3-1. 법률 정보 검색 도구, 웹 검색 도구 정의

* ContextualCompressionRetriever는 LangChain에서 제공하는 고급 Retriever로, 기본 검색 결과를 압축하고 필터링하여 더 관련성 높은 정보만을 반환하는 역할을 합니다.
* CrossEncoderReranker는 LangChain의 문서 압축기 중 하나로, **Cross-Encoder 모델을 사용하여 검색된 문서들을 재순위(re-ranking)**하는 역할을 합니다.
* HuggingFaceCrossEncoder는 LangChain Community에서 제공하는 클래스로, HuggingFace의 Cross-Encoder 모델을 LangChain 생태계에서 사용할 수 있도록 래핑한 컴포넌트입니다.


In [20]:

from langchain_community.vectorstores import FAISS
#from langchain_ollama import OllamaEmbeddings
from langchain_core.documents import Document

from langchain.retrievers import ContextualCompressionRetriever
from langchain.retrievers.document_compressors import CrossEncoderReranker
from langchain_community.cross_encoders import HuggingFaceCrossEncoder
from langchain_community.retrievers import TavilySearchAPIRetriever
#from langchain_core.tools import tool
from langchain.agents import tool

from langchain_upstage import UpstageEmbeddings

from typing import List

# 문서 임베딩 모델
#embeddings_model = OllamaEmbeddings(model="bge-m3") 
embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")

# Re-rank 모델
rerank_model = HuggingFaceCrossEncoder(model_name="BAAI/bge-reranker-v2-m3")
cross_reranker = CrossEncoderReranker(model=rerank_model, top_n=2)

# 개인정보보호법 검색 
personal_db = FAISS.load_local(
    "../db/legal_db/personal_law",
    embeddings_model,
    allow_dangerous_deserialization=True
)

personal_db_retriever = ContextualCompressionRetriever(
    base_compressor=cross_reranker, 
    base_retriever=personal_db.as_retriever(search_kwargs={"k":5}),
)

@tool
def personal_law_search(query: str) -> List[Document]:
    """개인정보보호법 법률 조항을 검색합니다."""
    docs = personal_db_retriever.invoke(query)

    if len(docs) > 0:
        return docs
    
    return [Document(page_content="관련 정보를 찾을 수 없습니다.")]


# 근로기준법 검색 
labor_db = FAISS.load_local(
    "../db/legal_db/labor_law",
    embeddings_model,
    allow_dangerous_deserialization=True
)

labor_db_retriever = ContextualCompressionRetriever(
    base_compressor=cross_reranker, 
    base_retriever=labor_db.as_retriever(search_kwargs={"k":5}),
)

@tool
def labor_law_search(query: str) -> List[Document]:
    """근로기준법 법률 조항을 검색합니다."""
    docs = labor_db_retriever.invoke(query)

    if len(docs) > 0:
        return docs
    
    return [Document(page_content="관련 정보를 찾을 수 없습니다.")]


# 주택임대차보호법 검색 
housing_db = FAISS.load_local(
    "../db/legal_db/housing_law",
    embeddings_model,
    allow_dangerous_deserialization=True
)

housing_db_retriever = ContextualCompressionRetriever(
    base_compressor=cross_reranker, 
    base_retriever=housing_db.as_retriever(search_kwargs={"k":5}),
)

@tool
def housing_law_search(query: str) -> List[Document]:
    """주택임대차보호법 법률 조항을 검색합니다."""
    docs = housing_db_retriever.invoke(query)

    if len(docs) > 0:
        return docs
    
    return [Document(page_content="관련 정보를 찾을 수 없습니다.")]


# 웹 검색
web_retriever = ContextualCompressionRetriever(
    base_compressor=cross_reranker, 
    base_retriever=TavilySearchAPIRetriever(k=10),
)

@tool
def web_search(query: str) -> List[str]:
    """데이터베이스에 없는 정보 또는 최신 정보를 웹에서 검색합니다."""
    docs = web_retriever.invoke(query)

    formatted_docs = []
    for doc in docs:
        formatted_docs.append(
            Document(
                page_content= f'<Document href="{doc.metadata["source"]}"/>\n{doc.page_content}\n</Document>',
                metadata={"source": "web search", "url": doc.metadata["source"]}
            )
        )

    if len(formatted_docs) > 0:
        return formatted_docs
    
    return [Document(page_content="관련 정보를 찾을 수 없습니다.")]


# 도구 목록을 정의 
tools = [personal_law_search, labor_law_search, housing_law_search, web_search]


In [21]:
### 3-2. LLM 모델

from langchain_openai import ChatOpenAI
# 기본 LLM
#llm = ChatOpenAI(model="gpt-4o-mini", temperature=0, streaming=True)

from langchain_upstage import ChatUpstage

llm = ChatUpstage(
        model="solar-pro",
        base_url="https://api.upstage.ai/v1",
        temperature=0.5
    )
print(llm.model_name)

# LLM에 도구 바인딩하여 추가 
llm_with_tools = llm.bind_tools(tools)


# 근로기준법과 관련된 질문을 하는 경우 -> 근로기준법 검색 도구를 호출  
query = "연차휴가 부여 기준에 대해서 설명해주세요."
ai_msg = llm_with_tools.invoke(query)

pprint(ai_msg)
print("-" * 100)

pprint(ai_msg.content)
print("-" * 100)

pprint(ai_msg.tool_calls)
print("-" * 100)


# 도구들의 목적과 관련 없는 질문을 하는 경우 -> 도구 호출 없이 그대로 답변을 생성 
query = "안녕하세요?"
ai_msg = llm_with_tools.invoke(query)

pprint(ai_msg)
print("-" * 100)

pprint(ai_msg.content)
print("-" * 100)

pprint(ai_msg.tool_calls)
print("-" * 100)

solar-pro
AIMessage(content='연차휴가 부여 기준은 근로기준법에 규정되어 있습니다. 해당 법률 조항을 정확히 확인하기 위해 `labor_law_search` 함수를 호출하는 것이 가장 직접적이고 신뢰할 수 있는 방법입니다. 일반적인 기준으로는 다음과 같은 사항이 포함되지만, 법적 효력이 있는 답변을 위해 반드시 공식 조항을 참조해야 합니다:\n\n1. **근속 기간**: 1년 미만 근무 시 월 1일 부여 (근속 1개월 완료 시)  \n2. **1년 이상 근무 시**: 15일 연차 부여 (단, 출근률에 따라 변동 가능)  \n3. **연장 근무자**: 2년차부터 매 2년마다 1일 추가 (최대 25일)  \n\n정확한 법률 조항을 확인하기 위해 함수를 호출하겠습니다.\n\n[근로기준법 제60조(연차 유급휴가) 및 관련 조항을 직접 검색하여 정확한 법적 근거를 제공하기 위해 필수적입니다. 일반 지식만으로는 최신 개정법이나 세부 조건을 반영할 수 없으므로, 공식 법률 검색이 반드시 필요합니다.]', additional_kwargs={'tool_calls': [{'id': 'chatcmpl-tool-0a437e2198604e5884a99a95d0194f5d', 'function': {'arguments': '{"query": "\\uc5f0\\ucc28\\ud734\\uac00 \\ubd80\\uc5ec \\uae30\\uc900"}', 'name': 'labor_law_search'}, 'type': 'function'}], 'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 212, 'prompt_tokens': 678, 'total_tokens': 890, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_pr

In [22]:
# 벡터 검색과 웹 검색이 모두 필요한 경우 
query = "연차휴가 부여 기준에 대해서 설명해주세요. 2023년 연차휴가 사용 비율은 어느 정도인가요?"
ai_msg = llm_with_tools.invoke(query)

pprint(ai_msg)
print("-" * 100)

pprint(ai_msg.content)
print("-" * 100)

pprint(ai_msg.tool_calls)
print("-" * 100)

AIMessage(content='[첫 번째 함수(`labor_law_search`)는 근로기준법상 연차휴가 부여 기준을 확인하는 데 필수적입니다. 두 번째 함수(`web_search`)는 2023년 연차휴가 사용 비율과 같은 최신 통계를 제공하기 위해 필요합니다. 일반 지식으로는 정확한 수치나 법적 조항을 제시할 수 없으므로, 두 함수 모두 질문에 직접적으로 답변하는 데 필수적입니다.]  \n\n### 연차휴가 부여 기준 (근로기준법)  \n- **1년 미만 근무자**: 월 1일 부여 (근속 1개월 경과 시)  \n- **1년 이상 근무자**: 15일 부여 (연간 80% 이상 출근 시)  \n- **3년 이상 근무자**: 2년마다 1일 추가 (최대 25일)  \n\n### 2023년 연차휴가 사용 비율  \n웹 검색을 통해 최신 통계를 확인한 결과, 2023년 한국의 연차휴가 평균 사용률은 약 **60~70%**로 나타났습니다. 산업별·규모별로 차이가 있으며, 중소기업은 대기업에 비해 사용률이 낮은 경향이 있습니다. (정확한 수치는 검색 결과에 따라 달라질 수 있음)', additional_kwargs={'tool_calls': [{'id': 'chatcmpl-tool-93f021477f4240adbef62d0e33a7bc4b', 'function': {'arguments': '{"query": "\\uc5f0\\ucc28\\ud734\\uac00 \\ubd80\\uc5ec \\uae30\\uc900"}', 'name': 'labor_law_search'}, 'type': 'function'}, {'id': 'chatcmpl-tool-cf336d181cc844eb9ee1c19671827e87', 'function': {'arguments': '{"query": "2023\\ub144 \\uc5f0\\ucc28\\ud734\\uac00 \\uc0ac\\uc6a9 \\ube44\\uc728"}', 'name': 'web_search'}, 'type': 'func

In [38]:

# 벡터 검색과 웹 검색이 모두 필요한 경우 
#query = "임대차계약 확정일자 부여는 무엇인가요?"
query = "전월세 직거래 시에 유의사항은 무엇인가요?"
ai_msg = llm_with_tools.invoke(query)

pprint(ai_msg)
print("-" * 100)

pprint(ai_msg.content)
print("-" * 100)

pprint(ai_msg.tool_calls)
print("-" * 100)


AIMessage(content='전월세 직거래 시 유의사항을 법률 조항과 실무적 측면에서 종합적으로 안내드리겠습니다. 다음 3가지 필수 기능 호출을 통해 핵심 정보를 제공드립니다:\n\n[주택임대차보호법의 핵심 조항(계약갱신청구권, 확정일자, 전월세 상한제)과 최신 사기 예방 정보를 종합적으로 제공하기 위해 필수 호출]\n\n1. **법적 필수 확인사항** (주택임대차보호법):\n   - 제3조: 최소 2년 계약 보장 및 계약갱신청구권\n   - 제6조: 전입신고+확정일자 부여로 우선변제권 확보\n   - 제10조: 전월세 상한제 적용 지역 여부 확인\n\n2. **권리보호 장치** (근로기준법 연계):\n   - 제8조: 보증금 반환채무 이행을 위한 근저당권 설정 가능성 검토\n\n3. **실무적 주의사항** (웹검색 기반 최신 정보):\n   - 2024년 부동산중개업협회 발표 직거래 사기 유형 5가지\n   - 등기부등본 확인 시 주의할 특수권리기록 사항\n   - 계약서 필수 기재사항(관리비 분담, 하자보수 책임 등)\n\n※ 반드시 확인해야 할 서류: 등기부등본(갑구/을구), 건축물대장, 임대인 신분증 대조, 대리인 계약시 위임장 확인', additional_kwargs={'tool_calls': [{'id': 'chatcmpl-tool-2a18c7429bfd409e95698c904703514a', 'function': {'arguments': '{"query": "\\uc8fc\\ud0dd\\uc784\\ub300\\ucc28\\ubcf4\\ud638\\ubc95 \\uc81c3\\uc870, \\uc81c6\\uc870, \\uc81c10\\uc870"}', 'name': 'housing_law_search'}, 'type': 'function'}, {'id': 'chatcmpl-tool-6d103c4d37334a018a7af27090bf4dd2', 'function': {'arguments': '{"query": "\\uc8fc\\ud0dd\\

## 4. Agent RAG 구현

### 4-1. 각 법률에 특화된 RAG 에이전트를 구현
### 검색된 문서의 관련성 등을 평가하여 질문 재작성 및 다시 검색 (Corrective RAG 적용)

#### (1) 개인정보보호법 검색 에이전트


In [39]:
from pydantic import BaseModel, Field
from typing import List, TypedDict, Annotated, Optional
from operator import add
from langchain_core.documents import Document

class CorrectiveRagState(TypedDict):
    question: str                 # 사용자의 질문
    generation: str               # LLM 생성 답변
    documents: List[Document]     # 컨텍스트 문서 (검색된 문서)
    num_generations: int          # 질문 or 답변 생성 횟수 (무한 루프 방지에 활용)

class InformationStrip(BaseModel):
    """추출된 정보에 대한 내용과 출처, 관련성 점수"""
    content: str = Field(..., description="추출된 정보 내용")
    source: str = Field(..., description="정보의 출처(법률 조항 또는 URL 등). 예시: 환경법 제22조 3항 or 블로그 환경법 개정 (https://blog.com/page/123)")
    relevance_score: float = Field(..., ge=0, le=1, description="관련성 점수 (0에서 1 사이)")
    faithfulness_score: float = Field(..., ge=0, le=1, description="충실성 점수 (0에서 1 사이)")

class ExtractedInformation(BaseModel):
    strips: List[InformationStrip] = Field(..., description="추출된 정보 조각들")
    query_relevance: float = Field(..., ge=0, le=1, description="질의에 대한 전반전인 답변 가능성 점수 (0에서 1 사이)")

class RefinedQuestion(BaseModel):
    """개선된 질문과 이유"""
    question_refined : str = Field(..., description="개선된 질문")
    reason : str = Field(..., description="이유")

# 개인정보보호법
class PersonalRagState(CorrectiveRagState):
    rewritten_query: str   # 재작성한 질문 
    extracted_info: Optional[ExtractedInformation]   # 추출된 정보 조각 
    node_answer: Optional[str]


In [41]:
from langchain_core.prompts import ChatPromptTemplate
from typing import Literal

def retrieve_documents(state: PersonalRagState) -> PersonalRagState:
    print("---문서 검색---")
    query = state.get("rewritten_query", state["question"])
    docs = personal_law_search.invoke(query)
    return {"documents": docs}

def extract_and_evaluate_information(state: PersonalRagState) -> PersonalRagState:
    print("---정보 추출 및 평가---")
    extracted_strips = []

    for doc in state["documents"]:
        extract_prompt = ChatPromptTemplate.from_messages([
            ("system", """당신은 개인정보보호법 전문가입니다. 주어진 문서에서 질문과 관련된 주요 사실과 정보를 3~5개 정도 추출하세요. 
            각 추출된 정보에 대해 다음 두 가지 측면을 0에서 1 사이의 점수로 평가하세요:
            1. 질문과의 관련성
            2. 답변의 충실성 (질문에 대한 완전하고 정확한 답변을 제공할 수 있는 정도)
            
            추출 형식:
            1. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            2. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            ...
            
            마지막으로, 추출된 정보를 종합하여 질문에 대한 전반적인 답변 가능성을 0에서 1 사이의 점수로 평가하세요."""),
            ("human", "[질문]\n{question}\n\n[문서 내용]\n{document_content}")
        ])

        extract_llm = llm.with_structured_output(ExtractedInformation)

        extracted_data = extract_llm.invoke(extract_prompt.format(
            question=state["question"],
            document_content=doc.page_content
        ))

        if extracted_data.query_relevance < 0.8:
            continue

        for strip in extracted_data.strips:
            if strip.relevance_score > 0.7 and strip.faithfulness_score > 0.7:
                extracted_strips.append(strip)

    return {
        "extracted_info": extracted_strips,
        "num_generations": state.get("num_generations", 0) + 1
    }

def rewrite_query(state: PersonalRagState) -> PersonalRagState:
    print("---쿼리 재작성---")

    rewrite_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 개인정보보호법 전문가입니다. 주어진 원래 질문과 추출된 정보를 바탕으로, 더 관련성 있고 충실한 정보를 찾기 위해 검색 쿼리를 개선해주세요.

        다음 사항을 고려하여 검색 쿼리를 개선하세요:
        1. 원래 질문의 핵심 요소
        2. 추출된 정보의 관련성 점수
        3. 추출된 정보의 충실성 점수
        4. 부족한 정보나 더 자세히 알아야 할 부분

        개선된 검색 쿼리 작성 단계:
        1. 2-3개의 검색 쿼리를 제안하세요.
        2. 각 쿼리는 구체적이고 간결해야 합니다(5-10 단어 사이).
        3. 개인정보보호법과 관련된 전문 용어를 적절히 활용하세요.
        4. 각 쿼리 뒤에는 해당 쿼리를 제안한 이유를 간단히 설명하세요.

        출력 형식:
        1. [개선된 검색 쿼리 1]
        - 이유: [이 쿼리를 제안한 이유 설명]
        2. [개선된 검색 쿼리 2]
        - 이유: [이 쿼리를 제안한 이유 설명]
        3. [개선된 검색 쿼리 3]
        - 이유: [이 쿼리를 제안한 이유 설명]

        마지막으로, 제안된 쿼리 중 가장 효과적일 것 같은 쿼리를 선택하고 그 이유를 설명하세요."""),
        ("human", "원래 질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 개선된 검색 쿼리를 작성해주세요.")
    ])

    extracted_info_str = "\n".join([strip.content for strip in state["extracted_info"]])
    
    rewrite_llm = llm.with_structured_output(RefinedQuestion)

    response = rewrite_llm.invoke(rewrite_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))
    
    return {"rewritten_query": response.question_refined}

def generate_node_answer(state: PersonalRagState) -> PersonalRagState:
    print("---답변 생성---")

    answer_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 개인정보보호법 전문가입니다. 주어진 질문과 추출된 정보를 바탕으로 답변을 생성해주세요. 
        답변은 마크다운 형식으로 작성하며, 각 정보의 출처를 명확히 표시해야 합니다. 
        답변 구조:
        1. 질문에 대한 직접적인 답변
        2. 관련 법률 조항 및 해석
        3. 추가 설명 또는 예시 (필요한 경우)
        4. 결론 및 요약
        각 섹션에서 사용된 정보의 출처를 괄호 안에 명시하세요. 예: (출처: 개인정보 보호법 제15조)"""),
        ("human", "질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 최종 답변을 작성해주세요.")
    ])

    extracted_info_str = "\n".join([f"내용: {strip.content}\n출처: {strip.source}\n관련성: {strip.relevance_score}\n충실성: {strip.faithfulness_score}" for strip in state["extracted_info"]])

    node_answer = llm.invoke(answer_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))

    return {"node_answer": node_answer.content}

def should_continue(state: PersonalRagState) -> Literal["계속", "종료"]:
    if state["num_generations"] >= 2:
        return "종료"
    if len(state["extracted_info"]) >= 1:
        return "종료"
    return "계속"

In [42]:
from langgraph.graph import StateGraph, START, END
from IPython.display import Image, display

# 그래프 생성
workflow = StateGraph(PersonalRagState)

# 노드 추가
workflow.add_node("retrieve", retrieve_documents)
workflow.add_node("extract_and_evaluate", extract_and_evaluate_information)
workflow.add_node("rewrite_query", rewrite_query)
workflow.add_node("generate_answer", generate_node_answer)


# 엣지 추가
workflow.add_edge(START, "retrieve")
workflow.add_edge("retrieve", "extract_and_evaluate")

# 조건부 엣지 추가
workflow.add_conditional_edges(
    "extract_and_evaluate",
    should_continue,
    {
        "계속": "rewrite_query",
        "종료": "generate_answer"
    }
)
workflow.add_edge("rewrite_query", "retrieve")
workflow.add_edge("generate_answer", END)

# 그래프 컴파일
personal_law_agent = workflow.compile()

# 그래프 시각화
#display(Image(personal_law_agent.get_graph().draw_mermaid_png()))

In [28]:
mermaid_code = personal_law_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	retrieve(retrieve)
	extract_and_evaluate(extract_and_evaluate)
	rewrite_query(rewrite_query)
	generate_answer(generate_answer)
	__end__([<p>__end__</p>]):::last
	__start__ --> retrieve;
	extract_and_evaluate -. &nbsp;종료&nbsp; .-> generate_answer;
	extract_and_evaluate -. &nbsp;계속&nbsp; .-> rewrite_query;
	retrieve --> extract_and_evaluate;
	rewrite_query --> retrieve;
	generate_answer --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqNkUFOwzAQRa9iBQklEgmlCxZOlVWP0F2LLCcZJ5asNDiTlgqxA1ZwCTgCt4IeAsdpoiYtEivP2H--3nw_Osk6BYc6meZlThbzcFWskLEKuTaHu5yVUd_NrsvozqOUCqkrbIQaUEvYgNsVXnMLD6h5gowXKYMNVzVHcM9deq3HVksEdl-D3rmDzr5nUIA2YjNZbUG7o95rgcHYdri27mEVb1n7NYjvR6QDDv8CJn5ALou4KsP9x8vP51tbk8DMjgj-YfH99bx_fT-yGKwZHkdp6c65hSdhnS4yIrOCQx72PTFhVHMQJAXBa4VESKXohZiKiRBXShbg5yCzHOlNMB0M2C-3cn9d8kTijk4Ggibmg10s4luROE-_kUDjew)

In [None]:
inputs = {"question": "개인정보 처리에 대한 동의를 받을 때 주의해야 할 점은 무엇인가요?"}
for output in personal_law_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node = '{key}':")
        pprint(f"Value = {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

---문서 검색---
"Node 'retrieve':"
("Value: {'documents': [Document(id='0a70319a-b684-4e0a-9f13-bb82efeb283d', "
 "metadata={'source': '../data/legal/개인정보 보호법(법률)(제19234호)(20240315).pdf', "
 "'chapter': '제3장 개인정보의 처리\\n         제1절 개인정보의 수집, 이용, 제공 등', 'name': '개인정보 "
 "보호법'}, page_content='[법률정보]\\n다음 조항은 개인정보 보호법 제3장 개인정보의 처리\\n         제1절 "
 '개인정보의 수집, 이용, 제공 등에서 발췌한 내용입니다.\\n\\n[법률조항]\\n제22조(동의를 받는 방법) ① 개인정보처리자는 이 '
 '법에 따른 개인정보의 처리에 대하여 정보주체(제22조의2제1항에\\n따른 법정대리인을 포함한다. 이하 이 조에서 같다)의 동의를 받을 '
 '때에는 각각의 동의 사항을 구분하여 정보주체가\\n이를 명확하게 인지할 수 있도록 알리고 동의를 받아야 한다. 이 경우 다음 각 호의 '
 '경우에는 동의 사항을 구분하여\\n각각 동의를 받아야 한다. <개정 2017. 4. 18., 2023. 3. 14.>\\n1. '
 '제15조제1항제1호에 따라 동의를 받는 경우\\n2. 제17조제1항제1호에 따라 동의를 받는 경우\\n3. 제18조제2항제1호에 따라 '
 '동의를 받는 경우\\n4. 제19조제1호에 따라 동의를 받는 경우\\n5. 제23조제1항제1호에 따라 동의를 받는 경우\\n6. '
 '제24조제1항제1호에 따라 동의를 받는 경우\\n7. 재화나 서비스를 홍보하거나 판매를 권유하기 위하여 개인정보의 처리에 대한 동의를 '
 '받으려는 경우\\n8. 그 밖에 정보주체를 보호하기 위하여 동의 사항을 구분하여 동의를 받아야 할 필요가 있는 경우로서 대통령령으\\n로 '
 '정하는 경우 \\n② 개인정보처리자는 제1항의 동의

In [44]:
print(value['node_answer'])

### 1. 질문에 대한 직접적인 답변  
개인정보 처리 동의를 받을 때는 다음 사항을 준수해야 합니다:  
- **동의 사항 구분 및 명확한 고지**: 정보주체가 각 동의 항목을 명확히 인지할 수 있도록 구분하여 알려야 합니다(제22조 ①항).  
- **별도 동의 필수 항목**: 홍보·판매 권유 등 8가지 특정 사항은 반드시 별도 동의를 받아야 합니다(제22조 ①항).  
- **서면 동의 시 요건**: 전자문서를 포함한 서면 동의 시 수집·이용 목적 및 항목을 명시해야 합니다(제22조 ②항).  
- **선택적 동의 거부 권리 보장**: 선택적 동의 사항 거부 시 서비스 제공을 거부해서는 안 됩니다(제22조 ⑤항).  
- **제3자 제공 시 필수 고지 사항**: 제공받는 자, 이용 목적, 항목, 보유 기간, 동의 거부 권리 및 불이익 등을 알려야 합니다(제17조 ②항).  

(출처: 개인정보 보호법 제15조, 제17조, 제22조)

---

### 2. 관련 법률 조항 및 해석  
#### 가. 동의 사항의 구분 및 고지 의무  
- **제22조 ①항**: 동의 사항을 구분해 정보주체가 명확히 인지할 수 있도록 고지해야 합니다. 예를 들어, 필수 동의와 선택적 동의를 별도로 표기해야 합니다.  
- **제22조 ②항**: 서면(전자문서 포함) 동의 시 수집·이용 목적 및 항목을 명확히 표시해야 합니다. 예: 체크박스 분리 또는 별도 페이지 구성.  

#### 나. 별도 동의가 필요한 사항  
- **제22조 ①항**: 홍보·마케팅, 제3자 제공 등 8가지 특정 사항은 별도 동의가 필수입니다.  
- **제17조 ②항**: 제3자 제공 시 다음 사항을 반드시 고지해야 합니다:  
  - 제공받는 자(제17조 ②항 1호)  
  - 이용 목적(제17조 ②항 2호)  
  - 제공 항목(제17조 ②항 3호)  
  - 보유 및 이용 기간(제17조 ②항 4호)  
  - 동의 거부 권리 및 불이익(제17조 ②항 5호)  

#### 다. 선택적 동의 거부 

`(2) 근로기준법 RAG 에이전트`

In [45]:
# 근로기준법
class LaborRagState(CorrectiveRagState):
    rewritten_query: str   # 재작성한 질문 
    extracted_info: Optional[ExtractedInformation]   # 추출된 정보 조각 
    node_answer: Optional[str]

In [46]:
from langchain_core.prompts import ChatPromptTemplate
from typing import Literal

def retrieve_documents(state: LaborRagState) -> LaborRagState:
    print("---문서 검색---")
    query = state.get("rewritten_query", state["question"])
    docs = labor_law_search.invoke(query)
    return {"documents": docs}

def extract_and_evaluate_information(state: LaborRagState) -> LaborRagState:
    print("---정보 추출 및 평가---")
    extracted_strips = []

    for doc in state["documents"]:
        extract_prompt = ChatPromptTemplate.from_messages([
            ("system", """당신은 근로기준법 전문가입니다. 주어진 문서에서 질문과 관련된 주요 사실과 정보를 3~5개 정도 추출하세요. 
            각 추출된 정보에 대해 다음 두 가지 측면을 0에서 1 사이의 점수로 평가하세요:
            1. 질문과의 관련성
            2. 답변의 충실성 (질문에 대한 완전하고 정확한 답변을 제공할 수 있는 정도)
            
            추출 형식:
            1. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            2. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            ...
            
            마지막으로, 추출된 정보를 종합하여 질문에 대한 전반적인 답변 가능성을 0에서 1 사이의 점수로 평가하세요."""),
            ("human", "[질문]\n{question}\n\n[문서 내용]\n{document_content}")
        ])

        extract_llm = llm.with_structured_output(ExtractedInformation)

        extracted_data = extract_llm.invoke(extract_prompt.format(
            question=state["question"],
            document_content=doc.page_content
        ))

        if extracted_data.query_relevance < 0.8:
            continue

        for strip in extracted_data.strips:
            if strip.relevance_score > 0.7 and strip.faithfulness_score > 0.7:
                extracted_strips.append(strip)

    return {
        "extracted_info": extracted_strips,
        "num_generations": state.get("num_generations", 0) + 1
    }

def rewrite_query(state: LaborRagState) -> LaborRagState:
    print("---쿼리 재작성---")

    rewrite_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 근로기준법 전문가입니다. 주어진 원래 질문과 추출된 정보를 바탕으로, 더 관련성 있고 충실한 정보를 찾기 위해 검색 쿼리를 개선해주세요.

        다음 사항을 고려하여 검색 쿼리를 개선하세요:
        1. 원래 질문의 핵심 요소
        2. 추출된 정보의 관련성 점수
        3. 추출된 정보의 충실성 점수
        4. 부족한 정보나 더 자세히 알아야 할 부분

        개선된 검색 쿼리 작성 단계:
        1. 2-3개의 검색 쿼리를 제안하세요.
        2. 각 쿼리는 구체적이고 간결해야 합니다(5-10 단어 사이).
        3. 근로기준법과 관련된 전문 용어를 적절히 활용하세요.
        4. 각 쿼리 뒤에는 해당 쿼리를 제안한 이유를 간단히 설명하세요.

        출력 형식:
        1. [개선된 검색 쿼리 1]
        - 이유: [이 쿼리를 제안한 이유 설명]
        2. [개선된 검색 쿼리 2]
        - 이유: [이 쿼리를 제안한 이유 설명]
        3. [개선된 검색 쿼리 3]
        - 이유: [이 쿼리를 제안한 이유 설명]

        마지막으로, 제안된 쿼리 중 가장 효과적일 것 같은 쿼리를 선택하고 그 이유를 설명하세요."""),
        ("human", "원래 질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 개선된 검색 쿼리를 작성해주세요.")
    ])

    extracted_info_str = "\n".join([strip.content for strip in state["extracted_info"]])
    
    rewrite_llm = llm.with_structured_output(RefinedQuestion)

    response = rewrite_llm.invoke(rewrite_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))
    
    return {"rewritten_query": response.question_refined}

def generate_node_answer(state: LaborRagState) -> LaborRagState:
    print("---답변 생성---")

    answer_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 근로기준법 전문가입니다. 주어진 질문과 추출된 정보를 바탕으로 답변을 생성해주세요. 
        답변은 마크다운 형식으로 작성하며, 각 정보의 출처를 명확히 표시해야 합니다. 
        답변 구조:
        1. 질문에 대한 직접적인 답변
        2. 관련 법률 조항 및 해석
        3. 추가 설명 또는 예시 (필요한 경우)
        4. 결론 및 요약
        각 섹션에서 사용된 정보의 출처를 괄호 안에 명시하세요. 예: (출처: 근로기준법 제15조)"""),
        ("human", "질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 최종 답변을 작성해주세요.")
    ])

    extracted_info_str = "\n".join([f"내용: {strip.content}\n출처: {strip.source}\n관련성: {strip.relevance_score}\n충실성: {strip.faithfulness_score}" for strip in state["extracted_info"]])

    node_answer = llm.invoke(answer_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))

    return {"node_answer": node_answer.content}

def should_continue(state: LaborRagState) -> Literal["계속", "종료"]:
    if state["num_generations"] >= 2:
        return "종료"
    if len(state["extracted_info"]) >= 1:
        return "종료"
    return "계속"

In [47]:
from langgraph.graph import StateGraph, START, END
from IPython.display import Image, display

# 그래프 생성
workflow = StateGraph(LaborRagState)

# 노드 추가
workflow.add_node("retrieve", retrieve_documents)
workflow.add_node("extract_and_evaluate", extract_and_evaluate_information)
workflow.add_node("rewrite_query", rewrite_query)
workflow.add_node("generate_answer", generate_node_answer)


# 엣지 추가
workflow.add_edge(START, "retrieve")
workflow.add_edge("retrieve", "extract_and_evaluate")

# 조건부 엣지 추가
workflow.add_conditional_edges(
    "extract_and_evaluate",
    should_continue,
    {
        "계속": "rewrite_query",
        "종료": "generate_answer"
    }
)
workflow.add_edge("rewrite_query", "retrieve")
workflow.add_edge("generate_answer", END)

# 그래프 컴파일
labor_law_agent = workflow.compile()

# 그래프 시각화
#display(Image(labor_law_agent.get_graph().draw_mermaid_png()))

In [34]:
mermaid_code = labor_law_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	retrieve(retrieve)
	extract_and_evaluate(extract_and_evaluate)
	rewrite_query(rewrite_query)
	generate_answer(generate_answer)
	__end__([<p>__end__</p>]):::last
	__start__ --> retrieve;
	extract_and_evaluate -. &nbsp;종료&nbsp; .-> generate_answer;
	extract_and_evaluate -. &nbsp;계속&nbsp; .-> rewrite_query;
	retrieve --> extract_and_evaluate;
	rewrite_query --> retrieve;
	generate_answer --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqNkUFOwzAQRa9iBQklEgmlCxZOlVWP0F2LLCcZJ5asNDiTlgqxA1ZwCTgCt4IeAsdpoiYtEivP2H--3nw_Osk6BYc6meZlThbzcFWskLEKuTaHu5yVUd_NrsvozqOUCqkrbIQaUEvYgNsVXnMLD6h5gowXKYMNVzVHcM9deq3HVksEdl-D3rmDzr5nUIA2YjNZbUG7o95rgcHYdri27mEVb1n7NYjvR6QDDv8CJn5ALou4KsP9x8vP51tbk8DMjgj-YfH99bx_fT-yGKwZHkdp6c65hSdhnS4yIrOCQx72PTFhVHMQJAXBa4VESKXohZiKiRBXShbg5yCzHOlNMB0M2C-3cn9d8kTijk4Ggibmg10s4luROE-_kUDjew)

In [48]:
inputs = {"question": "근로계약 체결할 때 주의해야 할 점은 무엇인가요?"}
for output in labor_law_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

---문서 검색---
"Node 'retrieve':"
("Value: {'documents': [Document(id='7f120996-5dff-4abe-b4f8-0f8851dde66a', "
 "metadata={'source': '../data/legal/근로기준법(법률)(제18176호)(20211119).pdf', "
 "'chapter': '제5장 여성과 소년', 'name': '근로기준법'}, page_content='[법률정보]\\n다음 조항은 "
 '근로기준법 제5장 여성과 소년에서 발췌한 내용입니다.\\n\\n[법률조항]\\n제67조(근로계약) ① 친권자나 후견인은 미성년자의 '
 '근로계약을 대리할 수 없다.\\n② 친권자, 후견인 또는 고용노동부장관은 근로계약이 미성년자에게 불리하다고 인정하는 경우에는 이를 해지할 '
 '수\\n있다.<개정 2010. 6. 4.>\\n③ 사용자는 18세 미만인 사람과 근로계약을 체결하는 경우에는 제17조에 따른 근로조건을 '
 '서면(「전자문서 및 전\\n자거래 기본법」 제2조제1호에 따른 전자문서를 포함한다)으로 명시하여 교부하여야 한다.<신설 2007. 7. '
 "27., 2020.\\n5. 26., 2021. 1. 5.>'), "
 "Document(id='00201e92-a631-4aa3-a0e6-0762b9992757', metadata={'source': "
 "'../data/legal/근로기준법(법률)(제18176호)(20211119).pdf', 'chapter': '제1장 총칙', "
 "'name': '근로기준법'}, page_content='[법률정보]\\n다음 조항은 근로기준법 제1장 총칙에서 발췌한 "
 '내용입니다.\\n\\n[법률조항]\\n제2조(정의) ① 이 법에서 사용하는 용어의 뜻은 다음과 같다. <개정 2018. 3. 20., '
 '2019. 1. 15., 2020. 5. 26.>\\n1. “근로자”란 직업의 종류와 관계없이 임금을 목적으로 사업이나 사업장에 근로를 '


In [49]:
print(type(value))
print(value)
print('====================><=======================')
print(value['node_answer'])

<class 'dict'>
{'node_answer': '### 1. 질문에 대한 직접적인 답변  \n근로계약 체결 시 주의해야 할 주요 사항은 다음과 같습니다:  \n- **미성년자 보호**: 친권자/후견인의 대리 계약 금지 및 불리한 계약 해지 권한 확인(근로기준법 제67조).  \n- **서면 명시 의무**: 18세 미만 근로자와 계약 시 근로조건을 서면(전자문서 포함)으로 교부(근로기준법 제67조 ③항).  \n- **근로계약 정의 준수**: "근로자"와 "사용자"의 법적 정의를 명확히 하고, 임금 지급 방식 및 근로조건(근로시간, 평균임금 등)을 계약서에 반영(근로기준법 제2조).  \n\n---\n\n### 2. 관련 법률 조항 및 해석  \n- **미성년자 근로계약의 제한**  \n  - 친권자나 후견인은 미성년자의 근로계약을 대리할 수 없으며, 계약이 미성년자에게 불리할 경우 친권자/후견인 또는 고용노동부장관이 해지할 수 있습니다(근로기준법 제67조 ①·②항).  \n- **서면 명시 의무**  \n  - 18세 미만 근로자와 계약 시 근로조건을 서면으로 명시·교부해야 합니다. 전자문서도 포함됩니다(근로기준법 제67조 ③항).  \n- **근로계약의 기본 요건**  \n  - 근로계약은 근로자의 근로 제공과 사용자의 임금 지급을 목적으로 하며(근로기준법 제2조 제4호), "근로자"는 직업의 종류와 관계없이 임금을 목적으로 사업이나 사업장에 근로를 제공하는 자로 정의됩니다(근로기준법 제2조 제1호).  \n  - "사용자"는 사업주 또는 사업 경영 담당자로, 근로자와의 관계에서 지휘·감독 권한을 가진 자를 의미합니다(근로기준법 제2조 제2호).  \n- **임금 및 근로조건 명시**  \n  - 임금은 근로의 대가로 지급되는 모든 금품을 포함하며, 지급 방식과 산정 기준을 계약서에 명시해야 합니다(근로기준법 제2조 제5호).  \n  - 소정근로시간(제2조 제6호), 평균임금(제2조 제8호), 단시간근로자 정의(제2조 제9호) 등 핵심 개념을 반영

`(3) 주택임대차보호법 RAG 에이전트`

In [50]:
# 주택임대차보호법
class HousingRagState(CorrectiveRagState):
    rewritten_query: str   # 재작성한 질문 
    extracted_info: Optional[ExtractedInformation]   # 추출된 정보 조각 
    node_answer: Optional[str] 

In [51]:
from langchain_core.prompts import ChatPromptTemplate
from typing import Literal

def retrieve_documents(state: HousingRagState) -> HousingRagState:
    print("---문서 검색---")
    query = state.get("rewritten_query", state["question"])
    docs = housing_law_search.invoke(query)
    return {"documents": docs}

def extract_and_evaluate_information(state: HousingRagState) -> HousingRagState:
    print("---정보 추출 및 평가---")
    extracted_strips = []

    for doc in state["documents"]:
        extract_prompt = ChatPromptTemplate.from_messages([
            ("system", """당신은 주택임대차보호법 전문가입니다. 주어진 문서에서 질문과 관련된 주요 사실과 정보를 3~5개 정도 추출하세요. 
            각 추출된 정보에 대해 다음 두 가지 측면을 0에서 1 사이의 점수로 평가하세요:
            1. 질문과의 관련성
            2. 답변의 충실성 (질문에 대한 완전하고 정확한 답변을 제공할 수 있는 정도)
            
            추출 형식:
            1. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            2. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            ...
            
            마지막으로, 추출된 정보를 종합하여 질문에 대한 전반적인 답변 가능성을 0에서 1 사이의 점수로 평가하세요."""),
            ("human", "[질문]\n{question}\n\n[문서 내용]\n{document_content}")
        ])

        extract_llm = llm.with_structured_output(ExtractedInformation)

        extracted_data = extract_llm.invoke(extract_prompt.format(
            question=state["question"],
            document_content=doc.page_content
        ))

        if extracted_data.query_relevance < 0.8:
            continue

        for strip in extracted_data.strips:
            if strip.relevance_score > 0.7 and strip.faithfulness_score > 0.7:
                extracted_strips.append(strip)

    return {
        "extracted_info": extracted_strips,
        "num_generations": state.get("num_generations", 0) + 1
    }

def rewrite_query(state: HousingRagState) -> HousingRagState:
    print("---쿼리 재작성---")

    rewrite_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 주택임대차보호법 전문가입니다. 주어진 원래 질문과 추출된 정보를 바탕으로, 더 관련성 있고 충실한 정보를 찾기 위해 검색 쿼리를 개선해주세요.

        다음 사항을 고려하여 검색 쿼리를 개선하세요:
        1. 원래 질문의 핵심 요소
        2. 추출된 정보의 관련성 점수
        3. 추출된 정보의 충실성 점수
        4. 부족한 정보나 더 자세히 알아야 할 부분

        개선된 검색 쿼리 작성 단계:
        1. 2-3개의 검색 쿼리를 제안하세요.
        2. 각 쿼리는 구체적이고 간결해야 합니다(5-10 단어 사이).
        3. 주택임대차보호법과 관련된 전문 용어를 적절히 활용하세요.
        4. 각 쿼리 뒤에는 해당 쿼리를 제안한 이유를 간단히 설명하세요.

        출력 형식:
        1. [개선된 검색 쿼리 1]
        - 이유: [이 쿼리를 제안한 이유 설명]
        2. [개선된 검색 쿼리 2]
        - 이유: [이 쿼리를 제안한 이유 설명]
        3. [개선된 검색 쿼리 3]
        - 이유: [이 쿼리를 제안한 이유 설명]

        마지막으로, 제안된 쿼리 중 가장 효과적일 것 같은 쿼리를 선택하고 그 이유를 설명하세요."""),
        ("human", "원래 질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 개선된 검색 쿼리를 작성해주세요.")
    ])

    extracted_info_str = "\n".join([strip.content for strip in state["extracted_info"]])
    
    rewrite_llm = llm.with_structured_output(RefinedQuestion)

    response = rewrite_llm.invoke(rewrite_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))
    
    return {"rewritten_query": response.question_refined}

def generate_node_answer(state: HousingRagState) -> HousingRagState:
    print("---답변 생성---")

    answer_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 주택임대차보호법 전문가입니다. 주어진 질문과 추출된 정보를 바탕으로 답변을 생성해주세요. 
        답변은 마크다운 형식으로 작성하며, 각 정보의 출처를 명확히 표시해야 합니다. 
        답변 구조:
        1. 질문에 대한 직접적인 답변
        2. 관련 법률 조항 및 해석
        3. 추가 설명 또는 예시 (필요한 경우)
        4. 결론 및 요약
        각 섹션에서 사용된 정보의 출처를 괄호 안에 명시하세요. 예: (출처: 주택임대차보호법 제15조)"""),
        ("human", "질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 최종 답변을 작성해주세요.")
    ])

    extracted_info_str = "\n".join([f"내용: {strip.content}\n출처: {strip.source}\n관련성: {strip.relevance_score}\n충실성: {strip.faithfulness_score}" for strip in state["extracted_info"]])

    node_answer = llm.invoke(answer_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))

    return {"node_answer": node_answer.content}

def should_continue(state: HousingRagState) -> Literal["계속", "종료"]:
    if state["num_generations"] >= 2:
        return "종료"
    if len(state["extracted_info"]) >= 1:
        return "종료"
    return "계속"

In [52]:
from langgraph.graph import StateGraph, START, END
from IPython.display import Image, display

# 그래프 생성
workflow = StateGraph(HousingRagState)

# 노드 추가
workflow.add_node("retrieve", retrieve_documents)
workflow.add_node("extract_and_evaluate", extract_and_evaluate_information)
workflow.add_node("rewrite_query", rewrite_query)
workflow.add_node("generate_answer", generate_node_answer)


# 엣지 추가
workflow.add_edge(START, "retrieve")
workflow.add_edge("retrieve", "extract_and_evaluate")

# 조건부 엣지 추가
workflow.add_conditional_edges(
    "extract_and_evaluate",
    should_continue,
    {
        "계속": "rewrite_query",
        "종료": "generate_answer"
    }
)
workflow.add_edge("rewrite_query", "retrieve")
workflow.add_edge("generate_answer", END)

# 그래프 컴파일
housing_law_agent = workflow.compile()

# 그래프 시각화
#display(Image(housing_law_agent.get_graph().draw_mermaid_png()))

In [53]:
mermaid_code = housing_law_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	retrieve(retrieve)
	extract_and_evaluate(extract_and_evaluate)
	rewrite_query(rewrite_query)
	generate_answer(generate_answer)
	__end__([<p>__end__</p>]):::last
	__start__ --> retrieve;
	extract_and_evaluate -. &nbsp;종료&nbsp; .-> generate_answer;
	extract_and_evaluate -. &nbsp;계속&nbsp; .-> rewrite_query;
	retrieve --> extract_and_evaluate;
	rewrite_query --> retrieve;
	generate_answer --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqNkUFOwzAQRa9iBQklEgmlCxZOlVWP0F2LLCcZJ5asNDiTlgqxA1ZwCTgCt4IeAsdpoiYtEivP2H--3nw_Osk6BYc6meZlThbzcFWskLEKuTaHu5yVUd_NrsvozqOUCqkrbIQaUEvYgNsVXnMLD6h5gowXKYMNVzVHcM9deq3HVksEdl-D3rmDzr5nUIA2YjNZbUG7o95rgcHYdri27mEVb1n7NYjvR6QDDv8CJn5ALou4KsP9x8vP51tbk8DMjgj-YfH99bx_fT-yGKwZHkdp6c65hSdhnS4yIrOCQx72PTFhVHMQJAXBa4VESKXohZiKiRBXShbg5yCzHOlNMB0M2C-3cn9d8kTijk4Ggibmg10s4luROE-_kUDjew)

In [54]:
inputs = {"question": "대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?"}
for output in housing_law_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

---문서 검색---
"Node 'retrieve':"
("Value: {'documents': [Document(id='87f44ba0-a79d-4956-aaaa-af2b3999a872', "
 "metadata={'source': '../data/legal/주택임대차보호법(법률)(제19356호)(20230719).pdf', "
 "'name': '주택임대차보호법'}, page_content='[법률정보]\\n다음 조항은 주택임대차보호법에서 발췌한 "
 '내용입니다.\\n\\n[법률조항]\\n제3조의7(임대인의 정보 제시 의무) 임대차계약을 체결할 때 임대인은 다음 각 호의 사항을 '
 '임차인에게 제시하여야 한\\n다.\\n1. 제3조의6제3항에 따른 해당 주택의 확정일자 부여일, 차임 및 보증금 등 정보. 다만, '
 '임대인이 임대차계약을 체결\\n하기 전에 제3조의6제4항에 따라 동의함으로써 이를 갈음할 수 있다. \\n2. 「국세징수법」 제108조에 '
 '따른 납세증명서 및 「지방세징수법」 제5조제2항에 따른 납세증명서. 다만, 임대인이 임\\n대차계약을 체결하기 전에 「국세징수법」 '
 '제109조제1항에 따른 미납국세와 체납액의 열람 및 「지방세징수법」 제 \\n6조제1항에 따른 미납지방세의 열람에 각각 동의함으로써 이를 '
 "갈음할 수 있다. \\n[본조신설 2023. 4. 18.]'), "
 "Document(id='c2a79905-c645-4ab8-8bf4-4990f515b064', metadata={'source': "
 "'../data/legal/주택임대차보호법(법률)(제19356호)(20230719).pdf', 'name': '주택임대차보호법'}, "
 "page_content='[법률정보]\\n다음 조항은 주택임대차보호법에서 발췌한 내용입니다.\\n\\n[법률조항]\\n제6조의3(계약갱신 "
 '요구 등) ① 제6조에도 불구하고 임대인은 임차인이 제6조제1항 전단의 기간 이내에 계약갱신을 요\\n구할 경우 정당한 사유 없이 '


In [55]:
print(value['node_answer'])

### 1. 질문에 대한 직접적인 답변  
대리인과 아파트 임대차 계약을 체결할 때는 **대리인의 권한 확인**이 가장 중요합니다.  
- 임대인은 대리인에게 계약 체결 권한을 명시적으로 부여했는지 확인해야 하며, **위임장**과 **인감증명서** 등을 요구해야 합니다.  
- 또한, 주택임대차보호법에 따라 임대인은 계약 시 **확정일자 부여일, 보증금·차임 정보** 또는 **제3자의 동의서**를 제시해야 합니다(제3조의7 제1항).  
- 추가로 **국세·지방세 납세증명서** 또는 **미납세금 열람 동의서**를 받아야 합니다(제3조의7 제2항).  

(출처: 주택임대차보호법 제3조의7 1항, 2항)

---

### 2. 관련 법률 조항 및 해석  
- **제3조의7 제1항**: 임대인은 계약 체결 시 확정일자 부여일, 차임·보증금 등을 명시한 서면 정보를 임차인에게 제공해야 합니다. 다만, 임차인이 제3자(예: 배우자, 직계가족)의 동의를 받은 경우 이를 생략할 수 있습니다.  
  → 대리인이 계약을 체결할 때도 동일한 정보가 필요합니다. 대리인의 권한 증명과 함께 위 정보를 반드시 확인해야 합니다.  
- **제3조의7 제2항**: 임대인은 국세·지방세 체납 여부를 증명하는 서류를 제시해야 하며, 임차인의 동의로 미납세금 열람이 가능합니다.  
  → 대리인을 통해 계약할 경우, 임대인의 세금 체납 여부도 확인해야 임차보증금의 안전성을 보장할 수 있습니다.  

---

### 3. 추가 설명 또는 예시  
- **대리인 권한 확인 방법**:  
  - 위임장에 임대인의 인감도장이 찍혀 있고, 인감증명서와 일치하는지 확인합니다.  
  - 임대인이 직접 전화로 권한을 확인하는 것이 가장 안전합니다.  
- **계약서 작성 시 주의사항**:  
  - 계약서에 대리인의 성명·주소·연락처를 기재하고, "대리인 ○○○"으로 명시합니다.  
  - 임대인의 실소유 여부를 등기부등본으로 추가 확인합니다.  
- **예시**:  
  > "임대인 김○○의 대리인

`(4) 웹 검색 기반 RAG 에이전트`

In [56]:
# 웹 검색 도구 
class SearchRagState(CorrectiveRagState):
    rewritten_query: str   # 재작성한 질문 
    extracted_info: Optional[ExtractedInformation]   # 추출된 정보 조각 
    node_answer: Optional[str] 

In [57]:
from langchain_core.prompts import ChatPromptTemplate
from typing import Literal

def retrieve_documents(state: SearchRagState) -> SearchRagState:
    print("---문서 검색---")
    query = state.get("rewritten_query", state["question"])
    docs = web_search.invoke(query)
    return {"documents": docs}

def extract_and_evaluate_information(state: SearchRagState) -> SearchRagState:
    print("---정보 추출 및 평가---")
    extracted_strips = []

    for doc in state["documents"]:
        extract_prompt = ChatPromptTemplate.from_messages([
            ("system", """당신은 인터넷 정보 검색 전문가입니다. 주어진 문서에서 질문과 관련된 주요 사실과 정보를 3~5개 정도 추출하세요. 
            각 추출된 정보에 대해 다음 두 가지 측면을 0에서 1 사이의 점수로 평가하세요:
            1. 질문과의 관련성
            2. 답변의 충실성 (질문에 대한 완전하고 정확한 답변을 제공할 수 있는 정도)
            
            추출 형식:
            1. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            2. [추출된 정보]
            - 관련성 점수: [0-1 사이의 점수]
            - 충실성 점수: [0-1 사이의 점수]
            ...
            
            마지막으로, 추출된 정보를 종합하여 질문에 대한 전반적인 답변 가능성을 0에서 1 사이의 점수로 평가하세요."""),
            ("human", "[질문]\n{question}\n\n[문서 내용]\n{document_content}")
        ])

        extract_llm = llm.with_structured_output(ExtractedInformation)

        extracted_data = extract_llm.invoke(extract_prompt.format(
            question=state["question"],
            document_content=doc.page_content
        ))

        if extracted_data.query_relevance < 0.8:
            continue

        for strip in extracted_data.strips:
            if strip.relevance_score > 0.7 and strip.faithfulness_score > 0.7:
                extracted_strips.append(strip)

    return {
        "extracted_info": extracted_strips,
        "num_generations": state.get("num_generations", 0) + 1
    }

def rewrite_query(state: SearchRagState) -> SearchRagState:
    print("---쿼리 재작성---")

    rewrite_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 인터넷 정보 검색 전문가입니다. 주어진 원래 질문과 추출된 정보를 바탕으로, 더 관련성 있고 충실한 정보를 찾기 위해 검색 쿼리를 개선해주세요.

        다음 사항을 고려하여 검색 쿼리를 개선하세요:
        1. 원래 질문의 핵심 요소
        2. 추출된 정보의 관련성 점수
        3. 추출된 정보의 충실성 점수
        4. 부족한 정보나 더 자세히 알아야 할 부분

        개선된 검색 쿼리 작성 단계:
        1. 2-3개의 검색 쿼리를 제안하세요.
        2. 각 쿼리는 구체적이고 간결해야 합니다(5-10 단어 사이).
        3. 질문과 관련된 전문 용어를 적절히 활용하세요.
        4. 각 쿼리 뒤에는 해당 쿼리를 제안한 이유를 간단히 설명하세요.

        출력 형식:
        1. [개선된 검색 쿼리 1]
        - 이유: [이 쿼리를 제안한 이유 설명]
        2. [개선된 검색 쿼리 2]
        - 이유: [이 쿼리를 제안한 이유 설명]
        3. [개선된 검색 쿼리 3]
        - 이유: [이 쿼리를 제안한 이유 설명]

        마지막으로, 제안된 쿼리 중 가장 효과적일 것 같은 쿼리를 선택하고 그 이유를 설명하세요."""),
        ("human", "원래 질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 개선된 검색 쿼리를 작성해주세요.")
    ])

    extracted_info_str = "\n".join([strip.content for strip in state["extracted_info"]])
    
    rewrite_llm = llm.with_structured_output(RefinedQuestion)

    response = rewrite_llm.invoke(rewrite_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))
    
    return {"rewritten_query": response.question_refined}

def generate_node_answer(state: SearchRagState) -> SearchRagState:
    print("---답변 생성---")

    answer_prompt = ChatPromptTemplate.from_messages([
        ("system", """당신은 인터넷 정보 검색 전문가입니다. 주어진 질문과 추출된 정보를 바탕으로 답변을 생성해주세요. 
        답변은 마크다운 형식으로 작성하며, 각 정보의 출처를 명확히 표시해야 합니다. 
        답변 구조:
        1. 질문에 대한 직접적인 답변
        2. 관련 출처 및 링크
        3. 추가 설명 또는 예시 (필요한 경우)
        4. 결론 및 요약
        각 섹션에서 사용된 정보의 출처를 괄호 안에 명시하세요. 예: (출처: 블로그 (www.blog.com/page/001)"""),
        ("human", "질문: {question}\n\n추출된 정보:\n{extracted_info}\n\n위 지침에 따라 최종 답변을 작성해주세요.")
    ])

    extracted_info_str = "\n".join([f"내용: {strip.content}\n출처: {strip.source}\n관련성: {strip.relevance_score}\n충실성: {strip.faithfulness_score}" for strip in state["extracted_info"]])

    node_answer = llm.invoke(answer_prompt.format(
        question=state["question"],
        extracted_info=extracted_info_str
    ))

    return {"node_answer": node_answer.content}

def should_continue(state: SearchRagState) -> Literal["계속", "종료"]:
    if state["num_generations"] >= 2:
        return "종료"
    if len(state["extracted_info"]) >= 1:
        return "종료"
    return "계속"

In [58]:
from langgraph.graph import StateGraph, START, END
from IPython.display import Image, display

# 그래프 생성
workflow = StateGraph(SearchRagState)

# 노드 추가
workflow.add_node("retrieve", retrieve_documents)
workflow.add_node("extract_and_evaluate", extract_and_evaluate_information)
workflow.add_node("rewrite_query", rewrite_query)
workflow.add_node("generate_answer", generate_node_answer)


# 엣지 추가
workflow.add_edge(START, "retrieve")
workflow.add_edge("retrieve", "extract_and_evaluate")

# 조건부 엣지 추가
workflow.add_conditional_edges(
    "extract_and_evaluate",
    should_continue,
    {
        "계속": "rewrite_query",
        "종료": "generate_answer"
    }
)
workflow.add_edge("rewrite_query", "retrieve")
workflow.add_edge("generate_answer", END)

# 그래프 컴파일
search_web_agent = workflow.compile()

# 그래프 시각화
#display(Image(search_web_agent.get_graph().draw_mermaid_png()))

In [59]:
mermaid_code = search_web_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	retrieve(retrieve)
	extract_and_evaluate(extract_and_evaluate)
	rewrite_query(rewrite_query)
	generate_answer(generate_answer)
	__end__([<p>__end__</p>]):::last
	__start__ --> retrieve;
	extract_and_evaluate -. &nbsp;종료&nbsp; .-> generate_answer;
	extract_and_evaluate -. &nbsp;계속&nbsp; .-> rewrite_query;
	retrieve --> extract_and_evaluate;
	rewrite_query --> retrieve;
	generate_answer --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqNkUFOwzAQRa9iBQklEgmlCxZOlVWP0F2LLCcZJ5asNDiTlgqxA1ZwCTgCt4IeAsdpoiYtEivP2H--3nw_Osk6BYc6meZlThbzcFWskLEKuTaHu5yVUd_NrsvozqOUCqkrbIQaUEvYgNsVXnMLD6h5gowXKYMNVzVHcM9deq3HVksEdl-D3rmDzr5nUIA2YjNZbUG7o95rgcHYdri27mEVb1n7NYjvR6QDDv8CJn5ALou4KsP9x8vP51tbk8DMjgj-YfH99bx_fT-yGKwZHkdp6c65hSdhnS4yIrOCQx72PTFhVHMQJAXBa4VESKXohZiKiRBXShbg5yCzHOlNMB0M2C-3cn9d8kTijk4Ggibmg10s4luROE-_kUDjew)

In [60]:
inputs = {"question": "대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?"}
for output in search_web_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

---문서 검색---
"Node 'retrieve':"
("Value: {'documents': [Document(metadata={'source': 'web search', 'url': "
 "'https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA%B3%84%EC%95%BD'}, "
 "page_content='<Document "
 'href="https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA%B3%84%EC%95%BD"/>\\n그러므로, '
 "부동산 계약 시 \\'대리인\\'과 계약을 하게 될 때는 \\'임대인\\', \\'임차인\\' 모두 위에서 설명드린 <위임 "
 "서류(위임장+인감증명서)>를 철저하게 요구\\n</Document>'), Document(metadata={'source': 'web "
 "search', 'url': 'http://lawbom.co.kr/?p=5055'}, page_content='<Document "
 'href="http://lawbom.co.kr/?p=5055"/>\\nSkip to the content Skip to the '
 'Navigation 매매계약이나 전세계약을 체결하는 경우 일반적으로는 소유자(매도자)가 직접 나와 계약서를 작성하지만 상황상 여의치 않아 '
 "대리인을 대신 내보내는 경우가 있다. 이를 현명이라고 하는데 \\'본인을 위한 것\\'임을 표시한다는 의미는 대리행위의 효과가 본인에게 "
 '귀속된다는 것을 의미한다. 하지만 원칙적으로는 대리인은 반드시 권한을 위임받아 행위를 한다는 뜻의 현명을 해야 하고, 상대방은 안전한 '
 '계약 진행을 위해서 대리인이 가져온 위임장, 인감증명서 첨부 등으로 정말 대리권한을 위임받았는지 여부에 대한 확인을 해야 한다. 이처럼 '
 "실질적으로는 \\'절차상 문제\\'만 남아있는 경우에는 아들로 하여금 전세보증금반환채권에 대

In [61]:
print(value['node_answer'])

### 1. 질문에 대한 직접적인 답변  
대리인과 아파트 임대차 계약 체결 시 주의해야 할 점은 다음과 같습니다:  
- **위임 서류(위임장 + 인감증명서) 확인**: 대리인의 권한을 증명하기 위해 반드시 원본 서류를 확인해야 합니다. (출처: [대리인과 계약 시 주의사항](https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA%B3%84%EC%95%BD))  
- **대리인 '현명' 요구**: 대리인은 계약 시 본인 대신 행동한다는 사실을 명시적으로 밝혀야 하며, 상대방은 이를 확인해야 합니다. (출처: [lawbom.co.kr](https://lawbom.co.kr/?p=5055))  
- **특약 조항 추가**: 대리인과 계약 시 문제 발생 시 손해배상 책임을 명시하는 조항을 계약서에 포함하는 것이 안전합니다. (출처: [lawbom.co.kr](https://lawbom.co.kr/?p=5055))  

---

### 2. 관련 출처 및 링크  
1. [대리인과 계약 시 주의사항](https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA%B3%84%EC%95%BD)  
   - 위임 서류 확인 및 임대인과 임차인의 상호 확인 필요성 강조.  
2. [lawbom.co.kr](https://lawbom.co.kr/?p=5055)  
   - 대리인의 '현명' 의무와 특약 조항 추가 권고.  

---

### 3. 추가 설명 또는 예시  
- **위임 서류 확인 방법**:  
  - 위임장에는 임대인의 서명 또는 날인, 인감증명서의 발급일(최근 3개월 이내 권장), 대리인의 신분증 대조가 필요합니다.  
  - 예시: "위임장에 '임대차 계약 체결' 권한이 명시되어 있는지 확인" (출처: [대리인과 계약 시 주의사항](https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA

### 4-2. 질문 라우팅 
- 사용자의 질문을 분석하여 적절한 에이전트를 선택 (Adaptive RAG 적용)

In [62]:
from typing import Annotated
from operator import add

# 메인 그래프 상태 정의
class ResearchAgentState(TypedDict):
    question: str
    answers: Annotated[List[str], add]
    final_answer: str
    datasources: List[str]
    evaluation_report: Optional[dict]
    user_decision: Optional[str]

In [63]:
from typing import Literal
from langchain_core.prompts import ChatPromptTemplate
from pydantic import BaseModel, Field

# 라우팅 결정을 위한 데이터 모델
class ToolSelector(BaseModel):
    """Routes the user question to the most appropriate tool."""
    tool: Literal["search_personal", "search_labor", "search_housing", "search_web"] = Field(
        description="Select one of the tools, based on the user's question.",
    )

class ToolSelectors(BaseModel):
    """Select the appropriate tools that are suitable for the user question."""
    tools: List[ToolSelector] = Field(
        description="Select one or more tools, based on the user's question.",
    )

# 구조화된 출력을 위한 LLM 설정
structured_llm_tool_selector = llm.with_structured_output(ToolSelectors)

# 라우팅을 위한 프롬프트 템플릿
system = dedent("""You are an AI assistant specializing in routing user questions to the appropriate tools.
Use the following guidelines:
- For questions specifically about legal provisions or articles of the privacy protection law (개인정보 보호법), use the search_personal tool.
- For questions specifically about legal provisions or articles of the labor law (근로기준법), use the search_labor tool.
- For questions specifically about legal provisions or articles of the housing law (주택임대차보호법), use the search_housing tool.
- For any other information, including questions related to these laws but not directly about specific legal provisions, or for the most up-to-date data, use the search_web tool.
Always choose all of the appropriate tools based on the user's question. 
If a question is about a law but doesn't seem to be asking about specific legal provisions, include both the relevant law search tool and the search_web tool.""")

route_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system),
        ("human", "{question}"),
    ]
)

# 질문 라우터 정의
question_tool_router = route_prompt | structured_llm_tool_selector

# 테스트 실행
print(question_tool_router.invoke({"question": "근로계약 체결할 때 개인정보 취급 상의 유의사항은 무엇인가요?"}))
print(question_tool_router.invoke({"question": "법에서 정한 연차휴가 기준을 알려주세요."}))
print(question_tool_router.invoke({"question": "개인정보보호법에서 정한 가명정보의 정의는 무엇인가요?"}))

tools=[ToolSelector(tool='search_personal'), ToolSelector(tool='search_labor')]
tools=[ToolSelector(tool='search_labor'), ToolSelector(tool='search_web')]
tools=[ToolSelector(tool='search_personal')]


In [64]:
# 질문 라우팅 노드 
def analyze_question_tool_search(state: ResearchAgentState):
    question = state["question"]
    result = question_tool_router.invoke({"question": question})
    datasources = [tool.tool for tool in result.tools]
    return {"datasources": datasources}


def route_datasources_tool_search(state: ResearchAgentState) -> List[str]:
    datasources = set(state['datasources'])
    valid_sources = {"search_personal", "search_labor", "search_housing", "search_web"}
    
    if datasources.issubset(valid_sources):
        return list(datasources)
    
    return list(valid_sources)

In [65]:
# 노드 정의 
def personal_rag_node(state: PersonalRagState, input=ResearchAgentState) -> ResearchAgentState:
    print("--- 개인정보보호법 전문가 에이전트 시작 ---")
    question = state["question"]
    answer = personal_law_agent.invoke({"question": question})
    return {"answers": [answer["node_answer"]]}

def labor_rag_node(state: LaborRagState, input=ResearchAgentState) -> ResearchAgentState:
    print("--- 근로기준법 전문가 에이전트 시작 ---")
    question = state["question"]
    answer = labor_law_agent.invoke({"question": question})
    return {"answers": [answer["node_answer"]]}

def housing_rag_node(state: HousingRagState, input=ResearchAgentState) -> ResearchAgentState:
    print("--- 주택임대차보호법 전문가 에이전트 시작 ---")
    question = state["question"]
    answer = housing_law_agent.invoke({"question": question})
    return {"answers": [answer["node_answer"]]}

def web_rag_node(state: SearchRagState, input=ResearchAgentState) -> ResearchAgentState:
    print("--- 인터넷 검색 전문가 에이전트 시작 ---")
    question = state["question"]
    answer = search_web_agent.invoke({"question": question})
    return {"answers": [answer["node_answer"]]}


In [66]:
# 최종 답변 생성 노드
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import ChatPromptTemplate

# RAG 프롬프트 정의
rag_prompt = ChatPromptTemplate.from_messages([
    ("system", """You are an assistant answering questions based on provided documents. Follow these guidelines:

1. Use only information from the given documents.
2. If the document lacks relevant info, say "제공된 정보로는 충분한 답변을 할 수 없습니다."
3. Cite the source of information for each sentence in your answer. Use the following format:
    - For legal articles: "법률명 제X조 Y항"
    - For web sources: "출처 제목 (URL)"
4. Don't speculate or add information not in the documents.
5. Keep answers concise and clear.
6. Omit irrelevant information.
7. If multiple sources provide the same information, cite all relevant sources.
8. If information comes from multiple sources, combine them coherently while citing each source.

Example of citation usage:
"부동산 거래 시 계약서에 거래 금액을 명시해야 합니다 (부동산 거래신고 등에 관한 법률 제3조 1항). 또한, 계약 체결일로부터 30일 이내에 신고해야 합니다 (부동산 거래 신고 안내 블로그, https://example.com/realestate)."
"""
    ),
    ("human", "Answer the following question using these documents:\n\n[Documents]\n{documents}\n\n[Question]\n{question}"),
])

def answer_final(state: ResearchAgentState) -> ResearchAgentState:
    """
    Generate answer using the retrieved_documents
    """
    print("---최종 답변---")
    question = state["question"]
    documents = state.get("answers", [])
    if not isinstance(documents, list):
        documents = [documents]

    # 문서 내용을 문자열로 결합 
    documents_text = "\n\n".join(documents)

    # RAG generation
    rag_chain = rag_prompt | llm | StrOutputParser()
    generation = rag_chain.invoke({"documents": documents_text, "question": question})
    return {"final_answer": generation, "question":question}


# LLM Fallback 프롬프트 정의
fallback_prompt = ChatPromptTemplate.from_messages([
    ("system", """You are an AI assistant helping with various topics. Follow these guidelines:

1. Provide accurate and helpful information to the best of your ability.
2. Express uncertainty when unsure; avoid speculation.
3. Keep answers concise yet informative.
4. Respond ethically and constructively.
5. Mention reliable general sources when applicable."""),
    ("human", "{question}"),
])

def llm_fallback(state: ResearchAgentState) -> ResearchAgentState:
    """
    Generate answer using the LLM without context
    """
    print("---Fallback 답변---")
    question = state["question"]
    
    # LLM chain
    llm_chain = fallback_prompt | llm | StrOutputParser()
    
    generation = llm_chain.invoke({"question": question})
    return {"final_answer": generation, "question":question}

In [67]:
# 노드 정의를 딕셔너리로 관리
nodes = {
    "analyze_question": analyze_question_tool_search,
    "search_personal": personal_rag_node,
    "search_labor": labor_rag_node,
    "search_housing": housing_rag_node,
    "search_web": web_rag_node,
    "generate_answer": answer_final,
    "llm_fallback": llm_fallback
}

# 그래프 생성을 위한 StateGraph 객체를 정의
search_builder = StateGraph(ResearchAgentState)

# 노드 추가
for node_name, node_func in nodes.items():
    search_builder.add_node(node_name, node_func)

# 엣지 추가 (병렬 처리)
search_builder.add_edge(START, "analyze_question")
search_builder.add_conditional_edges(
    "analyze_question",
    route_datasources_tool_search,
    ["search_personal", "search_labor", "search_housing", "search_web", "llm_fallback"]
)

# 검색 노드들을 generate_answer에 연결
for node in ["search_personal", "search_labor", "search_housing", "search_web"]:
    search_builder.add_edge(node, "generate_answer")

search_builder.add_edge("generate_answer", END)
search_builder.add_edge("llm_fallback", END)

# 그래프 컴파일
rag_search_graph = search_builder.compile()

# 그래프 시각화 
#display(Image(rag_search_graph.get_graph().draw_mermaid_png()))

In [68]:
mermaid_code = rag_search_graph.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	analyze_question(analyze_question)
	search_personal(search_personal)
	search_labor(search_labor)
	search_housing(search_housing)
	search_web(search_web)
	generate_answer(generate_answer)
	llm_fallback(llm_fallback)
	__end__([<p>__end__</p>]):::last
	__start__ --> analyze_question;
	analyze_question -.-> llm_fallback;
	analyze_question -.-> search_housing;
	analyze_question -.-> search_labor;
	analyze_question -.-> search_personal;
	analyze_question -.-> search_web;
	search_housing --> generate_answer;
	search_labor --> generate_answer;
	search_personal --> generate_answer;
	search_web --> generate_answer;
	generate_answer --> __end__;
	llm_fallback --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqFksFOhDAQhl-lwUtJBNc9eCgbTvsI3lzTDDCFxlqwLdmsxncXui4W1OXU_szXwnzDR1S2FUYsqg10DXncZwd9cJxbB2ZY6NOuy6e0u-vy55gxJqSxbgRBgzq9I3_r0TrZarp8EI-URTBlwzs0th3qdJFDRkHRGhqGsNq0vZW6pvMYEkcs6M_WV2rUaMAhB22PaOgie0apVy5AqQLKFxqG-KwDdTXJ8PtJhYKziUkSSZKcLDVkf8kiSTqg4duuYPOW10Hvbh27zGCdHHRmv0fhu10YzZbzXIMuH_EPl6bpCJeDartHQSoU0CtHhFSK3Yit2Ahxq6TGpEFZN47dp9vZAf-7ejxpOyilO7HNDBiH-H1dIYoHUUafXz5nKWI)

In [69]:
inputs = {"question": "대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?"}
for output in rag_search_graph.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

"Node 'analyze_question':"
"Value: {'datasources': ['search_housing', 'search_web']}"

----------------------------------------------------------

--- 주택임대차보호법 전문가 에이전트 시작 ---
---문서 검색---
--- 인터넷 검색 전문가 에이전트 시작 ---
---문서 검색---
---정보 추출 및 평가---
---정보 추출 및 평가---
---답변 생성---
---답변 생성---
"Node 'search_housing':"
("Value: {'answers': ['### 1. 질문에 대한 직접적인 답변  \\n대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 "
 '점은 다음과 같습니다:  \\n- **임대인의 대리권 확인**: 대리인의 신분증과 위임장(공정증서 또는 인감증명서 첨부)을 반드시 '
 '확인해야 합니다.  \\n- **임대인의 정보 제시 요구**: 대리인을 통해 계약 시, 임대인은 **확정일자 부여일, 차임·보증금 '
 '정보**(제3조의7 1항) 및 **국세·지방세 납세증명서**(제3조의7 2항)를 제시해야 합니다. 단, 임대인의 사전 동의로 대체 '
 '가능합니다.  \\n- **서면 계약 필수**: 모든 조건을 명시한 서면 계약서를 작성하고, 대리인과 임대인 모두의 서명을 받아야 '
 '합니다.  \\n\\n> (출처: 주택임대차보호법 제3조의7 1항, 2항 및 일반적 계약 관행)  \\n\\n---\\n\\n### 2. '
 '관련 법률 조항 및 해석  \\n- **제3조의7(임대인의 정보 제공 의무) 1항**:  \\n  > "임대인은 임대차계약 체결 시 '
 '확정일자 부여일, 차임 및 보증금 등을 임차인에게 서면으로 제시해야 합니다. 단, 임대인의 사전 동의로 정보 제공이 생략될 수 '
 '있습니다."  \\n  → 대리인과 계약 시, 임대인이 대리인에게 정보 제공 권한을 위임했는지 확인해야 합니다.  \

In [70]:
print(value['final_answer'])

대리인과 아파트 임대차 계약 체결 시 주의해야 할 점은 다음과 같습니다:  

1. **대리권 확인**:  
   - 대리인의 신분증과 위임장(공정증서 또는 인감증명서 첨부)을 반드시 확인해야 합니다 (주택임대차보호법 제3조의7 1항, 2항 및 일반적 계약 관행).  
   - 위임장에는 **"임대차 계약 체결 및 정보 제공 권한"**이 명시되어 있어야 합니다 (출처: [대리인과 계약 시 위임 서류 요구](https://geteng.tistory.com/entry/%EB%8C%80%EB%A6%AC%EC%9D%B8-%EA%B3%84%EC%95%BD)).  

2. **임대인의 정보 제공 의무 확인**:  
   - 대리인을 통해 계약 시, 임대인은 **확정일자 부여일, 차임·보증금 정보**(주택임대차보호법 제3조의7 1항) 및 **국세·지방세 납세증명서**(동법 제3조의7 2항)를 제시해야 합니다. 단, 임대인의 사전 동의로 대체 가능합니다.  
   - 납세증명서 제시가 어려운 경우, 임대인의 동의를 받아 국세청 홈택스 또는 지방세 포털에서 직접 미납세액을 확인할 수 있습니다 (출처: 주택임대차보호법 제3조의7 2항).  

3. **서면 계약 및 서명**:  
   - 모든 조건을 명시한 서면 계약서를 작성하고, 대리인과 임대인 모두의 서명을 받아야 합니다 (주택임대차보호법 제3조의7 1항 및 일반적 계약 관행).  
   - 계약서에 대리인이 "OOO의 대리인 XXX로서 계약한다"는 **현명(顯名)**을 명시해야 합니다 (출처: [lawbom.co.kr](https://lawbom.co.kr/?p=5055)).  

4. **손해배상 특약 추가**:  
   - 계약서에 대리인이 전세보증금 반환 문제 또는 계약 불이행 시 발생할 수 있는 **이사비용·복비 등 손해배상 책임**을 명시하는 것이 좋습니다 (출처: [lawbom.co.kr](https://lawbom.co.kr/?p=5055)).  

5. **추가 확인 사항**:  
   - 인감증명서는 위임

## 5. 답변 평가 및 확인
### 5-1. 답변을 평가하는 ReAct 에이전트

In [71]:
from textwrap import dedent

evaluation_prompt = dedent("""
당신은 AI 어시스턴트가 생성한 답변을 평가하는 전문가입니다. 주어진 질문과 답변을 평가하고, 60점 만점으로 점수를 매기세요. 다음 기준을 사용하여 평가하십시오:

1. 정확성 (10점)
2. 관련성 (10점)
3. 완전성 (10점)
4. 인용 정확성 (10점)
5. 명확성과 간결성 (10점)
6. 객관성 (10점)

평가 과정:
1. 주어진 질문과 답변을 주의 깊게 읽으십시오.
2. 필요한 경우, 다음 도구를 사용하여 추가 정보를 수집하세요:
   - web_search: 웹 검색
   - personal_law_search: 개인정보보호법 검색
   - labor_law_search: 근로기준법 검색
   - housing_law_search: 주택임대차보호법 검색

   도구 사용 형식:
   Action: [tool_name]
   Action Input: [input for the tool]

3. 각 기준에 대해 1-10점 사이의 점수를 매기세요.
4. 총점을 계산하세요 (60점 만점).

출력 형식:
{
  "scores": {
    "accuracy": 0,
    "relevance": 0,
    "completeness": 0,
    "citation_accuracy": 0,
    "clarity_conciseness": 0,
    "objectivity": 0
  },
  "total_score": 0,
  "brief_evaluation": "간단한 평가 설명"
}

최종 출력에는 각 기준의 점수, 총점, 그리고 간단한 평가 설명만 포함하세요.
""")

In [72]:
tools

[StructuredTool(name='personal_law_search', description='개인정보보호법 법률 조항을 검색합니다.', args_schema=<class 'langchain_core.utils.pydantic.personal_law_search'>, func=<function personal_law_search at 0x00000120A72DDA80>),
 StructuredTool(name='labor_law_search', description='근로기준법 법률 조항을 검색합니다.', args_schema=<class 'langchain_core.utils.pydantic.labor_law_search'>, func=<function labor_law_search at 0x00000120A5F83060>),
 StructuredTool(name='housing_law_search', description='주택임대차보호법 법률 조항을 검색합니다.', args_schema=<class 'langchain_core.utils.pydantic.housing_law_search'>, func=<function housing_law_search at 0x00000120FB74A840>),
 StructuredTool(name='web_search', description='데이터베이스에 없는 정보 또는 최신 정보를 웹에서 검색합니다.', args_schema=<class 'langchain_core.utils.pydantic.web_search'>, func=<function web_search at 0x00000120FB74A2A0>)]

In [73]:
from langgraph.prebuilt import create_react_agent
from IPython.display import Image, display

# 그래프 생성 
answer_reviewer = create_react_agent(
    llm, 
    tools=tools, 
    #state_modifier=evaluation_prompt,
    )

answer_reviewer = create_react_agent(llm, tools)

# 그래프 출력
#display(Image(answer_reviewer.get_graph().draw_mermaid_png()))

In [74]:
mermaid_code = answer_reviewer.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	agent(agent)
	tools(tools)
	__end__([<p>__end__</p>]):::last
	__start__ --> agent;
	agent -.-> __end__;
	agent -.-> tools;
	tools --> agent;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef first fill-opacity:0
	classDef last fill:#bfb6fc



* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqNkUFOwzAQRa9iBQklEgmlCxZOlVWP0F2LLCcZJ5asNDiTlgqxA1ZwCTgCt4IeAsdpoiYtEivP2H--3nw_Osk6BYc6meZlThbzcFWskLEKuTaHu5yVUd_NrsvozqOUCqkrbIQaUEvYgNsVXnMLD6h5gowXKYMNVzVHcM9deq3HVksEdl-D3rmDzr5nUIA2YjNZbUG7o95rgcHYdri27mEVb1n7NYjvR6QDDv8CJn5ALou4KsP9x8vP51tbk8DMjgj-YfH99bx_fT-yGKwZHkdp6c65hSdhnS4yIrOCQx72PTFhVHMQJAXBa4VESKXohZiKiRBXShbg5yCzHOlNMB0M2C-3cn9d8kTijk4Ggibmg10s4luROE-_kUDjew)

In [75]:
# 그래프 실행
from langchain_core.messages import HumanMessage

# messages = [HumanMessage(content=f"""[질문]\n\{value['question']}n\n[답변]\n{value['final_answer']}""")]
# messages = answer_reviewer.invoke({"messages": messages})
# for m in messages['messages']:
#     m.pretty_print()

# 프롬프트와 내용을 하나의 메시지로 결합
combined_content = f"""{evaluation_prompt}

[질문]
{value['question']}

[답변]
{value['final_answer']}"""

messages = [HumanMessage(content=combined_content)]
result = answer_reviewer.invoke({"messages": messages})

for m in result['messages']:
    m.pretty_print()



당신은 AI 어시스턴트가 생성한 답변을 평가하는 전문가입니다. 주어진 질문과 답변을 평가하고, 60점 만점으로 점수를 매기세요. 다음 기준을 사용하여 평가하십시오:

1. 정확성 (10점)
2. 관련성 (10점)
3. 완전성 (10점)
4. 인용 정확성 (10점)
5. 명확성과 간결성 (10점)
6. 객관성 (10점)

평가 과정:
1. 주어진 질문과 답변을 주의 깊게 읽으십시오.
2. 필요한 경우, 다음 도구를 사용하여 추가 정보를 수집하세요:
   - web_search: 웹 검색
   - personal_law_search: 개인정보보호법 검색
   - labor_law_search: 근로기준법 검색
   - housing_law_search: 주택임대차보호법 검색

   도구 사용 형식:
   Action: [tool_name]
   Action Input: [input for the tool]

3. 각 기준에 대해 1-10점 사이의 점수를 매기세요.
4. 총점을 계산하세요 (60점 만점).

출력 형식:
{
  "scores": {
    "accuracy": 0,
    "relevance": 0,
    "completeness": 0,
    "citation_accuracy": 0,
    "clarity_conciseness": 0,
    "objectivity": 0
  },
  "total_score": 0,
  "brief_evaluation": "간단한 평가 설명"
}

최종 출력에는 각 기준의 점수, 총점, 그리고 간단한 평가 설명만 포함하세요.


[질문]
대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?

[답변]
대리인과 아파트 임대차 계약 체결 시 주의해야 할 점은 다음과 같습니다:  

1. **대리권 확인**:  
   - 대리인의 신분증과 위임장(공정증서 또는 인감증명서 첨부)을 반드시 확인해야 합니다 (주택임대차보호법 제3조의7 1항, 2항 및 일반적 계약 관행).  
   - 위임장에는 *

In [80]:
print(m.content)
#json.loads(m.content)

**최종 평가 결과:**  

```json
{
  "scores": {
    "accuracy": 6,
    "relevance": 9,
    "completeness": 8,
    "citation_accuracy": 5,
    "clarity_conciseness": 9,
    "objectivity": 8
  },
  "total_score": 45,
  "brief_evaluation": "답변은 대리인과 계약 시 필요한 절차를 체계적으로 설명했으나, '주택임대차보호법 제3조의7'이라는 조항은 실제 존재하지 않아 인용 정확성이 크게 감점되었습니다. 외부 출처(블로그)는 실무적 조언을 제공하지만 법적 효력이 없으므로 객관성 점수도 일부 하락했습니다. 나머지 기준(관련성, 완전성, 명확성)은 우수합니다."
}
```

### 상세 평가:
1. **정확성 (6/10)**:  
   - 대리인과 계약 시 필요한 일반적인 절차(위임장 확인, 계약서 작성 등)는 정확하나, **"주택임대차보호법 제3조의7"**은 실제 법률에 존재하지 않는 조항입니다. 이는 법률 검색 결과로 확인되었습니다.  
   - 납세증명서 제시 의무 등 일부 내용은 법률 조항과 직접 연결되지 않습니다.

2. **관련성 (9/10)**:  
   - 대리권 확인, 계약서 작성, 손해배상 특약 등 대리인과 계약 시 핵심 요소를 모두 포함하여 질문과 높은 관련성이 있습니다.

3. **완전성 (8/10)**:  
   - 임대인의 등기부등본 확인, 실제 소유자와의 직접 연락 등 추가 확인 사항이 누락되었으나, 주요 절차는 충분히 다루었습니다.

4. **인용 정확성 (5/10)**:  
   - 존재하지 않는 법률 조항을 반복적으로 인용했으며, 블로그 출처는 법적 근거가 될 수 없어 점수가 크게 하락했습니다.

5. **명확성과 간결성 (9/10)**:  
   - 항목별 설명과 요약이 체계적이며 이해하기 쉽습니다.

6. **객관성 (8/10)**:  
   - 법적 조항 인용 오

### 5-2. 답변 평가 내용을 확인하는 HITL 추가

In [82]:
# 1. JSON 파싱 오류를 처리하는 안전한 함수
import json
import re
from langchain_core.messages import HumanMessage

def safe_json_parse(text):
    """
    AI 응답에서 JSON을 안전하게 추출하는 함수
    """
    try:
        # 1) 직접 JSON 파싱 시도
        return json.loads(text)
    except json.JSONDecodeError:
        try:
            # 2) JSON 블록 찾기 (```json ... ``` 형태)
            json_match = re.search(r'```json\s*(.*?)\s*```', text, re.DOTALL)
            if json_match:
                return json.loads(json_match.group(1))
            
            # 3) { ... } 패턴 찾기
            brace_match = re.search(r'\{.*\}', text, re.DOTALL)
            if brace_match:
                return json.loads(brace_match.group(0))
            
            # 4) 파싱 실패시 기본 구조 반환
            return {
                "accuracy": "파싱 실패",
                "completeness": "파싱 실패", 
                "relevance": "파싱 실패",
                "clarity": "파싱 실패",
                "legal_accuracy": "파싱 실패",
                "overall_score": 0,
                "comments": f"JSON 파싱 실패. 원본 응답: {text[:200]}..."
            }
        except Exception as e:
            return {
                "accuracy": "오류",
                "completeness": "오류",
                "relevance": "오류", 
                "clarity": "오류",
                "legal_accuracy": "오류",
                "overall_score": 0,
                "comments": f"파싱 오류: {str(e)}"
            }

# 2. 개선된 evaluation_prompt (JSON 형식 강조)
evaluation_prompt_improved = """
당신은 법률 상담 답변의 품질을 평가하는 전문가입니다.

다음 기준으로 답변을 평가해주세요:
1. 정확성 (Accuracy): 법률 정보의 정확성
2. 완전성 (Completeness): 질문에 대한 포괄적 답변
3. 관련성 (Relevance): 질문과의 연관성
4. 명확성 (Clarity): 이해하기 쉬운 설명
5. 법적 정확성 (Legal Accuracy): 법조문 인용의 정확성

**중요: 반드시 아래 JSON 형식으로만 응답해주세요:**

```json
{
    "accuracy": "우수/좋음/보통/부족",
    "completeness": "우수/좋음/보통/부족",
    "relevance": "우수/좋음/보통/부족", 
    "clarity": "우수/좋음/보통/부족",
    "legal_accuracy": "우수/좋음/보통/부족",
    "overall_score": 85,
    "comments": "구체적인 평가 의견"
}
```

JSON 형식을 반드시 지켜주세요. 다른 텍스트는 포함하지 마세요.
"""


In [83]:
# 답변 평가하는 노드를 추가
def evaluate_answer_node(state:ResearchAgentState):
    question = state["question"]
    final_answer = state["final_answer"]

    messages = [HumanMessage(content=f"""[질문]\n\{question}n\n[답변]\n{final_answer}""")]
    response = answer_reviewer.invoke({"messages": messages})
    response_content = response['messages'][-1].content

    #response_dict = json.loads(response['messages'][-1].content)
    response_dict = safe_json_parse(response_content)

    return {"evaluation_report": response_dict, "question": question, "final_answer": final_answer}

# HITL 조건부 엣지 정의
def human_review(state: ResearchAgentState):
    print("\n현재 답변:")
    print(state['final_answer'])
    print("\n평가 결과:")
    
    evaluation_report = state['evaluation_report']
    score = evaluation_report.get('overall_score') or evaluation_report.get('total_score', 0)
    print(f"총점: {score}/100")    
    #print(f"총점: {state['evaluation_report']['total_score']}/60")
    #print(state['evaluation_report']['brief_evaluation'])
    print(f"간단 평가: {state['evaluation_report'].get('brief_evaluation', state['evaluation_report'].get('comments', '정보 없음'))}")
    
    user_input = input("\n이 답변을 승인하시겠습니까? (y/n): ").lower()
    
    if user_input == 'y':
        return "approved"
    else:
        return "rejected"

In [84]:
# 노드 정의를 딕셔너리로 관리
nodes = {
    "analyze_question": analyze_question_tool_search,
    "search_personal": personal_rag_node,
    "search_labor": labor_rag_node,
    "search_housing": housing_rag_node,
    "search_web": web_rag_node,
    "generate_answer": answer_final,
    "llm_fallback": llm_fallback,
    "evaluate_answer": evaluate_answer_node, 
}

# 그래프 생성을 위한 StateGraph 객체를 정의
search_builder = StateGraph(ResearchAgentState)

# 노드 추가
for node_name, node_func in nodes.items():
    search_builder.add_node(node_name, node_func)

# 엣지 추가 (병렬 처리)
search_builder.add_edge(START, "analyze_question")
search_builder.add_conditional_edges(
    "analyze_question",
    route_datasources_tool_search,
    ["search_personal", "search_labor", "search_housing", "search_web", "llm_fallback"]
)

# 검색 노드들을 generate_answer에 연결
for node in ["search_personal", "search_labor", "search_housing", "search_web"]:
    search_builder.add_edge(node, "generate_answer")

search_builder.add_edge("generate_answer", "evaluate_answer")

# HITL 결과에 따른 조건부 엣지 추가
search_builder.add_conditional_edges(
    "evaluate_answer",
    human_review,
    {
        "approved": END,
        "rejected": "analyze_question"  # 승인되지 않은 경우 질문 분석 단계로 돌아감
    }
)

search_builder.add_edge("llm_fallback", END)

# 그래프 컴파일
legal_rag_agent = search_builder.compile()

# 그래프 시각화 
#display(Image(legal_rag_agent.get_graph().draw_mermaid_png()))

In [85]:
mermaid_code = legal_rag_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	analyze_question(analyze_question)
	search_personal(search_personal)
	search_labor(search_labor)
	search_housing(search_housing)
	search_web(search_web)
	generate_answer(generate_answer)
	llm_fallback(llm_fallback)
	evaluate_answer(evaluate_answer)
	__end__([<p>__end__</p>]):::last
	__start__ --> analyze_question;
	analyze_question -.-> llm_fallback;
	analyze_question -.-> search_housing;
	analyze_question -.-> search_labor;
	analyze_question -.-> search_personal;
	analyze_question -.-> search_web;
	evaluate_answer -. &nbsp;approved&nbsp; .-> __end__;
	evaluate_answer -. &nbsp;rejected&nbsp; .-> analyze_question;
	generate_answer --> evaluate_answer;
	search_housing --> generate_answer;
	search_labor --> generate_answer;
	search_personal --> generate_answer;
	search_web --> generate_answer;
	llm_fallback --> __end__;
	classDef default fill:#f2f0ff,line-height:1.2
	classDef fir

* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqFktFOwyAUhl-F1MSwxNa5Cy_aZVd7BO-caU7poUUREOiWaXx3W6aVNst2BT_nOyfkg6-E6RqTPGksmJY8bYud2vmydB5sv9DntdmMaX1vNi-LPM-5sM4PICiQx08sPzp0XmhF5weLgXIIlrWlQet0X6ezHDMSKm1pHOJqqzsnVEOnMSYOWNH_bag0qNCCxxKUO6ClsxwYKd9LDlJWwN5oHEIV9yC7aMIsL07KUNWjsLAfdUk42RpFkjTdkLmq4pxQkmY9Gt_oAjbVch0Mfq9jf-90neyVF2eE9Qy5VZUzBRhj9R7rUyJD66-sy30WX5H5Sd8ZfVmWDVNY79ttkZMaOXTSEy6kzG_4ii85v5NCYdqiaFqfP2SrSUP41wFPtQEm_DFfToDhJX_HVbx65Gynku8fu4s4kQ)

In [86]:
inputs = {"question": "대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?"}
for output in legal_rag_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

"Node 'analyze_question':"
"Value: {'datasources': ['search_housing', 'search_web']}"

----------------------------------------------------------

--- 주택임대차보호법 전문가 에이전트 시작 ---
---문서 검색---
--- 인터넷 검색 전문가 에이전트 시작 ---
---문서 검색---
---정보 추출 및 평가---
---정보 추출 및 평가---
---답변 생성---
---답변 생성---
"Node 'search_housing':"
("Value: {'answers': ['### 1. 질문에 대한 직접적인 답변  \\n대리인과 아파트 임대차 계약을 체결할 때는 다음 "
 '사항을 반드시 확인해야 합니다:  \\n- **임대인의 정보 제시 의무 이행 여부** (확정일자, 보증금·차임, 세금 납부 증명 등)  '
 '\\n- **대리인의 권한 증명** (위임장, 인감증명서 등)  \\n- 임대인이 직접 정보를 제공하지 않은 경우, **사전 동의서 또는 '
 '제3조의6제4항에 따른 대체 서류** 확인  \\n\\n(출처: 주택임대차보호법 제3조의7, 해석 및 실무 적용 기준)  '
 '\\n\\n---\\n\\n### 2. 관련 법률 조항 및 해석  \\n- **주택임대차보호법 제3조의7 제1호**: 임대인은 계약 시 '
 '**확정일자 부여일, 차임·보증금** 등을 임차인에게 제시해야 하며, 사전 동의로 대체 가능합니다.  \\n- **주택임대차보호법 '
 '제3조의7 제2호**: 임대인은 **국세·지방세 납세증명서** 또는 미납세금 열람 동의서를 제출해야 합니다.  \\n- **해석 및 실무 '
 '적용 기준**: 대리인과 계약할 경우, 임대인의 정보 제시 의무 이행 여부와 대리인의 **위임장 등 권한 증명 서류**를 추가로 점검해야 '
 '합니다.  \\n\\n---\\n\\n### 3. 추가 설명 또는 예시  \\n- **대리인 권한 증명*

In [87]:
print(value)

{'evaluation_report': {'accuracy': '파싱 실패', 'completeness': '파싱 실패', 'relevance': '파싱 실패', 'clarity': '파싱 실패', 'legal_accuracy': '파싱 실패', 'overall_score': 0, 'comments': 'JSON 파싱 실패. 원본 응답: 대리인과 아파트 임대차 계약 시 주의사항은 다음과 같습니다:  \n\n1. **임대인의 정보 제시 의무 확인**  \n   - 임대인은 확정일자 부여일, 보증금·차임, 국세·지방세 납세증명서 또는 미납세 열람 동의서를 제시해야 합니다(주택임대차보호법 제3조의7 제1호·제2호).  \n   - 동의서 또는 대체 서류로 확인 가능합니다.  \n\n2. **대리인 권한 증...'}, 'question': '대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 무엇인가요?', 'final_answer': '대리인과 아파트 임대차 계약을 체결할 때 주의해야 할 점은 다음과 같습니다:  \n\n1. **임대인의 정보 제시 의무 이행 여부 확인**  \n   - 임대인은 확정일자 부여일, 보증금·차임, 국세·지방세 납세증명서 또는 미납세금 열람 동의서를 제시해야 합니다 (주택임대차보호법 제3조의7 제1호, 제2호).  \n   - 사전 동의서 또는 제3조의6제4항에 따른 대체 서류로 확인 가능합니다 (주택임대차보호법 제3조의7, 해석 및 실무 적용 기준).  \n\n2. **대리인의 권한 증명 서류 확인**  \n   - 위임장과 인감증명서를 통해 대리인의 권한을 검증해야 합니다 (EasyLaw, [http://www.easylaw.go.kr/CSP/CnpClsMainBtr.laf?popMenu=ov&csmSeq=629&ccfNo=2&cciNo=2&cnpClsNo=1](http://www.easylaw.go.kr/CSP/CnpClsMainBtr.laf?popMenu=ov&csmSeq=629&ccfNo=2&cciNo=2&cnpClsNo

In [88]:
inputs = {"question": "개인정보 유출 시 기업이 취해야 할 법적 조치는 무엇인가요?"}
for output in legal_rag_agent.stream(inputs):
    for key, value in output.items():
        # 노드 출력
        pprint(f"Node '{key}':")
        pprint(f"Value: {value}", indent=2, width=80, depth=None)
    print("\n----------------------------------------------------------\n")

"Node 'analyze_question':"
"Value: {'datasources': ['search_personal', 'search_web']}"

----------------------------------------------------------

--- 개인정보보호법 전문가 에이전트 시작 ---
---문서 검색---
--- 인터넷 검색 전문가 에이전트 시작 ---
---문서 검색---
---정보 추출 및 평가---
---정보 추출 및 평가---
---답변 생성---
---답변 생성---
"Node 'search_web':"
("Value: {'answers': ['### 1. 질문에 대한 직접적인 답변  \\n개인정보 유출 시 기업이 취해야 할 법적 조치는 "
 '다음과 같습니다:  \\n- **피해자 및 감독기관 신고**: 유출 발생 시 **72시간 이내**에 피해 당사자(정보주체)와 '
 '개인정보보호위원회 등 감독기관에 신고해야 합니다. (출처: [유튜브 동영상 설명](https://youtu.be/example))  '
 '\\n- **법적 책임 최소화 조치**: 기술적/관리적 보안 강화(예: 암호화, 접근 통제)와 같은 예방 조치를 사전에 이행해야 하며, '
 '사후에도 유출 경로 차단, 피해자 지원 프로그램 마련 등 추가 조치를 수행해야 합니다. (출처: [티스토리 '
 '블로그](https://31aowazo.tistory.com/entry/개인정보-유출-시-기업의-법적-책임-핵심-정리))  \\n- '
 '**손해배상 등 법적 절차 대응**: 민사상 손해배상 청구 또는 행정/형사적 처벌에 대비해 법적 자문을 받고, 필요한 경우 피해자와의 '
 '합의를 진행해야 합니다. (출처: [티스토리 '
 '블로그](https://31aowazo.tistory.com/entry/개인정보-유출-시-기업의-법적-책임-핵심-정리))  '
 '\\n\\n---\\n\\n### 2. 관련 출처 및 링크  \\n- [개인정보 유출 시 기업의 법적 책임

## 6. Gradio 챗봇

In [90]:
from langgraph.checkpoint.memory import MemorySaver

# HITL 노드로 변경 (그라디오에서 입력을 처리)
def human_review(state: ResearchAgentState):
    pass

# 그래프 생성을 위한 StateGraph 객체를 정의
search_builder = StateGraph(ResearchAgentState)

# 노드 추가
nodes = {
    "analyze_question": analyze_question_tool_search,
    "search_personal": personal_rag_node,
    "search_labor": labor_rag_node,
    "search_housing": housing_rag_node,
    "search_web": web_rag_node,
    "generate_answer": answer_final,
    "llm_fallback": llm_fallback,
    "evaluate_answer": evaluate_answer_node, 
    "human_review": human_review,
}

for node_name, node_func in nodes.items():
    search_builder.add_node(node_name, node_func)

# 엣지 추가 (병렬 처리)
search_builder.add_edge(START, "analyze_question")
search_builder.add_conditional_edges(
    "analyze_question",
    route_datasources_tool_search,
    ["search_personal", "search_labor", "search_housing", "search_web", "llm_fallback"]
)

# 검색 노드들을 generate_answer에 연결
for node in ["search_personal", "search_labor", "search_housing", "search_web"]:
    search_builder.add_edge(node, "generate_answer")

search_builder.add_edge("generate_answer", "evaluate_answer")
search_builder.add_edge("evaluate_answer", "human_review")

# HITL 결과에 따른 조건부 엣지 추가
search_builder.add_conditional_edges(
    "human_review",
    lambda x: "approved" if x.get("user_decision") == "approved" else "rejected",
    {
        "approved": END,
        "rejected": "analyze_question"
    }
)

search_builder.add_edge("llm_fallback", END)

# 메모리 추가
memory = MemorySaver()

# 그래프 컴파일 (Breakpoint 설정)
legal_rag_agent = search_builder.compile(checkpointer=memory, interrupt_before=["human_review"])

# 그래프 시각화 
#display(Image(legal_rag_agent.get_graph().draw_mermaid_png()))

In [91]:
mermaid_code = legal_rag_agent.get_graph().draw_mermaid()
print("Mermaid Code:")
print(mermaid_code)

Mermaid Code:
---
config:
  flowchart:
    curve: linear
---
graph TD;
	__start__([<p>__start__</p>]):::first
	analyze_question(analyze_question)
	search_personal(search_personal)
	search_labor(search_labor)
	search_housing(search_housing)
	search_web(search_web)
	generate_answer(generate_answer)
	llm_fallback(llm_fallback)
	evaluate_answer(evaluate_answer)
	human_review(human_review<hr/><small><em>__interrupt = before</em></small>)
	__end__([<p>__end__</p>]):::last
	__start__ --> analyze_question;
	analyze_question -.-> llm_fallback;
	analyze_question -.-> search_housing;
	analyze_question -.-> search_labor;
	analyze_question -.-> search_personal;
	analyze_question -.-> search_web;
	evaluate_answer --> human_review;
	generate_answer --> evaluate_answer;
	human_review -. &nbsp;approved&nbsp; .-> __end__;
	human_review -. &nbsp;rejected&nbsp; .-> analyze_question;
	search_housing --> generate_answer;
	search_labor --> generate_answer;
	search_personal --> generate_answer;
	search_web --

* https://mermaid.live/ 에서  mermain_code 로 직접 확인한다.

* [Graph이미지](https://www.mermaidchart.com/play?utm_source=mermaid_live_editor&utm_medium=share#pako:eNqFktFOgzAUhl-lwZsuEZi78KJDrvYI3jlDDuwUGkvBtmyZxne3dIqFLO6K_pyPk_T7-Yyq7oARi2oNfUOed9u92tuiMBa0e9CXrM-nlKV9_rpijHGhjR1BUCDPH1i8D2is6BRdvliNlEHQVVP0qE3n5nSRQ0ZC2WkahnDadIMRqqbzGBInLOnf0U9qVKjBYgHKnFDTRfaMlG3BQcoSqjcaBj_FI8gh2LDInmmGFlSh8SjwRMOQNTrNM9O6hXmGrbMplEWth96SJ1Ii7zRmqRtk6QVaXRpAdZj8-_NkX8JF_tQLieOcLM1vr_VD4sSh4QX_weaWb4O-rtvYb-23Sdfg9op_f91QsYOSJBnJyrkxO-TkgBwGaQkXUrI7vuFrzu-lUBg3KOrGsodkM_vA_9Iej7seKmHPbD0DRus_60pePvIq-voGSf43ag)


In [92]:
import gradio as gr
import uuid
from typing import List, Tuple
from langgraph.checkpoint.memory import MemorySaver

# 메모리 사용 준비
memory = MemorySaver()
legal_rag_agent = search_builder.compile(checkpointer=memory, interrupt_before=["human_review"])

# 예시 질문들
example_questions = [
    "사업장에서 CCTV를 설치할 때 주의해야 할 법적 사항은 무엇인가요?",
    "전월세 계약 갱신 요구권의 행사 기간과 조건은 어떻게 되나요?",
    "개인정보 유출 시 기업이 취해야 할 법적 조치는 무엇인가요?",
]

# 챗봇 클래스 생성
class ChatBot:
    def __init__(self):
        self.thread_id = str(uuid.uuid4())
        self.user_decision = False

    def process_message(self, message: str) -> str:
        try:
            config = {"configurable": {"thread_id": self.thread_id}}
            
            if not self.user_decision:
                # Breakpoint 까지 먼저 실행
                inputs = {"question": message}
                legal_rag_agent.invoke(inputs, config=config)

                # Breakpoint에서 현재 상태를 출력하고, 사용자의 승인 여부를 입력받음 
                current_state = legal_rag_agent.get_state(config)
                print("Current state:", current_state)
                
                final_answer = current_state.values.get("final_answer", "No answer available")
                evaluation_report = current_state.values.get('evaluation_report', {'total_score': 0, 'brief_evaluation': 'No evaluation available'})
                
                response = f"""현재 답변:
            {final_answer}

            평가 결과:
            총점: {evaluation_report.get('total_score', 0)}/60
            {evaluation_report.get('brief_evaluation', 'No evaluation available')}

            이 답변을 승인하시겠습니까? (y/n): """
                
                # 사용자 승인 여부를 True로 변경 
                self.user_decision = True
                return response
                
            else:
                # 사용자 입력에 따라 다음 경로를 선택
                user_decision = message.lower()
                if user_decision == 'y':
                    self.user_decision = False # 초기화 
                    # 상태 업데이트 - 질문을 수정하여 업데이트
                    legal_rag_agent.update_state(config, {"user_decision": "approved"})
                    # 나머지 작업을 이어서 진행 
                    legal_rag_agent.invoke(None, config=config)
                    # 작업이 종료되고 최종 상태의 메시지를 출력 
                    current_state = legal_rag_agent.get_state(config)
                    print("Final state:", current_state)
                    return current_state.values.get("final_answer", "No final answer available")
                else:
                    self.user_decision = False # 초기화 
                    # 상태 업데이트 - 질문을 수정하여 업데이트
                    legal_rag_agent.update_state(config, {"user_decision": "rejected"})
                    # 나머지 작업을 이어서 진행 
                    legal_rag_agent.invoke(None, config=config)
                    # Breakpoint에서 현재 상태를 출력하고, 사용자의 승인 여부를 입력받음 
                    current_state = legal_rag_agent.get_state(config)
                    print("Revised state:", current_state)
                    
                    final_answer = current_state.values.get("final_answer", "No answer available")
                    evaluation_report = current_state.values.get('evaluation_report', {'total_score': 0, 'brief_evaluation': 'No evaluation available'})
                    
                    response = f"""다시 생성한 답변:
                {final_answer}

                평가 결과:
                총점: {evaluation_report.get('total_score', 0)}/60
                {evaluation_report.get('brief_evaluation', 'No evaluation available')}

                이 답변을 승인하시겠습니까? (y/n): """
                    
                    # 사용자 승인 여부를 True로 변경 
                    self.user_decision = True
                    return response

        except Exception as e:
            print(f"Error occurred: {str(e)}")
            return "죄송합니다. 응답을 생성하는 동안 오류가 발생했습니다. 다시 시도해 주세요."

    def chat(self, message: str, history: List[Tuple[str, str]]) -> str:
        print(f"Thread ID: {self.thread_id}")
        response = self.process_message(message)
        return response

chatbot = ChatBot()

# ChatInterface 생성
demo = gr.ChatInterface(
    fn=chatbot.chat,
    title="생활법률 AI 어시스턴트",
    description="주택임대차보호법, 근로기준법, 개인정보보호법 관련 질문에 답변해 드립니다.",
    examples=example_questions,
    theme=gr.themes.Soft()
)

# Gradio 앱 실행
demo.launch()

* Running on local URL:  http://127.0.0.1:7860
* To create a public link, set `share=True` in `launch()`.




Thread ID: 4cb5a8bc-8da1-4476-8a34-212a92a57456
--- 주택임대차보호법 전문가 에이전트 시작 ---
--- 인터넷 검색 전문가 에이전트 시작 ---
---문서 검색---
---문서 검색---
---정보 추출 및 평가---


In [None]:
demo.close()