In [1]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, WebDriverException


from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import FAISS
from langchain.agents.agent_toolkits import create_retriever_tool
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent
from langchain.chat_models import ChatOpenAI
from langchain.agents.openai_functions_agent.agent_token_buffer_memory import (
    AgentTokenBufferMemory,
)
from langchain.agents.openai_functions_agent.base import OpenAIFunctionsAgent
from langchain.prompts import MessagesPlaceholder
from langchain.schema.messages import SystemMessage
from langchain.agents import AgentExecutor
from langchain.docstore.document import Document
from langchain.document_loaders.base import BaseLoader

from time import sleep
from typing import List, Optional
import time
import requests
import nest_asyncio
import re
import logging

logger = logging.getLogger(__name__)

nest_asyncio.apply()

limited_cdata_texts = None
final_response = None
law_name = None
Answer = None

class wait_for_text_change:
    def __init__(self, locator, expected_text):
        self.locator = locator
        self.expected_text = expected_text

    def __call__(self, driver):
        element_text = driver.find_element(*self.locator).text
        return element_text != self.expected_text


class TextLoader(BaseLoader):
    """Load text data directly.

    Args:
        text_data: String containing the text data.
        source: Optional source information for the text data.
    """

    def __init__(
        self,
        text_data: str,
        source: Optional[str] = None
    ):
        """Initialize with text data."""
        self.text_data = text_data
        self.source = source

    def load(self) -> List[Document]:
        """Load from text data."""
        try:
            text = self.text_data
        except Exception as e:
            raise RuntimeError("Error processing text data") from e

        metadata = {"source": self.source}
        return [Document(page_content=text, metadata=metadata)]

        
# 특수 키워드 변환 규칙

conversion_rules = {
    '사생활': '형법',
    '녹음': '형법',
    '명의 도용' : '전자통신사업법',
    '명의' : '형법',
    '도용' : '형법',
    '임대차' : '주택임대차보호법',
    '사기' : '형법',
    '모욕' : '형법'
    # 다른 규칙들도 추가 가능
}

# 법령 Text 파일 저장 경로
# TextFilePath = '/home/user/exercise_j/AIchatbot-Neoul/law_example_2.txt'

# 질문 입력값
input_data = "신림역 칼부림 사건에서 적용할 수 있는 법은 어떤 게 있을까?"

In [8]:
def generate_law_keyword(input_data, conversion_rules):
    global final_response
    def handle_sensitive_response(response):
        # 모델의 응답이 공백인 경우 민감한 내용으로 간주
        if response.strip().endswith("the most important keyword for a law database would be:"):
            return "죄송하지만, 이 주제에 대해서는 법률적 조언을 제공할 수 없습니다. 전문가의 도움을 받으시길 권장합니다."
        else:
            return response

    # 프롬프트 템플릿 설정
    prompt = ChatPromptTemplate.from_template("Given the input, extract most important one keyword for the law database only in Korean and must be at least two characters long, but not just a single character.. Input: {input}\nKeywords:")

    # 모델 설정
    model = ChatOpenAI(temperature=0, model="gpt-4-1106-preview", openai_api_key="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")

    # 체인 설정: 모델 출력을 키워드로 제한
    chain = prompt | model.bind(stop=["\n"])

    # 체인 실행
    result = chain.invoke({"input": input_data})
    final_response = handle_sensitive_response(result.content)

    for keyword, new_value in conversion_rules.items():
        if keyword in final_response:
            final_response = new_value
    
    for keyword, new_value in conversion_rules.items():
        if '죄' in final_response:
            final_response ='형법'
    
    for keyword, new_value in conversion_rules.items():
        if final_response == '법률' or final_response == '법령' or final_response == '법조문':
            final_response = '형법'

    return final_response


In [3]:

def process_law_info(final_response):
    global limited_cdata_texts
    global law_name
    def extract_cdata(xml_data):
        cdata_sections = re.findall(r'<!\[CDATA\[(.*?)\]\]>', xml_data, re.DOTALL)
        return [cdata.strip() for cdata in cdata_sections]

    def limit_tokens(texts, max_tokens=12000):
        tokenized_texts = [word for text in texts for word in text.split()]
        return ' '.join(tokenized_texts[:max_tokens])
    
    def search_law(response, retries=5):
        for attempt in range(retries):
            try:
                options = webdriver.ChromeOptions()
                options.add_argument('--headless')
                options.add_argument('--no-sandbox')
                options.add_argument('--disable-dev-shm-usage')
                if 'driver' in globals():
                    driver.quit()

                driver = webdriver.Chrome(options=options)
                print(f"검색 시도: {attempt + 1}, 검색어: '{response}'")
                driver.get("https://glaw.scourt.go.kr/wsjo/lawod/sjo120.do")
                
                if 'original_text' in globals():
                    original_text = None

                original_text = driver.find_element(By.CSS_SELECTOR, 'h3.search_result_num').text

                search_box = WebDriverWait(driver, 10).until(
                    EC.presence_of_element_located((By.NAME, "srchw"))
                )
                search_box.clear()
                driver.execute_script("arguments[0].value = arguments[1];", search_box, response)
                search_box.send_keys(Keys.RETURN)

                WebDriverWait(driver, 10).until(
                    # wait_for_text_change 함수는 정의되어 있어야 합니다.
                    wait_for_text_change((By.CSS_SELECTOR, 'h3.search_result_num'), original_text)
                )
                
                popularity_button = WebDriverWait(driver, 10).until(
                    EC.element_to_be_clickable((By.CSS_SELECTOR, "a.btn_type_5[name='sort_popularity']"))
                )
                popularity_button.click()

                time.sleep(5)

                first_result = WebDriverWait(driver, 10).until(
                    EC.presence_of_element_located((By.CSS_SELECTOR, 'td a[name="listCont"] strong'))
                )
                print(f"검색 완료, 첫 번째 결과: {first_result.text}")
                law_name = first_result.text
                return law_name
            except (TimeoutException, WebDriverException) as e:
                print(f"재시도 {attempt + 1}/{retries}, 오류: {e}")
                continue
        print("검색 실패, 결과를 찾을 수 없음.")
        return None 

    def fetch_data(url, params, max_retries=10, delay=1):
       
        """지정된 횟수만큼 요청을 재시도하는 함수"""
        for attempt in range(max_retries):
            try:
                response = requests.get(url, params=params)
                response.raise_for_status()  # 상태 코드가 200이 아닌 경우 예외를 발생시킵니다.
                return response.text
            except requests.RequestException as e:
                print(f"요청 실패 (시도 {attempt + 1}/{max_retries}): {e}")
                sleep(delay)  # 지정된 시간만큼 대기 후 다시 시도
        return None  # 모든 시도가 실패한 경우 None을 반환

    law_name = search_law(final_response)
    if law_name:
        print(f'국가법령정보센터에서 {law_name}에 관한 정보를 불러옵니다.')

        # API의 기본 URL 설정
        base_url = "http://www.law.go.kr/DRF/lawService.do"

        # 요청에 필요한 파라미터 설정
        params = {
            'OC': 'cwindy200',    # 사용자 ID
            'target': 'law',      # 서비스 대상
            'LM': law_name,       # 법령 마스터 번호
            'type': 'XML'         # 출력 형태 (HTML 또는 XML)
        }

        # 함수를 사용하여 데이터 가져오기
        response_text = fetch_data(base_url, params)
        if response_text:
            cdata_texts = extract_cdata(response_text)

        # 토큰 제한 적용
            limited_cdata_texts = limit_tokens(cdata_texts)
            
            print(f"법령 텍스트 변환: {limited_cdata_texts}")
            return limited_cdata_texts
        else:
            print("모든 요청이 실패했습니다.")
            return None
    else:
        print("정보를 찾을 수 없습니다.")
        return None

In [4]:
def execute_legal_advice_agent(input_data):
    global Answer
    if 'db' in globals():
        db.delete()
    loader = TextLoader(limited_cdata_texts)
    documents = loader.load()
    text_splitter = CharacterTextSplitter(chunk_size=50000, chunk_overlap=0)
    texts = text_splitter.split_documents(documents)
    embeddings = OpenAIEmbeddings(openai_api_key="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")
    db = FAISS.from_documents(texts, embeddings)
    retriever = db.as_retriever()
    tool = create_retriever_tool(
        retriever,
        "search_legal_advice",
        "searches and returns answers regarding legal advice and information from Document",
    )
    tools = [tool]

    llm = ChatOpenAI(temperature=0, model="gpt-4-1106-preview", openai_api_key="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")

    memory_key = "history"

    memory = AgentTokenBufferMemory(memory_key=memory_key, llm=llm)

    system_message = SystemMessage(
        content=(
            "Must not repeat the content found in the Document verbatim."
            "Must use tools to look up relevant information from the Document."
            "Must double-check to ensure the grammar of the Korean answer is correct."
        )
    )

    prompt = OpenAIFunctionsAgent.create_prompt(
        system_message=system_message,
        extra_prompt_messages=[MessagesPlaceholder(variable_name=memory_key)],
    )

    agent = OpenAIFunctionsAgent(llm=llm, tools=tools, prompt=prompt)

    agent_executor = AgentExecutor(
        agent=agent,
        tools=tools,
        memory=memory,
        verbose=True,
        return_intermediate_steps=True,
    )

    result = agent_executor({"input": input_data})

    for message in result['history']:
        if message.__class__.__name__ == 'AIMessage':
            Answer = message.content
            print(message.content)
            return Answer


In [5]:
def integrated_law_process(input_data):
    # 전역 변수 'conversion_rules' 사용
    global conversion_rules

    # Step 1: 법률 관련 키워드 생성
    final_response = generate_law_keyword(input_data, conversion_rules)

    # Step 2: 법률 정보 처리 및 텍스트 파일 생성
    process_law_info(final_response)

    # Step 3: 법률 자문 에이전트 실행
    execute_legal_advice_agent(input_data)

In [6]:
integrated_law_process(input_data)


Exception managing chrome: error sending request for url (https://chromedriver.storage.googleapis.com/LATEST_RELEASE_103): error trying to connect: dns error: failed to lookup address information: Try again


검색 시도: 1, 검색어: '법률'
검색 완료, 첫 번째 결과: 가족관계의 등록 등에 관한 법률
국가법령정보센터에서 가족관계의 등록 등에 관한 법률에 관한 정보를 불러옵니다.
법령 텍스트 변환: 가족관계의 등록 등에 관한 법률 가족관계의 등록 등에 관한 법률 제1장 총칙 목적 제1조(목적) 이 법은 국민의 출생ㆍ혼인ㆍ사망 등 가족관계의 발생 및 변동사항에 관한 등록과 그 증명에 관한 사항을 규정함을 목적으로 한다. 관장 제2조(관장) 가족관계의 발생 및 변동사항에 관한 등록과 그 증명에 관한 사무(이하 "등록사무"라 한다)는 대법원이 관장한다. 권한의 위임 제3조(권한의 위임) ① ① 대법원장은 등록사무의 처리에 관한 권한을 시ㆍ읍ㆍ면의 장(도농복합형태의 시에 있어서 동지역에 대하여는 시장, 읍ㆍ면지역에 대하여는 읍ㆍ면장으로 한다. 이하 같다)에게 위임한다. ② ② 특별시 및 광역시와 구를 둔 시에 있어서는 이 법 중 시, 시장 또는 시의 사무소라 함은 각각 구, 구청장 또는 구의 사무소를 말한다. 다만, 광역시에 있어서 군지역에 대하여는 읍ㆍ면, 읍ㆍ면의 장 또는 읍ㆍ면의 사무소를 말한다. ③ ③ 대법원장은 등록사무의 감독에 관한 권한을 시ㆍ읍ㆍ면의 사무소 소재지를 관할하는 가정법원장에게 위임한다. 다만, 가정법원지원장은 가정법원장의 명을 받아 그 관할 구역 내의 등록사무를 감독한다. 등록사무처리 제4조(등록사무처리) 제3조에 따른 등록사무는 가족관계의 발생 및 변동사항의 등록(이하 "등록"이라 한다)에 관한 신고 등을 접수하거나 수리한 신고지의 시ㆍ읍ㆍ면의 장이 처리한다. 재외국민 등록사무처리에 관한 특례 제4조의2(재외국민 등록사무처리에 관한 특례) ① ① 제3조 및 제4조에도 불구하고, 대법원장은 외국에 거주하거나 체류하는 대한민국 국민(이하 "재외국민"이라 한다)에 관한 등록사무를 법원서기관, 법원사무관, 법원주사 또는 법원주사보(이하 "가족관계등록관"이라 한다)로 하여금 처리하게 할 수 있다. ② ② 재외국민에 관한 등록사무의 처리 및 지원을 위하여

In [7]:
print(final_response)
print(law_name)
print(Answer)
print(limited_cdata_texts)

법률
가족관계의 등록 등에 관한 법률
신림역 칼부림 사건과 관련하여 적용할 수 있는 법은 형법상의 살인죄(제250조), 살인미수죄(제251조), 폭행죄(제260조), 상해죄(제257조) 등이 있을 수 있습니다. 이러한 범죄는 사람의 생명이나 신체에 대한 위해를 가하는 행위에 대해 처벌하는 조항들입니다. 구체적인 적용 여부는 사건의 구체적인 사실관계와 법원의 판단에 따라 달라질 수 있습니다.
가족관계의 등록 등에 관한 법률 가족관계의 등록 등에 관한 법률 제1장 총칙 목적 제1조(목적) 이 법은 국민의 출생ㆍ혼인ㆍ사망 등 가족관계의 발생 및 변동사항에 관한 등록과 그 증명에 관한 사항을 규정함을 목적으로 한다. 관장 제2조(관장) 가족관계의 발생 및 변동사항에 관한 등록과 그 증명에 관한 사무(이하 "등록사무"라 한다)는 대법원이 관장한다. 권한의 위임 제3조(권한의 위임) ① ① 대법원장은 등록사무의 처리에 관한 권한을 시ㆍ읍ㆍ면의 장(도농복합형태의 시에 있어서 동지역에 대하여는 시장, 읍ㆍ면지역에 대하여는 읍ㆍ면장으로 한다. 이하 같다)에게 위임한다. ② ② 특별시 및 광역시와 구를 둔 시에 있어서는 이 법 중 시, 시장 또는 시의 사무소라 함은 각각 구, 구청장 또는 구의 사무소를 말한다. 다만, 광역시에 있어서 군지역에 대하여는 읍ㆍ면, 읍ㆍ면의 장 또는 읍ㆍ면의 사무소를 말한다. ③ ③ 대법원장은 등록사무의 감독에 관한 권한을 시ㆍ읍ㆍ면의 사무소 소재지를 관할하는 가정법원장에게 위임한다. 다만, 가정법원지원장은 가정법원장의 명을 받아 그 관할 구역 내의 등록사무를 감독한다. 등록사무처리 제4조(등록사무처리) 제3조에 따른 등록사무는 가족관계의 발생 및 변동사항의 등록(이하 "등록"이라 한다)에 관한 신고 등을 접수하거나 수리한 신고지의 시ㆍ읍ㆍ면의 장이 처리한다. 재외국민 등록사무처리에 관한 특례 제4조의2(재외국민 등록사무처리에 관한 특례) ① ① 제3조 및 제4조에도 불구하고, 대법원장은 외국에 거주하거나 체류하는 대한민국 국민(이하 "재외국민"이라