In [68]:
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException, WebDriverException


from langchain.embeddings import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import FAISS
from langchain.agents.agent_toolkits import create_retriever_tool
from langchain.agents.agent_toolkits import create_conversational_retrieval_agent
from langchain.chat_models import ChatOpenAI
from langchain.agents.openai_functions_agent.agent_token_buffer_memory import (
    AgentTokenBufferMemory,
)
from langchain.agents.openai_functions_agent.base import OpenAIFunctionsAgent
from langchain.prompts import MessagesPlaceholder
from langchain.schema.messages import SystemMessage
from langchain.agents import AgentExecutor
from langchain.docstore.document import Document
from langchain.document_loaders.base import BaseLoader

from time import sleep
from typing import List, Optional
import time
import requests
import nest_asyncio
import re
import logging

logger = logging.getLogger(__name__)

nest_asyncio.apply()

limited_cdata_texts = None
final_response = None
law_name = None
Answer = None

class wait_for_text_change:
    def __init__(self, locator, expected_text):
        self.locator = locator
        self.expected_text = expected_text

    def __call__(self, driver):
        element_text = driver.find_element(*self.locator).text
        return element_text != self.expected_text


class TextLoader(BaseLoader):
    """Load text data directly.

    Args:
        text_data: String containing the text data.
        source: Optional source information for the text data.
    """

    def __init__(
        self,
        text_data: str,
        source: Optional[str] = None
    ):
        """Initialize with text data."""
        self.text_data = text_data
        self.source = source

    def load(self) -> List[Document]:
        """Load from text data."""
        try:
            text = self.text_data
        except Exception as e:
            raise RuntimeError("Error processing text data") from e

        metadata = {"source": self.source}
        return [Document(page_content=text, metadata=metadata)]

# 특수 키워드 변환 규칙

conversion_rules = {
    '사생활': '형법',
    '녹음': '형법',
    '명의 도용' : '전자통신사업법',
    '명의' : '형법',
    '도용' : '형법',
    '임대차' : '주택임대차보호법',
    '사기' : '형법',
    '모욕' : '형법'
    # 다른 규칙들도 추가 가능
}

# 법령 Text 파일 저장 경로
# TextFilePath = '/home/user/exercise_j/AIchatbot-Neoul/law_example_2.txt'

# 질문 재유도 문구
Retry_answer = "관련된 법령 정보를 찾을 수 없습니다. 다른 질문으로 다시 입력해주시기 바랍니다."

# 질문 입력값
input_data = "여자화장실 불법촬영으로 인한 피해보상 청구"

In [47]:
def generate_law_keyword(input_data, conversion_rules):
    global final_response

    # 프롬프트 템플릿 설정
    prompt = ChatPromptTemplate.from_template(
    "Given the input, extract the most important keyword for the law database only in Korean and must not be just a single character. If the input is not related to law, output 'irrelevant'.\nInput: {input}\nKeywords:"
    )

    # 모델 설정
    model = ChatOpenAI(temperature=0, model="gpt-4-1106-preview", openai_api_key="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")

    # 체인 설정: 모델 출력을 키워드로 제한
    chain = prompt | model.bind(stop=["\n"])

    # 체인 실행
    result = chain.invoke({"input": input_data})
    final_response = result.content

    if final_response == 'irrelavant':
        return final_response

    for keyword, new_value in conversion_rules.items():
        if keyword in final_response:
            final_response = new_value
            break  # 일치하는 경우 더 이상 반복할 필요가 없으므로 반복문 종료

    if '죄' in final_response:
        final_response = '형법'

    if final_response in ['법률', '법령', '법조문']:
        final_response = '형법'

    return final_response


In [63]:

def process_law_info(final_response):
    global limited_cdata_texts
    global law_name
    global Retry_answer
    def extract_cdata(xml_data):
        cdata_sections = re.findall(r'<!\[CDATA\[(.*?)\]\]>', xml_data, re.DOTALL)
        return [cdata.strip() for cdata in cdata_sections]

    def limit_tokens(texts, max_tokens=12000):
        tokenized_texts = [word for text in texts for word in text.split()]
        return ' '.join(tokenized_texts[:max_tokens])
    
    def search_law(response, retries=3):
        for attempt in range(retries):
            try:
                options = webdriver.ChromeOptions()
                options.add_argument('--headless')
                options.add_argument('--no-sandbox')
                options.add_argument('--disable-dev-shm-usage')
                if 'driver' in globals():
                    driver.quit()

                driver = webdriver.Chrome(options=options)
                print(f"검색 시도: {attempt + 1}, 검색어: '{response}'")
                driver.get("https://glaw.scourt.go.kr/wsjo/lawod/sjo120.do")
                
                if 'original_text' in globals():
                    original_text = None

                original_text = driver.find_element(By.CSS_SELECTOR, 'h3.search_result_num').text

                search_box = WebDriverWait(driver, 10).until(
                    EC.presence_of_element_located((By.NAME, "srchw"))
                )
                search_box.clear()
                driver.execute_script("arguments[0].value = arguments[1];", search_box, response)
                search_box.send_keys(Keys.RETURN)

                WebDriverWait(driver, 10).until(
                    # wait_for_text_change 함수는 정의되어 있어야 합니다.
                    wait_for_text_change((By.CSS_SELECTOR, 'h3.search_result_num'), original_text)
                )
                
                popularity_button = WebDriverWait(driver, 10).until(
                    EC.element_to_be_clickable((By.CSS_SELECTOR, "a.btn_type_5[name='sort_popularity']"))
                )
                popularity_button.click()

                time.sleep(5)

                first_result = WebDriverWait(driver, 10).until(
                    EC.presence_of_element_located((By.CSS_SELECTOR, 'td a[name="listCont"] strong'))
                )
                print(f"검색 완료, 첫 번째 결과: {first_result.text}")
                law_name = first_result.text
                return law_name
            except (TimeoutException, WebDriverException) as e:
                print(f"재시도 {attempt + 1}/{retries}, 오류: {e}")
                continue
        print("검색 실패, 결과를 찾을 수 없음.")
        return None

    def fetch_data(url, params, max_retries=10, delay=1):
       
        """지정된 횟수만큼 요청을 재시도하는 함수"""
        for attempt in range(max_retries):
            try:
                response = requests.get(url, params=params)
                response.raise_for_status()  # 상태 코드가 200이 아닌 경우 예외를 발생시킵니다.
                return response.text
            except requests.RequestException as e:
                print(f"요청 실패 (시도 {attempt + 1}/{max_retries}): {e}")
                sleep(delay)  # 지정된 시간만큼 대기 후 다시 시도
        return None  # 모든 시도가 실패한 경우 None을 반환

    law_name = search_law(final_response)

    if law_name == None :
        return Retry_answer
    if law_name:
        print(f'국가법령정보센터에서 {law_name}에 관한 정보를 불러옵니다.')

        # API의 기본 URL 설정
        base_url = "http://www.law.go.kr/DRF/lawService.do"

        # 요청에 필요한 파라미터 설정
        params = {
            'OC': 'cwindy200',    # 사용자 ID
            'target': 'law',      # 서비스 대상
            'LM': law_name,       # 법령 마스터 번호
            'type': 'XML'         # 출력 형태 (HTML 또는 XML)
        }

        # 함수를 사용하여 데이터 가져오기
        response_text = fetch_data(base_url, params)
        if response_text:
            cdata_texts = extract_cdata(response_text)

        # 토큰 제한 적용
            limited_cdata_texts = limit_tokens(cdata_texts)
            
            print(f"법령 텍스트 변환: {limited_cdata_texts}")
            return limited_cdata_texts
        else:
            print("모든 요청이 실패했습니다.")
            return None
    else:
        print("정보를 찾을 수 없습니다.")
        return None

In [24]:
def execute_legal_advice_agent(input_data):
    global Answer
    if 'db' in globals():
        db.delete()
    loader = TextLoader(limited_cdata_texts)
    documents = loader.load()
    text_splitter = CharacterTextSplitter(chunk_size=50000, chunk_overlap=0)
    texts = text_splitter.split_documents(documents)
    embeddings = OpenAIEmbeddings(openai_api_key="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")
    db = FAISS.from_documents(texts, embeddings)
    retriever = db.as_retriever()
    tool = create_retriever_tool(
        retriever,
        "search_legal_advice",
        "searches and returns answers regarding legal advice and information from Document",
    )
    tools = [tool]

    llm = ChatOpenAI(temperature=0, model="gpt-4-1106-preview", openai_api_key="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")

    memory_key = "history"

    memory = AgentTokenBufferMemory(memory_key=memory_key, llm=llm)

    system_message = SystemMessage(
        content=(
            "Must not repeat the content found in the Document verbatim."
            "Must use tools to look up relevant information from the Document."
            "Must double-check to ensure the grammar of the Korean answer is correct."
        )
    )

    prompt = OpenAIFunctionsAgent.create_prompt(
        system_message=system_message,
        extra_prompt_messages=[MessagesPlaceholder(variable_name=memory_key)],
    )

    agent = OpenAIFunctionsAgent(llm=llm, tools=tools, prompt=prompt)

    agent_executor = AgentExecutor(
        agent=agent,
        tools=tools,
        memory=memory,
        verbose=True,
        return_intermediate_steps=True,
    )

    result = agent_executor({"input": input_data})

    for message in result['history']:
        if message.__class__.__name__ == 'AIMessage':
            Answer = message.content
            print(message.content)
            return Answer


In [65]:
def integrated_law_process(input_data):
    # 전역 변수 'conversion_rules' 사용
    global conversion_rules
    global Answer
    # Step 1: 법률 관련 키워드 생성
    final_response = generate_law_keyword(input_data, conversion_rules)
    
    if final_response == 'irrelevant' :
        Answer = "다시 질문을 입력해주세요."
        return "다시 질문을 입력해주세요."
    
    # Step 2: 법률 정보 처리 및 텍스트 파일 생성
    process_law_info(final_response)

    if law_name == None :
        return Retry_answer

    # Step 3: 법률 자문 에이전트 실행
    execute_legal_advice_agent(input_data)

In [69]:
integrated_law_process(input_data)

검색 시도: 1, 검색어: '불법촬영'
검색 완료, 첫 번째 결과: 양성평등기본법
국가법령정보센터에서 양성평등기본법에 관한 정보를 불러옵니다.
법령 텍스트 변환: 양성평등기본법 양성평등기본법 제1장 총칙 목적 제1조(목적) 이 법은 「대한민국헌법」의 양성평등 이념을 실현하기 위한 국가와 지방자치단체의 책무 등에 관한 기본적인 사항을 규정함으로써 정치ㆍ경제ㆍ사회ㆍ문화의 모든 영역에서 양성평등을 실현하는 것을 목적으로 한다. 기본이념 제2조(기본이념) 이 법은 개인의 존엄과 인권의 존중을 바탕으로 성차별적 의식과 관행을 없애고, 여성과 남성이 동등한 참여와 대우를 받고 모든 영역에서 평등한 책임과 권리를 공유함으로써 실질적 양성평등 사회를 이루는 것을 기본이념으로 한다. <개정 2021.4.20> 정의 제3조(정의) 이 법에서 사용하는 용어의 뜻은 다음과 같다. <개정 2021.4.20> 1. 1. "양성평등"이란 성별에 따른 차별, 편견, 비하 및 폭력 없이 인권을 동등하게 보장받고 모든 영역에 동등하게 참여하고 대우받는 것을 말한다. 2. 2. "성희롱"이란 업무, 고용, 그 밖의 관계에서 국가기관ㆍ지방자치단체 또는 대통령령으로 정하는 공공단체(이하 "국가기관등"이라 한다)의 종사자, 사용자 또는 근로자가 다음 각 목의 어느 하나에 해당하는 행위를 하는 경우를 말한다. 가. 가. 지위를 이용하거나 업무 등과 관련하여 성적 언동 또는 성적 요구 등으로 상대방에게 성적 굴욕감이나 혐오감을 느끼게 하는 행위 나. 나. 상대방이 성적 언동 또는 성적 요구에 따르지 아니한다는 이유로 불이익을 주거나 그에 따르는 것을 조건으로 이익 공여의 의사표시를 하는 행위 3. 3. "사용자"란 사업주 또는 사업경영담당자, 그 밖에 사업주를 위하여 근로자에 관한 사항에 대한 업무를 수행하는 자를 말한다. 국민의 권리와 의무 제4조(국민의 권리와 의무) ① ① 모든 국민은 가족과 사회 등 모든 영역에서 양성평등한 대우를 받고 양성평등한 생활을 영위할 권리를 가진다. ② ② 모든 국민은

In [70]:
print(final_response)
print(law_name)
print(Answer)
print(limited_cdata_texts)

불법촬영
양성평등기본법
여성화장실 불법촬영으로 인한 피해보상 청구에 관한 정보는 양성평등기본법 제30조에서 다루고 있습니다. 이 조항에 따르면, 국가와 지방자치단체는 성폭력, 가정폭력, 성매매 범죄 및 성희롱을 예방하고 방지하며, 피해자를 보호해야 할 책임이 있습니다. 또한, 필요한 시책을 마련해야 합니다. 성희롱 예방교육, 자체 예방지침의 마련, 성희롱 사건 발생 시 재발 방지 대책의 수립 및 시행 등이 필요한 조치에 포함됩니다.

불법촬영으로 인한 피해를 입은 경우, 「성폭력방지 및 피해자보호 등에 관한 법률」 제7조의3에 따라 불법촬영물로 인한 피해자 지원 사업이 시행되고 있으며, 이를 통해 피해자 보호 및 지원이 이루어질 수 있습니다. 피해자는 관련 기관에 연락하여 지원을 요청할 수 있으며, 법적 조치를 취할 수 있습니다.

불법촬영으로 인한 피해보상 청구에 대한 구체적인 절차나 방법은 관련 법률이나 지침에 따라 달라질 수 있으므로, 법률 전문가의 상담을 받거나 관련 기관에 문의하는 것이 좋습니다.
양성평등기본법 양성평등기본법 제1장 총칙 목적 제1조(목적) 이 법은 「대한민국헌법」의 양성평등 이념을 실현하기 위한 국가와 지방자치단체의 책무 등에 관한 기본적인 사항을 규정함으로써 정치ㆍ경제ㆍ사회ㆍ문화의 모든 영역에서 양성평등을 실현하는 것을 목적으로 한다. 기본이념 제2조(기본이념) 이 법은 개인의 존엄과 인권의 존중을 바탕으로 성차별적 의식과 관행을 없애고, 여성과 남성이 동등한 참여와 대우를 받고 모든 영역에서 평등한 책임과 권리를 공유함으로써 실질적 양성평등 사회를 이루는 것을 기본이념으로 한다. <개정 2021.4.20> 정의 제3조(정의) 이 법에서 사용하는 용어의 뜻은 다음과 같다. <개정 2021.4.20> 1. 1. "양성평등"이란 성별에 따른 차별, 편견, 비하 및 폭력 없이 인권을 동등하게 보장받고 모든 영역에 동등하게 참여하고 대우받는 것을 말한다. 2. 2. "성희롱"이란 업무, 고용, 그 밖의 관계에서 국가기관ㆍ지방자치단체 또는 