In [None]:
# pip install -qU langchain-upstage langchain-core langchain faiss-cpu pypdf python-dotenv

import os
from dotenv import load_dotenv
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_upstage import UpstageEmbeddings, ChatUpstage
from langchain_community.vectorstores import FAISS
from langchain_core.prompts import PromptTemplate
from langchain.chains import RetrievalQA

def main_rag_pipeline():
    """
    콘텐츠 분쟁 해결 RAG 시스템의 전체 파이프라인을 실행하는 메인 함수입니다.
    """
    try:
        # --- 환경 설정 ---
        load_dotenv()
        print("환경 변수 로드 완료")

        # --- 0단계: 문서 로드 (가이드에 맞게 경로 수정) ---
        pdf_path = '../data/콘텐츠분쟁해결_사례.pdf'
        loader = PyPDFLoader(pdf_path)
        docs = loader.load()
        print(f"{len(docs)}개의 문서 로드 완료")

        # --- 1단계: 문서 분할 ---
        text_splitter = RecursiveCharacterTextSplitter(
            chunk_size=1500,
            chunk_overlap=300,
            separators=[
                "\n【사건개요】", "\n【쟁점사항】", "\n【처리경위】", "\n【처리결과】",
                "\n■", "\n\n", "\n", ".", " ", ""
            ]
        )
        splits = text_splitter.split_documents(docs)
        print(f"{len(splits)}개의 분할된 문서 생성 완료")

        # --- 2단계: 임베딩 모델 설정 ---
        embeddings = UpstageEmbeddings(model="solar-embedding-1-large")
        print("임베딩 모델 설정 완료")

        # --- 3단계: 벡터 저장소 및 검색기 설정 ---
        vectorstore = FAISS.from_documents(splits, embeddings)
        retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 5})
        print("벡터 저장소 및 검색기 설정 완료")

        # --- 4단계: LLM 설정 ---
        llm = ChatUpstage(
            model="solar-pro",
            base_url="https://api.upstage.ai/v1",
            temperature=0.2
        )
        print("LLM 설정 완료")

        # --- 5단계: 법률 자문 프롬프트 작성 ---
        prompt_template = """
        당신은 콘텐츠 분야 전문 법률 자문가입니다.
        아래 분쟁조정 사례들을 바탕으로 정확하고 전문적인 법률 조언을 제공해주세요.
        관련 분쟁사례: {context}
        상담 내용: {question}
        답변 가이드라인:
        1. 제시된 사례들을 근거로 답변하세요
        2. 관련 법령이나 조항이 있다면 명시하세요
        3. 비슷한 사례의 처리경위와 결과를 참고하여 설명하세요
        4. 실무적 해결방안을 단계별로 제시하세요
        5. 사례에 없는 내용은 "제시된 사례집에서는 확인할 수 없습니다"라고 명시하세요
        전문 법률 조언:"""
        prompt = PromptTemplate(input_variables=["context", "question"], template=prompt_template)
        print("프롬프트 템플릿 생성 완료")

        # --- 6단계: QA 체인 생성 ---
        qa_chain = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type="stuff",
            retriever=retriever,
            chain_type_kwargs={"prompt": prompt},
            return_source_documents=True
        )
        print("QA 체인 생성 완료\\n")

        # --- 7단계: 테스트 질문 작성 및 실행 ---
        print("--- 법률 자문 테스트 시작 ---")
        test_questions = [
            "온라인 게임에서 시스템 오류로 아이템이 사라졌는데, 게임회사가 복구를 거부하고 있습니다. 어떻게 해결할 수 있나요?",
            "인터넷 강의를 중도 해지하려고 하는데 과도한 위약금을 요구받고 있습니다. 정당한가요?",
            "무료체험 후 자동으로 유료전환되어 요금이 청구되었습니다. 환불 가능한가요?",
            "미성년자가 부모 동의 없이 게임 아이템을 구매했습니다. 환불받을 수 있는 방법이 있나요?",
            "온라인 교육 서비스가 광고와 다르게 제공되어 계약을 해지하고 싶습니다. 가능한가요?"
        ]
        for question in test_questions:
            print(f"질문: {question}")
            result = qa_chain.invoke(question)
            print(f"답변: {result['result']}")
            print("--------------------------------------------------\\n")
        print("--- 법률 자문 테스트 종료 ---\\n")

        # --- 8단계: 분쟁 유형 분류 함수 테스트 ---
        def classify_dispute_type(query):
            game_keywords = ["게임", "아이템", "계정", "캐릭터", "레벨", "길드", "온라인게임"]
            elearning_keywords = ["강의", "온라인교육", "이러닝", "수강", "환불", "화상교육"]
            web_keywords = ["웹사이트", "무료체험", "자동결제", "구독", "사이트"]
            query_lower = query.lower()
            if any(keyword in query_lower for keyword in game_keywords):
                return "게임"
            elif any(keyword in query_lower for keyword in elearning_keywords):
                return "이러닝"
            elif any(keyword in query_lower for keyword in web_keywords):
                return "웹콘텐츠"
            else:
                return "기타"

        print("--- 분쟁 유형 분류 테스트 시작 ---")
        for question in test_questions:
            dispute_type = classify_dispute_type(question)
            print(f"질문: {question}")
            print(f"분류된 분쟁 유형: {dispute_type}\n")
        print("--- 분쟁 유형 분류 테스트 종료 ---")

    except Exception as e:
        print(f"오류가 발생했습니다: {e}")

if __name__ == '__main__':
    main_rag_pipeline()

  from .autonotebook import tqdm as notebook_tqdm


환경 변수 로드 완료
109개의 문서 로드 완료
104개의 분할된 문서 생성 완료
임베딩 모델 설정 완료
벡터 저장소 및 검색기 설정 완료
LLM 설정 완료
프롬프트 템플릿 생성 완료
QA 체인 생성 완료\n
--- 법률 자문 테스트 시작 ---
질문: 온라인 게임에서 시스템 오류로 아이템이 사라졌는데, 게임회사가 복구를 거부하고 있습니다. 어떻게 해결할 수 있나요?
답변: ### 전문 법률 조언: 온라인 게임 시스템 오류로 인한 아이템 복구 거부 시 해결 방안  

#### 1. **사례 기반 분석**  
제시된 사례집을 종합하면, 시스템 오류로 인한 아이템 복구 문제는 다음과 같은 요소에 따라 처리 결과가 달라집니다:  
- **계정 소유권 확인**: 게임사가 계정 명의자와 실소유자를 엄격히 구분할 경우, 명의자가 아닌 경우 복구가 거절될 수 있습니다(2006년 사례).  
- **오류 입증 가능성**: 시스템 오류가 다수 이용자에게 발생한 경우 복구 가능성이 높으나, 단일 사례일 경우 게임사가 오류를 인정하지 않을 수 있습니다(2009년 사례).  
- **게임사의 약관 및 조치**: 약관에 따라 복구 절차가 명시되거나, 오류 인정 시 복구 사례가 존재합니다(2006년 프로그램 오류 사례).  

#### 2. **관련 법령 및 약관 검토**  
- **민법 제250조(도품·유실물 특례)**:  
  - 아이템이 해킹 또는 시스템 오류로 소멸된 경우, 게임사는 "유실물 반환의무"가 있을 수 있으나, **게임머니는 금전으로 간주되어 적용되지 않을 수 있습니다**(2009년 사례 참조).  
- **게임산업진흥에 관한 법률 제12조(소비자 보호)**:  
  - 게임사는 시스템 오류 등 불가피한 사유로 인한 피해에 대해 **합리적인 보상 절차**를 마련해야 합니다.  
- **게임사 이용약관**:  
  - 대부분의 게임사는 "계정 공유·현금거래 금지", "시스템 오류 시 복구 불가" 등의 조항을 포함합니다. 단, 오류 인정 시 복구 사례가 있으므로 약관 확