In [1]:
# Install necessary libraries
# %pip install langchain langchain_community langchain_openai neo4j python-dotenv pypdf tiktoken

import os
import json
import re
from dotenv import load_dotenv
from langchain_community.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
from langchain_openai import OpenAIEmbeddings
from neo4j import GraphDatabase
import time

In [2]:
# Load environment variables (ensure NEO4J_URI, NEO4J_USERNAME, NEO4J_PASSWORD, OPENAI_API_KEY are set in your .env file)
load_dotenv()

NEO4J_URI = os.getenv("NEO4J_URI")
NEO4J_USERNAME = os.getenv("NEO4J_USERNAME")
NEO4J_PASSWORD = os.getenv("NEO4J_PASSWORD")

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")

# Embedding model setup
embedding_model = OpenAIEmbeddings(model="text-embedding-3-small", api_key=OPENAI_API_KEY)
embedding_dimension = 1536 # Dimension for text-embedding-3-small

# Data paths
pdf_path = './dataset/criminal-law.pdf'
precedent_dir = './dataset/precedent_label/' # Directory containing JSON files

In [15]:
# # Load PDF
# loader = PyPDFLoader(pdf_path)
# # pages = loader.load()[2:] # Skip first two pages as before
# pages = loader.load()
# full_text = "\n".join(page.page_content for page in pages)

# # Text Splitter (refined for graph structure)
# # We'll primarily focus on splitting by Article for node creation
# # article_pattern_precise = re.compile(r'(제\d+조(?:의\d+)?\s*\(.+?\))\s*') # More precise pattern to capture article header

# article_pattern_precise = re.compile(r'(제\d+조(?:의\d+)?(?:\s*\(.+?\))?)')

# separators = [
#     # r"(제\d+조(?:의\d+)?\s*\(.+?\))", # 조 (Article) - Primary separator
#     r"(제\d+조(?:의\d+)?(?:\s*\(.+?\))?)",
#     r"(제\d+장 [^\\n]+)",             # 장 (Chapter)
#     r"(제\d+편 [^\\n]+)",             # 편 (Edition)
#     "\n\n",                         # Paragraph
#     "\n",                           # Line break
#     " ",                            # Space
# ]
# text_splitter = RecursiveCharacterTextSplitter(
#     chunk_size=500, # Adjust as needed
#     chunk_overlap=150, # Adjust as needed
#     length_function=len,
#     separators=separators,
#     is_separator_regex=True,
# )

# raw_chunks = text_splitter.split_text(full_text)

# # Process chunks to associate content with articles
# articles = {}
# current_article_id = None
# current_content = ""

# for chunk in raw_chunks:
#     match = article_pattern_precise.search(chunk)
#     if match:
#         # If we encounter a new article, save the previous one (if any)
#         if current_article_id:
#             articles[current_article_id] = current_content.strip()

#         # Start the new article
#         current_article_id = match.group(1).strip()
#         # Remove the matched article header from the beginning of the chunk content
#         current_content = article_pattern_precise.sub("", chunk, count=1)
#     else:
#         # Append chunk content to the current article
#         if current_article_id: # Only append if we are already inside an article
#              current_content += "\n" + chunk

# # Save the last processed article
# if current_article_id:
#     articles[current_article_id] = current_content.strip()


# print(f"Processed {len(articles)} articles from PDF.")
# # Example: Print the first processed article
# if articles:
#     first_article_id = list(articles.keys())[0]
#     print(f"\n--- Example Article: {first_article_id} ---")
#     print(articles[first_article_id][:500] + "...")

# # Convert to Document objects for potential later use or consistency
# article_docs = [Document(page_content=content, metadata={"article_id": article_id}) for article_id, content in articles.items()]

Processed 194 articles from PDF.

--- Example Article: 제1조(범죄의 성립과 처벌) ---
제1조(범죄의 성립과 처벌) ①범죄의 성립과 처벌은 행위 시의 법률에 의한다.
②범죄 후 법률의 변경에 의하여 그 행위가 범죄를 구성하지 아니하거나 형이 구법보다 경한
때에는 신법에 의한다.
③재판확정 후 법률의 변경에 의하여 그 행위가 범죄를 구성하지 아니하는 때에는 형의 집행
을 면제한다.
 
제2조(국내범)제2조(국내범) 본법은 대한민국영역 내에서 죄를 범한 내국인과 외국인에게 적용한다.
 
제3조(내국인의 국외범)제3조(내국인의 국외범) 본법은 대한민국영역 외에서 죄를 범한 내국인에게 적용한다.
 
제4조(국외에 있는 내국선박 등에서 외국인이 범한 죄)제4조(국외에 있는 내국선박 등에서 외국인이 범한 죄) 본법은 대한민국영역 외에 있는 대한민
국의 선박 또는 항공기 내에서 죄를 범한 외국인에게 적용한다.
 
제5조(외국인의 국외범)제5조(외국인의 국외범)...


In [4]:
# 청킹이 아닌 정규식 패턴 매칭으로 각 조항 추출하기
import re

# Load PDF
loader = PyPDFLoader(pdf_path)
# pages = loader.load()[2:] # Skip first two pages as before
pages = loader.load()
full_text = "\n".join(page.page_content for page in pages)

# 전체 텍스트에서 모든 조항 시작 위치 찾기
article_pattern = r'제\d+조(?:의\d+)?(?:\s*\(.+?\))?'
matches = list(re.finditer(article_pattern, full_text))

articles = {}
for i in range(len(matches)):
    current_match = matches[i]
    current_article_id = current_match.group(0).strip()  # 현재 조항 ID
    
    # 현재 조항 시작 위치
    start_pos = current_match.start()
    
    # 다음 조항 시작 위치 (없으면 텍스트 끝까지)
    end_pos = matches[i+1].start() if i < len(matches)-1 else len(full_text)
    
    # 현재 조항의 전체 내용 (ID 포함)
    article_text = full_text[start_pos:end_pos].strip()
    
    # 저장 (ID는 조항 번호만)
    articles[current_article_id] = article_text

print(f"Processed {len(articles)} articles from PDF.")

# 예시 출력
if articles:
    article_ids = list(articles.keys())
    # print("\n=== 처음 5개 조항 ===")
    # for i in range(min(5, len(article_ids))):  # 처음 5개 조항만 출력
    #     article_id = article_ids[i]
    #     content = articles[article_id]
    #     print(f"\n--- Article: {article_id} ---")
    #     print(content[:200] + "..." if len(content) > 200 else content)
        
        
        # 마지막 10개 조항 출력
    print("\n\n=== 마지막 10개 조항 ===")
    for i in range(max(0, len(article_ids) - 10), len(article_ids)):
        article_id = article_ids[i]
        content = articles[article_id]
        print(f"\n--- Article: {article_id} ---")
        print(content[:200] + "..." if len(content) > 200 else content)

Processed 548 articles from PDF.


=== 마지막 10개 조항 ===

--- Article: 제4조 (형에 관한 경과조치) ---
제4조 (형에 관한 경과조치) 이 법 시행전에 종전의 형법규정에 의하여 형의 선고를 받은 자는
이 법에 의하여 형의 선고를 받은 것으로 본다. 집행유예 또는 선고유예를 받은 경우에도 이와
같다.

--- Article: 제5조 (다른 법령과의 관계) ---
제5조 (다른 법령과의 관계) 이 법 시행당시 다른 법령에서 종전의 형법 규정(장의 제목을 포함
한다)을 인용하고 있는 경우에 이 법중 그에 해당하는 규정이 있는 때에는 종전의 규정에 갈음
하여 이 법의 해당 조항을 인용한 것으로 본다.
  
부칙 <제5454호,1997.12.13>
이 법은 1998년 1월 1일부터 시행한다. <단서 생략>
  
부칙 <제...

--- Article: 제7조 ---
제7조(제2항 및 제29항
을 제외한다)의 규정은 2008년 1월 1일부터 시행한다.

--- Article: 제2조 ---
제2조 내지

--- Article: 제6조 ---
제6조 생략

--- Article: 제7조 (다른 법률의 개정) ---
제7조 (다른 법률의 개정) ①내지 <26>생략
<27>형법 일부를 다음과 같이 개정한다.

--- Article: 제151조 ---
제151조제2항 및

--- Article: 제155조 ---
제155조제4항중 "친족, 호주 또는 동거의 가족"을 각각 "친족 또는 동거의
가족"으로 한다.

--- Article: 제305조의2 ---
제305조의2의 개정규정은
공포한 날부터 시행한다.
②(가석방의 요건에 관한 적용례)

--- Article: 제72조 ---
제72조제1항의 개정규정은 이 법 시행 당시 수용 중인 사람에
대하여도 적용한다.
형법
 제 작 자   :송진아
메일주소  :blue4890@hanmail.net
제작일자  :2013.11.8
 법제처 국가법령정보센터


In [5]:
# Load precedent JSON files
precedents = []
for filename in os.listdir(precedent_dir):
    if filename.endswith(".json"):
        filepath = os.path.join(precedent_dir, filename)
        try:
            with open(filepath, 'r', encoding='utf-8') as f:
                data = json.load(f)
                # Extract relevant fields
                precedent_info = {
                    "case_id": data.get("info", {}).get("caseNoID", filename.replace(".json", "")),
                    "case_name": data.get("info", {}).get("caseNm"),
                    "judgment_summary": data.get("jdgmn"),
                    "full_summary": " ".join([s.get("summ_contxt", "") for s in data.get("Summary", [])]),
                    "keywords": [kw.get("keyword") for kw in data.get("keyword_tagg", []) if kw.get("keyword")],
                    "referenced_rules": data.get("Reference_info", {}).get("reference_rules", "").split(',') if data.get("Reference_info", {}).get("reference_rules") else [],
                    "referenced_cases": data.get("Reference_info", {}).get("reference_court_case", "").split(',') if data.get("Reference_info", {}).get("reference_court_case") else [],
                }
                # Clean up referenced rules (extract article numbers)
                cleaned_rules = []
                rule_pattern = re.compile(r'제\d+조(?:의\d+)?') # Pattern to find "제X조" or "제X조의Y"
                for rule in precedent_info["referenced_rules"]:
                    # Find all matches in the rule string
                    matches = rule_pattern.findall(rule.strip())
                    cleaned_rules.extend(matches)
                precedent_info["referenced_rules"] = list(set(cleaned_rules)) # Keep unique article numbers

                precedents.append(precedent_info)
        except json.JSONDecodeError:
            print(f"Warning: Could not decode JSON from {filename}")
        except Exception as e:
            print(f"Error processing {filename}: {e}")


print(f"Loaded {len(precedents)} precedents.")
# Example: Print the first loaded precedent
if precedents:
    print("\n--- Example Precedent ---")
    print(json.dumps(precedents[0], indent=2, ensure_ascii=False))

Loaded 5404 precedents.

--- Example Precedent ---
{
  "case_id": "88도2209",
  "case_name": "매장및묘지등에관한법률위반, 사문서위조, 동행사, 조세범처벌법위반, 특정범죄가중처벌등에관한법률위반",
  "judgment_summary": "가. 작성명의자의 인영이나 주민등록번호의 등재가 누락된 문서가 사문서위조죄의 객체인 사문서에 해당하는지 여부\n나. 사문서위조 및 동행사죄가 조세범처벌법 제9조 소정의 조세포탈의 수단으로 행해진 경우 후자의 죄에 흡수되는지 여부(소극)",
  "full_summary": "사문서의 작성명의자의 인장이 압날되지 아니하고 주민등록번호가 기재되지 않았다고 하더라도, 일반인으로 하여금 그 작상명의자가 진정하게 작성한 사문서로 믿기에 충분할 정도의 형식과 외관을 갖추었으면 사문서위조죄 및 동행사죄의 객체가 되는 사문서라고 보아야 할 것이고, 사문서위조 및 동행사죄가 조세범처벌법 제9조 제1항 소정의 “사기 기타 부정한 행위로써 조세를 포탈”하기 위한 수단으로 행하여졌다고 하여 조세범처벌법 제9조 소정의 조세포탈죄에 흡수된다고 볼 수도 없는 것이므로, 논지는 이유가 없다.",
  "keywords": [
    "사문서위조",
    "동행사"
  ],
  "referenced_rules": [
    "제9조",
    "제37조",
    "제231조",
    "제234조"
  ],
  "referenced_cases": []
}


In [6]:
# 로드된 판례 중 무작위로 1,000개만 선택
import random
random.seed(42)  # 재현성을 위한 시드 설정 (선택사항)

# 전체 판례 수 저장
total_precedents = len(precedents)

# 무작위로 1,000개 선택 (또는 전체 판례 수가 1,000개보다 적다면 모두 선택)
sample_size = min(1000, total_precedents)
precedents = random.sample(precedents, sample_size)

print(f"Randomly selected {len(precedents)} precedents out of {total_precedents} total precedents.")

Randomly selected 1000 precedents out of 5404 total precedents.


In [7]:
# Connect to Neo4j
try:
    driver = GraphDatabase.driver(NEO4J_URI, auth=(NEO4J_USERNAME, NEO4J_PASSWORD))
    driver.verify_connectivity()
    print("Successfully connected to Neo4j.")
except Exception as e:
    print(f"Failed to connect to Neo4j: {e}")
    # Stop execution if connection fails
    raise

# Create constraints and indexes for faster lookups and embedding search
def setup_neo4j(driver, dimension):
    with driver.session(database="neo4j") as session:
        # Constraints for uniqueness
        session.run("CREATE CONSTRAINT article_id IF NOT EXISTS FOR (a:Article) REQUIRE a.id IS UNIQUE")
        session.run("CREATE CONSTRAINT precedent_id IF NOT EXISTS FOR (p:Precedent) REQUIRE p.id IS UNIQUE")
        session.run("CREATE CONSTRAINT keyword_text IF NOT EXISTS FOR (k:Keyword) REQUIRE k.text IS UNIQUE")

        # Vector index for Articles
        try:
            session.run(
                "CREATE VECTOR INDEX article_embedding IF NOT EXISTS "
                "FOR (a:Article) ON (a.embedding) "
                f"OPTIONS {{indexConfig: {{`vector.dimensions`: {dimension}, `vector.similarity_function`: 'cosine'}}}}"
            )
            print("Article vector index created or already exists.")
        except Exception as e:
            print(f"Error creating Article vector index (may require Neo4j 5.11+ and APOC): {e}")
            print("Continuing without vector index creation for Article.")


        # Vector index for Precedents
        try:
            session.run(
                "CREATE VECTOR INDEX precedent_embedding IF NOT EXISTS "
                "FOR (p:Precedent) ON (p.embedding) "
                f"OPTIONS {{indexConfig: {{`vector.dimensions`: {dimension}, `vector.similarity_function`: 'cosine'}}}}"
            )
            print("Precedent vector index created or already exists.")
        except Exception as e:
            print(f"Error creating Precedent vector index (may require Neo4j 5.11+ and APOC): {e}")
            print("Continuing without vector index creation for Precedent.")

        # Wait for indexes to come online (important!)
        print("Waiting for indexes to populate...")
        session.run("CALL db.awaitIndexes(300)") # Wait up to 300 seconds
        print("Indexes should be online.")


setup_neo4j(driver, embedding_dimension)

Successfully connected to Neo4j.
Article vector index created or already exists.
Precedent vector index created or already exists.
Waiting for indexes to populate...
Indexes should be online.


In [8]:
# Create Article nodes and generate/store embeddings
def create_article_nodes(driver, articles_dict, embed_model):
    print(f"Creating {len(articles_dict)} Article nodes...")
    count = 0
    start_time = time.time()
    with driver.session(database="neo4j") as session:
        for article_id, content in articles_dict.items():
            if not content: # Skip empty content
                print(f"Skipping article {article_id} due to empty content.")
                continue
            try:
                # Generate embedding
                embedding = embed_model.embed_query(content)

                # Create node in Neo4j
                session.run(
                    """
                    MERGE (a:Article {id: $article_id})
                    SET a.text = $content,
                        a.embedding = $embedding
                    """,
                    article_id=article_id,
                    content=content,
                    embedding=embedding
                )
                count += 1
                if count % 50 == 0:
                    print(f"  Processed {count}/{len(articles_dict)} articles...")
            except Exception as e:
                print(f"Error processing article {article_id}: {e}")

    end_time = time.time()
    print(f"Finished creating {count} Article nodes in {end_time - start_time:.2f} seconds.")

create_article_nodes(driver, articles, embedding_model)

Creating 548 Article nodes...
  Processed 50/548 articles...
  Processed 100/548 articles...
  Processed 150/548 articles...
  Processed 200/548 articles...
  Processed 250/548 articles...
  Processed 300/548 articles...
  Processed 350/548 articles...
  Processed 400/548 articles...
  Processed 450/548 articles...
  Processed 500/548 articles...
Finished creating 548 Article nodes in 398.00 seconds.


In [9]:
# Create Precedent nodes, Keyword nodes, and relationships
def create_precedent_nodes_and_relationships(driver, precedents_list, embed_model):
    print(f"Creating {len(precedents_list)} Precedent nodes and relationships...")
    count = 0
    start_time = time.time()
    with driver.session(database="neo4j") as session:
        for precedent in precedents_list:
            # Use full_summary for embedding, or judgment_summary if full is empty
            text_to_embed = precedent.get("full_summary") or precedent.get("judgment_summary")
            if not text_to_embed:
                print(f"Skipping precedent {precedent.get('case_id')} due to empty summary.")
                continue

            try:
                # Generate embedding
                embedding = embed_model.embed_query(text_to_embed)

                # Create Precedent node
                session.run(
                    """
                    MERGE (p:Precedent {id: $case_id})
                    SET p.name = $case_name,
                        p.judgment_summary = $judgment_summary,
                        p.full_summary = $full_summary,
                        p.embedding = $embedding
                    """,
                    case_id=precedent["case_id"],
                    case_name=precedent["case_name"],
                    judgment_summary=precedent["judgment_summary"],
                    full_summary=precedent["full_summary"],
                    embedding=embedding
                )

                # Create Keyword nodes and relationships
                for keyword_text in precedent["keywords"]:
                    session.run(
                        """
                        MERGE (k:Keyword {text: $keyword_text})
                        WITH k
                        MATCH (p:Precedent {id: $case_id})
                        MERGE (p)-[:HAS_KEYWORD]->(k)
                        """,
                        keyword_text=keyword_text,
                        case_id=precedent["case_id"]
                    )

                # Create relationships to referenced Articles
                # Note: This uses the cleaned article IDs extracted earlier
                # It tries to match based on the "제X조" format.
                for article_id_ref in precedent["referenced_rules"]:
                     # Find Article nodes that START WITH the referenced ID (e.g., "제21조" should match "제21조(정당방위)")
                     # This is less precise but necessary if the exact title isn't in the reference.
                    session.run(
                        """
                        MATCH (p:Precedent {id: $case_id})
                        MATCH (a:Article)
                        WHERE a.id STARTS WITH $article_id_ref
                        MERGE (p)-[:REFERENCES_ARTICLE]->(a)
                        """,
                        case_id=precedent["case_id"],
                        article_id_ref=article_id_ref # Use the extracted "제X조"
                    )

                # Potential: Create relationships to other referenced Precedents (if needed)
                # for ref_case_id in precedent["referenced_cases"]:
                #    session.run(...) # MERGE (p)-[:REFERENCES_CASE]->(other_p:Precedent {id: ref_case_id})

                count += 1
                if count % 100 == 0:
                    print(f"  Processed {count}/{len(precedents_list)} precedents...")

            except Exception as e:
                print(f"Error processing precedent {precedent.get('case_id')}: {e}")

    end_time = time.time()
    print(f"Finished creating {count} Precedent nodes and relationships in {end_time - start_time:.2f} seconds.")


create_precedent_nodes_and_relationships(driver, precedents, embedding_model)

# Close the driver connection when done
# driver.close() # Keep it open for querying in the next step

Creating 1000 Precedent nodes and relationships...
  Processed 100/1000 precedents...
  Processed 200/1000 precedents...
  Processed 300/1000 precedents...
  Processed 400/1000 precedents...
  Processed 500/1000 precedents...
  Processed 600/1000 precedents...
  Processed 700/1000 precedents...
  Processed 800/1000 precedents...
  Processed 900/1000 precedents...
  Processed 1000/1000 precedents...
Finished creating 1000 Precedent nodes and relationships in 1316.83 seconds.


In [11]:
# Example RAG query using vector similarity search
def query_graph_rag(driver, query_text, embed_model, top_k=3):
    print(f"\n--- Querying RAG for: '{query_text}' ---")
    start_time = time.time()

    # Embed the query
    query_embedding = embed_model.embed_query(query_text)

    results = []
    with driver.session(database="neo4j") as session:
        # Find similar Articles
        try:
            article_res = session.run(
                """
                CALL db.index.vector.queryNodes('article_embedding', $top_k, $query_embedding) YIELD node, score
                RETURN node.id AS article_id, node.text AS text, score
                """,
                top_k=top_k,
                query_embedding=query_embedding
            )
            for record in article_res:
                 results.append({
                     "type": "Article",
                     "id": record["article_id"],
                     "score": record["score"],
                     "text": record["text"][:300] + "..." # Preview
                 })
        except Exception as e:
            print(f"Could not query Article vector index: {e}")


        # Find similar Precedents
        try:
            precedent_res = session.run(
                """
                CALL db.index.vector.queryNodes('precedent_embedding', $top_k, $query_embedding) YIELD node, score
                MATCH (node)-[:REFERENCES_ARTICLE]->(a:Article)
                OPTIONAL MATCH (node)-[:HAS_KEYWORD]->(k:Keyword)
                RETURN node.id AS case_id, node.name as case_name, node.full_summary AS text, score,
                       collect(DISTINCT a.id) as referenced_articles,
                       collect(DISTINCT k.text) as keywords
                """,
                top_k=top_k,
                query_embedding=query_embedding
            )
            for record in precedent_res:
                 results.append({
                     "type": "Precedent",
                     "id": record["case_id"],
                     "name": record["case_name"],
                     "score": record["score"],
                     "text": record["text"][:300] + "...", # Preview
                     "referenced_articles": record["referenced_articles"],
                     "keywords": record["keywords"]
                 })
        except Exception as e:
            print(f"Could not query Precedent vector index: {e}")


    end_time = time.time()
    print(f"Query completed in {end_time - start_time:.2f} seconds.")

    # Sort results by score (descending) and take top K overall
    results.sort(key=lambda x: x["score"], reverse=True)

    print("\n--- Top Results ---")
    for i, res in enumerate(results[:top_k]):
        print(f"{i+1}. Type: {res['type']}, ID: {res['id']}, Score: {res['score']:.4f}")
        if res['type'] == 'Precedent':
            print(f"   Name: {res.get('name')}")
            print(f"   Keywords: {res.get('keywords')}")
            print(f"   Referenced Articles: {res.get('referenced_articles')}")
        print(f"   Text Preview: {res['text']}")
        print("-" * 20)

    return results[:top_k] # Return top K overall results


# Test query
query = "정당방위의 요건은 무엇인가?"
retrieved_context = query_graph_rag(driver, query, embedding_model, top_k=3)

# Close driver when completely finished
driver.close()
print("\nNeo4j driver closed.")


--- Querying RAG for: '정당방위의 요건은 무엇인가?' ---


  with driver.session(database="neo4j") as session:


Query completed in 3.24 seconds.

--- Top Results ---
1. Type: Precedent, ID: 92도2540, Score: 0.7387
   Name: 살인
   Keywords: ['타인의 법익', '상당한 이유']
   Referenced Articles: ['제10조(심신장애자)', '제21조(정당방위)', '제308조(사자의 명예훼손)', '제308조', '제10조 (폐지되는 법률등)']
   Text Preview: 정당방위의 성립요건으로서의 방어행위에는 순수한 수비적 방어뿐 아니라 적극적 반격을 포함하는 반격방어의 형태도 포함됨은 소론과 같다고 하겠으나, 그 방어행위는 자기 또는 타인의 법익침해를 방위하기 위한 행위로서 상당한 이유가 있어야 하는 것인데, 피고인들의 판시 행위가 위에서 본 바와 같이 그 상당성을 결여한 것인 이상 정당방위행위로 평가될 수는 없는 것이므로, 원심이 피고인들의 이 사건 범행이 현재의 부당한 침해를 방위할 의사로 행해졌다기보다는 공격의 의사로 행하여졌다고 인정한 것이 적절하지 못하다고 하더라도, 정당방위행위가 되지 ...
--------------------
2. Type: Precedent, ID: 2009도2114, Score: 0.6939
   Name: 특수공무집행방해[변경된죄명:폭력행위등처벌에관한법률위반(공동폭행)]
   Keywords: ['사회상규에 위배', '소극적인 방어행위']
   Referenced Articles: ['제6조(대한민국과 대한민국 국민에 대한 국외범)', '제20조(정당행위)', '제21조(정당방위)', '제136조(공무집행방해)', '제136조', '제260조(폭행, 존속폭행)', '제260조', '제6조 (경합범에 대한 신법의 적용례)', '제6조']
   Text Preview: 비록 경찰관들의 위법한 상경 제지 행위에 대항하기 위하여 한 것이라 하더라도, 피고인들이 다른 시위참가자들과 공동하여 위와 같이 경찰관들을 때리고 진압방패와 채증

In [12]:
def hybrid_query_rag(driver, query_text, embed_model, top_k=3):
    print(f"\n--- 하이브리드 검색 실행: '{query_text}' ---")
    start_time = time.time()

    # 벡터 검색을 위한 임베딩
    query_embedding = embed_model.embed_query(query_text)
    
    # 간단한 키워드 추출 (1글자 이하 단어 제외)
    keywords = [w for w in re.findall(r'\w+', query_text) if len(w) > 1]
    
    results = []
    with driver.session(database="neo4j") as session:
        # Article 하이브리드 검색
        try:
            # 키워드 필터 준비
            keyword_conditions = []
            for keyword in keywords:
                keyword_conditions.append(f"node.text CONTAINS '{keyword}'")
            
            # 키워드가 있는 경우에만 필터 적용
            keyword_filter = " OR ".join(keyword_conditions) if keyword_conditions else "true"
            
            article_query = f"""
            MATCH (node:Article)
            WHERE {keyword_filter}
            WITH node, 0.2 as keyword_match
            CALL db.index.vector.queryNodes('article_embedding', 50, $query_embedding) 
                YIELD node as vector_node, score as vector_score
            WHERE node = vector_node
            WITH node, keyword_match + vector_score * 0.8 as combined_score
            RETURN node.id AS id, 'Article' as type, node.text AS text, 
                   combined_score as score
            ORDER BY combined_score DESC
            LIMIT $top_k
            """
            
            article_res = session.run(
                article_query,
                query_embedding=query_embedding,
                top_k=top_k
            )
            
            for record in article_res:
                results.append({
                    "type": record["type"],
                    "id": record["id"],
                    "score": record["score"],
                    "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"]
                })
        except Exception as e:
            print(f"Article 하이브리드 검색 오류: {e}")
            
            # 백업: 기본 벡터 검색
            try:
                article_res = session.run(
                    """
                    CALL db.index.vector.queryNodes('article_embedding', $top_k, $query_embedding) 
                    YIELD node, score
                    RETURN node.id AS id, 'Article' as type, node.text AS text, score
                    """,
                    top_k=top_k,
                    query_embedding=query_embedding
                )
                
                for record in article_res:
                    results.append({
                        "type": record["type"],
                        "id": record["id"],
                        "score": record["score"],
                        "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"]
                    })
            except Exception as e2:
                print(f"기본 Article 벡터 검색 오류: {e2}")

        # Precedent 하이브리드 검색
        try:
            keyword_filter = " OR ".join([f"node.full_summary CONTAINS '{k}' OR node.judgment_summary CONTAINS '{k}'" 
                                         for k in keywords]) if keywords else "true"
            
            precedent_query = f"""
            MATCH (node:Precedent)
            WHERE {keyword_filter}
            WITH node, 0.2 as keyword_match
            CALL db.index.vector.queryNodes('precedent_embedding', 50, $query_embedding) 
                YIELD node as vector_node, score as vector_score
            WHERE node = vector_node
            WITH node, keyword_match + vector_score * 0.8 as combined_score
            MATCH (node)-[:REFERENCES_ARTICLE]->(a:Article)
            OPTIONAL MATCH (node)-[:HAS_KEYWORD]->(k:Keyword)
            RETURN node.id AS id, 'Precedent' as type, 
                   node.name AS name, node.full_summary AS text, 
                   combined_score as score,
                   collect(DISTINCT a.id) as referenced_articles,
                   collect(DISTINCT k.text) as keywords
            ORDER BY combined_score DESC
            LIMIT $top_k
            """
            
            precedent_res = session.run(
                precedent_query,
                query_embedding=query_embedding,
                top_k=top_k
            )
            
            for record in precedent_res:
                results.append({
                    "type": record["type"],
                    "id": record["id"],
                    "name": record["name"],
                    "score": record["score"],
                    "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                    "referenced_articles": record["referenced_articles"],
                    "keywords": record["keywords"]
                })
        except Exception as e:
            print(f"Precedent 하이브리드 검색 오류: {e}")
            
            # 백업: 기본 벡터 검색
            try:
                precedent_res = session.run(
                    """
                    CALL db.index.vector.queryNodes('precedent_embedding', $top_k, $query_embedding) 
                    YIELD node, score
                    MATCH (node)-[:REFERENCES_ARTICLE]->(a:Article)
                    OPTIONAL MATCH (node)-[:HAS_KEYWORD]->(k:Keyword)
                    RETURN node.id AS id, 'Precedent' as type, 
                           node.name AS name, node.full_summary AS text, 
                           score,
                           collect(DISTINCT a.id) as referenced_articles,
                           collect(DISTINCT k.text) as keywords
                    ORDER BY score DESC
                    LIMIT $top_k
                    """,
                    top_k=top_k,
                    query_embedding=query_embedding
                )
                
                for record in precedent_res:
                    results.append({
                        "type": record["type"],
                        "id": record["id"],
                        "name": record["name"],
                        "score": record["score"],
                        "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                        "referenced_articles": record["referenced_articles"],
                        "keywords": record["keywords"]
                    })
            except Exception as e2:
                print(f"기본 Precedent 벡터 검색 오류: {e2}")

    end_time = time.time()
    print(f"검색 완료: {end_time - start_time:.2f}초 소요")

    # 결과를 스코어로 정렬
    results.sort(key=lambda x: x["score"], reverse=True)

    print("\n--- 검색 결과 ---")
    for i, res in enumerate(results[:top_k]):
        print(f"{i+1}. 유형: {res['type']}, ID: {res['id']}, 스코어: {res['score']:.4f}")
        if res['type'] == 'Precedent':
            print(f"   이름: {res.get('name')}")
            print(f"   키워드: {res.get('keywords')}")
            print(f"   참조 법조항: {res.get('referenced_articles')}")
        print(f"   미리보기: {res['text']}")
        print("-" * 20)

    return results[:top_k]

In [13]:
def multi_step_rag(driver, query_text, embed_model, top_k=3):
    print(f"\n--- 다단계 검색 실행: '{query_text}' ---")
    start_time = time.time()

    # 임베딩 생성
    query_embedding = embed_model.embed_query(query_text)
    
    results = []
    with driver.session(database="neo4j") as session:
        # 1단계: 관련 법조항 찾기
        article_results = []
        try:
            articles = session.run(
                """
                CALL db.index.vector.queryNodes('article_embedding', $top_k, $query_embedding) 
                YIELD node, score
                RETURN node.id AS id, node.text AS text, score
                ORDER BY score DESC
                """,
                top_k=top_k,
                query_embedding=query_embedding
            )
            
            for record in articles:
                article_results.append({
                    "id": record["id"],
                    "text": record["text"],
                    "score": record["score"]
                })
                
                # 각 법조항을 결과에 추가
                results.append({
                    "type": "Article",
                    "id": record["id"],
                    "score": record["score"],
                    "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"]
                })
        except Exception as e:
            print(f"법조항 검색 오류: {e}")
        
        # 2단계: 각 법조항을 참조하는 판례 찾기
        for article in article_results:
            try:
                # 해당 법조항을 참조하는 판례 중에서도 쿼리와 관련성이 높은 판례 검색
                precedents = session.run(
                    """
                    MATCH (p:Precedent)-[:REFERENCES_ARTICLE]->(a:Article)
                    WHERE a.id STARTS WITH $article_id
                    WITH p
                    CALL db.index.vector.queryNodes('precedent_embedding', 10, $query_embedding) 
                    YIELD node, score
                    WHERE p = node
                    MATCH (p)-[:REFERENCES_ARTICLE]->(ref_article:Article)
                    OPTIONAL MATCH (p)-[:HAS_KEYWORD]->(k:Keyword)
                    RETURN p.id AS id, p.name as name, p.full_summary AS text, 
                           score,
                           collect(DISTINCT ref_article.id) as referenced_articles,
                           collect(DISTINCT k.text) as keywords
                    ORDER BY score DESC
                    LIMIT 2
                    """,
                    article_id=article["id"],
                    query_embedding=query_embedding
                )
                
                for record in precedents:
                    # 중복 제거를 위한 ID 확인
                    if not any(r["type"] == "Precedent" and r["id"] == record["id"] for r in results):
                        results.append({
                            "type": "Precedent",
                            "id": record["id"],
                            "name": record["name"],
                            "score": record["score"],
                            "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                            "referenced_articles": record["referenced_articles"],
                            "keywords": record["keywords"]
                        })
            except Exception as e:
                print(f"판례 검색 오류 (법조항 {article['id']}): {e}")
        
        # 3단계(선택): 벡터 검색으로 최상위 판례 직접 찾기
        if len([r for r in results if r["type"] == "Precedent"]) < 2:
            try:
                direct_precedents = session.run(
                    """
                    CALL db.index.vector.queryNodes('precedent_embedding', 3, $query_embedding) 
                    YIELD node, score
                    MATCH (node)-[:REFERENCES_ARTICLE]->(a:Article)
                    OPTIONAL MATCH (node)-[:HAS_KEYWORD]->(k:Keyword)
                    RETURN node.id AS id, 'Precedent' as type, 
                           node.name AS name, node.full_summary AS text, 
                           score,
                           collect(DISTINCT a.id) as referenced_articles,
                           collect(DISTINCT k.text) as keywords
                    """,
                    query_embedding=query_embedding
                )
                
                for record in direct_precedents:
                    if not any(r["type"] == "Precedent" and r["id"] == record["id"] for r in results):
                        results.append({
                            "type": record["type"],
                            "id": record["id"],
                            "name": record["name"],
                            "score": record["score"],
                            "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                            "referenced_articles": record["referenced_articles"],
                            "keywords": record["keywords"]
                        })
            except Exception as e:
                print(f"직접 판례 검색 오류: {e}")
    
    end_time = time.time()
    print(f"검색 완료: {end_time - start_time:.2f}초 소요")

    # 결과를 스코어로 정렬
    results.sort(key=lambda x: x["score"], reverse=True)

    print("\n--- 검색 결과 ---")
    for i, res in enumerate(results[:top_k]):
        print(f"{i+1}. 유형: {res['type']}, ID: {res['id']}, 스코어: {res['score']:.4f}")
        if res['type'] == 'Precedent':
            print(f"   이름: {res.get('name')}")
            print(f"   키워드: {res.get('keywords')}")
            print(f"   참조 법조항: {res.get('referenced_articles')}")
        print(f"   미리보기: {res['text']}")
        print("-" * 20)

    return results[:top_k]

In [14]:
def graph_enhanced_rag(driver, query_text, embed_model, top_k=3):
    print(f"\n--- 그래프 기반 검색 실행: '{query_text}' ---")
    start_time = time.time()

    # 임베딩 생성
    query_embedding = embed_model.embed_query(query_text)
    
    # 키워드 추출
    keywords = [w for w in re.findall(r'\w+', query_text) if len(w) > 1]
    
    results = []
    with driver.session(database="neo4j") as session:
        try:
            # 그래프 구조를 활용한 검색
            cypher_query = """
            // 1. 벡터 검색으로 시작 법조항 찾기
            CALL db.index.vector.queryNodes('article_embedding', 5, $query_embedding) 
            YIELD node as article, score as article_score
            
            // 2. 해당 법조항과 연결된 판례와 키워드 찾기
            OPTIONAL MATCH (precedent:Precedent)-[:REFERENCES_ARTICLE]->(article)
            OPTIONAL MATCH (precedent)-[:HAS_KEYWORD]->(keyword:Keyword)
            
            // 3. 결과 집계 및 점수 계산
            WITH article, article_score, precedent, 
                 collect(DISTINCT keyword.text) as keywords,
                 count(precedent) as precedent_count
            
            // 법조항 점수 = 벡터 점수 + 판례 인용 수에 따른 보너스
            WITH article, article_score + (precedent_count * 0.01) as final_score,
                 precedent_count, keywords
            
            RETURN article.id as id, 
                   'Article' as type, 
                   article.text as text, 
                   final_score as score,
                   precedent_count,
                   keywords
            ORDER BY final_score DESC
            LIMIT $article_limit
            """
            
            # 법조항 검색
            article_results = session.run(
                cypher_query,
                query_embedding=query_embedding,
                article_limit=top_k
            )
            
            for record in article_results:
                results.append({
                    "type": record["type"],
                    "id": record["id"],
                    "score": record["score"],
                    "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                    "precedent_count": record["precedent_count"],
                    "related_keywords": record["keywords"]
                })
            
            # 관련 판례 검색
            for article_result in results[:3]:  # 상위 3개 법조항에 대해서만
                if article_result["type"] == "Article":
                    precedent_query = """
                    // 1. 특정 법조항을 참조하는 판례 찾기
                    MATCH (precedent:Precedent)-[:REFERENCES_ARTICLE]->(article:Article)
                    WHERE article.id STARTS WITH $article_id
                    
                    // 2. 해당 판례와 키워드
                    OPTIONAL MATCH (precedent)-[:HAS_KEYWORD]->(keyword:Keyword)
                    
                    // 3. 벡터 유사도 계산
                    CALL db.index.vector.queryNodes('precedent_embedding', 20, $query_embedding) 
                    YIELD node as vector_node, score as vector_score
                    WHERE precedent = vector_node
                    
                    // 4. 검색어와 관련된 키워드가 있는지 확인하여 보너스 점수
                    WITH precedent, vector_score, 
                         collect(DISTINCT keyword.text) as keywords,
                         sum(CASE WHEN $query_keywords IS NULL THEN 0
                              WHEN any(k IN $query_keywords WHERE keyword.text CONTAINS k) 
                              THEN 0.05 ELSE 0 END) as keyword_bonus
                    
                    // 5. 다른 법조항도 참조하는지 확인
                    MATCH (precedent)-[:REFERENCES_ARTICLE]->(ref_article:Article)
                    
                    // 6. 최종 결과 반환
                    RETURN precedent.id as id,
                           'Precedent' as type,
                           precedent.name as name,
                           precedent.full_summary as text,
                           vector_score + keyword_bonus as score,
                           keywords,
                           collect(DISTINCT ref_article.id) as referenced_articles
                    ORDER BY score DESC
                    LIMIT 2
                    """
                    
                    precedent_results = session.run(
                        precedent_query,
                        article_id=article_result["id"],
                        query_embedding=query_embedding,
                        query_keywords=keywords
                    )
                    
                    for record in precedent_results:
                        # 중복 제거
                        if not any(r["type"] == "Precedent" and r["id"] == record["id"] for r in results):
                            results.append({
                                "type": record["type"],
                                "id": record["id"],
                                "name": record["name"],
                                "score": record["score"],
                                "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                                "keywords": record["keywords"],
                                "referenced_articles": record["referenced_articles"]
                            })
        
        except Exception as e:
            print(f"그래프 검색 오류: {e}")
            # 백업: 기본 벡터 검색
            try:
                # Article 검색
                article_res = session.run(
                    """
                    CALL db.index.vector.queryNodes('article_embedding', $top_k, $query_embedding) 
                    YIELD node, score
                    RETURN node.id AS id, 'Article' as type, node.text AS text, score
                    """,
                    top_k=top_k,
                    query_embedding=query_embedding
                )
                
                for record in article_res:
                    results.append({
                        "type": record["type"],
                        "id": record["id"],
                        "score": record["score"],
                        "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"]
                    })
                
                # Precedent 검색
                precedent_res = session.run(
                    """
                    CALL db.index.vector.queryNodes('precedent_embedding', $top_k, $query_embedding) 
                    YIELD node, score
                    MATCH (node)-[:REFERENCES_ARTICLE]->(a:Article)
                    OPTIONAL MATCH (node)-[:HAS_KEYWORD]->(k:Keyword)
                    RETURN node.id AS id, 'Precedent' as type, 
                           node.name AS name, node.full_summary AS text, 
                           score,
                           collect(DISTINCT a.id) as referenced_articles,
                           collect(DISTINCT k.text) as keywords
                    """,
                    top_k=top_k,
                    query_embedding=query_embedding
                )
                
                for record in precedent_res:
                    results.append({
                        "type": record["type"],
                        "id": record["id"],
                        "name": record["name"],
                        "score": record["score"],
                        "text": record["text"][:300] + "..." if len(record["text"]) > 300 else record["text"],
                        "referenced_articles": record["referenced_articles"],
                        "keywords": record["keywords"]
                    })
            except Exception as e2:
                print(f"백업 검색 오류: {e2}")
    
    end_time = time.time()
    print(f"검색 완료: {end_time - start_time:.2f}초 소요")

    # 결과를 스코어로 정렬
    results.sort(key=lambda x: x["score"], reverse=True)

    print("\n--- 검색 결과 ---")
    for i, res in enumerate(results[:top_k]):
        print(f"{i+1}. 유형: {res['type']}, ID: {res['id']}, 스코어: {res['score']:.4f}")
        if res['type'] == 'Precedent':
            print(f"   이름: {res.get('name')}")
            print(f"   키워드: {res.get('keywords')}")
            print(f"   참조 법조항: {res.get('referenced_articles')}")
        elif res['type'] == 'Article':
            print(f"   관련 판례 수: {res.get('precedent_count', 0)}")
            print(f"   관련 키워드: {res.get('related_keywords')}")
        print(f"   미리보기: {res['text']}")
        print("-" * 20)

    return results[:top_k]

In [15]:
# 테스트할 검색 함수 선택 (세 가지 중 하나 사용)
search_function = hybrid_query_rag  # 또는 multi_step_rag 또는 graph_enhanced_rag

# 테스트 쿼리
query = "정당방위의 요건은 무엇인가?"
retrieved_context = search_function(driver, query, embedding_model, top_k=3)

# 드라이버 연결 종료
driver.close()
print("\nNeo4j 드라이버 연결 종료")


--- 하이브리드 검색 실행: '정당방위의 요건은 무엇인가?' ---


  with driver.session(database="neo4j") as session:


검색 완료: 3.40초 소요

--- 검색 결과 ---
1. 유형: Precedent, ID: 92도2540, 스코어: 0.7910
   이름: 살인
   키워드: ['타인의 법익', '상당한 이유']
   참조 법조항: ['제10조(심신장애자)', '제21조(정당방위)', '제308조(사자의 명예훼손)', '제308조', '제10조 (폐지되는 법률등)']
   미리보기: 정당방위의 성립요건으로서의 방어행위에는 순수한 수비적 방어뿐 아니라 적극적 반격을 포함하는 반격방어의 형태도 포함됨은 소론과 같다고 하겠으나, 그 방어행위는 자기 또는 타인의 법익침해를 방위하기 위한 행위로서 상당한 이유가 있어야 하는 것인데, 피고인들의 판시 행위가 위에서 본 바와 같이 그 상당성을 결여한 것인 이상 정당방위행위로 평가될 수는 없는 것이므로, 원심이 피고인들의 이 사건 범행이 현재의 부당한 침해를 방위할 의사로 행해졌다기보다는 공격의 의사로 행하여졌다고 인정한 것이 적절하지 못하다고 하더라도, 정당방위행위가 되지 ...
--------------------
2. 유형: Precedent, ID: 2003도4934, 스코어: 0.7295
   이름: 명예훼손(일부 인정된 죄명 : 모욕)·폭행
   키워드: ['사회상규에 위배되지 아니하는 행위', '행위의 수단이나 방법의 상당성']
   참조 법조항: ['제20조(정당행위)', '제21조(정당방위)', '제232조(자격모용에 의한 사문서의 작성)', '제232조의2(사전자기록위작ㆍ변작)', '제260조(폭행, 존속폭행)', '제260조', '제307조(명예훼손)', '제307조', '제311조(모욕)', '제312조(고소와 피해자의 의사)', '제311조', '제314조(업무방해)', '제316조(비밀침해)']
   미리보기: 형법 제20조 소정의 ‘사회상규에 위배되지 아니하는 행위’라 함은 법질서 전체의 정신이나 그 배후에 놓여 있는 사회윤리 내지 사회통념에 비추어 용인될 수 있는 행위를 말하고, 어떠한 행위가 사회상규에 위

In [16]:
# 테스트할 검색 함수 선택 (세 가지 중 하나 사용)
search_function = multi_step_rag  # 또는 multi_step_rag 또는 graph_enhanced_rag

# 테스트 쿼리
query = "정당방위의 요건은 무엇인가?"
retrieved_context = search_function(driver, query, embedding_model, top_k=3)

# 드라이버 연결 종료
driver.close()
print("\nNeo4j 드라이버 연결 종료")


--- 다단계 검색 실행: '정당방위의 요건은 무엇인가?' ---


  with driver.session(database="neo4j") as session:


검색 완료: 3.40초 소요

--- 검색 결과 ---
1. 유형: Precedent, ID: 92도2540, 스코어: 0.7386
   이름: 살인
   키워드: ['타인의 법익', '상당한 이유']
   참조 법조항: ['제10조(심신장애자)', '제21조(정당방위)', '제308조(사자의 명예훼손)', '제308조', '제10조 (폐지되는 법률등)']
   미리보기: 정당방위의 성립요건으로서의 방어행위에는 순수한 수비적 방어뿐 아니라 적극적 반격을 포함하는 반격방어의 형태도 포함됨은 소론과 같다고 하겠으나, 그 방어행위는 자기 또는 타인의 법익침해를 방위하기 위한 행위로서 상당한 이유가 있어야 하는 것인데, 피고인들의 판시 행위가 위에서 본 바와 같이 그 상당성을 결여한 것인 이상 정당방위행위로 평가될 수는 없는 것이므로, 원심이 피고인들의 이 사건 범행이 현재의 부당한 침해를 방위할 의사로 행해졌다기보다는 공격의 의사로 행하여졌다고 인정한 것이 적절하지 못하다고 하더라도, 정당방위행위가 되지 ...
--------------------
2. 유형: Precedent, ID: 2009도2114, 스코어: 0.6940
   이름: 특수공무집행방해[변경된죄명:폭력행위등처벌에관한법률위반(공동폭행)]
   키워드: ['사회상규에 위배', '소극적인 방어행위']
   참조 법조항: ['제6조(대한민국과 대한민국 국민에 대한 국외범)', '제20조(정당행위)', '제21조(정당방위)', '제136조(공무집행방해)', '제136조', '제260조(폭행, 존속폭행)', '제260조', '제6조 (경합범에 대한 신법의 적용례)', '제6조']
   미리보기: 비록 경찰관들의 위법한 상경 제지 행위에 대항하기 위하여 한 것이라 하더라도, 피고인들이 다른 시위참가자들과 공동하여 위와 같이 경찰관들을 때리고 진압방패와 채증장비를 빼앗는 등의 폭행행위를 한 것은 소극적인 방어행위를 넘어서 공격의 의사를 포함하여 이루어진 것으로서 그 수단과 방법에 있어서 상당성이 인정된다고 보기

In [17]:
# 테스트할 검색 함수 선택 (세 가지 중 하나 사용)
search_function = graph_enhanced_rag  # 또는 multi_step_rag 또는 graph_enhanced_rag

# 테스트 쿼리
query = "정당방위의 요건은 무엇인가?"
retrieved_context = search_function(driver, query, embedding_model, top_k=3)

# 드라이버 연결 종료
driver.close()
print("\nNeo4j 드라이버 연결 종료")


--- 그래프 기반 검색 실행: '정당방위의 요건은 무엇인가?' ---


  with driver.session(database="neo4j") as session:


검색 완료: 3.51초 소요

--- 검색 결과 ---
1. 유형: Article, ID: 제21조(정당방위), 스코어: 0.7724
   관련 판례 수: 7
   관련 키워드: ['공소시효', '정지', '연장', '배제', '특례조항', '소급적용', '경과규정']
   미리보기: 제21조(정당방위) ①자기 또는 타인의 법익에 대한 현재의 부당한 침해를 방위하기 위한 행위는
상당한 이유가 있는 때에는 벌하지 아니한다.
②방위행위가 그 정도를 초과한 때에는 정황에 의하여 그 형을 감경 또는 면제할 수 있다.
③전항의 경우에 그 행위가 야간 기타 불안스러운 상태하에서 공포, 경악, 흥분 또는 당황으로
인한 때에는 벌하지 아니한다.
--------------------
2. 유형: Article, ID: 제21조(정당방위), 스코어: 0.7624
   관련 판례 수: 6
   관련 키워드: ['성범죄', '선고형', '경합범', '성폭력처벌법', '개정', '신상정보 등록기간']
   미리보기: 제21조(정당방위) ①자기 또는 타인의 법익에 대한 현재의 부당한 침해를 방위하기 위한 행위는
상당한 이유가 있는 때에는 벌하지 아니한다.
②방위행위가 그 정도를 초과한 때에는 정황에 의하여 그 형을 감경 또는 면제할 수 있다.
③전항의 경우에 그 행위가 야간 기타 불안스러운 상태하에서 공포, 경악, 흥분 또는 당황으로
인한 때에는 벌하지 아니한다.
--------------------
3. 유형: Precedent, ID: 92도2540, 스코어: 0.7387
   이름: 살인
   키워드: ['타인의 법익', '상당한 이유']
   참조 법조항: ['제10조(심신장애자)', '제21조(정당방위)', '제308조(사자의 명예훼손)', '제308조', '제10조 (폐지되는 법률등)']
   미리보기: 정당방위의 성립요건으로서의 방어행위에는 순수한 수비적 방어뿐 아니라 적극적 반격을 포함하는 반격방어의 형태도 포함됨은 소론과 같다고 하겠으나, 그 방어행위는 자기 또는 타인