In [1]:
%pip install pandas

Note: you may need to restart the kernel to use updated packages.


In [3]:
# -*- coding: utf-8 -*-
import pandas as pd

def load_data(filepath):
    """
    讀取 CSV 檔案並回傳 pandas DataFrame
    """
    df = pd.read_csv(filepath, encoding="utf-8")
    return df

def get_factors_by_id(case_id, df, id_column="Unnamed: 0", ignore_columns=None):
    """
    根據案件 ID（預設存放在 id_column 欄位）搜尋案件，
    並回傳該案件中所有值為 1 的 factor 欄位名稱。
    
    參數：
      case_id：要查詢的案件 ID
      df：從 CSV 讀取的 DataFrame
      id_column：案件識別的欄位名稱，預設為 "Unnamed: 0"
      ignore_columns：要忽略的欄位列表（例如案件 ID 欄位或其他非 factor 欄位）
    
    回傳：
      若找到對應案件，回傳包含 factor 欄位名稱的列表；若找不到則回傳 None。
    """
    if ignore_columns is None:
        ignore_columns = [id_column]
    
    # 根據 id_column 搜尋符合的案件
    case_row = df[df[id_column] == case_id]
    
    if case_row.empty:
        return None
    
    # 取出該筆案件資料
    case_series = case_row.iloc[0]
    
    # 過濾出除了忽略欄位外，值為 1 的所有欄位名稱
    present_factors = [
        col for col in case_series.index 
        if col not in ignore_columns and case_series[col] == 1
    ]
    
    return present_factors

if __name__ == "__main__":
    filepath = "result_df_075.csv"
    df = load_data(filepath)
    
    # 例如查詢案件 ID 為 2 的資料（請根據實際資料調整 id_column 與案件 ID）
    case_id = 3
    factors = get_factors_by_id(case_id, df, id_column="Unnamed: 0")
    
    if factors is not None:
        print("案件 {} 擁有的法律 factor：".format(case_id), factors)
    else:
        print("找不到案件 ID:", case_id)

案件 3 擁有的法律 factor： ['於日常生活中有信賴關係', '與被害人達成和解', '審理中始坦承', '健全成長可能性', '嚴重精神創傷', '道歉且得被害人宥恕']


In [6]:
import json
import os

def print_judgment_by_index(index):
    """
    根據索引列印出對應判決內容
    
    參數:
    index -- 要查詢的判決索引（從0開始）
    """
    # 確認檔案路徑
    file_path = 'sexoffense_judgments_700.json'
    
    # 檢查檔案是否存在
    if not os.path.exists(file_path):
        print(f"錯誤: 找不到檔案 '{file_path}'")
        return
    
    try:
        # 讀取JSON檔案
        with open(file_path, 'r', encoding='utf-8') as file:
            judgments = json.load(file)
        
        # 判斷JSON結構並根據索引獲取判決
        if isinstance(judgments, list):
            # 如果是列表結構，直接使用索引
            if 0 <= index < len(judgments):
                judgment = judgments[index]
                print(f"索引 {index} 的判決:")
                print(json.dumps(judgment, ensure_ascii=False, indent=2))
            else:
                print(f"錯誤: 索引 {index} 超出範圍 (0-{len(judgments)-1})")
                
        elif isinstance(judgments, dict):
            # 如果是字典結構，使用鍵列表的索引
            keys = list(judgments.keys())
            if 0 <= index < len(keys):
                key = keys[index]
                judgment = judgments[key]
                print(f"索引 {index} (ID: {key}) 的判決:")
                print(json.dumps(judgment, ensure_ascii=False, indent=2))
            else:
                print(f"錯誤: 索引 {index} 超出範圍 (0-{len(keys)-1})")
        else:
            print("錯誤: JSON檔案結構不支援索引訪問")
            
    except json.JSONDecodeError:
        print("錯誤: 無法解析JSON檔案，檔案格式可能有誤")
    except Exception as e:
        print(f"錯誤: {e}")

In [7]:
print_judgment_by_index(0)


索引 0 的判決:
{
  "no": "100,侵上訴,30",
  "reason": "sexoffense",
  "fact": "一、0000-0000B係0000-0000（民國85年8月生，姓名年籍詳如卷內代號與真實姓名對照表，以下簡稱甲女）之伯公，明知甲女為未滿14歲之未成年女子，於97年7月、8月間某日11時許，見甲女獨自前來其住宅（地址如卷內代號與真實姓名對照所載地址），竟基於對未滿14歲之女子為強制猥褻之犯意，在違反甲女意願情況下，將甲女誘往屋內廚房後將甲女擁抱坐於腿上，先以手撫摸甲女之胸部，以嘴吸吮甲女之胸部，再解開甲女之褲頭，伸手進入撫摸甲女之下體，適為甲女之妹即0000-0000C（姓名年籍詳如卷內代號與真實姓名對照表）撞見，0000-0000B即停止前述行為，並佯若無事，以飲料水果打發甲女及0000-0000C返家。二、案經甲女及其母0000-0000A（姓名年籍詳如卷內代號與真實姓名對照表）訴由臺東縣警察局移送臺灣臺東地方法院檢察署檢察官偵查起訴。",
  "judgment": "臺灣高等法院花蓮分院刑事判決100年度侵上訴字第30號上訴人即被告0000-0000.選任辯護人吳漢成律師上列上訴人因妨害性自主案件，不服臺灣臺東地方法院100年度侵訴字第2號中華民國100年7月26日第一審判決（起訴案號：臺灣臺東地方法院檢察署100年度偵字第164號），提起上訴，本院判決如下：主文原判決撤銷。0000-0000B對未滿十四歲女子犯強制猥褻罪，處有期徒刑壹年拾月。緩刑肆年，緩刑期間付保護管束。犯罪事實一、0000-0000B係0000-0000（民國85年8月生，姓名年籍詳如卷內代號與真實姓名對照表，以下簡稱甲女）之伯公，明知甲女為未滿14歲之未成年女子，於97年7月、8月間某日11時許，見甲女獨自前來其住宅（地址如卷內代號與真實姓名對照所載地址），竟基於對未滿14歲之女子為強制猥褻之犯意，在違反甲女意願情況下，將甲女誘往屋內廚房後將甲女擁抱坐於腿上，先以手撫摸甲女之胸部，以嘴吸吮甲女之胸部，再解開甲女之褲頭，伸手進入撫摸甲女之下體，適為甲女之妹即0000-0000C（姓名年籍詳如卷內代號與真實姓名對照表）撞見，0000-0000B即停止前述行為，並佯若無事，以飲料水果打發甲女及0000-0000C返家。二、案經甲女及其母0000-00

In [8]:
import json
import os

def search_judgments_by_factors(factors):
    """
    根據輸入的多個因素檢索符合所有條件的判決索引
    
    參數:
    factors -- 要檢索的因素列表
    
    返回:
    符合所有指定因素的判決索引列表
    """
    # 確認檔案路徑
    file_path = 'inverted_index_075.json'
    
    # 檢查檔案是否存在
    if not os.path.exists(file_path):
        print(f"錯誤: 找不到檔案 '{file_path}'")
        return []
    
    try:
        # 讀取JSON檔案
        with open(file_path, 'r', encoding='utf-8') as file:
            inverted_index = json.load(file)
        
        # 檢查輸入的因素是否存在於索引中
        valid_factors = []
        for factor in factors:
            if factor in inverted_index:
                valid_factors.append(factor)
            else:
                print(f"警告: 因素 '{factor}' 不存在於索引中")
        
        if not valid_factors:
            print("沒有有效的檢索因素")
            return []
        
        # 取得第一個因素的判決索引集合
        result_set = set(inverted_index[valid_factors[0]])
        
        # 計算所有因素的交集
        for factor in valid_factors[1:]:
            result_set = result_set.intersection(set(inverted_index[factor]))
        
        # 將結果轉換為排序後的列表
        result_indices = sorted(list(result_set))
        
        # 顯示結果
        print(f"檢索條件: {', '.join(valid_factors)}")
        print(f"找到 {len(result_indices)} 筆符合的判決")
        if result_indices:
            print(f"判決索引: {', '.join(map(str, result_indices))}")
        else:
            print("沒有找到符合所有指定條件的判決")
        
        return result_indices
        
    except json.JSONDecodeError:
        print("錯誤: 無法解析JSON檔案，檔案格式可能有誤")
        return []
    except Exception as e:
        print(f"錯誤: {e}")
        return []

def print_judgment_by_index(index):
    """根據索引顯示判決內容"""
    # 使用先前定義的函數
    # 確認檔案路徑
    file_path = 'sexoffense_judgments_700.json'
    
    # 檢查檔案是否存在
    if not os.path.exists(file_path):
        print(f"錯誤: 找不到檔案 '{file_path}'")
        return
    
    try:
        # 讀取JSON檔案
        with open(file_path, 'r', encoding='utf-8') as file:
            judgments = json.load(file)
        
        # 判斷JSON結構並根據索引獲取判決
        if isinstance(judgments, list):
            # 如果是列表結構，直接使用索引
            if 0 <= index < len(judgments):
                judgment = judgments[index]
                print(f"索引 {index} 的判決:")
                print(json.dumps(judgment, ensure_ascii=False, indent=2))
            else:
                print(f"錯誤: 索引 {index} 超出範圍 (0-{len(judgments)-1})")
                
        elif isinstance(judgments, dict):
            # 如果是字典結構，使用鍵列表的索引
            keys = list(judgments.keys())
            if str(index) in judgments:
                judgment = judgments[str(index)]
                print(f"索引 {index} 的判決:")
                print(json.dumps(judgment, ensure_ascii=False, indent=2))
            else:
                print(f"錯誤: 找不到索引 {index} 的判決")
        else:
            print("錯誤: JSON檔案結構不支援索引訪問")
            
    except json.JSONDecodeError:
        print("錯誤: 無法解析JSON檔案，檔案格式可能有誤")
    except Exception as e:
        print(f"錯誤: {e}")

In [None]:
# 範例2: 搜尋更複雜的條件
factors = ["網友", "嚴重精神創傷", "陌生人"]
matched_indices = search_judgments_by_factors(factors)

# 查看其中一個判決的詳細內容
if matched_indices:
    print_judgment_by_index(matched_indices[0])

檢索條件: 網友, 偵查中即已坦承
找到 18 筆符合的判決
判決索引: 88, 92, 101, 114, 117, 158, 161, 172, 204, 227, 243, 347, 354, 420, 421, 427, 449, 601
檢索條件: 網友, 嚴重精神創傷, 陌生人
找到 11 筆符合的判決
判決索引: 90, 161, 200, 227, 243, 347, 408, 427, 435, 477, 601
索引 90 的判決:
{
  "no": "101,侵訴,59",
  "reason": "sexoffense",
  "fact": "一、王懷祥前因偽造文書案件，經本院99年度簡字第829號判處有期徒刑4月，減為有期徒刑2月確定，甫於民國99年7月30日易科罰金執行完畢。仍不思悔改，竟於100年9月3日中午以電腦連結網際網路，在「UT網路聊天室」與14歲以上未滿16歲之女子，代號101U01之女子（民國85年12月生，姓名年籍資料詳卷，下稱甲女）聊天相識，雖未明知甲女為14歲以上未滿16歲之女子，但主觀上可預見甲女可能係未滿16歲女子，仍基於與14歲以上未滿16歲之女子性交亦不違背其本意之不確定故意，於同日下午3時許，與甲女相約在臺南火車站附近見面，隨後將甲女載往臺南市○○區○○街156號5樓之「巨人飯店」為性交易，並在上開飯店房間內，以陰莖進入甲女陰道而為性交行為1次得逞，事後依約給付新台幣（下同）3千元予甲女。二、案經臺南市政府警察局第四分局移請臺灣臺南地法院檢察署檢察官偵查起訴。",
  "judgment": "臺灣臺南地方法院刑事判決101年度侵訴字第59號公訴人臺灣臺南地方法院檢察署檢察官被告王懷祥選任辯護人何建宏律師吳玉英律師上列被告因妨害性自主案件，經檢察官提起公訴（101年度偵字第3593號），被告於準備程序就被訴事實為有罪之陳述，經本院合議庭裁定由受命法官改依簡式審判程序審理，並判決如下：主文王懷祥犯對於十四歲以上未滿十六歲之女子為性交罪，累犯，處有期徒刑陸月。事實一、王懷祥前因偽造文書案件，經本院99年度簡字第829號判處有期徒刑4月，減為有期徒刑2月確定，甫於民國99年7月30日易科罰金執行完畢。仍不思悔改，竟於100年9月3日中午以電腦連結網際網路，在「UT網路聊天室」與14歲以上未滿16歲之女子，代號1