In [3]:
import os
import re
import numpy as np
import pandas as pd
import requests
import json
import pickle
from langchain.document_loaders import PyPDFLoader
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
from neo4j import GraphDatabase
from utils import read_json

  from .autonotebook import tqdm as notebook_tqdm


In [4]:
def get_whole_pdf(file_data):
    whole_pdf = ""
    for i in range(len(file_data)):
        whole_pdf += file_data[i].page_content

    return whole_pdf

In [5]:
configs = read_json('configs.json')
DATA_PATH = configs["DATA_PATH"]
DB_PATH = configs['DB_PATH']
files_list = [file for file in os.listdir(DATA_PATH) if os.path.isfile(os.path.join(DATA_PATH, file))]

def read_pdf(files_list, data_path=DATA_PATH):
    content_dict = {}

    for file_name in files_list:
        file_path = data_path + file_name
        loader = PyPDFLoader(file_path)
        content = loader.load()
        whole_pdf = ""
        for i in range(len(content)):
            whole_pdf += content[i].page_content

        whole_pdf = re.sub(r'[：。\n]', '', whole_pdf)
        content_dict[file_name] = whole_pdf

    return content_dict

In [6]:
files_list

['34944_高鐵_促參.pdf',
 '38005_核四_政策.pdf',
 '39243_核四_品質.pdf',
 '39477_核四_料件.pdf',
 '46365_高鐵_基金.pdf',
 '48052_大客車_逃生門.pdf',
 '48746_大客車_安全門.pdf',
 '49490_核四_延宕.pdf',
 '49627_核四_停建.pdf',
 '49676_大客車_駕照.pdf',
 '52922_大客車_超時.pdf',
 '54210_高鐵_出資.pdf',
 '54376_高鐵_航發.pdf',
 '54561_高鐵_機電.pdf',
 '58930_核四_封存.pdf']

In [7]:
pdf_contents = read_pdf(files_list)

In [8]:
def content_extraction(input, pattern):

    # Search using the pattern
    match = re.search(pattern, input, re.S)

    if match:
        result = match.group(1).strip()  # Use strip() to remove any leading/trailing whitespace
        print("Extraction succeed.")
        return result
    else:
        print("No match found")
        pass

In [9]:
pattern = r"貳、案   由(.*?)參、事實與理由"

extracted_content = {}
for filename, content in pdf_contents.items():
    extracted_content[filename] = content_extraction(content, pattern)

Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.
Extraction succeed.


In [10]:
extracted_content

{'34944_高鐵_促參.pdf': '交通部於 87年間與臺灣高速鐵路公司簽訂「臺灣南北高速鐵路興建營運合約」及「臺灣南北高速鐵路站區開發合約 」，疏未預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生 損失之責任歸屬，並綢繆約定 相關處罰條款 ，嗣對政府權益保障恝置不察，一再同意該公司展延通車營運時程及受領站區用地， 致政府蒙受回饋金與租金收入減少及顧問費用增加等鉅額損失，均有違失，爰依監察法第 24條規定提案糾正',
 '38005_核四_政策.pdf': '核四封存後每年仍耗費數億元於資產維護管理，行政院及經濟部對外宣告核四重啟不可行，核四興建費用 2,833億元頇列為損失，行政院及 經濟部對核四政策之重大變動，導致資源嚴重浪費； 再者，經濟部宣布能源配比 (燃氣50%、燃煤30%、再生能源20%)之能源轉型政策，未經能源安全、能源經濟及環境影響等完整評估 ，復於再生能源發電量增加有限情況下， 以運轉中核電機組長期停機 方式減核 ，致近年火力發購電量逐年提高， 106年占比達84.4%，燃煤發電增幅 甚至高於燃氣，造成嚴重空氣污染；以及經濟部宣布 新能源政策 之前，並未評估其對電價之影響，迄 106年3月行政院始於國公營企業體檢小組會議評估 等情，均有違失，爰依法提案糾正',
 '39243_核四_品質.pdf': '台電公司 未落實「核四工程品質保證方案」，致龍門電廠試運轉時違規與注意改善事項層出不窮，如 抑壓池灌水作業 不當，致反應器廠房底層淹水 、壓力試驗合格之室內消防栓 系統，其 太平龍頭 竟脫落，致汽機廠房積水等 ，均嚴重衝擊國人對核能安全運轉之信心等情 ，確有諸多違失，爰依法提案糾正',
 '39477_核四_料件.pdf': '台灣電力股份有限公司 (下稱台電公司 )於本院調查核四廠一號機因施工測詴期間設備損壞而移用二號機相關設備之過程，所提供資料內容前後不一，設備組件損壞、採購及修復個數未能確實清查正確，顯見台電公司核四廠之料件管理系統紊亂，且回復本院公文一再發生資料正確性不足，核有怠失；另台電公司於 81年陳報核四興建計畫， 竟以69年所估算成本陳報， 未能如實報告核四建廠成本，致使政府無法確實評估該項投資計畫之成本效益，台電公司表示當時即考慮日後再以追加預算方式提出，此亦導致政 府長年來不得不對核四預算持續加碼，形成台電公司及國家

# Gemini

In [11]:
gemini_key = 'AIzaSyBe0Vikb5BP3JA7S_Gs32cIme6k9iqtAvY'

In [12]:
extracted_content[list(extracted_content.keys())[0]]

'交通部於 87年間與臺灣高速鐵路公司簽訂「臺灣南北高速鐵路興建營運合約」及「臺灣南北高速鐵路站區開發合約 」，疏未預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生 損失之責任歸屬，並綢繆約定 相關處罰條款 ，嗣對政府權益保障恝置不察，一再同意該公司展延通車營運時程及受領站區用地， 致政府蒙受回饋金與租金收入減少及顧問費用增加等鉅額損失，均有違失，爰依監察法第 24條規定提案糾正'

In [13]:
extracted_content

{'34944_高鐵_促參.pdf': '交通部於 87年間與臺灣高速鐵路公司簽訂「臺灣南北高速鐵路興建營運合約」及「臺灣南北高速鐵路站區開發合約 」，疏未預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生 損失之責任歸屬，並綢繆約定 相關處罰條款 ，嗣對政府權益保障恝置不察，一再同意該公司展延通車營運時程及受領站區用地， 致政府蒙受回饋金與租金收入減少及顧問費用增加等鉅額損失，均有違失，爰依監察法第 24條規定提案糾正',
 '38005_核四_政策.pdf': '核四封存後每年仍耗費數億元於資產維護管理，行政院及經濟部對外宣告核四重啟不可行，核四興建費用 2,833億元頇列為損失，行政院及 經濟部對核四政策之重大變動，導致資源嚴重浪費； 再者，經濟部宣布能源配比 (燃氣50%、燃煤30%、再生能源20%)之能源轉型政策，未經能源安全、能源經濟及環境影響等完整評估 ，復於再生能源發電量增加有限情況下， 以運轉中核電機組長期停機 方式減核 ，致近年火力發購電量逐年提高， 106年占比達84.4%，燃煤發電增幅 甚至高於燃氣，造成嚴重空氣污染；以及經濟部宣布 新能源政策 之前，並未評估其對電價之影響，迄 106年3月行政院始於國公營企業體檢小組會議評估 等情，均有違失，爰依法提案糾正',
 '39243_核四_品質.pdf': '台電公司 未落實「核四工程品質保證方案」，致龍門電廠試運轉時違規與注意改善事項層出不窮，如 抑壓池灌水作業 不當，致反應器廠房底層淹水 、壓力試驗合格之室內消防栓 系統，其 太平龍頭 竟脫落，致汽機廠房積水等 ，均嚴重衝擊國人對核能安全運轉之信心等情 ，確有諸多違失，爰依法提案糾正',
 '39477_核四_料件.pdf': '台灣電力股份有限公司 (下稱台電公司 )於本院調查核四廠一號機因施工測詴期間設備損壞而移用二號機相關設備之過程，所提供資料內容前後不一，設備組件損壞、採購及修復個數未能確實清查正確，顯見台電公司核四廠之料件管理系統紊亂，且回復本院公文一再發生資料正確性不足，核有怠失；另台電公司於 81年陳報核四興建計畫， 竟以69年所估算成本陳報， 未能如實報告核四建廠成本，致使政府無法確實評估該項投資計畫之成本效益，台電公司表示當時即考慮日後再以追加預算方式提出，此亦導致政 府長年來不得不對核四預算持續加碼，形成台電公司及國家

In [14]:
# def gemini_result_clean(result_dict):
#     extracted_result = result_dict['candidates'][0]['content']['parts'][0]['text']
#     extracted_result
#     result_str = re.sub(r'[```json\n]','',extracted_result).replace("實體", "entity").replace("關係", "relationship").split("、")[0]
#     print(result_str)
#     result_list = list(json.loads(result_str).values())[0]

#     return result_list

In [15]:
output_dict = {}
# len(extracted_content)
for i in range(len(extracted_content)):
    url = f'https://generativelanguage.googleapis.com/v1/models/gemini-pro:generateContent?key={gemini_key}'
    headers = {'Content-Type': 'application/json'}
    item_name = list(extracted_content.keys())[i]
    print(f"working on {item_name}")
    data = {
        "contents": [
            {
                "parts": [{"text": """三元組指的是：（實體）--關係--（實體）。
                           （實體）通常是特定的人、組織或物體，（關係）則是描述兩個實體之間的關係，例如 （孫悟空）--徒弟--（唐僧）、（立法委員）--制定--（法律）
                            將以下這些内容以三元組方式描述並以Json格式呈現:""" + str({extracted_content[item_name]})}]
            }
        ]
    }
    response = requests.post(url, headers=headers, json=data)
    print(f"response status_code: {response.status_code}")
    result_dict = response.json()
    extracted_result = result_dict['candidates'][0]['content']['parts'][0]['text']
    extracted_result
    if '未找到三元組' in extracted_result:
        pass
    else:
        result_str = re.sub(r'[```json\n]','',extracted_result).replace("實體", "entity").replace("關係", "relationship").split("、")[0]
        print(result_str)
        # if isinstance(json.loads(result_str), list): 
        #     result_list = json.loads(result_str)
        # else:
        #     result_list = list(json.loads(result_str).values())[0]
            
        output_dict[item_name] = result_str
    


working on 34944_高鐵_促參.pdf
response status_code: 200
{  "三元組": [    {      "entity1": "交通部",      "relationship": "簽訂",      "entity2": "台灣高速鐵路公司"    },    {      "entity1": "交通部",      "relationship": "疏忽",      "entity2": "預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款"    },    {      "entity1": "交通部",      "relationship": "一再同意",      "entity2": "展延通車營運時程及受領站區用地"    },    {      "entity1": "政府",      "relationship": "蒙受",      "entity2": "回饋金與租金收入減少及顧問費用增加等鉅額損失"    },    {      "entity1": "交通部",      "relationship": "違失",      "entity2": "監察法第24條規定提案糾正"    }  ]}
working on 38005_核四_政策.pdf
response status_code: 200
{  "三元組": [    {      "entity1": "核四",      "relationship": "每年耗費數億元於資產維護管理",      "entity2": "核四"    },    {      "entity1": "行政院",      "relationship": "對外宣告核四重啟不可行",      "entity2": "核四"    },    {      "entity1": "經濟部",      "relationship": "對外宣告核四重啟不可行",      "entity2": "核四"    },    {      "entity1": "核四",      "relationship": "興建費用2,833億元頇列為損失",      "entity2": "行

In [27]:
extracted_result

'```json\n{\n  "三元組": [\n    {\n      "實體": "行政院原子能委員會",\n      "關係": "負責",\n      "實體": "我國核能安全監管"\n    },\n    {\n      "實體": "核四廠",\n      "關係": "未經審查認可",\n      "實體": "行政院原子能委員會"\n    },\n    {\n      "實體": "核四廠",\n      "關係": "不符合安全要求",\n      "實體": "經濟部"\n    },\n    {\n      "實體": "經濟部",\n      "關係": "聲稱審查過關",\n      "實體": "核四廠"\n    },\n    {\n      "實體": "核四廠",\n      "關係": "封存前未解決設計及設備問題",\n      "實體": null\n    },\n    {\n      "實體": "經濟部",\n      "關係": "散布錯誤訊息",\n      "實體": "核四重啟"\n    },\n    {\n      "實體": "台電",\n      "關係": "未及時監督承商",\n      "實體": "核四品質把關"\n    },\n    {\n      "實體": "核四斷層",\n      "關係": "新事證",\n      "實體": "核四處理"\n    },\n    {\n      "實體": "台電",\n      "關係": "把關不嚴謹",\n      "實體": "核能安全"\n    },\n    {\n      "實體": "經濟部",\n      "關係": "怠失",\n      "實體": "核能安全"\n    },\n    {\n      "實體": "台電",\n      "關係": "怠失",\n      "實體": "核能安全"\n    }\n  ]\n}\n```'

In [49]:
cleaned_output = {}
for key, value in output_dict.items():
    url = f'https://generativelanguage.googleapis.com/v1/models/gemini-pro:generateContent?key={gemini_key}'
    headers = {'Content-Type': 'application/json'}
    print(f"working on {key}")
    data = {
        "contents": [
            {
                "parts": [{"text": """將以下內容調整成符合JSON規範的格式，以及補上entity1或是entity2，不要顯示JSON字樣""" + str(value)}]
            }
        ]
    }
    response = requests.post(url, headers=headers, json=data)
    print(f"response status_code: {response.status_code}")
    result_dict_2 = response.json()
    extracted_result_2 = result_dict_2['candidates'][0]['content']['parts'][0]['text']
    extracted_result_2 = re.sub(r'[```json\n]','',extracted_result_2)
    cleaned_output[key] = extracted_result_2

working on 34944_高鐵_促參.pdf
response status_code: 200
working on 38005_核四_政策.pdf
response status_code: 200
working on 39243_核四_品質.pdf
response status_code: 200
working on 39477_核四_料件.pdf
response status_code: 200
working on 46365_高鐵_基金.pdf
response status_code: 200
working on 48052_大客車_逃生門.pdf
response status_code: 200
working on 48746_大客車_安全門.pdf
response status_code: 200
working on 49490_核四_延宕.pdf
response status_code: 200
working on 49627_核四_停建.pdf
response status_code: 200
working on 49676_大客車_駕照.pdf
response status_code: 200
working on 52922_大客車_超時.pdf
response status_code: 200
working on 54210_高鐵_出資.pdf
response status_code: 200
working on 54376_高鐵_航發.pdf
response status_code: 200
working on 54561_高鐵_機電.pdf
response status_code: 200
working on 58930_核四_封存.pdf
response status_code: 200


In [50]:
cleaned_output

{'34944_高鐵_促參.pdf': '{  "三元組": [    {      "etity1": "交通部",      "relatihip": "簽訂",      "etity2": "台灣高速鐵路公司"    },    {      "etity1": "交通部",      "relatihip": "疏忽",      "etity2": "預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款"    },    {      "etity1": "交通部",      "relatihip": "一再同意",      "etity2": "展延通車營運時程及受領站區用地"    },    {      "etity1": "政府",      "relatihip": "蒙受",      "etity2": "回饋金與租金收入減少及顧問費用增加等鉅額損失"    },    {      "etity1": "交通部",      "relatihip": "違失",      "etity2": "監察法第24條規定提案糾正"    }  ]}',
 '38005_核四_政策.pdf': '{  "三元組": [    {      "etity1": "核四",      "relatihip": "每年耗費數億元於資產維護管理",      "etity2": "核四"    },    {      "etity1": "行政院",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "經濟部",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "行政院"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "經濟部"    },    {  

In [51]:
with open('gemini_output_3.txt', 'w') as text_file:
    for key, value in cleaned_output.items():
        text_file.write(f'{key}: {value}\n')

In [52]:
for filename, content in cleaned_output.items():
    print(filename)
    print(content)
    list(json.loads(content).values())[0]

34944_高鐵_促參.pdf
{  "三元組": [    {      "etity1": "交通部",      "relatihip": "簽訂",      "etity2": "台灣高速鐵路公司"    },    {      "etity1": "交通部",      "relatihip": "疏忽",      "etity2": "預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款"    },    {      "etity1": "交通部",      "relatihip": "一再同意",      "etity2": "展延通車營運時程及受領站區用地"    },    {      "etity1": "政府",      "relatihip": "蒙受",      "etity2": "回饋金與租金收入減少及顧問費用增加等鉅額損失"    },    {      "etity1": "交通部",      "relatihip": "違失",      "etity2": "監察法第24條規定提案糾正"    }  ]}
38005_核四_政策.pdf
{  "三元組": [    {      "etity1": "核四",      "relatihip": "每年耗費數億元於資產維護管理",      "etity2": "核四"    },    {      "etity1": "行政院",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "經濟部",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "行政院"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "經濟部"    },    {      "etity1"

JSONDecodeError: Unterminated string starting at: line 1 column 840 (char 839)

In [59]:
# Reading the dictionary from the plain text file
data = {}

with open('gemini_output_3.txt', 'r') as text_file:
    for line in text_file:
        key, value = line.strip().split(': ', 1)
        # Convert value to an appropriate type (e.g., int if it's an integer)
        if value.isdigit():
            value = int(value)
        data[key] = value

data


{'34944_高鐵_促參.pdf': '{  "三元組": [    {      "etity1": "交通部",      "relatihip": "簽訂",      "etity2": "台灣高速鐵路公司"    },    {      "etity1": "交通部",      "relatihip": "疏忽",      "etity2": "預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款"    },    {      "etity1": "交通部",      "relatihip": "一再同意",      "etity2": "展延通車營運時程及受領站區用地"    },    {      "etity1": "政府",      "relatihip": "蒙受",      "etity2": "回饋金與租金收入減少及顧問費用增加等鉅額損失"    },    {      "etity1": "交通部",      "relatihip": "違失",      "etity2": "監察法第24條規定提案糾正"    }  ]}',
 '38005_核四_政策.pdf': '{  "三元組": [    {      "etity1": "核四",      "relatihip": "每年耗費數億元於資產維護管理",      "etity2": "核四"    },    {      "etity1": "行政院",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "經濟部",      "relatihip": "對外宣告核四重啟不可行",      "etity2": "核四"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "行政院"    },    {      "etity1": "核四",      "relatihip": "興建費用2,833億元頇列為損失",      "etity2": "經濟部"    },    {  

In [67]:
final_output_dict = {}
for filename, content in data.items():
    print(filename)
    
    content = content.replace('etity','entity').replace('relatihip', 'relationship')
    print(content)
    new_content = list(json.loads(content).values())[0]
    final_output_dict[filename] = new_content


34944_高鐵_促參.pdf
{  "三元組": [    {      "entity1": "交通部",      "relationship": "簽訂",      "entity2": "台灣高速鐵路公司"    },    {      "entity1": "交通部",      "relationship": "疏忽",      "entity2": "預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款"    },    {      "entity1": "交通部",      "relationship": "一再同意",      "entity2": "展延通車營運時程及受領站區用地"    },    {      "entity1": "政府",      "relationship": "蒙受",      "entity2": "回饋金與租金收入減少及顧問費用增加等鉅額損失"    },    {      "entity1": "交通部",      "relationship": "違失",      "entity2": "監察法第24條規定提案糾正"    }  ]}
38005_核四_政策.pdf
{  "三元組": [    {      "entity1": "核四",      "relationship": "每年耗費數億元於資產維護管理",      "entity2": "核四"    },    {      "entity1": "行政院",      "relationship": "對外宣告核四重啟不可行",      "entity2": "核四"    },    {      "entity1": "經濟部",      "relationship": "對外宣告核四重啟不可行",      "entity2": "核四"    },    {      "entity1": "核四",      "relationship": "興建費用2,833億元頇列為損失",      "entity2": "行政院"    },    {      "entity1": "核四",      "relationship": "興建費用2,833億元頇列為損

In [68]:
final_output_dict

{'34944_高鐵_促參.pdf': [{'entity1': '交通部',
   'relationship': '簽訂',
   'entity2': '台灣高速鐵路公司'},
  {'entity1': '交通部',
   'relationship': '疏忽',
   'entity2': '預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款'},
  {'entity1': '交通部', 'relationship': '一再同意', 'entity2': '展延通車營運時程及受領站區用地'},
  {'entity1': '政府', 'relationship': '蒙受', 'entity2': '回饋金與租金收入減少及顧問費用增加等鉅額損失'},
  {'entity1': '交通部', 'relationship': '違失', 'entity2': '監察法第24條規定提案糾正'}],
 '38005_核四_政策.pdf': [{'entity1': '核四',
   'relationship': '每年耗費數億元於資產維護管理',
   'entity2': '核四'},
  {'entity1': '行政院', 'relationship': '對外宣告核四重啟不可行', 'entity2': '核四'},
  {'entity1': '經濟部', 'relationship': '對外宣告核四重啟不可行', 'entity2': '核四'},
  {'entity1': '核四', 'relationship': '興建費用2,833億元頇列為損失', 'entity2': '行政院'},
  {'entity1': '核四', 'relationship': '興建費用2,833億元頇列為損失', 'entity2': '經濟部'},
  {'entity1': '行政院', 'relationship': '對核四政策之重大變動', 'entity2': '核四'},
  {'entity1': '經濟部', 'relationship': '對核四政策之重大變動', 'entity2': '核四'},
  {'entity1': '行政院', 'relationship': '導致資源

# Neo4j

In [77]:
URI = "bolt://localhost:7688"
AUTH = ("neo4j", "!QAZ2wsx")

with GraphDatabase.driver(URI, auth=AUTH, encrypted=False) as driver:
    driver.verify_connectivity()

In [78]:
def create_relationships(tx, data):
    for item in data:
        tx.run("MERGE (a:Entity {name: $entity1}) "
               "MERGE (b:Entity {name: $entity2}) "
               "MERGE (a)-[r:RELATIONSHIP {type: $relationship}]->(b)",
               entity1=item["entity1"], relationship=item["relationship"], entity2=item["entity2"])

In [79]:
for key, value in final_output_dict.items():
    with GraphDatabase.driver(uri=URI, auth=("neo4j", "neo4j")) as driver:
        with driver.session() as session:
            session.write_transaction(create_relationships, value)

  session.write_transaction(create_relationships, value)


In [80]:
def fetch_data(tx):
    result = tx.run("MATCH (n:Entity)-[r:RELATIONSHIP]->(m:Entity) "
                    "RETURN n.name, r.type, m.name")
    for record in result:
        print(f"{record['n.name']} {record['r.type']} {record['m.name']}")

with GraphDatabase.driver(uri=URI, auth=("neo4j", "neo4j")) as driver:  # Replace auth credentials as necessary
    with driver.session() as session:
        session.read_transaction(fetch_data)


交通部 簽訂 台灣高速鐵路公司
交通部 疏忽 預先審度該公司展延高鐵通車營運時程及遲延受領站區用地所生損失之責任歸屬，並綢繆約定相關處罰條款
交通部 一再同意 展延通車營運時程及受領站區用地
政府 蒙受 回饋金與租金收入減少及顧問費用增加等鉅額損失
交通部 違失 監察法第24條規定提案糾正
經濟部 對核四政策之重大變動 核四
行政院 對核四政策之重大變動 核四
經濟部 對外宣告核四重啟不可行 核四
行政院 對外宣告核四重啟不可行 核四
核四 每年耗費數億元於資產維護管理 核四
核四 興建費用2,833億元頇列為損失 行政院
核四廠 不符合安全要求 經濟部
核四 興建費用2,833億元頇列為損失 經濟部
經濟部 導致資源嚴重浪費 核四政策
行政院 導致資源嚴重浪費 核四政策
台電公司 未落實 核四工程品質保證方案
台電公司 導致 龍門電廠試運轉時違規與注意改善事項層出不窮
龍門電廠試運轉 發生 抑壓池灌水作業不當
抑壓池灌水作業 導致 反應器廠房底層淹水
壓力試驗合格之室內消防栓系統 發生 太平龍頭脫落
太平龍頭脫落 導致 汽機廠房積水
台電公司 衝擊 國人對核能安全運轉之信心
台灣電力股份有限公司 (下稱台電公司 ) 提供 設備組件損壞
近年利率 逐年下調 資金成本
交通部 未督飭 高公局
高公局 利用 此改進趨勢
高公局 進行 財務調度
高公局 舉新還舊 國道基金債務
高公局 積極規劃 國道基金債務
高公局 減輕 利息負擔
高公局 改善 財務結構
交通部 撥還 國道基金
交通部 復坐視 國道基金
國道基金 受影響 高鐵基金
交通部 迄今未將 國道基金負擔
國道基金負擔 未具自償性 地區性道路興建支出
國道基金負擔 與無直接關聯 國道
交通部暨公路總局 未善盡監督及執行 車輛之監理機制
交通部暨公路總局 輕縱 尊龍客運等公司
尊龍客運等公司 違規變更 內裝
內裝違規變更 造成 危害公共安全
危害公共安全 導致 大客車六名乘客慘遭大火燒死
逃生門遭鐵板封閉 導致 無法開啟
交通部暨公路總局 顯有違失 爰依監察法第二十四條之規定提案糾正
交通部 核准 安審（ 98）第1620號車型大客車
車輛靜止時 由車內及車外徒手開啟 緊急出口
0719陸客團火燒車事故 掛有鐵鍊未即時開啟 左側安全門
20部車輛 逾八成裝置暗鎖 安全門
交通部 未善盡監督 車身打造廠
大客車 未確保

  session.read_transaction(fetch_data)


In [81]:
def fetch_data(tx):
    query = """
    MATCH (n:Entity {name: '行政院'})-[r:RELATIONSHIP]->(m:Entity)
    RETURN n.name AS n_name, r.type AS r_type, m.name AS m_name
    """
    result = tx.run(query)
    for record in result:
        print(f"{record['n_name']} {record['r_type']} {record['m_name']}")

with GraphDatabase.driver(uri=URI, auth=("neo4j", "neo4j")) as driver:  # Replace auth credentials as necessary
    with driver.session() as session:
        session.read_transaction(fetch_data)


行政院 指示 中華航空事業發展基金會
行政院 一再挹注 鉅額資金
行政院 提供 鉅額中長期資金及融資保證
行政院 未能督促 原始股東履行承諾
行政院 准予 所屬公營事業機構投入資金
行政院 明知 高鐵公司財務困難
行政院 難辭其咎 核四問題
行政院 宣布 核四工程停建
行政院 導致資源嚴重浪費 核四政策
行政院 對核四政策之重大變動 核四
行政院 對外宣告核四重啟不可行 核四


  session.read_transaction(fetch_data)


### Neo4j syntax

MATCH (n:Entity {name:'行政院'})-[r]->(m) RETURN n, r, m