In [1]:
import os
from dotenv import load_dotenv

load_dotenv()

snowflake_account = os.getenv('SNOWFLAKE_ACCOUNT')
snowflake_username = os.getenv('SNOWFLAKE_USER')
snowflake_password = os.getenv('SNOWFLAKE_PASSWORD')
snowflake_warehouse = os.getenv('SNOWFLAKE_WAREHOUSE')
snowflake_database = os.getenv('SNOWFLAKE_DATABASE')
snowflake_schema = os.getenv('SNOWFLAKE_SCHEMA')
snowflake_role = os.getenv('SNOWFLAKE_ROLE')

In [2]:
from google.genai.types import GenerateContentConfig, Tool
from google import genai
from google.genai import types

import io
import re
import json
import time

def background_agent():
    GOOGLE_API_KEY = "AIzaSyCsY_4AOUvcfsmiwrUtB8Xl64ItLXA3Eyk"
    MODEL_ID = "gemini-2.5-pro" 

    client = genai.Client(api_key=GOOGLE_API_KEY)

    config = {
    "tools": [
        {"google_search": {}}
    ],
    }
    sys_instruction = f"""
            Anda adalah seorang analis kebijakan publik dan ahli anti-korupsi senior yang bertugas untuk memberikan laporan intelijen strategis kepada pimpinan lembaga negara.

            Tugas Anda adalah mengidentifikasi dan menganalisis secara mendalam **SATU isu korupsi yang paling URGENT dan berdampak sistemik** di Indonesia SAAT INI (fokus pada data, berita, dan laporan dalam 12-18 bulan terakhir).

            Gunakan kemampuan Google Grounding Anda untuk mengakses dan mensintesis informasi dari sumber-sumber berita terkemuka di Indonesia (seperti Kompas, Tempo, Tirto), laporan investigasi, dan rilis data dari lembaga kredibel (seperti KPK, ICW, Transparency International Indonesia, PPATK).

            Analisis Anda harus mencakup:
            1.  **Identifikasi isu tunggal yang paling mendesak.**
            2.  **Berikan justifikasi yang kuat mengapa isu ini lebih mendesak** dibandingkan isu korupsi lainnya yang juga marak terjadi. Pertimbangkan faktor-faktor seperti:
                *   Skala kerugian negara (finansial dan ekologis).
                *   Dampak langsung dan tidak langsung terhadap hajat hidup orang banyak.
                *   Keterlibatan pejabat tinggi atau elite politik (high-profile).
                *   Potensi kerusakan jangka panjang terhadap sistem tata kelola negara.
            3.  **Sajikan analisis mendalam** mengenai isu tersebut dengan detail yang komprehensif.

            Sajikan hasil analisis Anda dalam format laporan terstruktur berikut:

            **Judul Laporan:** Analisis Mendalam: Isu Korupsi Paling Urgent di Indonesia Saat Ini

            **Ringkasan Eksekutif:** (2-3 kalimat yang merangkum isu terpilih dan alasan utama urgensinya).

            **Isu Prioritas Utama: [Nama Isu, misal: Korupsi Masif di Sektor Pertambangan dan Sumber Daya Alam]**

            *   **Deskripsi Isu:** Jelaskan secara rinci modus operandi, lingkup, dan karakteristik utama dari korupsi di sektor ini.
            *   **Justifikasi Urgensi & Skala Prioritas:** Paparkan argumen yang kuat mengapa isu ini adalah prioritas nomor satu. Bandingkan skala dampaknya dengan isu korupsi lain secara singkat jika perlu untuk memperkuat argumen Anda.
            *   **Dampak Terhadap Negara dan Masyarakat:** Uraikan dampak spesifik, mencakup kerugian finansial negara (dalam triliun rupiah), kerusakan lingkungan yang tidak dapat diperbaiki, konflik sosial di tingkat lokal, dan hilangnya pendapatan negara di masa depan.
            *   **Studi Kasus Sentral (Contoh Terbaru):** Fokus pada satu kasus paling representatif yang menjadi sorotan utama. Jelaskan kronologi singkat, aktor yang terlibat, dan temuan kunci dari penyidikan. (Contoh: Kasus korupsi tata niaga komoditas timah di wilayah IUP PT Timah Tbk).
            *   **Aktor & Institusi Kunci yang Terlibat/Disorot:** Sebutkan lembaga pemerintah, perusahaan swasta/BUMN, dan individu (jika sudah menjadi tersangka/terdakwa) yang menjadi pusat dari isu ini.

            **Kesimpulan dan Implikasi Strategis:** (Sintesis singkat mengenai implikasi dari isu ini terhadap kepercayaan publik, stabilitas ekonomi, dan tantangan terbesar bagi upaya pemberantasan korupsi ke depan).

            **Sumber Referensi Utama:** (Sertakan 3-5 link ke artikel berita atau laporan paling relevan yang Anda gunakan sebagai dasar analisis).
        """
    config = GenerateContentConfig(system_instruction=sys_instruction, tools=[Tool(google_search={})], temperature=0)
    response = client.models.generate_content(model=MODEL_ID, config=config, contents=[sys_instruction])
    
    candidate = response.candidates[0]
    text = candidate.content.parts[-1].text

        # --- Tambah sitasi ---
    citations = []
    chunk_map = {}

    if candidate.grounding_metadata and candidate.grounding_metadata.grounding_chunks:
        for idx, chunk in enumerate(candidate.grounding_metadata.grounding_chunks, start=1):
            if chunk.web and chunk.web.uri:
                chunk_map[idx] = chunk.web.uri
                citations.append(f"[{idx}]({chunk.web.uri})")

        # Sisipkan marker [1], [2] ke teks
        for support in candidate.grounding_metadata.grounding_supports or []:
            for chunk_idx in support.grounding_chunk_indices:
                marker = f"[{chunk_idx+1}]"
                seg_text = support.segment.text

                if seg_text in text and marker not in text:
                    text = text.replace(seg_text, seg_text + marker)

    # Gabungkan teks dengan daftar sumber
    if citations:
        background_response = text + "\n\nSumber:\n" + "\n".join(citations)
    else:
        background_response = text + "\n\n"

    time.sleep(65)
    return background_response

# --- ubah run_section_2 agar simpan DOCX, bukan LaTeX ---
issue_report = background_agent()  
print(issue_report)  # opsional



Berdasarkan analisis data dan pemberitaan dalam 18 bulan terakhir, isu korupsi yang paling mendesak dan berdampak sistemik di Indonesia saat ini adalah **Korupsi Masif di Sektor Pertambangan dan Sumber Daya Alam (SDA)**. Puncak dari fenomena ini terkuak melalui penanganan kasus korupsi tata niaga komoditas timah di wilayah Izin Usaha Pertambangan (IUP) PT Timah Tbk yang ditangani oleh Kejaksaan Agung.

Skala kerugian negara yang ditimbulkan, kerusakan ekologis yang bersifat permanen, keterlibatan aktor elite, serta dampaknya yang langsung menggerus fondasi tata kelola sumber daya strategis negara menjadikan isu ini prioritas tertinggi. Berikut adalah laporan intelijen strategis yang merinci analisis mendalam mengenai isu tersebut.

***

### **Judul Laporan:** Analisis Mendalam: Isu Korupsi Paling Urgent di Indonesia Saat Ini

**Ringkasan Eksekutif:**
Isu korupsi paling mendesak di Indonesia saat ini adalah korupsi sistemik di sektor pertambangan dan sumber daya alam, yang dicontohkan o

In [3]:
def mitigation_agent(issue_report):
    GOOGLE_API_KEY = "AIzaSyCsY_4AOUvcfsmiwrUtB8Xl64ItLXA3Eyk"
    MODEL_ID = "gemini-2.5-pro" 

    client = genai.Client(api_key=GOOGLE_API_KEY)

    config = {
    "tools": [
        {"google_search": {}}
    ],
    }
    sys_instruction = f"""
            Anda adalah seorang analis risiko strategis senior di sebuah dewan keamanan nasional atau lembaga think tank kebijakan publik terkemuka. Keahlian utama Anda adalah mengidentifikasi, menganalisis, dan mengartikulasikan risiko-risiko tingkat tinggi yang mengancam kepentingan nasional.

        Anda menerima laporan intelijen awal berikut:

        **Laporan Acuan:**
        ---
        **{issue_report}**
        ---

        **TUGAS ANDA:**
        Berdasarkan Laporan Acuan di atas, susunlah naskah untuk bagian **"Peta Risiko Strategis"** dalam sebuah *policy brief*. Naskah ini harus memberikan analisis yang **tajam, mendalam, dan substantif** kepada para pengambil kebijakan tingkat tinggi.

        **PERINTAH EKSEKUSI UTAMA:**
        1.  **OUTPUT BERSIH:** Respon Anda **HARUS** langsung dimulai dengan baris `### Peta Risiko Strategis dan Urgensi Tindakan`. Jangan menulis kalimat pembuka, rangkuman, atau meta-komentar apa pun.
        2.  **KEDALAMAN ANALISIS:** Setiap risiko yang Anda identifikasi **HARUS** diurai secara detail. Jangan hanya memberikan deskripsi satu baris. Gunakan struktur multi-bagian (Nama, Deskripsi Analitis, Implikasi Strategis, Penilaian) untuk setiap risiko seperti yang dicontohkan di bawah.

        **Instruksi Konten:**
        Gunakan bahasa yang **autoritatif, ringkas, dan persuasif**. Setiap poin harus fokus pada menjelaskan **mekanisme sebab-akibat** (bagaimana korupsi menyebabkan risiko) dan **dampak turunan** (apa konsekuensi strategisnya).

        **Struktur Output yang Diminta (Ikuti dengan Tepat):**

        ### Peta Risiko Strategis dan Urgensi Tindakan

        Kegagalan dalam menangani isu korupsi sistemik di sektor [Sebutkan Isu Utama dari Laporan] secara cepat dan tuntas akan memicu serangkaian risiko berantai (cascading risks) yang mengancam stabilitas nasional. Tiga risiko prioritas yang paling mendesak untuk diwaspadai adalah:

        *   **Risiko 1: Erosi Kepercayaan Institusional & Instabilitas Politik**
            *   **Deskripsi Analitis:** Terungkapnya korupsi skala besar yang melibatkan pejabat tinggi secara langsung meruntuhkan legitimasi pemerintah dan institusi penegak hukum di mata publik. Kegagalan penindakan yang tegas akan menciptakan persepsi impunitas, di mana hukum hanya berlaku bagi masyarakat biasa, bukan elite.
            *   **Implikasi Strategis:** Erosi kepercayaan ini dapat memicu gelombang protes sosial, menurunkan partisipasi publik dalam program pemerintah, dan mempersulit implementasi kebijakan strategis di masa depan. Dalam jangka panjang, hal ini mengancam kohesi sosial dan stabilitas politik nasional.
            *   **Penilaian Risiko:** Dampak: **Tinggi** | Kemungkinan: **Tinggi**

        *   **Risiko 2: Guncangan Ekonomi Makro & Pelemahan Iklim Investasi**
            *   **Deskripsi Analitis:** Praktik korupsi dalam perizinan dan pengadaan menciptakan ekonomi biaya tinggi dan ketidakpastian hukum yang ekstrem. Investor, baik domestik maupun asing, akan menunda atau membatalkan rencana investasi karena risiko operasional dan reputasi yang tidak terukur.
            *   **Implikasi Strategis:** Pelemahan iklim investasi ini secara langsung menghambat target pertumbuhan ekonomi, mengurangi penciptaan lapangan kerja, dan menaikkan biaya pinjaman negara (cost of borrowing) karena naiknya profil risiko negara. Ini berpotensi memicu perlambatan ekonomi yang signifikan.
            *   **Penilaian Risiko:** Dampak: **Tinggi** | Kemungkinan: **Sedang**

        *   **Risiko 3: Kerusakan Lingkungan Permanen & Isolasi Internasional**
            *   **Deskripsi Analitis:** Korupsi di sektor sumber daya alam seringkali berjalan seiring dengan pengabaian total terhadap Analisis Mengenai Dampak Lingkungan (AMDAL). Hal ini menyebabkan eksploitasi yang merusak dan tidak berkelanjutan, yang dampaknya tidak dapat dipulihkan (irreversible).
            *   **Implikasi Strategis:** Kerusakan ekologis ini tidak hanya memicu bencana alam dan konflik sosial di tingkat lokal, tetapi juga membuka Indonesia terhadap tekanan internasional. Risiko sanksi perdagangan berbasis isu iklim, gugatan di forum arbitrase internasional, dan rusaknya citra negara sebagai mitra global yang bertanggung jawab menjadi sangat nyata.
            *   **Penilaian Risiko:** Dampak: **Tinggi** | Kemungkinan: **Tinggi**
        """
    config = GenerateContentConfig(system_instruction=sys_instruction, tools=[Tool(google_search={})], temperature=0)
    response = client.models.generate_content(model=MODEL_ID, config=config, contents=[issue_report])
    
    candidate = response.candidates[0]
    text = candidate.content.parts[-1].text

        # --- Tambah sitasi ---
    citations = []
    chunk_map = {}

    if candidate.grounding_metadata and candidate.grounding_metadata.grounding_chunks:
        for idx, chunk in enumerate(candidate.grounding_metadata.grounding_chunks, start=1):
            if chunk.web and chunk.web.uri:
                chunk_map[idx] = chunk.web.uri
                citations.append(f"[{idx}]({chunk.web.uri})")

        # Sisipkan marker [1], [2] ke teks
        for support in candidate.grounding_metadata.grounding_supports or []:
            for chunk_idx in support.grounding_chunk_indices:
                marker = f"[{chunk_idx+1}]"
                seg_text = support.segment.text

                if seg_text in text and marker not in text:
                    text = text.replace(seg_text, seg_text + marker)

    # Gabungkan teks dengan daftar sumber
    if citations:
        background_response = text + "\n\nSumber:\n" + "\n".join(citations)
    else:
        background_response = text + "\n\n"

    time.sleep(65)
    return background_response

# --- ubah run_section_2 agar simpan DOCX, bukan LaTeX ---
risk_report = mitigation_agent(issue_report)  
print(risk_report)  # opsional



### Peta Risiko Strategis dan Urgensi Tindakan

Kegagalan dalam menangani isu korupsi sistemik di sektor Pertambangan dan Sumber Daya Alam (SDA) secara cepat dan tuntas akan memicu serangkaian risiko berantai (*cascading risks*) yang mengancam stabilitas nasional. Tiga risiko prioritas yang paling mendesak untuk dimitigasi adalah:

*   **Risiko 1: Delegitimasi Negara dan Krisis Kepercayaan Sistemik**
    *   **Deskripsi Analitis:** Skandal korupsi SDA, yang dicontohkan oleh kasus timah, mengekspos adanya persekongkolan jahat (*state-corporate crime*) antara oknum regulator, operator BUMN, dan elite swasta. Hal ini bukan lagi sekadar persepsi korupsi individual, melainkan bukti nyata pembajakan institusi negara (*state capture*) untuk menjarah aset strategis. Fenomena ini secara fundamental merusak kontrak sosial antara negara dan warga, karena lembaga yang seharusnya menjadi penjaga amanat konstitusi justru menjadi fasilitator utama kejahatan.
    *   **Implikasi Strategis:** Erosi kep

In [4]:
def mitigation_agent2(issue_report):
    GOOGLE_API_KEY = "AIzaSyCsY_4AOUvcfsmiwrUtB8Xl64ItLXA3Eyk"
    MODEL_ID = "gemini-2.5-pro" 

    client = genai.Client(api_key=GOOGLE_API_KEY)

    config = {
    "tools": [
        {"google_search": {}}
    ],
    }
    sys_instruction = f"""
            Anda adalah seorang Kepala Tim Reformasi Kebijakan (Policy Reform Task Force Lead) di lingkungan Istana atau lembaga perencanaan nasional. Keahlian Anda adalah menerjemahkan analisis risiko kompleks menjadi rekomendasi kebijakan yang konkret, dapat diimplementasikan, dan politis.

        Anda baru saja menerima analisis risiko strategis berikut dari tim analis Anda:

        **ANALISIS RISIKO (DARI RISK AGENT):**
        ---
        **{issue_report}**
        ---

        **TUGAS ANDA:**
        Berdasarkan Analisis Risiko tersebut, susunlah naskah untuk bagian **"Rekomendasi Kebijakan Strategis"** dalam sebuah *policy brief*. Naskah ini harus memberikan peta jalan (roadmap) yang jelas dan dapat ditindaklanjuti bagi para pengambil kebijakan.

        **PERINTAH EKSEKUSI UTAMA:**
        1.  **OUTPUT BERSIH:** Respon Anda **HARUS** langsung dimulai dengan baris `### Rekomendasi Kebijakan Strategis`. Jangan menulis kalimat pembuka atau meta-komentar.
        2.  **KEDALAMAN & FOKUS SOLUSI:** Setiap rekomendasi harus diurai secara substantif. Jelaskan **rasional** (mengapa ini solusi yang tepat), **mekanisme implementasi** secara singkat, dan **dampak yang diharapkan**.
        3.  **KETERKAITAN LANGSUNG:** Setiap rekomendasi yang Anda usulkan **HARUS** secara langsung menjawab satu atau lebih risiko yang telah diidentifikasi dalam Analisis Risiko di atas.

        **Instruksi Konten:**
        Gunakan bahasa yang **autoritatif, proaktif, dan berorientasi pada solusi**. Susun rekomendasi dalam kerangka waktu yang logis (Jangka Pendek, Menengah, Panjang) untuk menunjukkan prioritas dan urutan tindakan.

        **Struktur Output yang Diminta (Ikuti dengan Tepat):**

        ### Rekomendasi Kebijakan Strategis

        Menjawab peta risiko yang telah diidentifikasi, diperlukan serangkaian intervensi kebijakan yang terkoordinasi dan terukur. Berikut adalah peta jalan mitigasi yang direkomendasikan:

        **1. Intervensi Jangka Pendek (Prioritas Utama: Shock Therapy & Pengendalian Kerusakan - 0-6 Bulan)**
        *   **Rekomendasi:** Membentuk Satuan Tugas Gabungan Pemberantasan Korupsi Sektor SDA lintas lembaga penegak hukum (KPK, Kejaksaan Agung, Polri).
            *   **Rasional & Dampak Diharapkan:** Tindakan ini secara langsung menjawab **Risiko Erosi Kepercayaan Institusional**. Koordinasi terpusat akan mengakselerasi penyidikan kasus-kasus besar, memberikan "shock therapy" kepada pelaku pasar, dan mengirim sinyal kuat keseriusan pemerintah yang dapat memulihkan kepercayaan publik secara cepat.
            *   **Penanggung Jawab:** Dikoordinasikan oleh Menko Polhukam.

        *   **Rekomendasi:** Menerbitkan moratorium sementara atas izin-izin baru di sektor terkait dan memulai audit investigatif menyeluruh.
            *   **Rasional & Dampak Diharapkan:** Ini adalah langkah krusial untuk mengendalikan **Risiko Kerusakan Lingkungan Permanen**. Moratorium akan menghentikan "pendarahan" kerugian negara, sementara audit oleh BPKP dan PPATK akan memetakan skala masalah dan mengidentifikasi aktor intelektual sebagai dasar penegakan hukum yang lebih dalam.
            *   **Penanggung Jawab:** Kementerian teknis terkait (misal: Kementerian ESDM), BPKP, PPATK.

        **2. Reformasi Sistemik Jangka Menengah (Membangun Disinsentif Struktural - 6-24 Bulan)**
        *   **Rekomendasi:** Merevitalisasi dan mewajibkan penggunaan sistem perizinan digital terintegrasi (OSS) dengan modul pengawasan publik dan pelacakan jejak audit (audit trail).
            *   **Rasional & Dampak Diharapkan:** Ini secara fundamental menargetkan **Risiko Pelemahan Iklim Investasi** dengan menciptakan transparansi dan prediktabilitas. Digitalisasi penuh mengurangi interaksi tatap muka (celah suap), sementara modul pengawasan publik memungkinkan CSO dan jurnalis memantau proses secara real-time, menciptakan disinsentif struktural bagi korupsi.
            *   **Penanggung Jawab:** Kementerian Investasi/BKPM, Kemenkominfo, Kantor Staf Presiden (untuk pengawasan implementasi).

        **3. Agenda Legislatif Jangka Panjang (Solusi Permanen & Pencegahan Hulu)**
        *   **Rekomendasi:** Mempercepat pembahasan dan pengesahan **Rancangan Undang-Undang tentang Perampasan Aset Tindak Pidana.**
            *   **Rasional & Urgensi Strategis:** UU ini adalah *game-changer* yang menjawab ketiga risiko secara simultan. Dengan memungkinkan perampasan aset tanpa menunggu putusan pidana, negara dapat secara cepat memulihkan kerugian, membiayai rehabilitasi lingkungan, dan memiskinkan koruptor. Ini mengubah kalkulasi risiko-imbalan (risk-reward) dari tindakan korupsi.
            *   **Inisiator:** Pemerintah (Presiden) & DPR RI.

        *   **Rekomendasi:** Menginisiasi **Revisi UU [Sebutkan UU terkait sektor, misal: UU Minerba]** untuk memperkuat klausul integritas.
            *   **Rasional & Urgensi Strategis:** Ini adalah solusi hulu untuk mencegah masalah terulang. Revisi harus fokus pada tiga area: 1) Kewajiban transparansi kepemilikan manfaat (Beneficial Ownership); 2) Pemberatan sanksi administratif bagi korporasi; 3) Sinkronisasi dengan UU Perlindungan Lingkungan. Ini akan menutup celah hukum yang saat ini dieksploitasi.
            *   **Inisiator:** DPR RI (Komisi terkait), Pemerintah (Kementerian teknis).
        """
    config = GenerateContentConfig(system_instruction=sys_instruction, tools=[Tool(google_search={})], temperature=0)
    response = client.models.generate_content(model=MODEL_ID, config=config, contents=[issue_report])
    
    candidate = response.candidates[0]
    text = candidate.content.parts[-1].text

        # --- Tambah sitasi ---
    citations = []
    chunk_map = {}

    if candidate.grounding_metadata and candidate.grounding_metadata.grounding_chunks:
        for idx, chunk in enumerate(candidate.grounding_metadata.grounding_chunks, start=1):
            if chunk.web and chunk.web.uri:
                chunk_map[idx] = chunk.web.uri
                citations.append(f"[{idx}]({chunk.web.uri})")

        # Sisipkan marker [1], [2] ke teks
        for support in candidate.grounding_metadata.grounding_supports or []:
            for chunk_idx in support.grounding_chunk_indices:
                marker = f"[{chunk_idx+1}]"
                seg_text = support.segment.text

                if seg_text in text and marker not in text:
                    text = text.replace(seg_text, seg_text + marker)

    # Gabungkan teks dengan daftar sumber
    if citations:
        background_response = text + "\n\nSumber:\n" + "\n".join(citations)
    else:
        background_response = text + "\n\n"

    time.sleep(65)
    return background_response

# --- ubah run_section_2 agar simpan DOCX, bukan LaTeX ---
mitigation_report = mitigation_agent2(risk_report)  
print(mitigation_report)  # opsional



### Rekomendasi Kebijakan Strategis

Menjawab peta risiko yang telah diidentifikasi, diperlukan serangkaian intervensi kebijakan yang terkoordinasi dan terukur. Berikut adalah peta jalan mitigasi yang direkomendasikan:

**1. Intervensi Jangka Pendek (Prioritas Utama: Shock Therapy & Pengendalian Kerusakan - 0-6 Bulan)**

*   **Rekomendasi:** Membentuk Satuan Tugas Gabungan Pemberantasan Korupsi SDA (*SDA Corruption Task Force*) yang terintegrasi antara Kejaksaan Agung, KPK, Polri, dan PPATK, dengan mandat khusus untuk mengakselerasi penuntasan kasus-kasus strategis.
    *   **Rasional & Dampak Diharapkan:** Langkah ini adalah respons langsung terhadap **Risiko 1 (Delegitimasi Negara)**. Aksi penegakan hukum yang cepat, masif, dan terkoordinasi akan memberikan "shock therapy" kepada para pelaku, memutus jaringan korupsi yang sedang berjalan, dan menjadi sinyal paling kuat kepada publik bahwa negara serius memulihkan kedaulatannya. Keberhasilan dalam membongkar kasus besar akan menjadi f

In [5]:
import os
from langchain_snowflake import (
    create_session_from_env,
    ChatSnowflake,
    SnowflakeCortexSearchRetriever
)
from langchain_core.prompts import ChatPromptTemplate

# --- Inisialisasi Session & Model ---
session = create_session_from_env()

llm = ChatSnowflake(
    session=session,
    model="claude-4-sonnet",
    temperature=0.2,
    max_tokens=3000  # lebih besar agar analisis tidak terpotong
)

retriever = SnowflakeCortexSearchRetriever(
    session=session,
    database=os.getenv("SNOWFLAKE_DATABASE"),
    schema=os.getenv("SNOWFLAKE_SCHEMA"),
    role=os.getenv("SNOWFLAKE_ROLE"),
    service_name=os.getenv("SNOWFLAKE_CORTEX_SEARCH_SERVICE"),
    k=10,
    auto_format_for_rag=True,
    content_field="CONTENT",
    join_separator="\n\n"
)

# --- Agent untuk Analisis Regulasi ---
def law_retriever_agent(issue_report, retriever, llm, mitigation_report):
    """
    Agent RAG untuk menilai kesesuaian rekomendasi kebijakan
    dengan peraturan perundang-undangan yang ada di knowledge bank.

    Langkah-langkah:
    1️⃣ Retrieve dokumen hukum relevan dari Snowflake Cortex.
    2️⃣ Gabungkan dan ringkas isinya.
    3️⃣ Analisis kesesuaian dengan rekomendasi kebijakan (mitigasi).
    """

    query = issue_report
    if not query:
        return {
            "law_summary": "⚠️ Tidak ada topik yang diberikan.",
            "law_text": "",
            "topic": ""
        }

    # --- Step 1: Retrieval ---
    docs = retriever.invoke(query)
    if not docs:
        return {
            "law_summary": f"⚠️ Tidak ditemukan dokumen hukum terkait topik: {query}",
            "law_text": "",
            "topic": query
        }

    combined_text = "\n\n".join(
        [d.page_content for d in docs if hasattr(d, "page_content")]
    )

    # --- Step 2: Prompt untuk Analisis ---
    prompt = ChatPromptTemplate.from_template("""
    Anda adalah seorang **Ahli Hukum dan Kebijakan Publik Senior** 
    dengan pengalaman dalam harmonisasi regulasi lintas sektor.

    Berdasarkan kumpulan peraturan berikut ini dan analisis risiko dari tim kebijakan,
    lakukan **penilaian keselarasan kebijakan** dengan hukum yang ada.

    ---
    **Isi Peraturan (hasil retrieval):**
    {law_text}

    ---
    **Analisis Risiko & Rekomendasi Kebijakan (dari Policy Agent):**
    {mitigation_report}

    ---
    **Tugas Anda:**
    1️⃣ Identifikasi bagian dari peraturan yang **sudah** mengakomodasi rekomendasi kebijakan di atas.  
    2️⃣ Jelaskan **kekosongan regulasi** atau area yang belum diatur secara memadai.  
    3️⃣ Rancang rekomendasi tambahan dalam bentuk:
        - Revisi pasal/UU eksisting, atau  
        - Usulan pembentukan regulasi baru.  
    4️⃣ Buat kesimpulan akhir apakah kerangka hukum saat ini **memadai atau tidak** untuk mengimplementasikan rekomendasi kebijakan tersebut.

    Gunakan bahasa analitis, sistematis, dan berorientasi pada solusi.
    Output Anda harus dimulai dengan:
    ### Analisis Kesesuaian Regulasi
                                              
    NOTE:
    hapus kalimat "No content found for document 1. Available metadata keys: 
                    ['@scores', 'CONTENT']"
    """)

    # --- Step 3: LLM Execution ---
    chain = prompt | llm
    result = chain.invoke({
        "law_text": combined_text,
        "mitigation_report": mitigation_report
    })

    # --- Step 4: Return Output ---
    return result.content

result = law_retriever_agent(issue_report, retriever, llm, mitigation_report)
print(result)

  class ChatSnowflake(
No content found for document 1. Available metadata keys: 
                    ['@scores', 'CONTENT']


### Analisis Kesesuaian Regulasi

## 1. Identifikasi Akomodasi Rekomendasi dalam Regulasi Eksisting

### A. Rekomendasi yang Sudah Terakomodasi Parsial

**1. Satuan Tugas Gabungan Pemberantasan Korupsi**
- **UU No. 19/2019 tentang KPK** telah mengatur koordinasi antar lembaga dalam Pasal 8 yang memberikan kewenangan KPK untuk "mengoordinasikan penyelidikan, penyidikan, dan penuntutan dalam Pemberantasan Tindak Pidana Korupsi"
- Pasal 8 huruf d mengatur "melaksanakan dengar pendapat atau pertemuan dengan instansi yang berwenang dalam melakukan Pemberantasan Tindak Pidana Korupsi"
- **Namun**, tidak ada ketentuan khusus untuk pembentukan satuan tugas gabungan dengan mandat khusus sektor SDA

**2. Pengawasan dan Supervisi Institusional**
- Pasal 9 UU KPK mengatur kewenangan monitoring "melakukan pengkajian terhadap sistem pengelolaan administrasi di semua lembaga negara dan lembaga pemerintahan"
- Pasal 10 mengatur supervisi terhadap instansi penegak hukum
- **Keterbatasan**: Tidak spesif

In [6]:
Report = f"""
{issue_report}
{risk_report}
{mitigation_report}
{result}
"""

In [7]:
from docx import Document
from docx.shared import Inches, Pt
from docx.enum.text import WD_PARAGRAPH_ALIGNMENT
import re
import docx.oxml.shared
import docx.opc.constants
from docx.oxml.ns import qn

def markdown_txt_to_docx(input_text: str, output_file: str):

    doc = Document()
    
    # Split text into lines
    lines = input_text.split("\n")
    
    # Table tracking
    table_mode = False
    table_data = []
    
    # Process each line
    i = 0
    while i < len(lines):
        line = lines[i]
        stripped = line.strip()
        
        # Skip completely empty lines but preserve spacing
        if not stripped:
            i += 1
            continue
            
        # Handle markdown tables
        if stripped.startswith("|") and stripped.endswith("|") and stripped.count("|") >= 3:
            table_mode = True
            cells = [cell.strip() for cell in stripped.split("|")[1:-1]]
            table_data.append(cells)
            i += 1
            continue
        else:
            # End table mode and create table if we have data
            if table_mode and table_data:
                create_table(doc, table_data)
                table_data = []
                table_mode = False
        
        # Calculate indentation level
        indent_level = get_indent_level(line)
        
        # Handle citation links - collect consecutive citations
        citation_match = re.match(r'^(\s*)\[(\d+)\]\((https?://[^)]+)\)', stripped)
        if citation_match:
            citations = []
            start_i = i
            indent_spaces = citation_match.group(1)
            
            # Collect all consecutive citations
            while i < len(lines):
                current_line = lines[i].strip()
                current_citation_match = re.match(r'^(\s*)\[(\d+)\]\((https?://[^)]+)\)', current_line)
                
                if current_citation_match:
                    citation_num = current_citation_match.group(2)
                    url = current_citation_match.group(3)
                    citations.append((citation_num, url))
                    i += 1
                else:
                    break
            
            # Create a single paragraph with all citations
            if citations:
                p = doc.add_paragraph()
                
                # Add "Sumber: " if this is the first citation group
                if len(citations) > 1:
                    p.add_run("")
                
                for idx, (citation_num, url) in enumerate(citations):
                    if idx > 0:
                        p.add_run(", ")
                    
                    # Add hyperlink for each citation
                    temp_p = p._element.getparent().makeelement(p._element.tag)
                    temp_paragraph = p.__class__(temp_p, p._parent)
                    add_hyperlink(temp_paragraph, f"[{citation_num}]", url)
                    
                    # Move the hyperlink content to current paragraph
                    for elem in temp_paragraph._element:
                        p._element.append(elem)
                
                if indent_level > 0:
                    p.paragraph_format.left_indent = Inches(0.25 * indent_level)
            
            continue
        
        heading_bold_match = re.match(r"^(#{1,6})\s+\*\*([^*]+)\*\*$", stripped)
        if heading_bold_match:
            level = len(heading_bold_match.group(1))
            heading_text = heading_bold_match.group(2).strip()
            heading = doc.add_heading(level=level)
            heading.clear()  # Clear default text
            run = heading.add_run(heading_text)
            run.bold = True
            run.font.size = Pt(14)
            i += 1
            continue
        
        bold_heading_match = re.match(r"^\*\*([^*]+)\*\*$", stripped)
        if bold_heading_match:
            heading_text = bold_heading_match.group(1).strip()
            p = doc.add_paragraph()
            run = p.add_run(heading_text)
            run.bold = True
            run.font.size = Pt(14)
            i += 1
            continue
        
        bold_colon_match = re.match(r"^\*\*([^*]+):\*\*\s*(.*)", stripped)
        if bold_colon_match:
            field_name = bold_colon_match.group(1).strip() + ":"
            field_value = bold_colon_match.group(2).strip()
            
            p = doc.add_paragraph()
            # Add bold field name
            run1 = p.add_run(field_name + " ")
            run1.bold = True
            # Add regular value
            if field_value:
                add_formatted_text_to_paragraph(p, field_value)
            i += 1
            continue
        
        heading_match = re.match(r"^(#{1,6})\s+(.*)", stripped)
        if heading_match:
            level = len(heading_match.group(1))
            heading_text = heading_match.group(2).strip()
            doc.add_heading(heading_text, level=level)
            i += 1
            continue
        
        # Page breaks
        if stripped == "---":
            doc.add_page_break()
            i += 1
            continue
        
        # Handle checkbox items
        checkbox_match = re.match(r"^(\s*)-?\s*\[([Xx ])\]\s+(.*)", line)
        if checkbox_match:
            indent_spaces = checkbox_match.group(1)
            check_status = checkbox_match.group(2)
            item_text = checkbox_match.group(3)
            
            # Create checkbox symbol
            checkbox_symbol = "☑" if check_status.upper() == "X" else "☐"
            full_text = f"{checkbox_symbol} {item_text}"
            
            p = doc.add_paragraph()
            add_formatted_text(p, full_text)
            p.paragraph_format.left_indent = Inches(0.25 * len(indent_spaces) // 4)
            i += 1
            continue
        
        # Handle bullet points (various formats)
        bullet_match = re.match(r"^(\s*)[-*•]\s+(.*)", line)
        if bullet_match:
            indent_spaces = bullet_match.group(1)
            bullet_text = bullet_match.group(2)
            
            p = doc.add_paragraph(style="List Bullet")
            add_formatted_text(p, bullet_text)
            p.paragraph_format.left_indent = Inches(0.25 * len(indent_spaces) // 4)
            i += 1
            continue
        
        # Handle numbered lists
        numbered_match = re.match(r"^(\s*)\d+\.\s+(.*)", line)
        if numbered_match:
            indent_spaces = numbered_match.group(1)
            numbered_text = numbered_match.group(2)
            
            p = doc.add_paragraph(style="List Number")
            add_formatted_text(p, numbered_text)
            p.paragraph_format.left_indent = Inches(0.25 * len(indent_spaces) // 4)
            i += 1
            continue
        
        # Handle special formatting for field names (e.g., "Overall Recommendation:")
        if ":" in stripped and not stripped.endswith(":"):
            parts = stripped.split(":", 1)
            if len(parts) == 2:
                field_name = parts[0].strip()
                field_value = parts[1].strip()
                
                p = doc.add_paragraph()
                # Add bold field name
                run1 = p.add_run(field_name + ": ")
                run1.bold = True
                # Add regular value
                if field_value:
                    add_formatted_text_to_paragraph(p, field_value)
                
                if indent_level > 0:
                    p.paragraph_format.left_indent = Inches(0.25 * indent_level)
                i += 1
                continue
        
        # Regular paragraph
        if stripped:
            p = doc.add_paragraph()
            add_formatted_text(p, stripped)
            
            if indent_level > 0:
                p.paragraph_format.left_indent = Inches(0.25 * indent_level)
        
        i += 1
    
    # Handle any remaining table data
    if table_mode and table_data:
        create_table(doc, table_data)
        
    # === Khusus case **, hapus ** yang tersisa ===
    for para in doc.paragraphs:
        for run in para.runs:
            run.text = run.text.replace("**", "")

    for table in doc.tables:
        for row in table.rows:
            for cell in row.cells:
                for para in cell.paragraphs:
                    for run in para.runs:
                        run.text = run.text.replace("**", "")
    
    doc.save(output_file)
    print(f"✅ Converted text → {output_file}")

def get_indent_level(line):
    """Calculate indentation level based on leading spaces"""
    leading_spaces = len(line) - len(line.lstrip(' '))
    return leading_spaces // 4  # 4 spaces = 1 indent level

def add_hyperlink(paragraph, text, url):
    """
    Add a hyperlink to a paragraph
    """
    # This gets access to the document.xml.rels file and gets a new relation id value
    part = paragraph.part
    r_id = part.relate_to(url, docx.opc.constants.RELATIONSHIP_TYPE.HYPERLINK, is_external=True)

    # Create the w:hyperlink tag and add needed values
    hyperlink = docx.oxml.shared.OxmlElement('w:hyperlink')
    hyperlink.set(docx.oxml.shared.qn('r:id'), r_id)

    # Create a new run and set the text
    new_run = docx.oxml.shared.OxmlElement('w:r')
    new_run_pr = docx.oxml.shared.OxmlElement('w:rPr')
    new_run.append(new_run_pr)
    
    t = docx.oxml.shared.OxmlElement('w:t')
    t.set(docx.oxml.shared.qn('xml:space'), 'preserve')
    t.text = text
    new_run.append(t)

    # Set style
    color = docx.oxml.shared.OxmlElement('w:color')
    color.set(qn('w:val'), '0000FF')
    new_run_pr.append(color)
    
    underline = docx.oxml.shared.OxmlElement('w:u')
    underline.set(qn('w:val'), 'single')
    new_run_pr.append(underline)

    # Join all the xml elements together
    hyperlink.append(new_run)
    
    # Clear any existing runs in the paragraph
    paragraph._p.clear()
    
    # Add the hyperlink to the paragraph
    paragraph._p.append(hyperlink)

    return hyperlink

def add_formatted_text(paragraph, text):
    """Add text to paragraph while preserving bold and italic formatting"""
    add_formatted_text_to_paragraph(paragraph, text)

def add_formatted_text_to_paragraph(paragraph, text):
    """Add formatted text to an existing paragraph"""
    
    # Handle citations with URLs first - extract [number](url) patterns
    citation_url_pattern = r'\[(\d+)\]\(([^)]+)\)'
    citation_urls = {}
    
    def replace_citation_url(match):
        citation_num = match.group(1)
        url = match.group(2)
        placeholder = f"CITATION_URL_PLACEHOLDER_{citation_num}_"
        citation_urls[placeholder] = (citation_num, url)
        return placeholder
    
    text = re.sub(citation_url_pattern, replace_citation_url, text)
    
    # Handle simple citations - extract [number] patterns
    simple_citation_pattern = r'\[(\d+)\]'
    simple_citations = {}
    
    def replace_simple_citation(match):
        citation_num = match.group(1)
        placeholder = f"CITATION_SIMPLE_PLACEHOLDER_{citation_num}_"
        simple_citations[placeholder] = citation_num
        return placeholder
    
    text = re.sub(simple_citation_pattern, replace_simple_citation, text)
    
    # Step 1: Fix common malformed patterns
    # Fix **text: **word**, -> **text: word,**
    text = re.sub(r'\*\*([^*]+?):\s*\*\*([^*,]+?)\*\*,\*\*', r'**\1: \2,**', text)
    # Fix **word **word** -> **word word**
    text = re.sub(r'\*\*([^*]+?)\s+\*\*([^*]+?)\*\*', r'**\1 \2**', text)
    
    # Step 2: Fix super malformed patterns like ****text** or **text****
    text = re.sub(r'\*{4,}([^*]*?)\*{2}(?!\*)', r'**\1**', text)  # ****text** -> **text**
    text = re.sub(r'(?<!\*)\*{2}([^*]*?)\*{4,}', r'**\1**', text)  # **text**** -> **text**
    text = re.sub(r'\*{4,}([^*]*?)\*{4,}', r'**\1**', text)  # ****text**** -> **text**
    
    # Step 3: Fix broken bold patterns like **word**, **another** -> **word, another**
    text = re.sub(r'\*\*([^*]+?)\*\*,\s*\*\*([^*]+?)\*\*', r'**\1, \2**', text)
    
    # Step 4: Clean up any remaining odd asterisk counts
    text = re.sub(r'\*{5,}', '**', text)  # 5+ asterisks -> **
    
    # Step 5: Fix orphaned ** patterns
    # Remove standalone ** that don't have matching pairs
    parts = text.split('**')
    if len(parts) % 2 == 0:  # Even number means unmatched **
        # Find the last ** that doesn't have a pair and remove it
        text = '**'.join(parts[:-1]) + parts[-1]
    
    # Step 4: Now process proper markdown
    text = re.sub(r'\*{3}([^*]+?)\*{3}', r'BOLDITALIC_START\1BOLDITALIC_END', text)
    text = re.sub(r'(\w)(\*\*)', r'\1 \2', text)    
    text = re.sub(r'(\*\*)(\w)', r'\1 \2', text) 
    text = re.sub(r'(\w\*\*)(\w)', r'\1 \2', text)
    text = re.sub(r'([,.:;])\*\*', r'\1 **', text)

    # eihter bagian ini atau step lain untuk **
    text = re.sub(r'\*{2}(.+?)\*{2}', r'BOLD_START\1BOLD_END', text)

    text = re.sub(r'(?<!\*)\*([^*]+?)\*(?!\*)', r'ITALIC_START\1ITALIC_END', text)
    
    # Hapus semua sisa **, layer 1
    text = re.sub(r'\*{2,}', '', text)

    # Split by formatting markers and apply formatting
    parts = re.split(r'(BOLD_START|BOLD_END|ITALIC_START|ITALIC_END|BOLDITALIC_START|BOLDITALIC_END)', text)
    
    current_bold = False
    current_italic = False
    
    for part in parts:
        if part in ['BOLD_START', 'BOLD_END', 'ITALIC_START', 'ITALIC_END', 'BOLDITALIC_START', 'BOLDITALIC_END']:
            # Handle formatting markers
            if part == 'BOLD_START':
                current_bold = True
            elif part == 'BOLD_END':
                current_bold = False
            elif part == 'ITALIC_START':
                current_italic = True
            elif part == 'ITALIC_END':
                current_italic = False
            elif part == 'BOLDITALIC_START':
                current_bold = True
                current_italic = True
            elif part == 'BOLDITALIC_END':
                current_bold = False
                current_italic = False
                
        elif 'CITATION_URL_PLACEHOLDER_' in part:
            # Handle citation with URL - could be multiple in one part
            temp_text = part
            for placeholder, (citation_num, url) in citation_urls.items():
                if placeholder in temp_text:
                    # Create hyperlink for each citation URL found
                    temp_p = paragraph._element.getparent().makeelement(paragraph._element.tag)
                    temp_paragraph = paragraph.__class__(temp_p, paragraph._parent)
                    add_hyperlink(temp_paragraph, f"[{citation_num}]", url)
                    # Move the hyperlink content to current paragraph
                    for elem in temp_paragraph._element:
                        paragraph._element.append(elem)
                    # Remove processed placeholder
                    temp_text = temp_text.replace(placeholder, '')
            
            # Add any remaining text
            if temp_text.strip():
                run = paragraph.add_run(temp_text)
                run.bold = current_bold
                run.italic = current_italic
            
        elif 'CITATION_SIMPLE_PLACEHOLDER_' in part:
            # Handle simple citation without URL - could be multiple in one part  
            temp_text = part
            for placeholder, citation_num in simple_citations.items():
                if placeholder in temp_text:
                    # Replace placeholder with actual citation
                    temp_text = temp_text.replace(placeholder, f"[{citation_num}]")
            
            # Add the processed text
            if temp_text:
                run = paragraph.add_run(temp_text)
                run.bold = current_bold
                run.italic = current_italic
            
        elif part:  # Actual text content
            run = paragraph.add_run(part)
            run.bold = current_bold
            run.italic = current_italic

def create_table(doc, table_data):
    """Create a table from the collected table data"""
    if not table_data:
        return
    
    # Filter out separator rows (rows with dashes)
    filtered_data = []
    for row in table_data:
        if not all(cell.replace('-', '').replace(':', '').strip() == '' for cell in row):
            filtered_data.append(row)
    
    if not filtered_data:
        return
    
    table = doc.add_table(rows=len(filtered_data), cols=len(filtered_data[0]))
    table.style = "Table Grid"
    
    for i, row_data in enumerate(filtered_data):
        for j, cell_data in enumerate(row_data):
            if j < len(table.rows[i].cells):
                cell = table.cell(i, j)
                # Add formatted text to table cells
                if cell_data.strip():
                    cell.text = ""  # Clear default text
                    add_formatted_text_to_paragraph(cell.paragraphs[0], cell_data)
                for paragraph in cell.paragraphs:
                    for run in paragraph.runs:
                        run.font.size = Pt(9)  # Font size 9 untuk table
    
    # Add some spacing after table
    doc.add_paragraph("")

In [8]:
markdown_txt_to_docx(Report, f"GSK_output3.docx")

✅ Converted text → GSK_output3.docx
