In [18]:
# Langkah 1: Instalasi library yang dibutuhkan
!pip install -q replicate langchain langchain_community "pypdf>=4.0.0" fpdf

print("✅ Library berhasil diinstal.")

✅ Library berhasil diinstal.


In [19]:
# Langkah 2: Impor library dan setup Replicate API Token
import os
from getpass import getpass
from google.colab import userdata, files
from langchain_community.llms import Replicate
from pypdf import PdfReader
from fpdf import FPDF

# Mengatur Replicate API Token dengan aman menggunakan Colab Secrets
# Simpan token Anda di Colab Secrets (ikon kunci 🔑) dengan nama 'REPLICATE_API_TOKEN'
try:
    api_token = userdata.get('api_token')
    os.environ["REPLICATE_API_TOKEN"] = api_token
    print("🔑 REPLICATE_API_TOKEN berhasil dimuat dari Colab Secrets.")
except Exception as e:
    print("🔴 Token tidak ditemukan di Colab Secrets. Silakan masukkan secara manual.")
    api_token = getpass("Masukkan Replicate API Token Anda: ")
    os.environ["REPLICATE_API_TOKEN"] = api_token

🔑 REPLICATE_API_TOKEN berhasil dimuat dari Colab Secrets.


In [21]:
# Langkah 3: Fungsi untuk mengunggah dan mengekstrak teks dari PDF
def extract_text_from_pdf():
    """Meminta pengguna mengunggah file PDF dan mengekstrak teksnya."""
    print("\nSilakan unggah file PDF yang ingin diringkas...")
    uploaded = files.upload()

    if not uploaded:
        print("Tidak ada file yang diunggah. Proses dibatalkan.")
        return None

    file_name = next(iter(uploaded))
    print(f"\n📄 File '{file_name}' berhasil diunggah. Mengekstrak teks...")

    text = ""
    try:
        reader = PdfReader(file_name)
        for page in reader.pages:
            page_text = page.extract_text()
            if page_text:
                text += page_text + "\n"
        print("✅ Ekstraksi teks selesai.")
        return text
    except Exception as e:
        print(f"🔴 Gagal mengekstrak teks dari PDF: {e}")
        return None

In [22]:
# Langkah 4: Inisialisasi Model IBM Granite dari Replicate
try:
    # Identifier untuk model IBM Granite di platform Replicate
    # Kita menggunakan versi chat yang baik untuk tugas instruksional seperti meringkas
    model_identifier = "ibm-granite/granite-3.2-8b-instruct"

    llm = Replicate(
        model=model_identifier,
        model_kwargs={"temperature": 0.2, "max_length": 512, "top_p": 0.95}
    )
    print(f"🤖 Model '{model_identifier}' berhasil diinisialisasi dari Replicate.")
    model_ready = True
except Exception as e:
    print(f"🔴 Gagal menginisialisasi model: {e}")
    model_ready = False


🤖 Model 'ibm-granite/granite-3.2-8b-instruct' berhasil diinisialisasi dari Replicate.


In [26]:
# Langkah 5: Jalankan Proses Peringkasan
if model_ready:
    pdf_text = extract_text_from_pdf()

    if pdf_text:
        print("\n🚀 Memulai proses peringkasan... Proses ini mungkin butuh beberapa saat.")

        # Membuat prompt yang jelas untuk model
        prompt = f"""
        INSTRUCTION: Summarize the following text clearly and concisely in a few paragraphs.
        Focus on the main ideas, key arguments, and conclusions and always use indonesian.

        TEXT:
        "{pdf_text}"

        SUMMARY:
        """

        try:
            # Memanggil model untuk menghasilkan ringkasan
            summary = llm.invoke(prompt)

            # Menampilkan hasil
            print("\n" + "="*40)
            print("📝 HASIL RINGKASAN")
            print("="*40)
            print(summary)

            # Langkah 6: Menyimpan hasil ringkasan ke PDF
            # Asumsi nama file asli tersedia dari proses unggah
            # Kita perlu mendapatkan nama file asli dari fungsi extract_text_from_pdf
            # Untuk saat ini, kita akan menggunakan placeholder atau mencoba mendapatkannya
            # dari output upload, tapi cara terbaik adalah mengembalikan nama file dari extract_text_from_pdf
            # Untuk demo ini, mari kita asumsikan nama file terakhir yang diunggah tersedia
            # atau kita bisa meminta pengguna memasukkan nama file output
            # Atau, lebih baik lagi, modifikasi extract_text_from_pdf untuk mengembalikan nama file
            # Tapi, untuk langsung menjalankan, kita bisa coba ambil nama file dari `files.upload()` output jika tersedia.
            # Atau, cara paling sederhana untuk saat ini adalah menggunakan nama default.

            # Mengambil nama file asli dari variabel `uploaded` dari fungsi extract_text_from_pdf jika masih tersedia
            # Ini kurang robust, cara yang lebih baik adalah modifikasi extract_text_from_pdf
            original_filename = "summary_output.pdf" # Default fallback
            if 'uploaded' in locals() and uploaded:
                 original_filename = next(iter(uploaded))


            saved_file = save_summary_to_pdf(summary, original_filename)

            if saved_file:
                print(f"\n✅ Ringkasan berhasil disimpan ke '{saved_file}'")
            else:
                 print("\n🔴 Gagal menyimpan ringkasan ke PDF.")


        except Exception as e:
            print(f"🔴 Terjadi error saat membuat ringkasan: {e}")


Silakan unggah file PDF yang ingin diringkas...


Saving Analisis Sentimen Masyarakat Sebelum Dan Sesudah Terpilihnya Gibran Sebagai Cawapres Prabowo Menggunakan Naïve Bayes.pdf to Analisis Sentimen Masyarakat Sebelum Dan Sesudah Terpilihnya Gibran Sebagai Cawapres Prabowo Menggunakan Naïve Bayes (1).pdf

📄 File 'Analisis Sentimen Masyarakat Sebelum Dan Sesudah Terpilihnya Gibran Sebagai Cawapres Prabowo Menggunakan Naïve Bayes (1).pdf' berhasil diunggah. Mengekstrak teks...
✅ Ekstraksi teks selesai.

🚀 Memulai proses peringkasan... Proses ini mungkin butuh beberapa saat.

📝 HASIL RINGKASAN
Studi ini menggunakan algoritma Naïve Bayes untuk menganalisis perubahan sentimen masyarakat sebelum dan sesudah Gibran Rakabuming Raka dipilih sebagai calon wakil presiden oleh Prabowo Subianto pada tahun 2024. Data digunakan adalah ulasan dari Twitter (X) dengan rentang waktu Juli 2023 hingga Desember 2023. Dataset tersebut dianalisis menggunakan tahap preprocessing yang termasuk cleansing, tokenizing, stopwords, dan transform cases. Hasil analis