# Eksperimen 1: Eksplorasi OCR + LLM

Notebook ini bertujuan untuk mencoba berbagai kombinasi library OCR dan LLM untuk memperbaiki teks hasil ekstraksi, terutama pada kasus "Gambar Kotor" (coretan, tip-x, tulisan tangan).

## Daftar Kandidat / Rekomendasi

Berikut adalah daftar kombinasi yang direkomendasikan untuk dicoba:

### 1. The "Easy" Robust Choice: **EasyOCR + GPT-4o/Gemini**
- **OCR**: `EasyOCR` (Deep learning based, support 80+ bahasa, bagus untuk teks miring/tulisan tangan).
- **LLM**: `OpenAI GPT-4o` atau `Google Gemini`.
- **Pros**: Mudah di-setup, performa OCR sangat bagus out-of-the-box.
- **Cons**: EasyOCR agak berat di CPU/GPU dibanding Tesseract.

### 2. The "Open Source" Powerhouse: **PaddleOCR + Llama 3 (via Ollama)**
- **OCR**: `PaddleOCR` (Sangat populer di industri, ringan dan akurat).
- **LLM**: `Llama 3` atau `Mistral` via `Ollama` (Local).
- **Pros**: Gratis total, privasi terjaga, PaddleOCR sering mengalahkan EasyOCR di benchmark.
- **Cons**: Setup PaddleOCR (terutama di Windows) kadang butuh sedikit effort instalasi dependency.

### 3. The "Classic" Baseline: **Tesseract + GPT-3.5**
- **OCR**: `Tesseract` (Google).
- **LLM**: `GPT-3.5`.
- **Pros**: Sangat cepat, standar industri lama.
- **Cons**: Performa buruk pada gambar noise/coretan tanpa pre-processing gambar yang canggih.

---

## Persiapan Environment
Jalankan cell di bawah untuk menginstall library yang diperlukan sesuai pilihan.

In [1]:
# Install Option 1: EasyOCR (Recommended start)
!pip install easyocr openai

# Install Option 2: Tesseract (Butuh install binary Tesseract di Windows terpisah)
# !pip install pytesseract

# Install Option 3: PaddleOCR
# !pip install paddlepaddle paddleocr



## Percobaan 1: EasyOCR Basic

In [2]:
import easyocr
import time

# Inisialisasi Reader (Download model di awal agak lama)
# 'en' untuk Inggris, 'id' untuk Indonesia
reader = easyocr.Reader(['en', 'id'], gpu=True) # Set gpu=True jika ada NVIDIA GPU

def run_easyocr(image_path):
    print(f"Processing {image_path}...")
    start_time = time.time()
    
    # detail=0 returns only text list
    result = reader.readtext(image_path, detail=0) 
    
    end_time = time.time()
    text_combined = " ".join(result)
    
    return {
        'time': end_time - start_time,
        'raw_text_list': result,
        'full_text': text_combined
    }

# TODO: Ganti dengan path gambar sampel kamu
# results = run_easyocr('path/to/your/image.jpg')
# print(results)

Neither CUDA nor MPS are available - defaulting to CPU. Note: This module is much faster with a GPU.


## Percobaan 2: Simulasi LLM Correction
Anggap kita sudah dapat teks berantakan dari OCR, kita kirim ke LLM.

In [3]:
# Contoh Mock LLM Call (Ganti dengan API Call asli nanti)
def mock_llm_correction(ocr_text):
    # Prompt logic simulation
    prompt = f"""
    Kamu adalah asisten guru.
    Teks berikut adalah hasil OCR dari jawaban siswa yang mungkin mengandung typo atau pecahan kata.
    Perbaiki teks ini menjadi kalimat yang masuk akal.
    
    OCR Text: {ocr_text}
    """
    print("--- Sending to LLM ---")
    print(prompt)
    print("----------------------")
    
    # Return dummy response
    return "[Ini adalah teks yang sudah diperbaiki oleh LLM]"

# corrected = mock_llm_correction("Jaw b an s y a adal h 5")
# print("Result:", corrected)