In [1]:
# realtime_detector.py

import cv2
import torch
import torch.nn as nn
from torchvision import models, transforms
from PIL import Image

# --- KONFIGURASI ---
# Path ke model yang sudah disimpan
MODEL_PATH = "model/yawn_detector_notebook.pth" 

# Nama kelas harus sesuai dengan urutan saat training
CLASS_NAMES = ['no_yawn', 'yawn']
# --------------------


def main():
    """Fungsi utama untuk menjalankan detektor real-time."""
    
    # 1. Muat Model
    print("Memuat model...")
    device = torch.device("cpu")
    
    # Definisikan arsitektur model (harus sama persis)
    model = models.mobilenet_v2()
    num_ftrs = model.classifier[1].in_features
    model.classifier[1] = nn.Linear(num_ftrs, len(CLASS_NAMES))
    
    # Muat bobot yang sudah dilatih
    model.load_state_dict(torch.load(MODEL_PATH, map_location=device))
    model.to(device)
    model.eval() # Set ke mode evaluasi
    print("Model berhasil dimuat.")
    
    # 2. Definisikan transformasi gambar (harus sama dengan validasi)
    transform = transforms.Compose([
        transforms.Resize(256),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ])
    
    # 3. Inisialisasi Webcam
    cap = cv2.VideoCapture(0) # 0 adalah ID untuk webcam default
    if not cap.isOpened():
        print("Error: Tidak bisa membuka webcam.")
        return
        
    print("\nWebcam aktif. Tekan 'q' untuk keluar.")
    
    # 4. Loop Real-time
    while True:
        # Baca satu frame dari webcam
        ret, frame = cap.read()
        if not ret:
            print("Gagal membaca frame. Keluar...")
            break
            
        # Balik frame secara horizontal agar seperti cermin
        frame = cv2.flip(frame, 1)

        # Proses frame untuk prediksi
        # Konversi frame OpenCV (BGR) ke PIL Image (RGB)
        rgb_frame = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)
        pil_image = Image.fromarray(rgb_frame)
        
        # Terapkan transformasi dan buat batch
        input_tensor = transform(pil_image).unsqueeze(0).to(device)
        
        # Lakukan prediksi
        with torch.no_grad():
            outputs = model(input_tensor)
            probabilities = torch.nn.functional.softmax(outputs[0], dim=0)
            _, preds = torch.max(outputs, 1)
            
            predicted_class = CLASS_NAMES[preds.item()]
            confidence = probabilities[preds.item()].item()
            
        # Tentukan warna teks berdasarkan prediksi
        if predicted_class == 'yawn':
            text_color = (0, 0, 255) # Merah
        else:
            text_color = (0, 255, 0) # Hijau
            
        # Tampilkan hasil prediksi pada frame
        text = f"Prediksi: {predicted_class} ({confidence:.2%})"
        cv2.putText(frame, text, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 0.9, text_color, 2)
        
        # Tampilkan frame di jendela
        cv2.imshow('Real-time Yawn Detector', frame)
        
        # Cek jika tombol 'q' ditekan untuk keluar
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
            
    # 5. Bersihkan
    print("Menutup aplikasi.")
    cap.release()
    cv2.destroyAllWindows()


if __name__ == '__main__':
    main()

Memuat model...
Model berhasil dimuat.


  model.load_state_dict(torch.load(MODEL_PATH, map_location=device))



Webcam aktif. Tekan 'q' untuk keluar.
Menutup aplikasi.
