**MK Rekayasa Fitur**

**Topik:** Rekayasa Fitur Data Video

**Galih Hermawan. Prodi Teknik Informatika. UNIKOM**

---

# Menampilkan Video

In [74]:
import cv2
import numpy as np

# Baca video dari file yang ditentukan
nama_file_video = 'video/galih_jalan.mp4'
nama_file_video = 'video/shibuya.mp4'
#nama_file_video = 'video/jalan_raya.mp4'

tangkap_video = cv2.VideoCapture(nama_file_video)

# Loop untuk memproses setiap frame video
while True:
    # Baca frame selanjutnya
    berhasil, bingkai = tangkap_video.read()

    # Jika tidak ada frame lagi (akhir video), keluar dari loop
    if not berhasil:
        break

    # Tampilkan frame di jendela bernama "Video"
    cv2.imshow('Video', bingkai)

    # Tunggu 1 milidetik untuk input keyboard
    # Keluar jika tombol 'q' ditekan
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela OpenCV
tangkap_video.release()
cv2.destroyAllWindows()

# Menampilkan Video - Resize, Delay, Looping

In [61]:
import cv2
import time

# Baca video
tangkap_video = cv2.VideoCapture(nama_file_video)

# Dapatkan FPS (Frame Per Second) video
fps = tangkap_video.get(cv2.CAP_PROP_FPS)
print("FPS video:", fps)

# Baca frame pertama untuk mendapatkan ukuran asli video
berhasil, bingkai = tangkap_video.read()
tinggi, lebar = bingkai.shape[:2]  # Ambil tinggi dan lebar frame

# Atur skala perubahan ukuran video (50% dari ukuran asli)
skala_persen = 50
lebar_tampilan = int(lebar * skala_persen / 100)
tinggi_tampilan = int(tinggi * skala_persen / 100)

# Hitung delay antar frame (dalam milidetik) untuk mengatur kecepatan putar
# Delay 500ms / fps akan membuat video diputar 2x lebih lambat dari aslinya
delay = int(500 / fps)

# Loop untuk memproses setiap frame video
while True:
    # Baca frame selanjutnya
    berhasil, bingkai = tangkap_video.read()

    # Jika sudah mencapai akhir video, ulang dari awal
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)
        continue

    # Ubah ukuran frame ke ukuran tampilan yang diinginkan
    bingkai_diubah_ukuran = cv2.resize(bingkai, (lebar_tampilan, tinggi_tampilan))

    # Tampilkan frame yang sudah diubah ukuran
    cv2.imshow('Video Asli (Diubah Ukuran)', bingkai_diubah_ukuran)

    # Tunggu selama delay dan periksa apakah tombol 'q' ditekan
    if cv2.waitKey(delay) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()

FPS video: 29.97002997002997


# Analisis Video

---
## Menghitung Rata-rata Warna

Dalam konteks pengolahan video, menghitung rata-rata warna adalah proses menganalisis distribusi warna pada setiap frame video. Ini dilakukan dengan mengambil rata-rata nilai intensitas dari setiap kanal warna (misalnya, merah, hijau, dan biru dalam model warna RGB).

**Mengapa Menghitung Rata-rata Warna?**

* **Deteksi Perubahan Adegan:** Perubahan drastis dalam rata-rata warna antar frame dapat mengindikasikan perubahan adegan dalam video.
* **Identifikasi Warna Dominan:** Rata-rata warna memberikan gambaran tentang warna yang paling sering muncul dalam video.
* **Analisis Suasana:** Warna-warna tertentu dapat dikaitkan dengan suasana atau emosi tertentu dalam video.
* **Pengindeksan dan Pencarian Video:** Rata-rata warna dapat digunakan sebagai fitur untuk pengindeksan dan pencarian video berdasarkan konten.

**Cara Menghitung Rata-rata Warna:**

1. **Baca Frame Video:** Baca setiap frame video secara berurutan.
2. **Konversi Warna (Opsional):** Jika diperlukan, konversi frame ke ruang warna yang diinginkan (misalnya, dari BGR ke HSV).
3. **Hitung Rata-rata:** Hitung rata-rata nilai intensitas untuk setiap kanal warna di seluruh piksel dalam frame.
4. **Analisis atau Visualisasi:** Gunakan nilai rata-rata warna untuk analisis lebih lanjut (misalnya, deteksi perubahan adegan) atau tampilkan langsung pada video sebagai informasi tambahan.

**Contoh Penggunaan:**

* Membandingkan rata-rata warna antara dua video untuk melihat seberapa mirip keduanya.
* Membuat grafik perubahan rata-rata warna sepanjang video untuk menganalisis perubahan suasana.
* Menggunakan rata-rata warna sebagai fitur untuk melatih model pembelajaran mesin untuk mengklasifikasikan video berdasarkan genre atau suasana.


In [62]:
import cv2
import numpy as np

# Baca video
tangkap_video = cv2.VideoCapture(nama_file_video)

while True:
    # Baca frame selanjutnya dari video
    berhasil, bingkai = tangkap_video.read()

    # Jika sudah mencapai akhir video, ulang dari awal
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)  # Kembali ke frame 0
        continue

    # Hitung rata-rata warna (BGR) dari frame
    rata_rata_warna = np.mean(bingkai, axis=(0, 1))

    # Konversi nilai rata-rata warna menjadi integer (untuk keperluan tampilan)
    rata_rata_warna_int = rata_rata_warna.astype(int)

    # Buat teks untuk menampilkan rata-rata warna
    teks = f"Rata-rata warna BGR: {rata_rata_warna_int}"

    # Tampilkan teks pada frame
    # Parameter: frame, teks, posisi, font, ukuran font, warna, ketebalan
    cv2.putText(bingkai, teks, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

    # Tampilkan frame dengan teks rata-rata warna
    cv2.imshow('Frame', bingkai)

    # Tunggu 1 milidetik untuk input keyboard
    # Keluar jika tombol 'q' ditekan
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()


## Menghitung Jumlah Piksel Bergerak dalam Video

Dalam konteks pengolahan video, menghitung jumlah piksel bergerak adalah proses mengukur seberapa banyak perubahan yang terjadi antara dua frame video berurutan. Ini memberikan informasi tentang tingkat aktivitas atau gerakan dalam video.

**Mengapa Menghitung Jumlah Piksel Bergerak?**

* **Deteksi Gerakan:** Perubahan piksel yang signifikan antar frame menunjukkan adanya gerakan dalam video.
* **Segmentasi Objek Bergerak:** Piksel-piksel yang bergerak dapat dipisahkan dari latar belakang statis untuk mengidentifikasi objek yang bergerak.
* **Analisis Intensitas Gerakan:** Jumlah piksel bergerak dapat digunakan untuk mengukur seberapa intens gerakan dalam video.
* **Aplikasi Keamanan:** Deteksi gerakan dapat digunakan untuk memicu alarm atau notifikasi pada sistem keamanan.

**Cara Menghitung Jumlah Piksel Bergerak:**

1. **Baca Frame Berurutan:** Baca dua frame video secara berurutan.
2. **Konversi ke Grayscale:** Konversi kedua frame ke grayscale untuk menyederhanakan perhitungan.
3. **Hitung Perbedaan Piksel:** Hitung perbedaan nilai piksel antara kedua frame menggunakan operasi pengurangan atau absolute difference (`cv2.absdiff()`).
4. **Terapkan Threshold (Opsional):** Terapkan thresholding pada gambar perbedaan piksel untuk mendapatkan gambar biner di mana piksel putih menunjukkan piksel yang bergerak dan piksel hitam menunjukkan piksel statis.
5. **Hitung Jumlah Piksel Bergerak:** Hitung jumlah piksel putih (atau piksel dengan nilai di atas threshold) pada gambar biner. Ini adalah jumlah piksel bergerak.

**Contoh Penggunaan:**

* Membuat grafik perubahan jumlah piksel bergerak sepanjang video untuk menganalisis dinamika gerakan.
* Menggunakan jumlah piksel bergerak sebagai fitur untuk melatih model pembelajaran mesin untuk mengklasifikasikan video berdasarkan tingkat aktivitas.
* Menggabungkan dengan deteksi objek untuk menganalisis pergerakan objek tertentu dalam video.

**Pertimbangan:**

* **Thresholding:** Nilai threshold yang digunakan dapat mempengaruhi hasil perhitungan. Nilai yang terlalu rendah akan membuat piksel noise dianggap sebagai gerakan, sedangkan nilai yang terlalu tinggi akan mengabaikan gerakan yang kecil.
* **Pencahayaan:** Perubahan pencahayaan dapat mempengaruhi perhitungan perbedaan piksel. Anda mungkin perlu melakukan normalisasi atau kompensasi pencahayaan sebelum menghitung perbedaan piksel.


In [63]:
import cv2
import numpy as np

# Baca video
tangkap_video = cv2.VideoCapture(nama_file_video)

# Baca frame pertama untuk mendapatkan ukuran asli video
berhasil, bingkai = tangkap_video.read()
tinggi, lebar = bingkai.shape[:2]

# Atur skala perubahan ukuran video (50% dari ukuran asli)
skala_persen = 50
lebar_tampilan = int(lebar * skala_persen / 100)
tinggi_tampilan = int(tinggi * skala_persen / 100)

# Simpan frame sebelumnya dalam grayscale untuk perbandingan
bingkai_abu_abu_sebelumnya = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

while True:
    # Baca frame selanjutnya dari video
    berhasil, bingkai = tangkap_video.read()

    # Jika sudah mencapai akhir video, ulang dari awal
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)
        continue

    # Konversi frame saat ini ke grayscale
    bingkai_abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

    # Hitung perbedaan piksel antara frame saat ini dan frame sebelumnya
    perbedaan_bingkai = cv2.absdiff(bingkai_abu_abu, bingkai_abu_abu_sebelumnya)

    # Simpan frame saat ini sebagai frame sebelumnya untuk iterasi selanjutnya
    bingkai_abu_abu_sebelumnya = bingkai_abu_abu.copy()

    # Terapkan thresholding untuk mendeteksi piksel yang berubah (bergerak)
    # Piksel dengan perbedaan di atas ambang batas dianggap bergerak
    ambang_batas = 25  # Anda bisa menyesuaikan nilai ini
    _, biner_perubahan = cv2.threshold(perbedaan_bingkai, ambang_batas, 255, cv2.THRESH_BINARY)

    # Hitung jumlah piksel yang bergerak (piksel putih pada gambar biner)
    jumlah_piksel_bergerak = np.sum(biner_perubahan == 255)

    # Ubah ukuran frame asli ke ukuran tampilan yang diinginkan
    bingkai_diubah_ukuran = cv2.resize(bingkai, (lebar_tampilan, tinggi_tampilan))

    # Tampilkan jumlah piksel bergerak pada frame
    teks = f"Piksel Bergerak: {jumlah_piksel_bergerak}"
    cv2.putText(bingkai_diubah_ukuran, teks, (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

    # Tampilkan frame yang sudah diubah ukuran dengan informasi jumlah piksel bergerak
    cv2.imshow('Frame (Diubah Ukuran)', bingkai_diubah_ukuran)

    # Tunggu 1 milidetik untuk input keyboard
    # Keluar jika tombol 'q' ditekan
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()


# Deteksi Tepi

Deteksi tepi adalah proses mengidentifikasi perubahan intensitas piksel yang signifikan dalam gambar atau video. Dalam video, tepi ini seringkali mewakili batas-batas objek, perubahan latar belakang, atau perubahan kedalaman.

**Mengapa Deteksi Tepi Penting?**

* **Segmentasi Objek:** Tepi dapat digunakan untuk memisahkan objek dari latar belakang, sehingga memudahkan analisis objek secara individual.
* **Deteksi Objek:** Tepi dapat menjadi petunjuk penting untuk mendeteksi keberadaan objek dalam video.
* **Analisis Bentuk:** Tepi dapat digunakan untuk menganalisis bentuk objek dalam video, seperti menghitung luas, keliling, atau mengklasifikasikan objek berdasarkan bentuknya.
* **Pelacakan Objek:** Tepi dapat digunakan sebagai fitur untuk melacak pergerakan objek dari frame ke frame.

**Cara Mendeteksi Tepi dalam Video:**

1. **Konversi ke Grayscale:** Konversi frame video ke grayscale untuk menyederhanakan perhitungan.
2. **Terapkan Algoritma Deteksi Tepi:** Gunakan algoritma deteksi tepi seperti:
    * **Sobel:** Mendeteksi tepi berdasarkan gradien intensitas piksel.
    * **Prewitt:** Mirip dengan Sobel, tetapi menggunakan filter yang berbeda.
    * **Canny:** Algoritma multi-tahap yang menghasilkan tepi yang lebih tipis dan akurat.
    * **Laplacian:** Mendeteksi tepi berdasarkan perubahan kedua dari intensitas piksel.
3. **Tampilkan Hasil:** Tampilkan frame asli dan hasil deteksi tepi secara berdampingan.

**Contoh Penggunaan:**

* **Deteksi Objek Bergerak:** Gabungkan deteksi tepi dengan pengurangan latar belakang (background subtraction) untuk mendeteksi objek yang bergerak di depan latar belakang statis.
* **Analisis Gerakan Kamera:** Deteksi tepi dapat digunakan untuk memperkirakan gerakan kamera dalam video.
* **Penghitungan Objek:** Deteksi tepi dapat membantu dalam menghitung jumlah objek dalam video (misalnya, menghitung jumlah mobil di jalan).

**Pertimbangan:**

* **Pemilihan Algoritma:** Pilihan algoritma tergantung pada kebutuhan Anda. Canny sering menjadi pilihan yang baik karena menghasilkan tepi yang akurat dan tipis.
* **Parameter Algoritma:** Setiap algoritma memiliki parameter yang perlu disesuaikan, seperti threshold untuk menentukan tepi mana yang akan dipertahankan.
* **Noise:** Video seringkali mengandung noise yang dapat mengganggu deteksi tepi. Anda mungkin perlu melakukan pra-pemrosesan (misalnya, filtering) untuk mengurangi noise sebelum mendeteksi tepi.

In [75]:
import cv2
import numpy as np

# Baca video
tangkap_video = cv2.VideoCapture(nama_file_video)

# Baca frame pertama untuk mendapatkan ukuran asli video
berhasil, bingkai = tangkap_video.read()
tinggi, lebar = bingkai.shape[:2]

# Atur skala perubahan ukuran video (50% dari ukuran asli)
skala_persen = 50
lebar_tampilan = int(lebar * skala_persen / 100)
tinggi_tampilan = int(tinggi * skala_persen / 100)

while True:
    # Baca frame selanjutnya dari video
    berhasil, bingkai = tangkap_video.read()

    # Jika sudah mencapai akhir video, ulang dari awal
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)
        continue

    # Konversi frame ke grayscale
    abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

    # Deteksi tepi dengan algoritma Canny
    # Parameter: gambar, threshold bawah, threshold atas
    tepi = cv2.Canny(abu_abu, 100, 200)  # Sesuaikan nilai threshold sesuai kebutuhan

    # Ubah ukuran frame asli dan hasil deteksi tepi
    bingkai_diubah_ukuran = cv2.resize(bingkai, (lebar_tampilan, tinggi_tampilan))
    tepi_diubah_ukuran = cv2.resize(tepi, (lebar_tampilan, tinggi_tampilan))

    # Konversi hasil deteksi tepi ke format BGR agar bisa digabungkan dengan frame asli
    tepi_diubah_ukuran_bgr = cv2.cvtColor(tepi_diubah_ukuran, cv2.COLOR_GRAY2BGR)

    # Gabungkan frame asli dan hasil deteksi tepi secara horizontal
    gabungan = np.hstack((bingkai_diubah_ukuran, tepi_diubah_ukuran_bgr))

    # Tampilkan frame yang sudah digabungkan
    cv2.imshow('Video Asli dan Deteksi Tepi', gabungan)

    # Tunggu 1 milidetik untuk input keyboard
    # Keluar jika tombol 'q' ditekan
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()

# Deteksi Gerakan (Motion Detection)

Deteksi gerakan adalah proses mengidentifikasi perubahan yang terjadi dalam video dari waktu ke waktu. Perubahan ini biasanya disebabkan oleh pergerakan objek di dalam adegan video. 

**Mengapa Deteksi Gerakan Penting?**

* **Keamanan:** Mendeteksi penyusup atau aktivitas yang tidak biasa dalam sistem pengawasan.
* **Otomatisasi:** Mengaktifkan tindakan otomatis berdasarkan deteksi gerakan, seperti menyalakan lampu atau mengirim notifikasi.
* **Analisis Video:** Memahami perilaku objek atau aktivitas dalam video, seperti menghitung jumlah orang atau kendaraan yang lewat.

**Cara Kerja Deteksi Gerakan:**

1. **Akuisisi Video:** Menerima aliran video dari kamera atau file video.
2. **Pemrosesan Awal (Opsional):** Mengubah ukuran, mengonversi ke grayscale, atau menerapkan filter untuk meningkatkan kualitas gambar dan mengurangi noise.
3. **Deteksi Perubahan:**
   * **Background Subtraction:** Membandingkan frame saat ini dengan model latar belakang untuk mengidentifikasi piksel yang berubah (foreground).
   * **Perbedaan Frame:** Menghitung perbedaan piksel antara dua frame berurutan.
4. **Thresholding (Opsional):** Menerapkan threshold pada hasil deteksi perubahan untuk mendapatkan gambar biner (hitam-putih), di mana piksel putih menunjukkan area yang bergerak.
5. **Analisis (Opsional):** Menganalisis area yang bergerak untuk mendapatkan informasi lebih lanjut, seperti ukuran, bentuk, atau lintasan objek.

**Contoh Penggunaan:**

* **Sistem Keamanan:** Mendeteksi gerakan untuk memicu alarm atau merekam video.
* **Otomatisasi Rumah:** Mengaktifkan lampu atau perangkat lain ketika ada gerakan terdeteksi.
* **Pengukur Lalu Lintas:** Menghitung jumlah kendaraan yang lewat di jalan.
* **Analisis Perilaku Hewan:** Menganalisis pergerakan hewan dalam video penelitian.


In [76]:
import cv2
import numpy as np

# Baca video (gunakan 0 untuk webcam)
tangkap_video = cv2.VideoCapture(nama_file_video)

# Inisialisasi pengurangan latar belakang
pengurang_latar = cv2.createBackgroundSubtractorMOG2()

while True:
    # Baca frame
    berhasil, bingkai = tangkap_video.read()
    if not berhasil:
        break

    # Terapkan pengurangan latar belakang
    topeng_depan = pengurang_latar.apply(bingkai)

    # Terapkan thresholding untuk mendapatkan gambar biner
    _, biner = cv2.threshold(topeng_depan, 127, 255, cv2.THRESH_BINARY)

    # Temukan kontur pada gambar biner
    kontur, _ = cv2.findContours(biner, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # Gambar bounding box di sekitar objek bergerak
    for kontur in kontur:
        if cv2.contourArea(kontur) > 100:  # Abaikan kontur yang terlalu kecil
            (x, y, w, h) = cv2.boundingRect(kontur)
            cv2.rectangle(bingkai, (x, y), (x + w, y + h), (0, 255, 0), 2)

    # Tampilkan frame dengan bounding box
    cv2.imshow('Deteksi Gerakan', bingkai)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

tangkap_video.release()
cv2.destroyAllWindows()

# Motion History Image (MHI)

Motion History Image (MHI) adalah representasi visual dari riwayat gerakan dalam video. MHI adalah gambar grayscale di mana intensitas piksel menunjukkan seberapa baru gerakan terjadi di lokasi tersebut. Piksel yang lebih terang menunjukkan gerakan yang lebih baru, sedangkan piksel yang lebih gelap menunjukkan gerakan yang lebih lama atau tidak ada gerakan sama sekali.

**Cara Kerja MHI:**

MHI dibuat dengan menggabungkan informasi dari beberapa frame video. Setiap kali ada gerakan terdeteksi dalam frame, nilai piksel di lokasi gerakan tersebut ditingkatkan. Seiring waktu, nilai piksel di lokasi yang tidak ada gerakan akan berkurang secara bertahap.

**Manfaat MHI:**

* **Visualisasi Gerakan:** MHI memberikan gambaran visual yang intuitif tentang pola gerakan dalam video.
* **Fitur Gerakan:** MHI dapat digunakan sebagai fitur untuk berbagai tugas analisis video, seperti:
    * Pengenalan Aksi: MHI dapat digunakan untuk mengenali aksi manusia seperti berjalan, berlari, atau melompat.
    * Deteksi Abnormalitas: MHI dapat digunakan untuk mendeteksi perilaku yang tidak biasa atau mencurigakan dalam video pengawasan.
    * Segmentasi Objek Bergerak: MHI dapat digunakan untuk memisahkan objek yang bergerak dari latar belakang statis.

**Contoh Penggunaan MHI:**

* Dalam video orang berjalan, MHI akan menunjukkan jejak gerakan kaki dan tangan.
* Dalam video lalu lintas, MHI akan menunjukkan jalur pergerakan kendaraan.
* Dalam video pengawasan, MHI dapat digunakan untuk mendeteksi orang yang berkeliaran di area terlarang.


In [78]:
import cv2
import numpy as np

# Baca video dari file
#nama_file_video = 'video/galih_jalan.mp4'  # Sesuaikan dengan path video Anda
tangkap_video = cv2.VideoCapture(nama_file_video)

# Mendapatkan ukuran frame asli
berhasil, bingkai = tangkap_video.read()
tinggi, lebar = bingkai.shape[:2]

# Atur skala perubahan ukuran video (50% dari ukuran asli)
skala_persen = 50
lebar_tampilan = int(lebar * skala_persen / 100)
tinggi_tampilan = int(tinggi * skala_persen / 100)

# Parameter durasi MHI (seberapa cepat gerakan memudar)
durasi_mhi = 0.2

while True:
    # Inisialisasi MHI (dipindahkan ke dalam loop agar direset setiap pengulangan video)
    mhi = np.zeros((tinggi, lebar), dtype=np.float64)

    # Baca frame pertama untuk inisialisasi awal prev_gray
    berhasil, bingkai = tangkap_video.read()
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)
        continue
    bingkai_abu_abu_sebelumnya = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

    # Lebar MHI setengah dari lebar tampilan, tinggi sama dengan tinggi tampilan
    lebar_mhi = lebar // 2
    tinggi_mhi = tinggi_tampilan

    # Loop dalam untuk memproses setiap frame dalam satu pengulangan video
    while True:
        berhasil, bingkai = tangkap_video.read()
        if not berhasil:
            break  # Keluar dari loop dalam jika sudah mencapai akhir video

        # Konversi frame ke grayscale
        bingkai_abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

        # Hitung perbedaan piksel antara frame saat ini dan frame sebelumnya
        perbedaan_bingkai = cv2.absdiff(bingkai_abu_abu, bingkai_abu_abu_sebelumnya)
        bingkai_abu_abu_sebelumnya = bingkai_abu_abu.copy()

        # Update MHI
        mhi = np.maximum(mhi - durasi_mhi, perbedaan_bingkai)

        # Resize frame asli dan MHI ke ukuran tampilan
        bingkai_diubah_ukuran = cv2.resize(bingkai, (lebar_tampilan, tinggi_tampilan))
        mhi_diubah_ukuran = cv2.resize(mhi, (lebar_mhi, tinggi_mhi))

        # Konversi MHI ke uint8 (agar bisa ditampilkan)
        mhi_diubah_ukuran = mhi_diubah_ukuran.astype(np.uint8)

        # Tambahkan padding (batas hitam) ke atas dan bawah MHI agar ukurannya sama dengan bingkai asli
        padding_atas_bawah = (tinggi_tampilan - tinggi_mhi) // 2
        mhi_dengan_padding = cv2.copyMakeBorder(mhi_diubah_ukuran, padding_atas_bawah, padding_atas_bawah, 0, 0, cv2.BORDER_CONSTANT, value=0)

        # Gabungkan frame asli dan MHI secara horizontal
        gabungan = np.hstack((bingkai_diubah_ukuran, cv2.cvtColor(mhi_dengan_padding, cv2.COLOR_GRAY2BGR)))

        # Tampilkan frame yang sudah digabungkan
        cv2.imshow('Video Asli dan MHI (50%)', gabungan)

        # Periksa apakah tombol 'r' atau 'q' ditekan
        key = cv2.waitKey(1) & 0xFF
        if key == ord('r'):  # Reset MHI jika tombol 'r' ditekan
            # Inisialisasi ulang MHI dan prev_gray
            mhi = np.zeros_like(bingkai_abu_abu_sebelumnya)
            berhasil, bingkai = tangkap_video.read()  # Baca ulang frame pertama
            if berhasil:
                bingkai_abu_abu_sebelumnya = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)
        elif key == ord('q'):  # Keluar jika tombol 'q' ditekan
            break

    # Keluar dari loop luar jika tombol 'q' ditekan
    if key == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()

# Optical Flow

Optical flow adalah teknik dalam pengolahan citra dan video yang digunakan untuk memperkirakan gerakan piksel antara dua frame berurutan. Dalam istilah sederhana, optical flow menunjukkan bagaimana setiap piksel dalam gambar pertama berpindah ke posisi baru di gambar kedua. Informasi ini direpresentasikan dalam bentuk vektor 2D yang memiliki arah dan magnitudo (besar) gerakan.

**Mengapa Optical Flow Penting?**

* **Pemahaman Gerakan:** Optical flow memungkinkan kita untuk memahami bagaimana objek atau kamera bergerak dalam video.
* **Segmentasi Objek Bergerak:** Dengan menganalisis pola aliran optik, kita dapat memisahkan objek yang bergerak dari latar belakang.
* **Estimasi Gerakan Kamera:** Optical flow dapat digunakan untuk memperkirakan bagaimana kamera bergerak (misalnya, panning, tilting, zooming) dalam video.
* **Aplikasi Luas:** Optical flow memiliki berbagai aplikasi dalam bidang seperti robotika, augmented reality, pengeditan video, dan analisis olahraga.

**Cara Kerja Optical Flow:**

1. **Asumsi Dasar:** Optical flow mengasumsikan bahwa intensitas piksel tetap konstan antara dua frame berurutan.
2. **Perhitungan Gerakan:** Algoritma optical flow menghitung pergerakan piksel dengan mencari pola intensitas yang paling mirip antara dua frame.
3. **Hasil:** Hasil perhitungan optical flow adalah field flow, yaitu sekumpulan vektor 2D yang menunjukkan arah dan besar gerakan untuk setiap piksel.

**Contoh Penggunaan:**

* Dalam video orang berjalan, optical flow akan menunjukkan arah dan kecepatan pergerakan setiap bagian tubuh orang tersebut.
* Dalam video mobil yang melaju, optical flow dapat digunakan untuk memperkirakan kecepatan dan arah mobil.
* Dalam video yang direkam dengan drone, optical flow dapat digunakan untuk menstabilkan video dengan menghilangkan efek guncangan kamera.


---
**Sparse Optical Flow – Metode Lucas-Kanade**

Sparse optical flow dengan metode Lucas-Kanade adalah teknik pengolahan video yang berfokus pada pelacakan gerakan titik-titik tertentu (fitur) dalam video, bukan seluruh piksel seperti pada dense optical flow. Metode ini menganggap bahwa gerakan pada area sekitar titik fitur tersebut relatif konstan.

**Cara Kerja Lucas-Kanade:**

1. **Deteksi Fitur:** Pada frame awal, algoritma mendeteksi titik-titik fitur yang menonjol, seperti sudut (corners) atau area dengan perubahan intensitas yang signifikan.

2. **Pelacakan Fitur:** Pada frame berikutnya, algoritma mencoba melacak pergerakan titik-titik fitur yang telah dideteksi sebelumnya. Ini dilakukan dengan meminimalkan perbedaan intensitas antara area sekitar titik fitur pada frame saat ini dan frame sebelumnya.

3. **Perhitungan Optical Flow:** Setelah titik fitur berhasil dilacak, vektor optical flow dihitung untuk setiap titik fitur. Vektor ini menunjukkan arah dan besar pergerakan titik fitur tersebut antara dua frame.

**Kelebihan Lucas-Kanade:**

* **Efisiensi Komputasi:** Karena hanya melacak sejumlah kecil titik fitur, metode ini lebih cepat dan efisien daripada dense optical flow.
* **Pelacakan Objek:** Cocok untuk aplikasi pelacakan objek, di mana kita tertarik untuk mengetahui bagaimana objek tertentu bergerak dalam video.

**Kekurangan Lucas-Kanade:**

* **Keterbatasan pada Gerakan Kompleks:** Kurang akurat untuk gerakan yang besar, cepat, atau kompleks seperti rotasi atau deformasi objek.
* **Ketergantungan pada Fitur yang Baik:** Kinerja metode ini sangat bergantung pada kualitas deteksi titik fitur. Jika titik fitur yang terdeteksi tidak stabil atau berubah secara signifikan antar frame, pelacakan akan menjadi tidak akurat.

**Contoh Penggunaan:**

* **Pelacakan Wajah:** Mendeteksi dan melacak wajah seseorang dalam video.
* **Analisis Gerakan Objek:** Menganalisis pergerakan objek tertentu (misalnya, bola dalam pertandingan olahraga) dengan melacak titik-titik fitur pada objek tersebut.
* **Augmented Reality:** Menempatkan objek virtual pada titik-titik fitur yang terdeteksi untuk menciptakan efek augmented reality.


In [79]:
import cv2
import numpy as np

# Baca video dari file
tangkap_video = cv2.VideoCapture(nama_file_video)

# Parameter untuk deteksi titik fitur Lucas-Kanade
parameter_fitur = dict(maxCorners=100,  # Jumlah maksimum sudut yang dideteksi
                       qualityLevel=0.3,  # Kualitas minimal sudut yang diterima
                       minDistance=7,     # Jarak minimum antar sudut
                       blockSize=7)       # Ukuran blok untuk menghitung turunan

# Parameter untuk perhitungan optical flow Lucas-Kanade
parameter_lk = dict(winSize=(15, 15),    # Ukuran jendela pencarian
                  maxLevel=2,        # Jumlah level piramida
                  criteria=(cv2.TERM_CRITERIA_EPS | cv2.TERM_CRITERIA_COUNT, 10, 0.03))

# Ambil frame pertama dan temukan titik-titik sudut (corner points)
berhasil, bingkai_lama = tangkap_video.read()
abu_abu_lama = cv2.cvtColor(bingkai_lama, cv2.COLOR_BGR2GRAY)
titik_awal = cv2.goodFeaturesToTrack(abu_abu_lama, mask=None, **parameter_fitur)

# Buat mask (citra hitam) untuk menggambar jejak titik
topeng = np.zeros_like(bingkai_lama)

while True:
    # Baca frame selanjutnya
    berhasil, bingkai = tangkap_video.read()
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)  # Ulang video jika sudah selesai
        continue

    # Konversi frame ke grayscale (abu-abu)
    bingkai_abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

    # Hitung optical flow dengan metode Lucas-Kanade
    titik_baru, status, error = cv2.calcOpticalFlowPyrLK(abu_abu_lama, bingkai_abu_abu, titik_awal, None, **parameter_lk)

    # Ambil hanya titik-titik yang berhasil dilacak
    titik_baru_valid = titik_baru[status == 1]
    titik_lama_valid = titik_awal[status == 1]

    # Gambar garis antara titik-titik lama dan baru pada mask (hijau)
    # Juga gambar lingkaran pada titik-titik baru di frame (merah)
    for i, (titik_baru, titik_lama) in enumerate(zip(titik_baru_valid, titik_lama_valid)):
        a, b = titik_baru.ravel()  # Koordinat titik baru
        c, d = titik_lama.ravel()  # Koordinat titik lama
        topeng = cv2.line(topeng, (int(a), int(b)), (int(c), int(d)), (0, 255, 0), 2)  # Gambar garis
        bingkai = cv2.circle(bingkai, (int(a), int(b)), 5, (0, 0, 255), -1)       # Gambar lingkaran

    # Tampilkan frame dengan optical flow (garis dan titik)
    img = cv2.add(bingkai, topeng)  # Gabungkan frame dan mask
    cv2.imshow('Hasil Optical Flow Lucas-Kanade', img)

    # Perbarui frame dan titik awal untuk iterasi berikutnya
    abu_abu_lama = bingkai_abu_abu.copy()
    titik_awal = titik_baru_valid.reshape(-1, 1, 2)

    # Tekan 'q' untuk keluar
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()


**Dense Optical Flow – Metode Farneback**

Dense optical flow dengan metode Farneback adalah teknik pengolahan video yang menghitung pergerakan untuk setiap piksel dalam gambar. Metode ini memperkirakan bagaimana setiap piksel dalam frame pertama berpindah ke posisi baru di frame berikutnya. Hasilnya adalah field flow yang berisi vektor 2D (arah dan magnitudo) untuk setiap piksel.

**Cara Kerja Farneback:**

1. **Asumsi Dasar:** Metode Farneback mengasumsikan bahwa pergerakan piksel di sekitar suatu titik adalah polinomial orde kedua.

2. **Ekspansi Polinomial:** Algoritma melakukan ekspansi polinomial pada lingkungan sekitar setiap piksel untuk memperkirakan pergerakannya.

3. **Pendekatan Multi-Skala:** Untuk menangani gerakan yang besar, metode Farneback menggunakan pendekatan piramida gambar (image pyramid), di mana pergerakan diperkirakan pada skala yang lebih kecil terlebih dahulu, kemudian diperbaiki pada skala yang lebih besar.

**Kelebihan Farneback:**

* **Akurasi Tinggi:** Metode ini umumnya lebih akurat daripada metode sparse optical flow seperti Lucas-Kanade, terutama untuk gerakan yang besar dan kompleks.
* **Robust Terhadap Noise:** Lebih tahan terhadap noise dalam gambar dibandingkan dengan metode Horn-Schunck.
* **Kecepatan yang Wajar:** Meskipun lebih lambat daripada Lucas-Kanade, metode Farneback masih cukup cepat untuk banyak aplikasi real-time.

**Kekurangan Farneback:**

* **Lebih Kompleks:** Implementasinya lebih kompleks daripada Lucas-Kanade.
* **Tidak Cocok untuk Gerakan Sangat Cepat:** Mungkin kurang akurat untuk gerakan yang sangat cepat, di mana asumsi pergerakan polinomial orde kedua tidak lagi valid.

**Contoh Penggunaan:**

* **Estimasi Gerakan Kamera:** Memperkirakan bagaimana kamera bergerak dalam video.
* **Segmentasi Objek Bergerak:** Memisahkan objek yang bergerak dari latar belakang dengan menganalisis pola aliran optik.
* **Analisis Aliran Fluida:** Menganalisis pergerakan fluida (misalnya, air, asap) dalam video.
* **Efek Visual:** Menciptakan efek visual yang menarik dalam film atau video game dengan memanipulasi aliran optik.

**Catatan:**

* Metode Farneback adalah salah satu metode dense optical flow yang paling populer dan banyak digunakan dalam berbagai aplikasi.
* Implementasi metode Farneback dalam OpenCV dapat dilakukan dengan menggunakan fungsi `cv2.calcOpticalFlowFarneback()`.


In [80]:
import cv2
import numpy as np

# Baca video dari file
tangkap_video = cv2.VideoCapture(nama_file_video)

# Baca frame pertama dan simpan sebagai bingkai_sebelumnya
berhasil, bingkai_awal = tangkap_video.read()

# Jika gagal membaca frame pertama, keluar program
if not berhasil:
    print("Error: Tidak dapat membaca frame video.")
    exit()

# Ubah ukuran gambar agar lebih mudah diproses (opsional)
ukuran_baru = 600  # Ukuran maksimum dimensi terpanjang (lebar atau tinggi)
dimensi_maks = max(bingkai_awal.shape)
skala = ukuran_baru / dimensi_maks
bingkai_awal = cv2.resize(bingkai_awal, None, fx=skala, fy=skala)

# Konversi bingkai pertama ke grayscale (abu-abu)
abu_abu_sebelumnya = cv2.cvtColor(bingkai_awal, cv2.COLOR_BGR2GRAY)

# Buat mask untuk menyimpan informasi warna aliran optik
# Akan direpresentasikan dalam format HSV (Hue, Saturation, Value)
topeng = np.zeros_like(bingkai_awal)

# Atur saturasi (kejenuhan warna) gambar ke maksimum
topeng[..., 1] = 255

# Loop untuk memproses setiap frame video
while tangkap_video.isOpened():

    # Baca frame saat ini
    berhasil, bingkai = tangkap_video.read()

    # Jika tidak ada frame lagi (akhir video), keluar dari loop
    if not berhasil:
        break

    # Konversi frame ke grayscale
    abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)
    abu_abu = cv2.resize(abu_abu, None, fx=skala, fy=skala)

    # Hitung optical flow dengan metode Farneback
    # Parameter: prev, next, flow, pyr_scale, levels, winsize, iterations, poly_n, poly_sigma, flags
    aliran_optik = cv2.calcOpticalFlowFarneback(abu_abu_sebelumnya, abu_abu, None, 
                                               pyr_scale=0.5, levels=5, winsize=11, 
                                               iterations=5, poly_n=5, poly_sigma=1.1, flags=0)

    # Hitung magnitudo (besar) dan sudut dari vektor aliran optik
    magnitudo, sudut = cv2.cartToPolar(aliran_optik[..., 0], aliran_optik[..., 1])

    # Tangani nilai NaN atau inf (opsional)
    # Ganti nilai NaN dan inf dengan 0, atau dengan nilai rata-rata magnitudo
    magnitudo = np.nan_to_num(magnitudo)

    # Atur hue (rona) pada mask berdasarkan sudut aliran optik
    topeng[..., 0] = sudut * 180 / np.pi / 2

    # Atur value (nilai/kecerahan) pada mask berdasarkan magnitudo aliran optik (dinormalisasi ke 0-255)
    # Tambahkan konversi ke uint8
    topeng[..., 2] = cv2.normalize(magnitudo, None, 0, 255, cv2.NORM_MINMAX).astype(np.uint8)

    # Konversi mask dari HSV ke BGR (agar bisa ditampilkan)
    rgb = cv2.cvtColor(topeng, cv2.COLOR_HSV2BGR)

    # Ubah ukuran frame agar sesuai dengan dimensi yang diinginkan
    bingkai = cv2.resize(bingkai, None, fx=skala, fy=skala)

    # Gabungkan frame asli dengan visualisasi optical flow
    # Dengan bobot 1 untuk frame asli dan 2 untuk visualisasi, sehingga visualisasi lebih dominan
    aliran_padat = cv2.addWeighted(bingkai, 1, rgb, 2, 0)

    # Tampilkan hasil visualisasi optical flow
    cv2.imshow("Dense Optical Flow", aliran_padat)

    # Perbarui frame sebelumnya untuk iterasi selanjutnya
    abu_abu_sebelumnya = abu_abu

    # Tekan 'q' untuk keluar
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()


**Dense Optical Flow - Metode Farneback** dengan latar belakang gelap. Aliran optik difokuskan kepada benda bergerak.

In [81]:
import cv2
import numpy as np
import time

# Baca video
tangkap_video = cv2.VideoCapture(nama_file_video)

# Baca dan ubah warna bingkai pertama ke grayscale (abu-abu)
berhasil, bingkai = tangkap_video.read()
tinggi, lebar = bingkai.shape[:2]

# Atur skala perubahan ukuran video (50% dari ukuran asli)
skala_persen = 50
lebar_tampilan = int(lebar * skala_persen / 100)
tinggi_tampilan = int(tinggi * skala_persen / 100)

# Inisialisasi waktu untuk perhitungan FPS
waktu_sebelumnya = 0

# Inisialisasi bingkai sebelumnya
abu_abu_sebelumnya = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

while True:
    # Catat waktu saat ini untuk perhitungan FPS
    waktu_baru = time.time()

    # Baca frame selanjutnya
    berhasil, bingkai = tangkap_video.read()
    if not berhasil:
        tangkap_video.set(cv2.CAP_PROP_POS_FRAMES, 0)
        continue

    # Konversi frame ke grayscale
    abu_abu = cv2.cvtColor(bingkai, cv2.COLOR_BGR2GRAY)

    # Hitung Optical Flow menggunakan metode Farneback
    aliran_optik = cv2.calcOpticalFlowFarneback(abu_abu_sebelumnya, abu_abu, None, 
                                               0.5, 3, 15, 3, 5, 1.2, 0)

    # Konversi hasil optical flow dari koordinat kartesian ke polar (magnitudo saja)
    magnitudo, _ = cv2.cartToPolar(aliran_optik[..., 0], aliran_optik[..., 1])

    # Normalisasi magnitudo ke rentang 0-255
    magnitudo_norm = cv2.normalize(magnitudo, None, 0, 255, cv2.NORM_MINMAX).astype(np.uint8)

    # Resize frame asli dan visualisasi optical flow
    bingkai_diubah_ukuran = cv2.resize(bingkai, (lebar_tampilan, tinggi_tampilan))
    magnitudo_norm_diubah_ukuran = cv2.resize(magnitudo_norm, (lebar_tampilan, tinggi_tampilan))

    # Gabungkan frame asli dan visualisasi optical flow secara horizontal
    # Konversi magnitudo_norm_diubah_ukuran ke BGR agar bisa digabungkan
    gabungan = np.hstack((bingkai_diubah_ukuran, cv2.cvtColor(magnitudo_norm_diubah_ukuran, cv2.COLOR_GRAY2BGR)))

    # Hitung FPS
    fps = 1 / (waktu_baru - waktu_sebelumnya)
    waktu_sebelumnya = waktu_baru

    # Tampilkan FPS pada frame
    cv2.putText(gabungan, "FPS: {:.2f}".format(fps), (10, 30), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 2)

    # Tampilkan frame yang sudah digabungkan
    cv2.imshow('Video Asli dan Optical Flow', gabungan)

    # Perbarui frame sebelumnya
    abu_abu_sebelumnya = abu_abu.copy()

    # Tekan 'q' untuk keluar
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Setelah selesai, lepaskan sumber daya video dan tutup semua jendela
tangkap_video.release()
cv2.destroyAllWindows()