# Deteksi Wajah Menggunakan OpenCV dan CNN
---

Deteksi wajah adalah bagian penting dari visi komputer (computer vision) dan merupakan area yang telah mengalami pertumbuhan signifikan dalam beberapa tahun terakhir. Pada bab ini, kita akan memulai dengan konsep sederhana dari deteksi wajah dan fitur kunci menggunakan metode Viola-Jones, lalu melanjutkan ke konsep yang lebih canggih seperti deteksi titik kunci wajah dan ekspresi wajah menggunakan jaringan saraf tiruan (neural network). Bab ini akan diakhiri dengan konsep canggih deteksi wajah 3D.

### Mengapa Pembahasan Ini Perlu Dipelajari?

Memahami deteksi wajah sangat penting karena teknologi ini digunakan dalam berbagai aplikasi sehari-hari, seperti keamanan, hiburan, dan interaksi manusia-mesin. Dengan mempelajari teknik-teknik ini, kita dapat mengembangkan sistem yang lebih aman dan efisien, serta menciptakan aplikasi yang lebih interaktif dan responsif terhadap pengguna.

### Topik yang Akan Dibahas:

1. **Menerapkan Viola-Jones AdaBoost Learning dan Klasifikasi Haar Cascade untuk Pengenalan Wajah**:
   - **Penjelasan**: Metode Viola-Jones adalah teknik deteksi wajah yang cepat dan efektif menggunakan algoritma pembelajaran AdaBoost dan klasifikasi Haar Cascade. Teknik ini cocok untuk deteksi wajah secara real-time karena kecepatan dan akurasinya.
   - **Aplikasi**: Digunakan dalam kamera digital untuk fokus otomatis, aplikasi pengenalan wajah di smartphone, dan sistem keamanan.

2. **Memprediksi Titik Kunci Wajah Menggunakan Jaringan Saraf Tiruan**:
   - **Penjelasan**: Titik kunci wajah adalah titik-titik penting pada wajah seperti mata, hidung, dan mulut. Menggunakan jaringan saraf tiruan, kita dapat mendeteksi posisi titik-titik ini dengan presisi tinggi.
   - **Aplikasi**: Digunakan dalam aplikasi filter wajah seperti Snapchat, pengenalan emosi, dan aplikasi kosmetik untuk menyesuaikan makeup secara virtual.

3. **Memprediksi Ekspresi Wajah Menggunakan CNN**:
   - **Penjelasan**: Convolutional Neural Network (CNN) digunakan untuk mengenali ekspresi wajah seperti senyum, sedih, marah, dan lainnya. CNN sangat efektif dalam menganalisis gambar dan mendeteksi pola-pola kompleks.
   - **Aplikasi**: Digunakan dalam sistem analisis emosi untuk pemasaran, interaksi manusia-robot, dan pengawasan keamanan untuk mendeteksi perilaku mencurigakan.

4. **Tinjauan Deteksi Wajah 3D**:
   - **Penjelasan**: Deteksi wajah 3D melibatkan pemodelan wajah dalam tiga dimensi untuk mendapatkan representasi yang lebih akurat. Teknik ini sangat berguna dalam situasi di mana posisi atau orientasi wajah tidak ideal.
   - **Aplikasi**: Digunakan dalam pengenalan wajah untuk keamanan tingkat tinggi, aplikasi medis untuk analisis struktur wajah, dan animasi 3D dalam film dan permainan.

### Mengapa Topik Ini Penting?

- **Keamanan**: Sistem pengenalan wajah digunakan dalam berbagai aplikasi keamanan seperti kunci pintar, pengawasan CCTV, dan kontrol akses.
- **Interaksi Pengguna**: Aplikasi interaktif seperti filter wajah, game augmented reality, dan asisten virtual menggunakan teknologi deteksi wajah untuk pengalaman yang lebih menarik.
- **Kesehatan**: Dalam bidang kesehatan, analisis ekspresi wajah dapat digunakan untuk mendeteksi kondisi emosional dan psikologis pasien.
- **Hiburan**: Teknologi ini juga digunakan dalam film dan game untuk menciptakan karakter animasi yang realistis dan interaktif.


## **Menerapkan Pembelajaran AdaBoost Viola-Jones dan Klasifikasi Cascade Haar untuk Pengenalan Wajah**
---

Pada tahun 2001, Paul Viola dari Microsoft Research dan Michael Jones dari Mitsubishi Electric mengembangkan metode revolusioner untuk mendeteksi wajah dalam gambar dengan mengembangkan sebuah pengklasifikasi yang disebut Klasifikasi Cascade Haar. Klasifikasi Cascade Haar didasarkan pada fitur Haar, yaitu jumlah dari perbedaan nilai piksel dalam sebuah daerah persegi panjang. Besarnya nilai perbedaan ini dikalibrasi untuk menunjukkan karakteristik dari suatu daerah pada wajah—misalnya, hidung, mata, dan sebagainya. Detektor akhir memiliki 38 pengklasifikasi cascade dengan 6.060 fitur yang terdiri dari sekitar 4.916 gambar wajah dan 9.500 gambar non-wajah. Total waktu pelatihan memakan waktu beberapa bulan, tetapi waktu deteksi sangat cepat.

Pertama, gambar diubah dari RGB menjadi skala abu-abu, kemudian dilakukan penyaringan dan segmentasi gambar sehingga pengklasifikasi dapat dengan cepat mendeteksi objek. Pada bagian berikutnya, kita akan mempelajari bagaimana membangun Klasifikasi Cascade Haar.

#### Mengapa Materi Ini Penting untuk Dipelajari?

Pembelajaran mengenai pengenalan wajah dengan metode Viola-Jones dan Klasifikasi Cascade Haar penting untuk beberapa alasan berikut:
1. **Kemajuan Teknologi**: Dengan memahami teknologi ini, kita dapat mengapresiasi kemajuan dalam bidang pengolahan citra dan pembelajaran mesin.
2. **Keamanan dan Identifikasi**: Teknologi pengenalan wajah digunakan dalam sistem keamanan dan identifikasi, seperti di bandara, kantor, dan perangkat pribadi.
3. **Aplikasi Nyata**: Pengetahuan ini dapat diterapkan dalam berbagai aplikasi sehari-hari seperti penguncian ponsel menggunakan wajah, sistem kehadiran otomatis, dan pencarian foto berdasarkan wajah di media sosial.

#### Contoh Aplikasi dalam Kehidupan Nyata

1. **Keamanan dan Pengawasan**: Sistem pengenalan wajah digunakan di tempat-tempat umum seperti bandara, stasiun kereta, dan mal untuk mengidentifikasi individu yang dicari atau untuk tujuan keamanan.
2. **Smartphone dan Gadget**: Banyak ponsel pintar modern menggunakan teknologi pengenalan wajah untuk membuka kunci perangkat, membuatnya lebih aman dan nyaman.
3. **Media Sosial**: Platform seperti Facebook menggunakan pengenalan wajah untuk menandai orang dalam foto secara otomatis, memudahkan pengguna dalam mengelola dan mencari foto.
4. **Sistem Kehadiran**: Beberapa perusahaan menggunakan sistem pengenalan wajah untuk mencatat kehadiran karyawan, mengurangi kemungkinan kecurangan dan meningkatkan efisiensi.

### **Memilih Fitur Mirip Haar**
---

Algoritma klasifikasi cascade Haar didasarkan pada gagasan bahwa gambar wajah manusia memiliki fitur intensitas yang khas di berbagai bagian wajah. Misalnya, daerah mata pada wajah lebih gelap dibandingkan bagian bawah kelopak mata dan daerah hidung lebih terang dibandingkan dua bagian wajah di sebelahnya. Fitur mirip Haar direpresentasikan oleh persegi panjang hitam dan putih yang bersebelahan, seperti yang ditunjukkan dalam gambar berikut. Dalam gambar ini, terdapat beberapa fitur mirip Haar potensial (fitur dua-persegi panjang, tiga-persegi panjang, dan empat-persegi panjang):

- Fitur Dua-Persegi Panjang: terdiri dari dua persegi panjang yang bersebelahan, satu hitam dan satu putih.
- Fitur Tiga-Persegi Panjang: terdiri dari tiga persegi panjang yang bersebelahan, satu hitam di tengah dan dua putih di sisi.
- Fitur Empat-Persegi Panjang: terdiri dari empat persegi panjang yang bersebelahan, dua hitam dan dua putih.

![image-2.png](attachment:image-2.png)

Perhatikan bahwa bagian persegi panjang ditempatkan di atas fitur karakteristik wajah. Karena intensitas daerah mata lebih gelap daripada wajah, daerah hitam dari persegi panjang ditempatkan di dekat mata dan daerah putih di bawah mata. Demikian pula, karena daerah hidung lebih terang daripada sekelilingnya, persegi panjang putih ditempatkan di hidung dan persegi panjang hitam berada di kedua sisi.

#### Penjelasan Lebih Lanjut

1. **Daerah Mata**: Mata cenderung memiliki intensitas yang lebih rendah (lebih gelap) dibandingkan dengan daerah di bawah kelopak mata. Oleh karena itu, persegi panjang hitam ditempatkan di atas mata, dan persegi panjang putih ditempatkan di bawah mata.
2. **Daerah Hidung**: Hidung cenderung memiliki intensitas yang lebih tinggi (lebih terang) dibandingkan dengan daerah di sekitarnya. Oleh karena itu, persegi panjang putih ditempatkan di atas hidung, dan persegi panjang hitam ditempatkan di kedua sisi hidung.

Dengan menempatkan persegi panjang hitam dan putih ini secara strategis, algoritma dapat mengenali pola intensitas yang khas dari fitur wajah tertentu. Proses ini memungkinkan algoritma untuk secara efisien mendeteksi wajah dalam gambar dengan cepat dan akurat.

#### Mengapa Materi Ini Penting untuk Dipelajari?

Pembelajaran tentang pemilihan fitur mirip Haar penting karena:

1. **Pemahaman Teknologi**: Memberikan pemahaman tentang bagaimana komputer dapat mendeteksi wajah dalam gambar, yang merupakan dasar dari banyak aplikasi teknologi modern.
2. **Pengembangan Keterampilan Analisis**: Mengajarkan keterampilan analisis yang dapat diterapkan dalam bidang lain yang memerlukan pengenalan pola dan analisis data.
3. **Relevansi Praktis**: Membantu siswa memahami aplikasi praktis dari teknologi pengenalan wajah dalam kehidupan sehari-hari, seperti dalam keamanan, pengawasan, dan penggunaan ponsel pintar.

Dengan memahami cara kerja fitur mirip Haar dan penerapannya, siswa dapat lebih menghargai teknologi yang digunakan dalam banyak aspek kehidupan modern dan mungkin terinspirasi untuk mengeksplorasi lebih lanjut di bidang teknologi dan ilmu komputer.

### **Membuat Gambar Integral**
---

Gambar integral digunakan untuk menghitung nilai piksel fitur persegi panjang dengan sangat cepat dalam satu kali proses. Untuk memahami gambar integral dengan lebih baik, mari kita lihat penjelasan berikut tentang cara menghitungnya:

![image.png](attachment:image.png)

Nilai dari fitur mirip Haar dapat dihitung sebagai selisih antara jumlah nilai piksel di daerah putih dan jumlah nilai piksel di daerah hitam. Jumlah piksel I(x,y) dapat diwakili oleh nilai dari semua piksel di sebelah kiri dan di atas lokasi piksel saat ini i(x,y), termasuk nilai piksel saat ini, dan dapat direpresentasikan sebagai berikut:

![image-2.png](attachment:image-2.png)

Dalam gambar berikut, I(x,y) adalah nilai akhir dari gambar integral yang terdiri dari sembilan nilai piksel (62, 51, 51, 111, 90, 77, 90, 79, dan 73). Menjumlahkan semua nilai ini memberikan nilai 684:

![image-3.png](attachment:image-3.png)

Gambar di atas menunjukkan intensitas piksel dari daerah mata wajah dan gambar integral yang sesuai. Gambar ini menunjukkan bahwa jumlah intensitas piksel dari daerah persegi panjang diperoleh dengan menjumlahkan semua nilai piksel yang berada di atas dan di sebelah kiri—misalnya, 917 diperoleh dengan menjumlahkan 866 (yang merupakan jumlah dari 73, 79, 90, 111,...68, searah jarum jam) dan 10, 14, 9, dan 18. Perlu diperhatikan bahwa 917 juga dapat diperoleh dengan menjumlahkan 717 dan kemudian menambahkan jumlah dari 50, 64, 68, dan 18.

Persamaan jumlah piksel sebelumnya dapat ditulis ulang sebagai berikut:
![image-4.png](attachment:image-4.png)

Dalam gambar integral, area untuk setiap daerah persegi panjang dalam gambar dapat dihitung dengan menjumlahkan empat array (seperti yang ditunjukkan pada persamaan sebelumnya) dibandingkan dengan enam akses memori untuk jumlah semua piksel individu. Jumlah persegi panjang pengklasifikasi Haar dapat diperoleh dari persamaan sebelumnya, seperti yang ditunjukkan dalam persamaan berikut:

Persamaan sebelumnya dapat diatur ulang sebagai berikut:

![image-6.png](attachment:image-6.png)

Gambar berikut menunjukkan nilai piksel gambar yang diubah menjadi nilai piksel gambar integral:

![image-5.png](attachment:image-5.png)

Gambar integral di sebelah kanan hanyalah jumlah dari nilai piksel di sebelah kiri—jadi 113 = 62 + 51, dan seterusnya. Nilai piksel daerah yang diarsir hitam mewakili persegi panjang Haar hitam seperti yang dijelaskan sebelumnya. Untuk menghitung nilai intensitas di daerah yang diarsir terang, kita mengambil nilai intensitas integral, misalnya, 1.063 dan mengurangkan 268 darinya.

![image-7.png](attachment:image-7.png)

#### Penjelasan Lebih Lanjut

1. **Gambar Integral**: Gambar integral adalah representasi khusus dari gambar asli yang memungkinkan perhitungan jumlah intensitas piksel dalam daerah persegi panjang dengan cepat.
2. **Kecepatan dan Efisiensi**: Dengan menggunakan gambar integral, kita dapat menghitung jumlah piksel dalam sebuah daerah dengan hanya beberapa operasi aritmatika, membuat proses ini sangat cepat dan efisien.
3. **Aplikasi Praktis**: Penggunaan gambar integral sangat penting dalam algoritma pengenalan wajah karena memungkinkan deteksi fitur wajah dengan cepat tanpa memerlukan banyak komputasi.

#### Mengapa Materi Ini Penting untuk Dipelajari?

Pembelajaran tentang gambar integral penting karena:

1. **Pemahaman Teknologi Canggih**: Memberikan wawasan tentang teknik-teknik canggih dalam pengolahan citra dan pembelajaran mesin.
2. **Aplikasi di Dunia Nyata**: Memahami bagaimana teknologi ini diterapkan dalam sistem pengenalan wajah yang digunakan di berbagai perangkat dan aplikasi.
3. **Meningkatkan Keterampilan Matematika**: Membantu siswa meningkatkan keterampilan matematika mereka melalui pemahaman konsep-konsep seperti penjumlahan dan perbedaan piksel.

Dengan memahami konsep gambar integral dan bagaimana cara kerjanya, siswa dapat lebih menghargai teknologi di balik pengenalan wajah dan mungkin terinspirasi untuk mengeksplorasi lebih lanjut di bidang teknologi dan ilmu komputer.

In [1]:
import numpy as np

def compute_integral_image(image):
    """
    Compute the integral image for the given image.
    
    Parameters:
    image (numpy.ndarray): 2D array representing the grayscale image.
    
    Returns:
    integral_image (numpy.ndarray): 2D array representing the integral image.
    """
    # Get the dimensions of the image
    rows, cols = image.shape
    
    # Initialize the integral image with zeros
    integral_image = np.zeros((rows, cols), dtype=np.int32)
    
    # Compute the integral image
    for i in range(rows):
        for j in range(cols):
            integral_image[i, j] = image[i, j]
            if i > 0:
                integral_image[i, j] += integral_image[i - 1, j]
            if j > 0:
                integral_image[i, j] += integral_image[i, j - 1]
            if i > 0 and j > 0:
                integral_image[i, j] -= integral_image[i - 1, j - 1]
    
    return integral_image

image = np.array([[1, 2, 3, 4, 5],
                    [6, 7, 8, 9, 10],
                    [11, 12, 13, 14, 15],
                    [16, 17, 18, 19, 20],
                    [21, 22, 23, 24, 25]], dtype=np.int32)
    
# Compute the integral image
integral_image = compute_integral_image(image)

# Print the original and integral images
print("Original Image:")
print(image)
print("\nIntegral Image:")
print(integral_image)


Original Image:
[[ 1  2  3  4  5]
 [ 6  7  8  9 10]
 [11 12 13 14 15]
 [16 17 18 19 20]
 [21 22 23 24 25]]

Integral Image:
[[  1   3   6  10  15]
 [  7  16  27  40  55]
 [ 18  39  63  90 120]
 [ 34  72 114 160 210]
 [ 55 115 180 250 325]]


### **Menjalankan Pelatihan AdaBoost**
---

Gambar dibagi menjadi T jendela di mana fitur mirip Haar diterapkan dan nilai-nilainya dihitung seperti yang telah dijelaskan sebelumnya. AdaBoost membangun pengklasifikasi kuat dari sejumlah besar pengklasifikasi lemah dengan mengiterasi satu set pelatihan dari T jendela. Pada setiap iterasi, bobot dari pengklasifikasi lemah disesuaikan berdasarkan jumlah sampel positif (wajah) dan jumlah sampel negatif (non-wajah) untuk mengevaluasi jumlah item yang salah diklasifikasikan. Kemudian, untuk iterasi berikutnya, bobot dari item yang salah diklasifikasikan diberi bobot lebih tinggi untuk meningkatkan kemungkinan item tersebut terdeteksi. Pengklasifikasi kuat akhir h(x) adalah kombinasi dari pengklasifikasi lemah yang dibobot sesuai dengan kesalahannya.

#### Pengklasifikasi Lemah

Setiap pengklasifikasi lemah mengambil satu fitur, f. Pengklasifikasi ini memiliki polaritas, p, dan ambang batas, θ:

- **Polaritas, p**: Menunjukkan arah dari perbandingan fitur terhadap ambang batas.
- **Ambang batas, θ**: Nilai batas yang digunakan untuk memutuskan apakah fitur tersebut menunjukkan wajah atau bukan.
  
  ![image.png](attachment:image.png)

#### Pengklasifikasi Kuat

Pengklasifikasi kuat akhir, h(x), memiliki kesalahan terendah, Et, dan diberikan oleh persamaan berikut:

![image-2.png](attachment:image-2.png)

Di sini, $ \alpha_t = \log(\frac{1}{\beta_t}) $ dan $ \beta_t = \frac{E_t}{1 - E_t} $:

![image-4.png](attachment:image-4.png)

Bobot (Wt) diinisialisasi sebagai berikut:

![image-5.png](attachment:image-5.png)

Di mana P dan N adalah jumlah sampel positif dan negatif masing-masing. Nilai bobot diperbarui sebagai berikut:

![image-6.png](attachment:image-6.png)

Di mana $ e_t $ adalah nilai kesalahan untuk pengklasifikasi lemah ke-t.

#### Penjelasan Lebih Lanjut

1. **Pembobotan dan Penyesuaian**: Pada setiap iterasi, bobot dari pengklasifikasi lemah disesuaikan. Jika sebuah pengklasifikasi salah mengklasifikasikan sampel, bobotnya ditingkatkan sehingga pada iterasi berikutnya, pengklasifikasi tersebut memiliki peluang lebih besar untuk mengklasifikasikan sampel tersebut dengan benar.
   
2. **Kombinasi Pengklasifikasi Lemah**: Setiap pengklasifikasi lemah hanya mampu melakukan klasifikasi sederhana, tetapi dengan menggabungkan banyak pengklasifikasi lemah, kita bisa mendapatkan pengklasifikasi kuat yang mampu melakukan klasifikasi dengan akurasi tinggi.

3. **Mekanisme AdaBoost**: AdaBoost menggabungkan pengklasifikasi lemah dengan cara memberikan bobot yang lebih besar pada pengklasifikasi yang memiliki kesalahan rendah dan bobot yang lebih kecil pada pengklasifikasi yang memiliki kesalahan tinggi.

#### Mengapa Materi Ini Penting untuk Dipelajari?

1. **Pemahaman Algoritma Pembelajaran Mesin**: Memberikan wawasan tentang bagaimana algoritma pembelajaran mesin bekerja untuk meningkatkan akurasi melalui kombinasi pengklasifikasi sederhana.
2. **Aplikasi Nyata**: Memahami mekanisme ini penting untuk mengembangkan aplikasi yang memerlukan deteksi objek, seperti sistem keamanan dan aplikasi pengenalan wajah.
3. **Pengembangan Keterampilan Analitis**: Mengajarkan siswa untuk memahami dan menganalisis bagaimana berbagai algoritma bekerja dan bagaimana mereka dapat diterapkan dalam situasi nyata.

Dengan memahami konsep pelatihan AdaBoost, siswa dapat lebih menghargai teknologi di balik pengenalan wajah dan mungkin terinspirasi untuk mengeksplorasi lebih lanjut di bidang teknologi dan ilmu komputer.

### **Pengklasifikasi Attentional Cascade**
---

Setiap pengklasifikasi kuat yang telah dijelaskan sebelumnya membentuk sebuah cascade, di mana setiap pengklasifikasi lemah mewakili satu tahap untuk dengan cepat menghilangkan sub-jendela negatif dan mempertahankan sub-jendela positif. Respons positif dari pengklasifikasi pertama menunjukkan bahwa daerah wajah (misalnya, daerah mata) telah terdeteksi dan kemudian algoritma beralih ke fitur berikutnya (misalnya, daerah hidung) untuk memicu evaluasi pengklasifikasi kedua, dan seterusnya. Hasil negatif pada titik mana pun akan menyebabkan penolakan tahap tersebut secara langsung. 

#### Penjelasan Lebih Lanjut

1. **Tahap Cascade**: Setiap pengklasifikasi lemah dalam cascade berfungsi sebagai filter tahap awal. Jika suatu sub-jendela tidak lulus dari pengklasifikasi lemah pada tahap awal, sub-jendela tersebut langsung dihapus dari pertimbangan.
   
2. **Peningkatan Akurasi**: Saat klasifikasi bergerak dari kiri ke kanan (dari tahap awal ke tahap berikutnya), akurasi klasifikasi meningkat. Ini karena hanya sub-jendela yang lolos dari semua pengklasifikasi lemah sebelumnya yang akan dievaluasi oleh pengklasifikasi lemah berikutnya.

3. **Efisiensi**: Dengan menghilangkan sub-jendela negatif di tahap awal, algoritma menjadi lebih efisien karena hanya sub-jendela yang memiliki kemungkinan besar mengandung wajah yang dipertimbangkan lebih lanjut.

Gambar berikut mengilustrasikan poin ini:

![image.png](attachment:image.png)

Gambar ini menunjukkan bahwa fitur negatif dihilangkan segera. Saat klasifikasi bergerak dari kiri ke kanan, akurasinya meningkat.

#### Mengapa Materi Ini Penting untuk Dipelajari?

1. **Pemahaman Algoritma Efisien**: Memberikan pemahaman tentang bagaimana algoritma dapat dioptimalkan untuk bekerja dengan cepat dan efisien, yang penting dalam aplikasi real-time seperti pengenalan wajah.
2. **Implementasi dalam Dunia Nyata**: Menunjukkan bagaimana teknologi ini diterapkan dalam berbagai aplikasi, seperti keamanan, pengawasan, dan perangkat pintar.
3. **Pengembangan Keterampilan Analitis**: Membantu siswa memahami cara kerja algoritma dan bagaimana berbagai tahap dalam algoritma saling berhubungan untuk mencapai tujuan akhir dengan efisien.

Dengan memahami konsep pengklasifikasi cascade perhatian, siswa dapat lebih menghargai teknologi di balik pengenalan wajah dan mungkin terinspirasi untuk mengeksplorasi lebih lanjut di bidang teknologi dan ilmu komputer.