# Deep Learning - Convolutional Neural Network

## Apa itu Deep Learning?
Deep learning adalah metode dalam kecerdasan buatan (AI) yang mengajarkan komputer untuk memproses data dengan cara yang terinspirasi otak manusia. Model deep learning dapat mengenali pola kompleks dalam gambar, teks, suara, dan data lain untuk menghasilkan wawasan dan prediksi yang akurat. 

Deep learning sendiri banyak digunakan untuk:
- Autonomus car menggunakan model deep learning untuk secara otomatis mendeteksi rambu lalu lintas dan pejalan kaki.
- Sistem pertahanan menggunakan deep learning untuk secara otomatis menandai lingkup area pada citra satelit.
- Analisis citra medis menggunakan deep learning untuk secara otomatis mendeteksi sel kanker untuk diagnosis medis.

## Apa itu Computer Vision?
![WhatsApp Image 2024-06-05 at 12 27 52 AM](https://github.com/tarishaicha/gambar/assets/107459188/8aa82bb0-a475-4fe9-8d3f-81a2879d7bbe)

Computer vision adalah suatu kemampuan komputer untuk mengembangkan model yang dapat mengenali objek, wajah, gerakan, dan lain-lain dari gambar dan video. 

Beberapa contoh implementasi computer vision:
- Content moderation untuk otomatisasi menghapus konten yang tidak senonoh/kurang aman dari foto/video yang telah disimpan. 
- Face recognition untuk mengidentifikasi wajah dan atributnya seperti, kacamata, gaya rambut, dan lainnya. 
- Image classification untuk mengidentifikasi macam hewan, sampah  facial expression,dan lainnya. 

Nah, untuk modul saat ini kita akan fokus pada penggunaan deep learning untuk image classification!

## Convolutional Neural Networks (CNN)
![image](https://github.com/tarishaicha/gambar/assets/107459188/e6ed7c8c-1f5c-45db-a7dd-35d5e7cfe6f2)

Convolutional Neural Network (CNN), atau juga dikenal sebagai ConvNet, adalah jenis algoritma deep learning khusus yang dirancang terutama untuk tugas-tugas yang memerlukan pengenalan objek, termasuk klasifikasi gambar, deteksi, dan segmentasi. Implementasi dari CNN sendiri ada berbagai macam, seperti autonomus car, security camera systems, dan lainnya. 

Ada beberapa alasan mengapa CNN penting di dunia modern, seperti yang di bawah ini:
- CNN berbeda dari algoritma machine learning seperti SVM dan random forest berdasarkan kemampuannya mengekstrak fitur secara mandiri dalam skala besar, sehingga mengabaikan kebutuhan feature engineering secara manual sehingga dapat meningkatkan efisiensi.
- Berbagai pre-trained CNN model, termasuk VGG-16, ResNet50, Inceptionv3, dan EfficientNet, yang memiliki performa bagus. Model-model ini dapat disesuaikan dengan tugas-tugas baru dengan data yang relatif sedikit melalui proses yang disebut fine-tuning.
- Selain klasifikasi gambar, CNN juga serbaguna dan dapat diterapkan ke berbagai bidang lain, seperti natural language processing, time series analysis, dan speech recognition.

### Architecture of a Vanilla CNN
![image](https://github.com/tarishaicha/gambar/assets/107459188/17bcef57-99c6-4b48-ae21-77fb809e0f71)

Vanilla arsitektur CNN yaitu arsitektur basic dari Convolutional Neural Network tanpa modifikasi atau penambahan layer kompleks lainnya.

Terdapat 2 komponen utama dari arsitektur CNN:
1. Feature Extraction
- Convolution Layers: Pada tahap ini, convolution layer memisahkan dan mengidentifikasi berbagai fitur dari gambar untuk dianalisis. 
- Jaringan Ekstraksi Fitur:  Terdiri dari banyak pasangan convolution layer dan pooling layer. Convolution layer  menerapkan filter untuk mengekstraksi fitur dari gambar, sedangkan pooling layer mengurangi dimensi fitur yang diekstraksi untuk menyederhanakan data dan mengurangi beban model.
2. Classification
- Fully Connected Layers: Menggunakan output dari proses convolution layer dan memprediksi kelas gambar berdasarkan fitur-fitur yang telah diekstraksi pada tahap sebelumnya. Lapisan ini menghubungkan semua neuron dari lapisan sebelumnya dengan neuron pada lapisan ini untuk melakukan klasifikasi akhir.







## Filter Pada CNN dan Fungsinya

## Pooling Layer
## Apa itu Pooling Layer?
Pooling layer merupakan salah satu elemen penyusun CNN yang juga dikenal sebagai subsampling atau downsampling. Digunakan untuk mengurangi dimensi spasial secara bertahap dengan tetap mempertahankan informasi penting. Hal ini mampu mengontrol kompleksitas model, mengurangi overfitting, dan meningkatkan efisiensi komputasi dengan mengurangi jumlah parameter dan komputasi yang diperlukan pada lapisan berikutnya. Pooling layer berbeda dengan convolution layer di mana convolution layer mengekstrak fitur dari gambar sedangkan pooling layer berperan dalam penggabungan fitur.

Proses pooling layer dapat dianalogikan dengan melihat foto kucing dari kejauhan. Saat melihat foto dari kejauhan, detail kecil seperti bulu kucing atau tekstur sofa tidak dapat terlihat. Namun, dengan hanya melihat bentuk umum kucing seperti bentuk mata, hidung, dan telinga. Informasi ini cukup untuk mengklasifikasikan kucing sebagai kucing Persia atau bukan.

## Kenapa perlu Pooling Layer?
- Pooling layer digunakan untuk mengurangi dimensi feature maps. Dengan demikian, ini mengurangi jumlah parameter yang perlu dipelajari dan jumlah komputasi yang dilakukan dalam jaringan.
- Pooling layer merangkum fitur-fitur yang ada di wilayah feature maps yang dihasilkan oleh convolutional layer. Jadi, operasi lebih lanjut dilakukan pada fitur yang diringkas, bukan pada fitur yang diposisikan secara tepat yang dihasilkan oleh lapisan konvolusi. Hal ini membuat model lebih tahan terhadap variasi posisi fitur pada gambar masukan.

## Jenis Pooling Layer
Terdapat 2 jenis pooling layer yang umum digunakan yaitu : 
- Max Pooling
- Average Pooling
- Global Pooling
- Stochastic Pooling

Modul kali ini hanya akan membahas mengenai jenis pooling yang umum digunakan yaitu max pooling dan average pooling.


## Fully Connected Layer
Fully connected layer atau biasa lebih dikenal dengan sebutan dense layer adalah salah satu komponen utama dalam neural network yang menghubungkan setiap neuron di satu layer ke setiap neuron di layer berikutnya. Layer ini sangat penting dalam proses klasifikasi karena memungkinkan jaringan untuk belajar pola kompleks dalam data. Sebelum masuk ke fully connected layer, output dari pooling layer terakhir yang berbentuk multi-dimensi perlu "diratakan" (flatenned) terlebih dahulu agar menjadi vektor 1 dimensi seperti ilustrasi berikut:

<div align="center">
    <img src=".\images\flatten.png" height="350" alt="FC Layer">
</div>

Output yang diratakan kemudian dapat diproses oleh fully connected layer, dan back propagation diterapkan pada setiap iterasi pelatihan untuk menghitung gradien kesalahan terhadap setiap bobot dalam jaringan. Gradien ini kemudian digunakan untuk memperbarui bobot guna meminimalkan kesalahan pada iterasi berikutnya. Selama serangkaian epoch, model dapat membedakan antara fitur dominan dan fitur tingkat rendah tertentu dalam gambar dan mengklasifikasikannya. Lapisan ini menetapkan weight secara acak pada input dan memprediksi label yang sesuai. 

Jumlah layer yang digunakan dapat bervariasi, tergantung pada seberapa dalam model akan mengklasifikasikan data. Hal ini tentunya juga bergantung pada seberapa banyak dataset training yang digunakan. Pada layer ini, fungsi aktivasi yang biasa digunakan adalah fungsi ReLU Dikarenakan modul ini berfokus pada computer vision, berikut merupakan ilustrasi yang lebih jelas:

<div align="center">
    <img src=".\images\fc-2.png" height="350" alt="FC Layer">
</div>

Output dari lapisan fully connected terakhir dikirim ke lapisan final dengan fungsi aktivasi softmax atau sigmoid untuk menghasilkan output klasifikasi.

#### Referensi:
- [Convolution Neural Network – Better Understanding](https://www.analyticsvidhya.com/blog/2021/07/convolution-neural-network-better-understanding/)
- [Fully Connected Layer vs. Convolutional Layer: Explained](https://builtin.com/machine-learning/fully-connected-layer)
- [Fully Connected Layers in Convolutional Neural Networks](https://indiantechwarrior.com/fully-connected-layers-in-convolutional-neural-networks/)