# Flattening
Ya, **ciri utama FCNN (Fully Connected Neural Network)** adalah bahwa input ke lapisan pertama, dan output dari lapisan-lapisan berikutnya, harus dalam bentuk **vektor 1D**. Proses **flattening** sering kali dilakukan untuk mengubah data multidimensi (seperti gambar 2D atau 3D) menjadi vektor 1D, agar sesuai dengan format input yang dibutuhkan oleh FCNN.

### Mengapa Flattening Diperlukan dalam FCNN?
1. **Struktur Fully Connected**:
   - Setiap neuron di satu lapisan terhubung dengan **semua** neuron di lapisan berikutnya. Untuk mewujudkan ini, data harus berada dalam format **linear (vektor)**.
   
2. **Tidak Memanfaatkan Lokalitas**:
   - FCNN tidak mengenali struktur spasial (seperti pola 2D dalam gambar), sehingga semua piksel atau fitur diperlakukan sama, tanpa mempertimbangkan hubungan lokal.

3. **Persyaratan Arsitektur**:
   - Model FCNN memerlukan data input berupa vektor, sehingga data 2D/3D (misalnya gambar) harus diubah menjadi bentuk linear.

---

### Contoh Proses Flattening

#### Sebelum Flattening (Data 2D)
Misalnya, gambar berukuran 3x3:
```python
image = np.array([
    [255, 128, 64],
    [128, 64, 32],
    [64, 32, 16]
])
```
Berukuran `(3, 3)`.

#### Setelah Flattening
Setelah flattening, menjadi vektor 1D:
```python
flattened_image = image.flatten()
# Output: [255, 128, 64, 128, 64, 32, 64, 32, 16]
```
Berukuran `(9,)`.

---

### FCNN vs CNN dalam Penanganan Data Gambar

| **Aspek**                  | **FCNN**                                           | **CNN**                                          |
|----------------------------|---------------------------------------------------|------------------------------------------------|
| **Input Data**             | Harus di-flatten menjadi vektor 1D.               | Dapat langsung menggunakan data 2D/3D (gambar).|
| **Struktur Koneksi**       | Setiap neuron terhubung ke semua neuron lain.     | Koneksi lokal berdasarkan filter (kernel).     |
| **Efisiensi Parameter**    | Banyak parameter untuk gambar besar (overfitting).| Lebih sedikit parameter karena koneksi lokal. |
| **Deteksi Pola Lokal**     | Tidak memanfaatkan hubungan spasial.             | Sangat efektif untuk pola lokal (edge, corner).|
| **Penggunaan Utama**       | Data tabel atau sekuensial.                      | Data gambar dan spasial.                      |

---

### Apakah Flatten Hanya Ada di FCNN?
Tidak selalu. **Flattening** juga bisa muncul di CNN, tetapi biasanya hanya setelah semua lapisan konvolusi selesai dan model beralih ke FCNN untuk klasifikasi. Contohnya:
1. CNN menangkap fitur gambar (edge, corner, texture) menggunakan lapisan konvolusi.
2. Sebelum ke lapisan FCNN, fitur 2D yang diekstrak di-flatten menjadi vektor untuk klasifikasi.

---

### Kesimpulan
Flattening adalah **ciri khas FCNN** karena input harus dalam bentuk vektor. Namun, CNN dan arsitektur lain juga bisa menggunakan flattening dalam tahapan tertentu, biasanya di akhir sebelum klasifikasi. FCNN sendiri kurang efektif untuk data seperti gambar karena tidak mempertimbangkan hubungan spasial antar fitur.

# Feature detection with FCNN
Pada Fully Connected Neural Network (FCNN), proses deteksi fitur seperti edge, corner, dan texture tidak dilakukan secara langsung seperti pada Convolutional Neural Network (CNN). Ini karena FCNN menghubungkan setiap neuron di satu lapisan dengan setiap neuron di lapisan berikutnya, tanpa memanfaatkan pola lokal atau spasial seperti CNN. Namun, FCNN dapat mempelajari fitur tersebut secara tidak langsung melalui bobot dan bias selama pelatihan, tetapi efisiensinya jauh lebih rendah dibandingkan CNN.

Berikut adalah pendekatan sederhana untuk menunjukkan bagaimana FCNN dapat digunakan untuk mengenali fitur gambar, meskipun proses ini jauh lebih manual dibandingkan CNN:

### Simulasi Deteksi Fitur dengan FCNN menggunakan NumPy
Misalkan kita memiliki gambar kecil dan kita ingin menggunakan FCNN untuk mengenali edge.

#### Langkah:
1. **Flatten** gambar menjadi vektor 1D (karena FCNN bekerja dengan vektor input).
2. Setiap neuron diberi bobot khusus yang dapat belajar mengenali pola tertentu.

```python
import numpy as np

# Gambar sederhana 3x3 (grayscale)
image = np.array([
    [255, 100, 100],
    [100, 255, 100],
    [100, 100, 255]
], dtype=np.float32)

# Flatten gambar menjadi vektor 1D
input_vector = image.flatten()

# Bobot FCNN untuk deteksi edge horizontal dan vertikal (manual)
# Bobot disusun sesuai pola edge detection
weights_horizontal = np.array([
    -1, -1, -1,
     0,  0,  0,
     1,  1,  1
], dtype=np.float32)

weights_vertical = np.array([
    -1,  0,  1,
    -1,  0,  1,
    -1,  0,  1
], dtype=np.float32)

# Bias
bias = 0

# Output neuron (dot product antara input dan bobot)
output_horizontal = np.dot(input_vector, weights_horizontal) + bias
output_vertical = np.dot(input_vector, weights_vertical) + bias

# Magnitude dari edge (kombinasi horizontal dan vertikal)
edge_magnitude = np.sqrt(output_horizontal**2 + output_vertical**2)

# Hasil
print("Output Horizontal Edge:", output_horizontal)
print("Output Vertical Edge:", output_vertical)
print("Edge Magnitude:", edge_magnitude)
```

### Penjelasan:
1. **Flattening**:
   - Gambar 2D diubah menjadi vektor 1D untuk masuk ke FCNN.

2. **Bobot dan Bias**:
   - Bobot disusun manual untuk mendeteksi pola horizontal dan vertikal.

3. **Dot Product**:
   - Dot product antara input dan bobot menghasilkan output fitur.

4. **Magnitude**:
   - Kombinasi hasil horizontal dan vertikal digunakan untuk mengukur intensitas tepi.

### Kekurangan FCNN untuk Deteksi Fitur:
1. **Inefisiensi**:
   - Tidak memanfaatkan pola lokal secara langsung, sehingga membutuhkan lebih banyak parameter.
2. **Tidak Generalisasi**:
   - Harus melatih banyak neuron untuk mempelajari pola secara eksplisit.
3. **Overfitting**:
   - FCNN cenderung mempelajari semua piksel secara global, yang tidak efisien untuk data gambar.

### Kesimpulan:
Untuk mendeteksi fitur gambar seperti edge, **CNN jauh lebih efisien dibandingkan FCNN** karena memanfaatkan konvolusi dan pola lokal. FCNN lebih cocok untuk pengolahan data non-spasial seperti tabel atau data tekstual, sedangkan CNN dirancang khusus untuk data gambar.

# Dot Product dan Linear Transformation
output_horizontal = np.dot(input_vector, weights_horizontal) + bias

dot product dari (input * weight + bias) tidak lain adalah proses linear transformation bukan?
seorang pakar mengatakan bahwa linear transformation adalah inti dari aljabar liner dan neural network?

# Feature detection with CNN
Neuron dalam neural network mengenali fitur seperti **corner**, **edge**, dan **texture** melalui **konvolusi** (pada Convolutional Neural Network, CNN). Konvolusi bekerja dengan mengaplikasikan **kernel (filter)** pada gambar untuk mendeteksi pola lokal seperti garis atau tepi. Kernel ini adalah matriks kecil yang menggulung gambar (convolution operation) untuk menghasilkan fitur tertentu.

Berikut adalah contoh sederhana menggunakan NumPy untuk menunjukkan bagaimana neuron dapat mengenali fitur seperti **edge** dalam gambar dengan mengaplikasikan **edge detection filter**:

### Contoh: Deteksi Edge dengan NumPy
#### Input: Gambar Grayscale
```python
import numpy as np
from scipy.signal import convolve2d
import matplotlib.pyplot as plt

# Gambar grayscale sederhana (matrix 5x5)
image = np.array([
    [255, 255, 255, 255, 255],
    [255, 100, 100, 100, 255],
    [255, 100, 255, 100, 255],
    [255, 100, 100, 100, 255],
    [255, 255, 255, 255, 255]
], dtype=np.float32)

# Kernel Sobel untuk deteksi edge horizontal
sobel_horizontal = np.array([
    [-1, -2, -1],
    [ 0,  0,  0],
    [ 1,  2,  1]
])

# Kernel Sobel untuk deteksi edge vertikal
sobel_vertical = np.array([
    [-1,  0,  1],
    [-2,  0,  2],
    [-1,  0,  1]
])

# Convolution
edge_horizontal = convolve2d(image, sobel_horizontal, mode='same', boundary='fill', fillvalue=0)
edge_vertical = convolve2d(image, sobel_vertical, mode='same', boundary='fill', fillvalue=0)

# Magnitude dari edge
edges = np.sqrt(edge_horizontal**2 + edge_vertical**2)

# Visualisasi
plt.figure(figsize=(10, 5))
plt.subplot(1, 3, 1)
plt.title("Original Image")
plt.imshow(image, cmap='gray')

plt.subplot(1, 3, 2)
plt.title("Horizontal Edges")
plt.imshow(edge_horizontal, cmap='gray')

plt.subplot(1, 3, 3)
plt.title("Edge Magnitude")
plt.imshow(edges, cmap='gray')

plt.tight_layout()
plt.show()
```

### Penjelasan:
1. **Kernel Sobel**:
   - **Sobel Horizontal** mendeteksi garis horizontal.
   - **Sobel Vertical** mendeteksi garis vertikal.

2. **Convolution**:
   - Kernel diterapkan pada gambar dengan sliding window untuk menghasilkan peta fitur.

3. **Edge Magnitude**:
   - Kombinasi dari hasil horizontal dan vertikal untuk mendapatkan intensitas tepi.

### Output:
1. Gambar asli.
2. Hasil deteksi tepi horizontal.
3. Magnitudo tepi keseluruhan.

### Kegunaan:
Neuron di lapisan pertama CNN biasanya mendeteksi fitur sederhana seperti edge. Setelah itu, lapisan berikutnya menggabungkan fitur sederhana ini menjadi fitur kompleks seperti corner, texture, dan objek.

Pada **output layer** dari CNN atau model neural network lainnya, setiap neuron merepresentasikan **kelas tertentu** (misalnya, angka 0 hingga 9 pada MNIST). Nilai probabilitas untuk setiap neuron pada akhirnya menentukan prediksi model, di mana kelas dengan nilai probabilitas terbesar menjadi prediksi akhir.

Berikut penjelasan mendalam tentang mengapa nilai setiap neuron bervariasi dan faktor yang memengaruhi besarannya:

---

### **1. Fungsi Aktivasi Softmax**
- Di lapisan output, biasanya digunakan **fungsi aktivasi Softmax** untuk menghasilkan probabilitas dari skor mentah (logit) yang dihasilkan oleh neuron output.
- Fungsi Softmax menghitung probabilitas sebagai berikut:
  \[
  P(y = k | \mathbf{x}) = \frac{\exp(z_k)}{\sum_{j=1}^N \exp(z_j)}
  \]
  di mana:
  - \(z_k\): Skor mentah (logit) dari neuron ke-\(k\).
  - \(N\): Jumlah kelas (10 untuk MNIST).
  - \(P(y=k|\mathbf{x})\): Probabilitas kelas \(k\).

Fungsi ini memastikan:
1. Probabilitas setiap neuron berada dalam rentang [0, 1].
2. Jumlah seluruh probabilitas adalah 1.

Neuron dengan skor mentah terbesar (\(z_k\)) akan menghasilkan nilai probabilitas terbesar setelah Softmax.

---

### **2. Mengapa Nilai Setiap Neuron Bervariasi?**
Nilai tiap neuron output (\(z_k\)) bervariasi karena:
1. **Bobot dan Bias yang Berbeda**:
   - Setiap neuron di lapisan output memiliki **bobot dan bias unik** yang menentukan bagaimana mereka merespons fitur dari lapisan sebelumnya (fully connected layer).
   - Jika fitur yang dipelajari lebih sesuai dengan kelas tertentu, bobot untuk neuron kelas tersebut akan menghasilkan nilai skor mentah yang lebih besar.

2. **Fitur yang Dipelajari oleh Model**:
   - Lapisan convolutional dan pooling sebelumnya mengekstrak fitur dari gambar, seperti garis vertikal (angka "1"), kurva (angka "3"), atau lingkaran (angka "8").
   - Fitur ini diumpankan ke lapisan fully connected. Neuron output yang lebih "selaras" dengan fitur-fitur tertentu akan memiliki nilai skor mentah lebih tinggi.

3. **Distribusi Input**:
   - Setiap gambar memiliki distribusi piksel yang unik, yang menghasilkan aktivasi berbeda pada setiap lapisan.
   - Aktivasi ini diteruskan melalui jaringan, menghasilkan skor mentah yang berbeda di lapisan output.

4. **Penyesuaian Selama Pelatihan**:
   - Selama pelatihan, bobot dan bias dioptimalkan untuk meningkatkan probabilitas pada neuron yang sesuai dengan label sebenarnya.
   - Jika model dilatih dengan baik, skor mentah akan lebih tinggi untuk neuron yang sesuai dengan kelas gambar.

---

### **3. Faktor yang Menyebabkan Suatu Neuron Lebih Besar dari yang Lain**
Neuron output yang menghasilkan nilai probabilitas terbesar dipengaruhi oleh:
1. **Fitur Input**:
   - Jika gambar input mengandung fitur kuat yang cocok dengan pola yang dipelajari oleh model untuk kelas tertentu, skor neuron tersebut akan lebih besar.

2. **Bobot dan Bias**:
   - Neuron dengan bobot yang lebih besar terhadap fitur dominan akan menghasilkan skor mentah lebih tinggi.

3. **Non-Linearitas**:
   - Fungsi aktivasi pada lapisan sebelumnya (misalnya, ReLU) membantu jaringan menangkap hubungan non-linear, memperkuat fitur yang relevan untuk kelas tertentu.

4. **Regularisasi**:
   - Teknik seperti Dropout membantu mencegah overfitting, sehingga model lebih fokus pada fitur yang benar-benar relevan untuk menentukan kelas.

---

### **4. Proses Prediksi Akhir**
1. **Forward Pass**:
   - Input gambar diproses melalui jaringan, menghasilkan skor mentah untuk setiap neuron di lapisan output.
2. **Softmax**:
   - Skor mentah diubah menjadi probabilitas melalui fungsi Softmax.
3. **Prediksi**:
   - Probabilitas terbesar menentukan kelas prediksi.

Contoh:
Jika skor mentah output adalah \([1.2, 0.5, 2.8, 1.0, 0.3, 0.1, 1.5, 0.8, 1.0, 0.2]\), setelah Softmax, hasilnya mungkin:
\[
[0.1, 0.05, 0.55, 0.1, 0.03, 0.02, 0.1, 0.04, 0.1, 0.01]
\]
Kelas ke-2 (dengan skor 2.8) memiliki probabilitas tertinggi (0.55) dan menjadi prediksi model.

---

### **5. Intuisi Geometris**
- Setiap neuron output dapat dianggap sebagai **detektor kelas** dalam ruang fitur yang telah dipelajari.
- Lapisan sebelumnya mengubah gambar menjadi representasi fitur yang kompleks. Neuron output memetakan representasi ini ke skor untuk setiap kelas.
- **Bobot dan bias menentukan arah** di ruang fitur yang "relevan" untuk setiap kelas.

---

### **Kesimpulan**
- Nilai tiap neuron bervariasi karena bobot, bias, dan fitur input.
- Neuron dengan nilai probabilitas terbesar mencerminkan kelas yang paling sesuai dengan fitur dari input gambar.
- **Softmax** memungkinkan interpretasi hasil sebagai probabilitas, membuatnya intuitif untuk tugas klasifikasi.