## Softmax Regression

**Algoritma softmax regression** adalah generalisasi dari logistic regression, yang merupakan algoritma klasifikasi biner, ke konteks klasifikasi multiclass. Mari kita lihat lebih detail bagaimana cara kerjanya.

### Recap Logistic Regression
Ingat bahwa **logistic regression** diterapkan ketika variabel target $ y $ hanya memiliki dua nilai keluaran, yaitu 0 atau 1. Logistic regression menghitung outputnya sebagai berikut:

1. **Hitung kombinasi linear**:
   $
   z = w \cdot x + b
   $
   di mana $ w $ adalah bobot (weight), $ x $ adalah vektor fitur input, dan $ b $ adalah bias.

2. **Terapkan fungsi sigmoid**:
   $
   a = g(z)
   $
   di mana $ g(z) $ adalah fungsi sigmoid:
   $
   g(z) = \frac{1}{1 + e^{-z}}
   $
   Fungsi ini menghasilkan probabilitas $ y $ bernilai 1 berdasarkan input $ x $. Jika probabilitas $ y = 1 $ adalah 0,71, maka probabilitas $ y = 0 $ adalah $ 1 - 0,71 = 0,29 $.

Dalam logistic regression, kita juga dapat mendefinisikan:
- $ a_1 $ sebagai probabilitas $ y = 1 $, dan
- $ a_2 $ sebagai probabilitas $ y = 0 $, yaitu $ 1 - a_1 $.

### Generalisasi ke Softmax Regression
Sekarang, kita akan menggeneralisasi logistic regression ke **softmax regression**. Sebagai contoh, misalkan $ y $ dapat memiliki empat nilai keluaran yang mungkin: 1, 2, 3, atau 4.

Berikut cara kerja **softmax regression**:

1. Hitung beberapa nilai $ z $:
   $
   z_1 = w_1 \cdot x + b_1
   $
   $
   z_2 = w_2 \cdot x + b_2
   $
   dan seterusnya hingga $ z_3 $, $ z_4 $, di mana $ w_1, w_2, w_3, w_4 $ serta $ b_1, b_2, b_3, b_4 $ adalah parameter softmax regression.

2. Gunakan rumus softmax untuk menghitung probabilitas keluaran $ a_1, a_2, a_3, a_4 $:
   $
   a_1 = \frac{e^{z_1}}{e^{z_1} + e^{z_2} + e^{z_3} + e^{z_4}}
   $
   Nilai ini ditafsirkan sebagai estimasi algoritma terhadap probabilitas bahwa $ y = 1 $ berdasarkan fitur input $ x $.

   Dengan cara yang sama, kita hitung:
   $
   a_2 = \frac{e^{z_2}}{e^{z_1} + e^{z_2} + e^{z_3} + e^{z_4}}
   $
   Ini adalah estimasi probabilitas bahwa $ y = 2 $.

   Lalu untuk $ a_3 $ dan $ a_4 $, di mana pembilangnya masing-masing adalah $ e^{z_3} $ dan $ e^{z_4} $, dengan penyebut yang sama.

<img src="img\image-8.png" alt="Contoh Deteksi Mobil" style="display: block; margin-left: auto; margin-right: auto; width: 800px;">

### Kasus Umum
Pada kasus umum, jika $ y $ memiliki $ n $ nilai keluaran yang mungkin, maka softmax regression akan menghitung:
$
z_j = w_j \cdot x + b_j
$
di mana $ w_1, w_2, ..., w_n $ serta $ b_1, b_2, ..., b_n $ adalah parameter softmax regression.

Kemudian kita hitung probabilitas untuk setiap kelas $ j $:
$
a_j = \frac{e^{z_j}}{\sum_{k=1}^{n} e^{z_k}}
$
Nilai $ a_j $ ditafsirkan sebagai estimasi model terhadap probabilitas bahwa $ y = j $ berdasarkan input $ x $.

### Fungsi Biaya (Cost Function)
Untuk softmax regression, kita menggunakan fungsi biaya yang mirip dengan logistic regression. Jika label sebenarnya adalah $ y = j $, maka loss yang dihitung adalah:
$
-\log(a_j)
$
Semakin kecil probabilitas $ a_j $, semakin besar nilai loss-nya. Ini mendorong algoritma untuk memaksimalkan nilai $ a_j $ mendekati 1 untuk nilai $ y $ yang benar.

<img src="img\image-9.png" alt="Contoh Deteksi Mobil" style="display: block; margin-left: auto; margin-right: auto; width: 800px;">

### Klasifikasi Multiclass
Setelah model softmax regression ini dilatih, kita dapat menggunakannya untuk melakukan klasifikasi multiclass. Model ini bisa digunakan sebagai dasar untuk membangun **neural network** yang lebih kompleks untuk tugas klasifikasi yang lebih canggih.

<img src="img\image-10.png" alt="Contoh Deteksi Mobil" style="display: block; margin-left: auto; margin-right: auto; width: 800px;">

