## Pemahaman Backpropagation dalam Neural Networks

Anda sudah melihat bagaimana di TensorFlow Anda dapat menentukan arsitektur jaringan saraf untuk menghitung keluaran $y$ sebagai fungsi dari masukan $x$, serta menentukan fungsi biaya. TensorFlow kemudian secara otomatis menggunakan backpropagation untuk menghitung turunan dan menggunakan gradient descent atau Adam untuk melatih parameter jaringan saraf. Algoritma backpropagation, yang menghitung turunan dari fungsi biaya Anda terhadap parameter, adalah algoritma kunci dalam pembelajaran jaringan saraf. 

### Cara Kerja Backpropagation

Tetapi bagaimana cara kerjanya? Dalam video ini dan beberapa video opsional berikutnya, kita akan melihat bagaimana backpropagation menghitung turunan. Video ini sepenuhnya opsional dan sedikit menyentuh kalkulus. Jika Anda sudah familiar dengan kalkulus, semoga Anda menikmati video ini, tetapi jika tidak, tidak apa-apa. Kita akan mulai dari dasar-dasar kalkulus untuk memastikan Anda memiliki semua intuisi yang diperlukan untuk memahami cara kerja backpropagation.

### Contoh Fungsi Biaya

![image.png](attachment:image.png)

Mari kita lihat. Saya akan menggunakan fungsi biaya yang disederhanakan, yaitu $J(w) = w^2$. Fungsi biaya ini adalah fungsi dari parameter $w$ dan $b$, dan untuk fungsi biaya yang disederhanakan ini, mari kita anggap $J(w) = w^2$. Saya akan mengabaikan $b$ untuk contoh ini. 

Misalkan nilai parameter $w$ sama dengan 3. Maka, $J(w)$ akan sama dengan 9, yaitu $3^2$. Sekarang, jika kita meningkatkan $w$ sedikit, katakanlah $\epsilon$, yang saya atur menjadi 0.001. Bagaimana perubahan nilai $J(w)$? 

Jika kita meningkatkan $w$ sebesar 0.001, maka $w$ menjadi $3 + 0.001 = 3.001$. Maka, $J(w)$, yang adalah $w^2$, sekarang menjadi $3.001^2 = 9.006001$. 

Apa yang kita lihat adalah bahwa jika $w$ meningkat sebesar 0.001, maka $J(w)$ kira-kira meningkat 6 kali lipat dari itu, yaitu $6 \times 0.001$. Ini tidak persis sama. Sesungguhnya, ia naik tidak ke 9.006 tetapi ke 9.006001. Namun, jika $\epsilon$ sangat kecil, yaitu mendekati nol, ini menjadi semakin akurat.

### Derivatif dalam Kalkulus

![image-2.png](attachment:image-2.png)

Dalam kalkulus, kita akan mengatakan bahwa turunan dari $J(w)$ terhadap $w$ adalah 6. Ini berarti jika $w$ meningkat sedikit, $J(w)$ meningkat enam kali lipat. 

- **Contoh Lain:** 
    - Bagaimana jika $\epsilon$ bernilai 0.002? Dalam hal ini, $w$ akan menjadi $3 + 0.002$, dan $w^2$ menjadi $3.002^2$, yang sama dengan 9.012004. Kita dapat menyimpulkan bahwa jika $w$ meningkat sebesar 0.002, maka $J(w)$ meningkat sekitar $6 \times 0.002$.

![image-3.png](attachment:image-3.png)

### Kesimpulan

Ini membawa kita pada definisi informal dari turunan, yaitu kapan pun $w$ meningkat sebesar $\epsilon$ yang menyebabkan $J(w)$ meningkat sebesar $k$ kali $\epsilon$. Dalam contoh kita sebelumnya, $k$ sama dengan 6. 

Anda mungkin ingat ketika menerapkan gradient descent, Anda akan secara berulang menggunakan aturan ini untuk memperbarui parameter $w_J$, di mana biasanya $\alpha$ adalah laju pembelajaran.

### Penerapan Gradient Descent

Apa yang dilakukan oleh gradient descent? Perhatikan bahwa jika turunan kecil, maka pembaruan ini akan membuat perubahan kecil pada parameter $W_j$. Sebaliknya, jika turunan ini besar, maka ini akan menghasilkan perubahan besar pada parameter $W_j$. Ini masuk akal karena jika turunan kecil, ini berarti bahwa mengubah $w$ tidak membuat perbedaan besar pada nilai $j$, jadi kita tidak perlu mengubah $W_j$ secara besar-besaran. Namun, jika turunan besar, maka perubahan kecil pada $W_j$ dapat membuat perbedaan besar pada seberapa banyak kita dapat mengurangi fungsi biaya $J(w)$.

### Contoh Tambahan

Mari kita lihat beberapa contoh turunan lagi. 
- Ketika $w = 3$, $J(w) = 9$, jika $w$ meningkat sebesar $\epsilon$ yaitu 0.01, maka $J(3.01) = 9.006001$.
- Jika $w = 2$, $J(w) = 4$, dan jika $w$ meningkat 0.001, maka $J(2.001) = 4.004001$, sehingga turunan sekarang menjadi 4.

![image-4.png](attachment:image-4.png)

### Menghitung Derivatif dengan Python

Akhirnya, kita bisa menggunakan library Python yang disebut **SymPy** untuk menghitung turunan ini. Berikut adalah contoh cara melakukannya:

```python
import sympy as sp

w = sp.symbols('w')
J = w**2
dJ_dw = sp.diff(J, w)
print(dJ_dw)  # Ini akan mencetak 2*w Untuk nilai  𝑤=2

derivative_value = dJ_dw.subs(w, 2)
print(derivative_value)  # Ini akan mencetak 4
```
![image-5.png](attachment:image-5.png)