# **Welcome to the Second Course in This Specialization: Advanced Techniques in TensorFlow**

Selamat datang di kursus kedua dalam spesialisasi ini yang fokus pada penggunaan teknik-teknik lanjutan di TensorFlow. Dalam kursus ini, Anda akan membangun teknik-teknik yang telah dipelajari di kursus pertama untuk melakukan kustomisasi model Anda. Kursus ini akan fokus pada bagian pelatihan dan optimasi dalam proses pembuatan model.

---

### **Optimizing Neural Network Training**

Sering kali kita menggunakan algoritma standar untuk sebagian besar pelatihan jaringan saraf kita, tetapi mengapa kita menggunakan algoritma ini? Di kursus ini, Anda akan mempelajari bagaimana Anda dapat membangun algoritma optimasi yang berbeda, mungkin lebih baik dan lebih sesuai dengan kebutuhan spesifik Anda.

### **Distributed Training Across Multiple Cores**

Salah satu hal yang sangat menarik yang akan Anda pelajari adalah bagaimana melakukan pelatihan terdistribusi di beberapa core. Alih-alih melakukan pelatihan pada satu CPU, GPU, atau TPU, bagaimana Anda dapat memanfaatkan *data parallelism* untuk membagi data dan memiliki core yang berbeda untuk memproses bagian yang berbeda dari set data pelatihan secara paralel? Ini akan memungkinkan Anda untuk melakukan pelatihan jauh lebih cepat pada dataset besar.

> "Tentu, ini adalah kursus yang sangat menarik bagi saya karena ketika Anda menciptakan model, nilai sejati terletak pada pelatihan. Untuk melatih model agar lebih akurat atau lebih cepat, atau bahkan keduanya." – **Instruktur**

---

### **Custom Training in TensorFlow**

Jika Anda telah mengikuti kursus TensorFlow sebelumnya, Anda mungkin terbiasa dengan metode seperti `model.fit(X, Y)` untuk melatih model dalam beberapa *epoch*, di mana semua terjadi secara otomatis di balik layar tanpa benar-benar mengetahui apa yang terjadi.

Di kursus ini, kita akan membuka proses pelatihan dan memeriksa bagaimana optimizers bekerja, bagaimana gradien diterapkan, dan bagaimana fungsi kerugian dihitung. Hal ini penting agar Anda dapat memahami cara mengoptimalkan pelatihan dan hasilnya.

### **Sharding Across Multiple Cores**

Salah satu hal yang akan dilakukan oleh peserta kursus adalah memanfaatkan **Google Colab** dengan akses ke TPU yang memiliki 8 core. Kita akan melihat bagaimana cara membagi dataset ke dalam 8 core, bagaimana melatih model di setiap core, dan memeriksa kerugian di setiap core untuk meminimalkan total kerugian.

### **TensorFlow 1 vs. TensorFlow 2**

Pada TensorFlow 1, model dijalankan dalam *graph mode* di mana Anda memuat semua data ke dalam sebuah graf, membuka sesi, dan mengeksekusinya. Ini memberikan performa yang luar biasa, tetapi lebih sulit untuk pengembang karena Anda tidak bisa melakukan *step-by-step debugging*.

Namun, dengan **eager execution** di TensorFlow 2, prosesnya menjadi lebih mudah bagi pengembang. Meskipun begitu, ada trade-off performa. Untuk mendapatkan manfaat dari keduanya, kita dapat menggunakan `tf.function` dan **autograph** untuk menulis kode dalam gaya eksekusi *eager*, tetapi mengonversinya ke dalam *graph mode* saat pelatihan untuk mendapatkan performa terbaik.

> "TensorFlow memulai perjalanan dengan meminta semua orang untuk menulis kode berbasis graf. Ini memberikan kontrol penuh dan sangat fleksibel. Dengan lapisan Pythonic yang lebih baru, semuanya menjadi lebih mudah, dan di kursus ini kita akan mengeksplorasi keduanya untuk mendapatkan kontrol lebih dan fleksibilitas." – **Instruktur**

---

### **Exciting Features of the Course**

- **Custom Training**: Belajar tentang optimasi pelatihan, memahami cara kerjanya di balik layar.
- **Distributed Training**: Menggunakan *data parallelism* untuk melatih model lebih cepat di multiple cores.
- **Performance Optimization**: Memanfaatkan `tf.function` dan *graph mode* untuk meningkatkan performa.
- **Google Colab TPU**: Pelajari cara menggunakan TPU dengan 8 core untuk pelatihan model yang lebih cepat.

---

### **Closing Remarks**

Kursus kedua dalam spesialisasi ini memberikan wawasan mendalam tentang pelatihan dan optimasi model di TensorFlow, dengan fokus pada pelatihan terdistribusi dan kustomisasi proses pelatihan. Dengan menggunakan TPU di **Google Colab**, peserta dapat belajar cara mengoptimalkan pelatihan model untuk mencapai performa yang lebih tinggi.

> "Dengan semua alat ini yang tersedia di Google Colab, sangat menarik untuk melihat bagaimana kita dapat belajar menggunakan sumber daya ini untuk pelatihan model yang lebih cepat dan lebih efisien." – **Instruktur**

Mari kita mulai kursus ini dan jelajahi lebih dalam tentang optimasi pelatihan!

# Pelatihan Kustom dengan TensorFlow

Selamat datang di kursus tentang pelatihan kustom dengan TensorFlow. Jika Anda mengikuti kursus pertama dalam spesialisasi ini, Anda pasti sudah mendapatkan pemahaman tentang **Functional API** serta bagaimana cara menyesuaikan berbagai aspek di TensorFlow, seperti **loss functions** dan **layers**. Dalam kursus ini, Anda akan melihat lebih detail bagaimana Anda dapat menyesuaikan pelatihan model dan menimpa beberapa fungsionalitas dasar di TensorFlow.

Untuk itu, Anda perlu menggali lebih dalam ke dalam komponen dasar. Minggu ini, kita akan melihat dua komponen inti yang digunakan dalam melatih sebuah jaringan. Pertama adalah **tensor** itu sendiri, yang akan kita bahas dalam pelajaran ini. Setelah itu, Anda akan mempelajari bagaimana TensorFlow menggunakan **gradien** saat mengoptimalkan proses pembelajaran.

### Apa itu Tensor?

Jadi, mari kita mulai dengan penjelasan cepat tentang **tensor** dan apa itu sebenarnya, serta bagaimana tensor mengalir melalui sistem. Segera Anda akan dapat menjelaskan kepada teman-teman Anda mengapa TensorFlow diberi nama demikian.

Tensor adalah konsep dalam matematika yang pada dasarnya adalah struktur data fleksibel yang dapat menampung data dengan berbagai cara yang berbeda, seperti yang ditunjukkan di sini. 

### Dimensi pada Tensor

Salah satu istilah penting yang perlu diingat adalah **dimensionalitas** dari sebuah tensor, yang nantinya akan sangat mempengaruhi tipe data yang diwakili oleh tensor tersebut.

- **Skalar**: Sebuah nilai tunggal, atau skalar, dapat dilihat sebagai tensor tanpa dimensi.
- **Vektor**: Sebuah tensor yang nilai-nilainya direpresentasikan dalam satu dimensi, seperti contoh vektor horisontal [1, 2, 3] atau vertikal [1, 2, 3].
- **Matriks**: Matriks klasik mirip dengan vektor, tetapi setiap dimensinya lebih besar dari satu, seperti matriks 3x3 yang bisa Anda lihat di sini.

![image.png](attachment:image.png)

Meskipun jumlah dimensi dan jumlah nilai dalam setiap dimensi dapat bervariasi, tensor adalah struktur data yang sangat umum yang dapat menggambarkan semuanya, dan lebih banyak lagi. Sebagai contoh, sebuah tensor bisa memiliki tiga dimensi, seperti tensor 3x3x3, yang dapat Anda visualisasikan sebagai sebuah kubus.

### Penggunaan Tensor dalam TensorFlow

Ingat, tensor adalah istilah yang sangat umum. Sebuah tensor hanyalah cara fleksibel untuk menyimpan data. Dalam **TensorFlow**, Anda dapat membuat objek tensor yang mengimplementasikan konsep dasar dari tensor matematika.

Cara yang paling mudah adalah dengan menggunakan `tf.Variable` atau `tf.constant`.

**Catatan**: Ketika saya menyebutkan tensor di sini, saya merujuk pada objek tensor dalam TensorFlow, bukan pada pengertian umum dari tensor dalam matematika.

#### Mutable vs Immutable

![image-2.png](attachment:image-2.png)

- **tf.Variable**: Sebagaimana namanya, ketika menggunakan `tf.Variable`, tensor Anda dapat dimodifikasi. Ini berarti jika tensor menyimpan nilai "hello", Anda bisa menggantinya menjadi "goodbye". Ketika nilai sebuah variabel bisa diubah, kita mengatakan bahwa objek tersebut bersifat **mutable**.
  
- **tf.constant**: Sebaliknya, ketika menggunakan `tf.constant`, tensor tersebut bersifat **immutable**, yang berarti tidak dapat diubah. Jika sebuah `tf.constant` menyimpan nilai [1, 2, 3, 4, 5, 6], Anda tidak bisa mengganti angka pertama menjadi 0 atau menambahkan angka 7 di akhir tensor tersebut. Anda harus membuat `tf.constant` baru jika ingin menyimpan set nilai yang berbeda.

### Properti Tensor di TensorFlow

Di TensorFlow, objek yang mengelola tipe data tensor, sering kali ditulis dengan huruf kapital T untuk tensor, memiliki dua properti dasar:

1. **Shape**: Bentuk dari tensor, yaitu jumlah unit yang diperlukan untuk setiap dimensi.
2. **Data Type**: Tipe data yang digunakan untuk mewakili tensor tersebut, seperti integer, floating-point numbers, atau string.

![image-3.png](attachment:image-3.png)

Contoh: Sebuah tensor dengan satu dimensi yang memiliki dua unit di dalam dimensi tersebut dapat menyimpan dua nilai, misalnya 4 dan 6. Ini memberi Anda **shape** dari tensor tersebut.

Sebagian besar operasi menghasilkan tensor dengan bentuk yang sudah diketahui sepenuhnya jika dimensi inputnya juga sudah diketahui sepenuhnya. Namun dalam beberapa kasus, bentuk tensor hanya bisa ditemukan pada saat eksekusi grafik.

### Tipe Data pada Tensor

Tipe data ini menunjukkan jenis data yang digunakan untuk merepresentasikan tensor. Misalnya, bisa berupa integer, floating-point number, atau string. Pada contoh ini, tipe data yang digunakan adalah `int32`, yang merupakan integer 32-bit.

---

# Manipulasi Tensor dengan TensorFlow

Pada video sebelumnya, kita telah mempelajari cara kerja tensor. Sekarang kita akan melihat beberapa fungsi kuat di Python, dan bagaimana Anda dapat menggunakannya untuk memanipulasi tensor. Ini bukan daftar lengkap dari segala hal yang mungkin dilakukan dengan Python dan tensor, tetapi semoga bisa menggugah rasa ingin tahu Anda untuk menggali lebih dalam lagi.

---

## 1. **Eksekusi TensorFlow: Mode Eager vs Mode Graph**

TensorFlow mendukung dua jenis eksekusi kode:
- **Graph-based**: Semua data dan operasi dimuat ke dalam grafik sebelum dievaluasi dalam sebuah sesi.
- **Eager-based**: Semua kode dieksekusi baris demi baris.

![image-2.png](attachment:image-2.png)

Untuk kesederhanaan dalam video ini, kita akan menggunakan **mode eager execution**.

---

## 2. **Evaluasi Tensor**

Untuk memulai, tensor Anda perlu dievaluasi sebelum dapat dilihat. Berikut adalah contoh cara membuat variabel `x` yang diinisialisasi dengan angka 2.

```python
import tensorflow as tf
x = tf.Variable(2)
```
Kemudian, kita dapat mengkuadratkan angka ini menggunakan operasi tf.square.

```python
x_squared = tf.square(x)
print(x_squared)  # Output: 4
```

Dalam mode eager, hasil evaluasi dari tensor akan langsung ditampilkan, yaitu nilai 4.
Jika mode eager dimatikan, Anda perlu mengevaluasi tensor dalam sesi TensorFlow untuk mendapatkan hasilnya.

3. Broadcasting

Broadcasting adalah kemampuan untuk melakukan operasi pada tensor dengan bentuk yang berbeda. Misalnya, jika kita ingin menambahkan 1 ke setiap elemen dalam matriks 10x10, alih-alih melakukan loop 100 kali, kita bisa langsung menambahkan skalar 1 ke matriks tersebut dan broadcasting akan mengurus sisanya.

```python
a = tf.constant([[1, 2], [3, 4]])
b = tf.constant(1)
result = tf.add(a, b)
print(result)  # Output: [[2, 3], [4, 5]]
```

TensorFlow secara otomatis mengubah skalar 1 menjadi matriks 2x2 untuk mencocokkan dimensi tensor a. Proses ini disebut broadcasting.

4. Operator Overloading
TensorFlow mendukung overloading operator Python. Misalnya, Anda bisa menggunakan operator Python seperti ** untuk melakukan operasi pada tensor.

```python
a = tf.constant([[1, 2], [3, 4]])
result = a ** 2
print(result)  # Output: [[1, 4], [9, 16]]
```

5. Interoperabilitas dengan NumPy
TensorFlow kompatibel dengan operasi NumPy, yang sangat penting di dunia data science. Berikut adalah contoh mengalikan dua tensor menggunakan NumPy.

```python
import numpy as np

a = tf.constant([1, 2, 3])
b = tf.constant([4, 5, 6])
result = np.multiply(a.numpy(), b.numpy())
print(result)  # Output: [4, 10, 18]
```

TensorFlow secara otomatis mengonversi objek tensor menjadi array NumPy sebelum melakukan operasi. Setelah operasi selesai, hasilnya adalah nilai Python biasa.

6. Mencampurkan TensorFlow dan NumPy
Anda juga bisa mengonversi array NumPy menjadi tensor menggunakan tf.convert_to_tensor, dan kemudian menggunakan TensorFlow untuk operasi lebih lanjut. Misalnya:

```python
np_array = np.ones((3, 3))
tensor_result = tf.multiply(np_array, 3)
print(tensor_result)  # Output: [[3., 3., 3.], [3., 3., 3.], [3., 3., 3.]]
```

Dengan interoperabilitas ini, Anda dapat dengan mudah beralih antara operasi NumPy dan TensorFlow.

Kesimpulan
Dalam tutorial ini, kita telah membahas:

Mode Eager Execution: Eksekusi baris demi baris untuk evaluasi tensor.
Broadcasting: Melakukan operasi pada tensor dengan bentuk yang berbeda.
Operator Overloading: Menggunakan operator Python seperti biasa pada tensor.
Interoperabilitas dengan NumPy: TensorFlow dapat berinteraksi dengan operasi NumPy.

# Pemahaman TensorFlow `tf.variable` dan Operator Overloading

Sekarang, mari kita terapkan beberapa operasi pada entitas `tf.variable`. Di sini kita akan melihat bahwa operator overloading juga berlaku pada `tf.variable`. 

### Langkah 1: Membuat Tensor dan Menambahkan Nilai
Kita dapat membuat sebuah Tensor menggunakan `tf.variable` dan menyimpan nilai nol di dalamnya. Kemudian kita dapat menambahkan angka satu ke variabel `tf` ini. Di balik layar, TensorFlow memeriksa tipe data dari kedua item yang dijumlahkan menggunakan operator `+`. TensorFlow akan melihat bahwa satu bukan objek tensor, sehingga ia akan membuat objek tensor untuk menyimpan nilai satu dan kemudian menambahkan nilai ini ke objek tensor yang berisi nol.

**Contoh:**
```python
import tensorflow as tf

v = tf.Variable(0)
v.assign_add(1)  # Menambahkan 1 ke variabel
print(v.numpy())  # Output: 1
```
Hasil dari operasi v + 1 akan menghasilkan sebuah objek tensor yang berisi nilai satu.

Langkah 2: Menggunakan Operasi Built-in assign_add
Pada contoh kedua, kita menggunakan operasi built-in assign_add pada tensor untuk melakukan hal yang sama. Ketika operasi ini dilakukan, status variabel menjadi "unread" pada titik ini. Status variabel yang "unread" ada untuk kompatibilitas mundur dengan eksekusi mode graf. Anda tidak perlu khawatir mengetahui hal ini.

Namun, status variabel yang "unread" digunakan oleh TensorFlow untuk melacak apakah variabel sudah dievaluasi dalam sebuah sesi. Yang penting untuk diketahui adalah bahwa saat Anda mengeksekusi baris kode menggunakan assign_add dan memasukkan nilai satu, nilai satu akan langsung terlihat, seperti yang dapat Anda lihat pada hasil berikut: numpy=1.

```python
v = tf.Variable(0)
v.assign_add(1)  
print(v.numpy())  # Output: 1
```

Jika Anda memanggil v.read_value().numpy(), maka variabel akan dievaluasi dan diperbarui.

Langkah 3: Menggunakan Tensor dalam Custom Class
Jika Anda mendefinisikan sebuah kelas kustom yang mewarisi dari kelas TensorFlow, variabel kelas juga bisa dievaluasi agar Anda dapat melihat nilai-nilai yang disimpan dalam tensor tersebut.

Contoh Kelas Kustom:

```python
class MyLayer(tf.keras.layers.Layer):
    def __init__(self):
        super(MyLayer, self).__init__()
        self.my_var = tf.Variable(1)
        self.my_other_var_list = [tf.Variable(i) for i in range(3)]

    def call(self, inputs):
        return inputs

m = MyLayer()
for var in m.variables:
    print(var.numpy())  # Output: [1, 0, 1, 2]
```

Di sini, m.variables digunakan untuk mengakses semua objek tensor dari kelas. Dengan menggunakan .numpy() pada objek tensor, kita bisa mendapatkan nilai yang disimpan dalam objek tensor tersebut.

Langkah 4: Mengubah Tipe Data dengan tf.cast
Selain itu, kita juga bisa menggunakan casting gaya numpy untuk mengubah tipe data. Misalnya, jika saya membuat tf.constant yang berisi angka 1, 2, 3, kita bisa melihat bahwa tipe data tensor tersebut adalah int32. Tetapi dengan menggunakan tf.cast, kita dapat menentukan tipe data dengan sintaks numpy, seperti float32, dan data dalam tensor tersebut akan mengikuti tipe yang baru.

Contoh Penggunaan tf.cast:

```python
tensor = tf.constant([1, 2, 3], dtype=tf.int32)
tensor_float = tf.cast(tensor, dtype=tf.float32)
print(tensor_float.numpy())  # Output: [1.0, 2.0, 3.0]
```

Kesimpulan
Sekarang Anda telah mempelajari dasar-dasar tensor dan bagaimana mereka berfungsi, serta bagaimana mereka dapat digunakan dalam operasi yang di-overload dengan Python. Anda juga telah melihat bagaimana casting dan operasi aritmatika dapat diterapkan pada tensor di TensorFlow.

Selanjutnya, kita akan menggali lebih dalam mengenai matematika dalam machine learning, seperti diferensiasi dan gradien yang berfungsi dengan tensor. Semua ini merupakan dasar dari teknologi optimizer. Pada video berikutnya, kita akan menjelajahi bagaimana semua ini dapat dicapai menggunakan API gradient tape.

# Implementasi Langkah Pelatihan dengan TensorFlow GradientTape

Pada bagian sebelumnya, Anda telah melihat bagaimana `GradientTape` dapat digunakan untuk melakukan pelatihan sederhana, menyediakan layanan diferensiasi yang dapat mengimplementasikan optimisasi dasar. Pada video kali ini, kita akan membahas lebih rinci bagaimana itu bekerja. Berikut adalah pendekatan tentang bagaimana kita dapat mengimplementasikan langkah pelatihan dari algoritma pembelajaran menggunakan API `GradientTape` dari TensorFlow.

## Tahapan-Tahapan Dalam Langkah Pelatihan

Untuk melakukan langkah pelatihan, Anda perlu menyelesaikan dua tahap krusial dalam algoritma pembelajaran di dalam konteks `GradientTape` saat ini.

### 1. **Forward Pass**
Langkah pertama melibatkan pemanggilan forward pass dari model Anda. Dalam contoh ini, Anda memanggil forward pass dengan memanggil `model()` dan menyimpan hasil prediksi dalam variabel yang disebut **logits**.

**Logits** dalam Machine Learning merujuk pada vektor nilai prediksi mentah untuk setiap kategori dalam klasifikasi multi-kelas. Logits ini belum diskalakan untuk dijumlahkan menjadi satu, sehingga biasanya logits dimasukkan ke dalam fungsi **softmax** untuk mengubahnya menjadi probabilitas untuk setiap kategori.

### 2. **Menghitung Loss**
Tahap selanjutnya adalah menghitung **loss** yang diperoleh pada setiap forward pass. Anda dapat melakukan ini dengan memanggil fungsi yang disebut **loss object**, yang menerima label yang benar dan logits untuk menghitung nilai loss. Nilai loss ini memungkinkan Anda untuk memperbarui model guna mengurangi kesalahan prediksi model.

Nilai loss ini akan disimpan pada langkah pelatihan ini dengan menambahkan **average loss** ke dalam daftar yang disebut **loss history**.

### 3. **Menghitung Gradien**
Selanjutnya, Anda perlu menghitung **gradien** terhadap variabel-variabel yang dapat dilatih dalam model. Ini dilakukan dengan memanggil `tape.gradient`, yang pertama-tama menerima loss, lalu semua variabel model yang dapat dilatih. Hasilnya disimpan dalam variabel bernama **grads**, yang berisi gradien dari loss terhadap setiap variabel yang dapat dilatih.

### 4. **Menerapkan Gradien**
Terakhir, Anda akan menerapkan gradien ini pada **optimizer** dengan memanggil `optimizer.apply_gradients`.

### 5. **Loop Pelatihan Kustom**
Pada akhirnya, Anda akan mengeksekusi langkah pelatihan ini dalam **custom training loop**. Anda akan melihat bagaimana menggunakan custom training loop lebih rinci pada minggu depan.

---

## Menghitung Gradien dari Persamaan Sederhana

Sekarang, mari kita lihat bagaimana menggunakan `GradientTape` untuk menghitung gradien dari persamaan sederhana. Dalam hal ini, kita menyetel **loss** menjadi \( W^2 \), dan Anda mungkin ingat dari kalkulus bahwa turunan dari \( W^2 \) adalah dua kali W. Jadi, gradien dari loss terhadap W adalah dua kali W.

Pada contoh sebelumnya, Anda telah melihat bagaimana forward pass dari model dihitung dengan `GradientTape`. Di sini, kita akan melakukan hal yang sama, tetapi menggunakan persamaan \( W^2 \).

### Langkah-langkah:

1. **Merekam Operasi dalam Konteks GradientTape**
   Untuk memulai, kita harus merekam nilai operasi yang dieksekusi di dalam konteks menggunakan sintaks Python `with as`. Kita menulis:
   ```python
   with tf.GradientTape() as tape:
Ini memungkinkan TensorFlow's GradientTape untuk mengawasi semua operasi yang dieksekusi dalam konteks tersebut. Ide dari tape di sini adalah bahwa gradien diingat dan disimpan selama berada dalam konteks, seperti musik pada pita kaset, dan akan dibuang setelah konteks selesai.

Menghitung Gradien Sama seperti cara Anda menghitung turunan fungsi dalam kalkulus, Anda dapat memanggil tape.gradient untuk menghitung gradien dari loss terhadap nilai input W.

Contoh Kasus Jika loss adalah 
𝑊
2
W 
2
 , maka gradiennya terhadap W adalah dua kali W. Ketika kita menyetel W menjadi 1, maka gradiennya adalah dua kali satu, yaitu dua. Dengan menggunakan GradientTape untuk melakukan hal yang sama, mendefinisikan W sebagai tensor dengan nilai satu, dan memanggil tape.gradient dengan memasukkan loss dan W, kita akan mendapatkan tensor yang berisi nilai dua.

Kode Implementasi:

import tensorflow as tf

# Mendefinisikan W sebagai tensor dengan nilai 1
W = tf.Variable(1.0)

# Menggunakan GradientTape untuk merekam operasi
with tf.GradientTape() as tape:
    loss = W * W  # Loss = W^2

# Menghitung gradien loss terhadap W
gradients = tape.gradient(loss, W)

print("Gradien dari loss terhadap W adalah:", gradients.numpy())  # Output: 2.0
Penjelasan:
Pada kode ini, kita mendefinisikan W sebagai variabel TensorFlow dengan nilai 1.0.
Kita menggunakan GradientTape untuk merekam operasi yang dilakukan di dalam konteksnya.
Kemudian kita menghitung gradien dari loss 
𝑊
2
W 
2
  terhadap W dengan tape.gradient.
Kesimpulan
GradientTape adalah alat yang sangat berguna dalam TensorFlow untuk menghitung gradien dari fungsi yang lebih kompleks, dan membantu memperbarui model dengan cara yang efisien. Dalam skenario nyata dengan fungsi loss yang lebih rumit, Anda tidak akan ingin menghitung gradien secara manual, dan GradientTape akan melakukannya untuk Anda secara otomatis.

# Perhitungan Gradien untuk Tensor Orde Lebih Tinggi dengan TensorFlow

Pada pembahasan ini, kita akan mengembangkan konsep perhitungan gradien untuk tensor dengan lebih dari satu dimensi, menggunakan operasi-operasi dalam TensorFlow. Kita juga akan mendefinisikan variabel `z` sebagai fungsi dari `y`, dan `y` sebagai fungsi dari `x`, sehingga `z` menjadi fungsi dari `x` melalui keduanya.

## Langkah-langkah

1. **Mendefinisikan variabel `x`**
   
   Kita mulai dengan mendefinisikan variabel `x` sebagai matriks dua kali dua yang berisi semua angka satu:

   ```python
   import tensorflow as tf

   # Definisikan x sebagai tensor 2x2 yang berisi nilai 1
   x = tf.Variable([[1.0, 1.0], [1.0, 1.0]])
Menentukan fungsi y

Selanjutnya, kita tentukan y sebagai fungsi dari x, di mana y adalah jumlah dari seluruh elemen dalam tensor x. Kita menggunakan operasi reduce_sum untuk menghitung jumlah elemen-elemen tensor x.

with tf.GradientTape() as tape:
    tape.watch(x)  # Memastikan bahwa x diawasi untuk perhitungan gradien
    y = tf.reduce_sum(x)  # Fungsi y adalah jumlah semua elemen dalam x
Untuk nilai tertentu dari x, hasil y adalah 4 karena x berisi empat angka 1.

Menentukan fungsi z

Fungsi z kemudian didefinisikan sebagai y yang dikuadratkan:

z = y ** 2  # z adalah y kuadrat
Dengan input x yang seperti ini, nilai y adalah 4, dan nilai z adalah 16.

Menghitung Gradien z terhadap x

Sekarang, kita akan menghitung gradien dari z terhadap x menggunakan GradientTape. Gradien ini menunjukkan seberapa banyak perubahan z dipengaruhi oleh perubahan dalam x.

grad = tape.gradient(z, x)  # Menghitung gradien z terhadap x
print(grad)  # Output gradien
Output yang diharapkan adalah tensor yang berisi nilai 8 untuk setiap elemen, karena perhitungan gradien mengikuti aturan rantai (chain rule).

Perhitungan Gradien Secara Manual

Gradien ini dapat dihitung secara manual jika kita tidak menggunakan GradientTape. Menggunakan aturan rantai, kita bisa mengikuti langkah-langkah berikut:

Gradien z terhadap y adalah 2 * y, karena z = y^2.
Gradien y terhadap setiap elemen x adalah 1 (karena y adalah jumlah elemen-elemen x).
Dengan menggantikan nilai-nilai y dan x, kita akan mendapatkan hasil gradien:

Gradien z terhadap y = 2 * y = 2 * 4 = 8
Gradien y terhadap x_ij = 1, untuk setiap elemen x_ij
Gradien z terhadap x_ij = Gradien z terhadap y * Gradien y terhadap x_ij
Sehingga hasil gradien dari z terhadap x adalah tensor yang berisi nilai 8 untuk setiap elemen x_ij.

Kesimpulan
Dengan menggunakan tf.GradientTape, kita dapat dengan mudah menghitung gradien untuk tensor orde lebih tinggi. Ini menghemat waktu kita dalam perhitungan gradien manual dan memungkinkan kita untuk bekerja dengan tensor yang lebih kompleks.