
# **Learning Rate Scheduler**

_Learning rate scheduler adalah sebuah algoritma yang menentukan besarnya learning rate (learning rate) yang akan digunakan. `torch.optim.lr_scheduler` menyediakan beberapa metode untuk menyesuaikan learning rate berdasarkan epoch_



## Mengimpor Library



In [1]:
import torch
import torch.nn as nn
import torch.optim.lr_scheduler as lr_scheduler


## Mendefinisikan Model dan Learning Rate
- Untuk contoh pembelajaran, model yang kita gunakan hanya berupa sebuah fully connected layer dengan jumlah input dan output yang kecil





In [2]:
l_rate      = 0.01
model       = nn.Linear(4,1)
optim       = torch.optim.Adam(model.parameters(), lr=l_rate)
epochs      = 5

## Lambda LR

Pada contoh kali ini kita akan menggunakan salah satu jenis scheduler yaitu `LambdaLR`. LambdaLR adalah sebuah scheduler yang menggunakan fungsi lambda untuk menentukan learning rate. Parameter yang diberikan kepada LambdaLR adalah:
- `optimizer`: optimizer yang akan digunakan untuk mengatur learning rate
- `lambda`: fungsi lambda yang akan digunakan untuk menentukan learning rate
- `last_epoch`: epoch terakhir yang telah dilakukan, nilai ini akan digunakan untuk menentukan learning rate yang akan digunakan pada epoch terakhir. Defaultnya adalah -1.
- `verbose`: boolean yang menentukan apakah akan menampilkan pesan atau tidak. Defaultnya adalah False.

<div align="center">

**Review Fungsi Lambda di Python**

</div>

> Sebelum melanjutkan pembahasan tentang scheduler, mari kita review sejenak tentang fungsi lambda di python.

Misalkan kita memiliki sebuah fungsi sederhana, yang menerima input `x`, dan mengembalikan nilai `x+3`

```python
def func(x):
    return x+3
```

maka cara lain untuk menulis fungsi ini dapat menggunakan `lambda` yaitu sebagai berikut:

In [3]:
func = lambda x: x+3

# mencoba fungsi lambda dengan memberikan masukan 3
print(func(3))

6


Mari kita lanjutkan pembahasan Lambda LR. Selanjutnya, kita akan membuat sebuah scheduler yang menggunakan fungsi lambda sebagai berikut:
- Fungsi kita beri nama `f_lambda`
- Fungsi akan menerima masukan berupa epoch
- Fungsi akan mengembalikan nilai berupa epoch dibagi dengan 10

In [4]:
f_lambda = lambda epoch: epoch/10

## Memuat scheduler

In [5]:
scheduler = lr_scheduler.LambdaLR(optim,f_lambda)

## Melihat perubahan learning rate

In [6]:
print(f'Kondisi Awal:{optim.state_dict()}')

for epoch in range(epochs):
    
    # proses loss.backward() ditempatkan di sini
    optim.step()
    # proses validasi ditempatkan di sini
    scheduler.step()
    print(f'LR pada Epoch ke-{epoch+1} adalah {optim.param_groups[0]["lr"]}')

Kondisi Awal:{'state': {}, 'param_groups': [{'lr': 0.0, 'betas': (0.9, 0.999), 'eps': 1e-08, 'weight_decay': 0, 'amsgrad': False, 'maximize': False, 'foreach': None, 'initial_lr': 0.01, 'params': [0, 1]}]}
LR pada Epoch ke-1 adalah 0.001
LR pada Epoch ke-2 adalah 0.002
LR pada Epoch ke-3 adalah 0.003
LR pada Epoch ke-4 adalah 0.004
LR pada Epoch ke-5 adalah 0.005


## Penjelasan
- Dapat kita amati bahwa LR pada epoch ke-1 adalah 0.001
- Nilai ini didapat dari fungsi `lambda` yang kita buat sebelumnya dimana `f_lambda` menerima `epoch = 1` dan mengembalikan nilai `f_lambda = 0.1`
- Selanjutnya scheduler mengubah nilai learning rate pada epoch ke 1 dengan cara mengalikan nilai awal learning rate (0.01) dengan nilai `f_lambda` saat itu yaitu `0.1` sehingga pada epoch ke-1 nilai LR menjadi $0.01 * 0.1 = 0.001$

## Catatan Lanjutan

Tentunya masih banyak jenis scheduler yang tidak dibahas pada modul ini. Anda dapat mencobanya sendiri.

**Mengapa menggunakan scheduler?**
Ada banyak alasan mengapa perubahan learning rate di tiap epoch perlu dilakukan, misalnya masalah [vanishing / exploding gradient](https://towardsdatascience.com/the-exploding-and-vanishing-gradients-problem-in-time-series-6b87d558d22). Nilai LR yang besar akan menyebabkan parameter pada model menjadi sangat cepat untuk berubah, sebaliknya jika terlalu kecil maka akan membutuhkan semakin banyak epoch untuk mencapai kondisi model yang ideal. 

## Referensi
- [`torch.optim`](https://pytorch.org/docs/stable/optim.html)
- [Patrick Loerber, Python Engineer @ Youtube](https://www.youtube.com/watch?v=81NJgoR5RfY&list=WL&index=2&t=9s)