# Transfer Learning
Ide utama dari transfer learning adalah sebagai berikut:
> Kita menggunakan model yang sudah dibuat oleh orang lain untuk permasalahan lain yang lebih spesifik. Atau dengan kata lain, kita mengembangkan model yang telah dibuat sebelumnya agar memiliki kemampuan yang lebih spesifik sesuai dengan kebutuhan kita.

**Tujuan dari percobaan ini**

**Import Library yang digunakan**

In [21]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

**Transformasi Data**
- Menginisiasi nilai mean dan standar deviasi untuk digunakan dalam ```data_transforms```
- Transformasi untuk data training terdiri atas:
    - Resize dan Random Crop
    - Horizontal Flip
    - Konversi ke tensor
    - Normalisasi
- Transformasi untuk data testing terdiri atas:
    - Resize
    - Center Crop
    - Mengkonversi ke tensor, dan
    - Normalisasi

In [22]:
mean = np.array([0.485, 0.456, 0.406])
std = np.array([0.229, 0.224, 0.225])

data_transforms = {
    'train': transforms.Compose([
        transforms.RandomResizedCrop(224),
        transforms.RandomHorizontalFlip(),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
    'val': transforms.Compose([
        transforms.Resize(256),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize(mean, std)
    ]),
}

**Import Data**
- Dataset dapat diunduh dari tautan [berikut ini](https://download.pytorch.org/tutorial/hymenoptera_data.zip)
- Dataset tersebut berisi gambar lebah dan semut yang telah dibagi kedalam dua folder untuk training dan validasi

In [23]:
data_directory = '../data/hymenoptera_data'
sets = ['train', 'val']

image_datasets = {x: datasets.ImageFolder(os.path.join(data_directory, x),data_transforms[x]) for x in sets}

dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=4, shuffle=True, num_workers=4)for x in sets}

dataset_sizes = {x: len(image_datasets[x]) for x in sets}

class_names = image_datasets['train'].classes

print(class_names)

['ants', 'bees']


**Fungsi Training**

In [24]:
def train_model(model, loss_fn, optimizer, scheduler, num_epochs=25):
    since = time.time()

    best_model_wts = copy.deepcopy(model.state_dict())
    best_acc = 0.0

    for epoch in range(num_epochs):
        print(f'Epoch {epoch+1}/{num_epochs}')
        print('-' * 10)

        for phase in ['train','val']:
            if phase == 'train':
                model.train()
            else:
                model.eval()

            running_loss = 0.0
            running_corrects = 0

            for inputs, labels in dataloaders[phase]:
                inputs = inputs.to(device)
                labels = labels.to(device)

                with torch.set_grad_enabled(phase=='train'):
                    outputs = model(inputs)
                    _, preds = torch.max(outputs, 1)
                    loss = loss_fn(outputs, labels)

                    if phase == 'train':
                        optimizer.zero_grad()
                        loss.backward()
                        optimizer.step()

                running_loss += loss.item() * inputs.size(0)
                running_corrects += torch.sum(preds == labels.data)

            if phase=='train':
                scheduler.step()

            epoch_loss = running_loss / dataset_sizes[phase]
            epoch_acc = running_corrects.double() / dataset_sizes[phase]

            print(f'{phase} Loss: {epoch_loss:.4f} Acc: {epoch_acc:.4f}')

            if phase == 'val' and epoch_acc > best_acc:
                best_acc = epoch_acc
                best_model_wts = copy.deepcopy(model.state_dict())

        print()

    time_elapsed = time.time() - since
    print(f'Training complete in {time_elapsed // 60}m {time_elapsed % 60}s')
    print(f'Best val Acc: {best_acc:.4f}')

    model.load_state_dict(best_model_wts)
    return model

**Memuat Pretrained Model**
- Kita menggunakan pretrained model yaitu ```resnet18```
- Untuk menggunakan model ini, kita harus mengimport library ```torchvision.models```
- Untuk mengetahui banyaknya fitur pada layer terakhir sebelum fully connected layer, kita dapat menggunakan ```model.fc.in_features```
- Untuk mengubah fully-connected layer dari pre-trained model, kita gunakan ```model.fc = nn.Linear(in_features, num_classes)```
- ```num_classes``` kita isi dengan 2 karena kelas yang akan diprediksi berupa lebah atau semut

In [25]:
model = models.resnet18(pretrained=True)

num_features = model.fc.in_features
print(f'Banyaknya Fitur: {num_features}')

model.fc = nn.Linear(num_features, 2)
model.to(device)

Banyaknya Fitur: 512


ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
    (1): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
  

**Menentukan Loss dan Optimizer**

In [26]:
loss_fn = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001)

**Menggunakan Scheduler**
Scheduler digunakan untuk memperbaharui learning rate setiap epoch. Scheduler ini dapat diakses pada modul(library) ```optim```

**Sekilas tentang ```StepLR```**
- ```StepLR``` adalah scheduler yang menggunakan ```Step``` sebagai parameter
- Untuk menggunakannya, terdapat beberapa parameter yang dibutuhkan:
    - ```step_size``` adalah banyaknya epoch yang akan dihitung sebagai step
    - ```gamma``` adalah parameter untuk mengubah learning rate
    - ```optimizer``` adalah parameter untuk optimizer yang akan digunakan
    - ```last_epoch``` adalah parameter untuk menentukan epoch yang akan dihitung sebagai step
- Misalnya pada contoh di bawah ini, kita menggunakan ```step_size = 7``` dan ```gamma = 0.1```. Artinya: setiap 7 epoch, learning rate akan menjadi ```0.1 * learning_rate```


In [27]:
step_lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)

**Mengupdate Model**

In [28]:
model = train_model(model, loss_fn, optimizer, step_lr_scheduler, num_epochs=2)

Epoch 1/2
----------
train Loss: 0.6229 Acc: 0.6516
val Loss: 0.4341 Acc: 0.8366

Epoch 2/2
----------
train Loss: 0.5273 Acc: 0.7336
val Loss: 0.3268 Acc: 0.8824

Training complete in 1.0m 56.21578001976013s
Best val Acc: 0.8824


**Model Alternatif**
Semua layer kecuali layer terakhir akan di-freeze dan layer terakhir akan diganti menjadi seperti di bawah ini.

In [29]:
model = models.resnet18(pretrained=True)
for param in model.parameters():
    param.requires_grad = False
num_features = model.fc.in_features
print(f'Banyaknya Fitur: {num_features}')

model.fc = nn.Linear(num_features, 2)
model.to(device)
loss_fn = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.001)
step_lr_scheduler = lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)
model = train_model(model, loss_fn, optimizer, step_lr_scheduler, num_epochs=2)

Banyaknya Fitur: 512
Epoch 1/2
----------
train Loss: 0.7128 Acc: 0.5205
val Loss: 0.7287 Acc: 0.5098

Epoch 2/2
----------
train Loss: 0.6385 Acc: 0.6557
val Loss: 0.5013 Acc: 0.7712

Training complete in 1.0m 40.54062795639038s
Best val Acc: 0.7712
