[![Open in Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/drive/1r0RTa6FGzQecpUhAS-n7c_LEPMpNx2_O)

# **อารัมภบทสู่การเขียน Deep learning ด้วย Pytorch**

การประมวลผมของ Neural Network หรือ Deep learning ใช้พีชคณิต (algebra) ที่คำนวณในชุดตัวเลขที่เรียกว่าเทนเซอร์ (Tensors) เป็นหลัก โดยเราสามารถเขียนเวกเตอร์ได้เป็นเทนเซอร์ที่มีจำนวน 1 มิติ และสามารถเขียนเมทริกซ์ได้เป็นเทนเซอร์ที่มีจำนวน 2 มิติ

เทนเซอร์เป็นหนึ่งใน data structure ที่สำคัญต่อการเขียน Neural network และไลบรารี่ Pytorch เราสามารถดูตัวอย่างของเทนเซอร์ได้ตามด้านล่าง

<img src="images/01_tensor.png" width="600"/>

อ้างอิง: [udacity/deep-learning-v2-pytorch](https://github.com/udacity/deep-learning-v2-pytorch)

## **พื้นฐานการใช้ Pytorch เบื้องต้น**

ใน Notebook นี้เราจะมาสำรวจการทำงานของไลบรารี่ Pytorch เบื้องต้น ได้แก่ การสร้างเทนเซอร์ (Tensor) และการดำเนินทางคณิตศาสตร์ (Operations) ที่ใช้งานบ่อยใน Pytorch กัน

In [None]:
import torch
import numpy as np

In [None]:
torch.cuda.is_available() # ตรวจสอบว่ามี CUDA หรือ GPU ที่สามารถใช้ได้หรือไม่
device = "cuda" if torch.cuda.is_available() else "cpu" # เลือก device เป็น "cuda" ถ้ามี ถ้าไม่มีเปลี่ยนเป็น "cpu" แทน

In [None]:
# (https://towardsdatascience.com/understanding-pytorch-with-an-example-a-step-by-step-tutorial-81fc5f8c4e8e#ea0d)

## สร้าง Tensor ด้วย torch.tensor
t0 = torch.tensor([1,2]) # ถ้าไม่กำหนดประเภทของ Tensor เราจะได้ประเภทของ Tensor ตามที่กำหนด
t1 = torch.tensor([1,2], dtype=torch.float) # กำหนดให้สร้าง teosor เป็นชนิด float 
t2 = torch.tensor([1,2], dtype=torch.float, requires_grad=True) # set as "trainable"
t3 = torch.tensor([1,2], dtype=torch.float, requires_grad=True, device=device) # send to gpu 
for i, t in enumerate([t0, t1, t2, t3]):
    print(f"Tensor No.{i}: {t}")
    print("="*50)

In [None]:
## เราสามารถเปลี่ยนชนิดของ tensor, ทำให้ tensor สามาถหา gradient ได้, หรือย้าย tensor ไปใน hardward อื่นๆได้

t0 = torch.tensor([1,2])
t1 = t0.float()
t2 = t1.clone().requires_grad_() # กำหนดให้ t2 สามารถหา gradient ได้ (หรืออยู่ในโหมดที่ "trainable" นั่นเอง)
t3 = t2.to("cuda") # send to gpu

for i, t in enumerate([t0, t1, t2, t3]):
    print(f"Tensor No.{i}: {t}")
    print("="*50)

In [None]:
# https://deeplearning.neuromatch.io/tutorials/W1D1_BasicsAndPytorch/student/W1D1_Tutorial1.html#section-2-1-creating-tensors

# สร้าง tensor จาก list
a = torch.tensor([0, 1, 2])
## Output: tensor([0, 1, 2])

# สร้าง tensor จาก tuple ใน tuples
b = ((1.0, 1.1), (1.2, 1.3))
b = torch.tensor(b)
## Output: tensor([[1.0000, 1.1000], [1.2000, 1.3000]])

# สร้าง tensor จาก a numpy
c = np.ones([2, 3])
c = torch.tensor(c)
## Output: tensor([[1., 1., 1.], [1., 1., 1.]], dtype=torch.float64)

print(f"Tensor a: {a}")
print(f"Tensor b: {b}")
print(f"Tensor c: {c}")

In [None]:
# สร้าง Pytorch จาก Numpy  ด้วย torch.from_numpy
A = np.random.rand(3, 4)
print("Array A, \n", A)
B = torch.from_numpy(A)
print("Tensor B, \n", B)

In [None]:
# ตรวจสอบขนาดของ Tensor ด้วย B.shape หรือ B.size()
print(B.shape)
print(B.size())

In [None]:
# สร้าง tensor ที่มีค่า 1, 0, ไม่มีค่าเริ่มต้น

x = torch.ones(5, 3)
y = torch.zeros(2)
z = torch.empty(1, 1, 5)
print(f"Tensor x: {x}")
print(f"Tensor y: {y}")
print(f"Tensor z: {z}")

In [None]:
# There are also constructors for random numbers

# สร้าง tensor ขนาด 1 x 3 ที่ค่าได้จากการสุ่มจาก uniform distribution (0 ถึง 1)
a = torch.rand(1, 3)

# สร้าง tensor ขนาด 3 x 4 ที่ค่าได้จากการสุ่มจาก normal distribution
b = torch.randn(3, 4)

# สร้าง tensor c ที่มีค่า 0 และมีขนาดเท่ากับ tensor a
c = torch.zeros_like(a)

# สร้าง tensor d ที่มีค่่าสุ่มจากการกระจายตัวแบบ uniform distribution และมีขนาดเท่า c
d = torch.rand_like(c)

print(f"Tensor a: {a}")
print(f"Tensor b: {b}")
print(f"Tensor c: {c}")
print(f"Tensor d: {d}")

### Tensor operations

In [None]:
a = torch.ones(5, 3) # สร้าง tensor ที่มีค่า 1 ขนาด 5 แถว x 3 หลัก
b = torch.rand(5, 3) # สร้าง tensor ที่สุ่มค่าระหว่าง 0 ถึง 1 ขนาด 5 แถว x 3 หลัก
c = torch.empty(5, 3) # สร้าง tensor เปล่า (มีค่าแต่ค่าเริ่มต้นแต่ค่าไม่เจาะจง) ขนาด 5 แถว x 3 หลัก
d = torch.empty(5, 3)

# ใช้ได้เมื่อ c และ d ได้ถูกสร้างไว้แล้ว
torch.add(a, b, out=c) 

# ทำการคูณตามตำแหน่งหรือ Pointwise Multiplication ระหว่าง a และ b
torch.multiply(a, b, out=d)

print(a + b)
print(c)
print(d)

In [None]:
# เราสามารถใช้ `.mul_(2)` เพื่อเขียน operation ที่กระทำกับตัว Tensor เดิมได้ เช่น a.mul_(2) จะทำการคูณ 2 ไปใน tensor เดิมที่สร้างขึ้น
# เทียบเท่ากับ inplace ในไลบรารี่ pandas
a = torch.ones(2, 3)
print(a)
a.mul_(2)
print(a)

In [None]:
# ทำการบวก 3 เข้าไปใน Tensor ที่มีค่า 1 ขนาด 2 x 3 ที่สร้างขึ้น
a = torch.ones(2, 3)
a.add_(3)

In [None]:
x = torch.rand(3, 3)
print(x)
print("\n")
# sum() - note the axis is the axis you move across when summing
print(f"Sum of every element of x: {x.sum()}")
print(f"Sum of the columns of x: {x.sum(axis=0)}")
print(f"Sum of the rows of x: {x.sum(axis=1)}")
print("\n")

print(f"Mean value of all elements of x {x.mean()}")
print(f"Mean values of the columns of x {x.mean(axis=0)}")
print(f"Mean values of the rows of x {x.mean(axis=1)}")

In [None]:
a1 = torch.tensor([[2, 4], [5, 7]])
a2 = torch.tensor([[1, 1], [2, 3]])
a3 = torch.tensor([[10, 10], [12, 1]])

a1 @ a2 + a3

In [None]:
# อ้างอิง: https://www.geeksforgeeks.org/python-pytorch-stack-method/

a1 = torch.tensor([1, 2, 3, 4])
a2 = torch.tensor([5, 6, 7, 8])

a_stacked_0 = torch.stack((a1, a2), dim = 0) # ทับ
# Output: tensor([[1, 2, 3, 4],
#                 [5, 6, 7, 8]])

a_stacked_1 = torch.stack((a1, a2), dim = 1) # แปะข้างๆ
# Output: tensor([[1, 5],
#                 [2, 6],
#                 [3, 7],
#                 [4, 8]])

In [None]:
a1 = torch.tensor([1, 2, 3, 4])

print(a1.view(4,1))
# Output: tensor([[1],
#                 [2],
#                 [3],
#                 [4]])

print(a1.view(2,2))
# Output: tensor([[1, 2],
                # [3, 4]])

print(a1.view(-1, 2))
# Output: tensor([[1, 2],
#                 [3, 4]])

In [None]:
a2 = torch.tensor([1, 2, 3, 4, 5, 6, 7, 8])

print(a2.view(2,2,2))
# Output: tensor([[[1, 2],
#                  [3, 4]],

#                 [[5, 6],
#                  [7, 8]]])

In [None]:
a3 = a2.view(1,8)
print(a3.size())
# Output: torch.Size([1, 8])

a3_t = torch.transpose(a3, 0, 1) # swap dim 0 and 1.
print(a3_t.size())
# Output: torch.Size([8, 1])

print("="*50)

a4 = a2.view(4,2,1)
print(a4.size())
# Output: torch.Size([4, 2, 1])

a4_t = torch.transpose(a4, 0, 1) # swap dim 0 and 1
print(a4_t.size())
# Output: torch.Size([2, 4, 1])

In [None]:
# ทดลองใช้ squeeze เพื่อลด dimension ของ tensor
a5 = torch.ones((1, 3, 3))
print(a5.shape)
print(a5)
a5.squeeze_(0)
print(a5.shape)
print(a5)

## Neural Networks


In [None]:
# อ้างอิง: https://pytorch.org/tutorials/beginner/blitz/neural_networks_tutorial.html

import torch
import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.flatten = nn.Flatten()
        # 28 * 28 is the image dimension
        self.fc1 = nn.Linear(28 * 28, 28)
        # 10 is the total number of classes
        self.fc2 = nn.Linear(28, 10)

    def forward(self, x):
        x = self.flatten(x)
        x = self.fc1(x)
        x = F.relu(x) # optionally apply some non-linearity here
        x = self.fc2(x)
        return x

In [None]:
net = Net()
print(net)
print("="*50)

input = torch.randn(1, 28, 28) # ignore 1 for now
out = net(input)
print(f"Output shape: {out.shape}")

## Loss

ไลบรารี่ `torch` ได้เขียนคำสั่งที่ช่วยในการคำนวณ loss หรือ operations ต่างๆที่ใช้ระหว่างการเทรนโมเดลใน `torch.nn.functional` ซึ่งโดยส่วนมากเราจะสามารถ import มาได้ด้วยคำสั่ง 

```py
import torch.nn.functional as F
```

In [None]:
import torch
import torch.nn as nn
import torch.nn.functional as F

## 1/3 incorrect
labels = torch.tensor([1, 1, 0], dtype=torch.float) # Dog, Dog, Cat
predictions = torch.tensor([1, 0, 0], dtype=torch.float, requires_grad=True) # Dog, Cat, Cat

loss_fn = nn.BCELoss(reduction="mean")
loss = loss_fn(predictions, labels)


loss # tensor(33.3333, grad_fn=<BinaryCrossEntropyBackward0>)

## Gradients

In [None]:
a = torch.tensor([1.5], requires_grad=True)
b = torch.tensor([-1.5], requires_grad=True)
c = a + b
print(f'Gradient function = {c.grad_fn}')

In [None]:
loss.backward()

การหา `Gradient` โดยอัตโนมัติมีพื้นฐานจาก `autograd` ซึ่งเป็นหนึ่งในการทำงานที่ทรงพลังมากๆของไลบรารี่ Pytorch เราสามารถลองหา Gradient ของฟังก์ชั่นโดยใช้ Pytorch ได้ตามตัวอย่างด้านล่าง

In [None]:
# กำหนดให้ x มีค่า = 10 และสร้างฟังก์ชั่น f(x) = x^2 - 4x
x = torch.tensor(10, dtype=torch.float, requires_grad=True)  
cost = torch.sum(x * x - 4 * x)
cost.backward(retain_graph=True)
print(x.grad) # gradient หรือความชันของ f(x) ที่ x = 10 มีค่าเท่ากับ f'(x) = 2x - 4 = 2*10 - 4 = 16

## Datasets & Dataloaders

นอกจากนั้นเรายังสามารถสร้าง Class, `Dataset` เพื่อกำหนดชุดข้อมูล รวมถึง `DataLoader` ที่สามารถทำให้เราสามารถดึงชุดข้อมูลออกมาเป็น batch ได้ เราจะได้เขียนการดึงข้อมูลเพื่อใส่เข้าไปในโมเดลในการเรียนถัดๆไป

ชุดโค้ดด้านล่างเป็น template เพื่อให้ผู้เรียนได้เห็นภาพการ Neural network มากยิ่งขึ้น

In [None]:
from torch.utils.data import Dataset
# import pandas as pd

class AnimalDataset(Dataset):
    def __init__(self, filenames, labels):
        self.filenames = filenames
        self.labels = labels

    ## An alternative...
    # def __init__(self, dataframe):
    #     self.filenames = list(dataframe["filenames"].values)
    #     self.labels = list(dataframe["labels"].values)
        
    def __getitem__(self, index):
        return (self.filenames[index], self.labels[index])

    def __len__(self):
        return len(self.filenames)

train_data = AnimalDataset(train_filenames, train_labels)

In [None]:
from torch.utils.data import DataLoader

train_loader = DataLoader(dataset=train_data, batch_size=16, shuffle=True)

In [None]:
# https://pytorch.org/tutorials/beginner/basics/optimization_tutorial.html#optimizer

def train_loop(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    # Iterate over the dataloader
    for batch, (X, y) in enumerate(dataloader):
        # Compute prediction and loss
        pred = model(X)
        loss = loss_fn(pred, y)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        # Report loss every 100 batch
        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(X)
            print(f"loss: {loss:>7f}  [{current:>5d}/{size:>5d}]")


def test_loop(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    test_loss, correct = 0, 0

    # Prevent Pytorch from updating the gradients at the testing steps!
    with torch.no_grad():
        for X, y in dataloader:
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()

    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100*correct):>0.1f}%, Avg loss: {test_loss:>8f} \n")
    return test_loss

In [None]:
from torch.optim.lr_scheduler import ReduceLROnPlateau
epochs = 50
learning_rate = 1e-3

loss_fn = nn.CrossEntropyLoss() # loss function for classification
optimizer = torch.optim.SGD(net.parameters(), lr=learning_rate) # Optimizer
scheduler = ReduceLROnPlateau(optimizer, "min")

for t in range(epochs):
    print(f"Epoch {t+1}\n-------------------------------")
    train_loop(train_dataloader, net, loss_fn, optimizer)
    val_loss = test_loop(val_dataloader, net, loss_fn, optimizer)
    scheduler.step(val_loss)
print("Done!")

## **Exercise**

1. กำหนดฟังก์ชัน $f(x) = sin(x) + cos(x)$, จงหา $df(x)/dx$ เมื่อ $x = \pi$ โดยใช้ Pytorch
2. จงหา dot product ของ Tensor 2 ตัวต่อไปนี้ ด้วยคำสั่ง `dot`

``` py
v1 = torch.tensor([1, 2])
v2 = torch.tensor([3, -5])
```

หาค่าของ dot product ระหว่างเวกเตอร์ `v1` และ `v2`

3. ทดลองใช้ `torchvision` อ่านข้อมูล และแสดงผล

3.1 ทดลองใช้ `torchvision` เพื่อลองดาวน์โหลดชุดข้อมูล FashionMNIST จากนั้นลองใช้ Dataloader ดึงข้อมูลออกมาดังด้านต่อไปนี้

``` py
from torch.utils.data import DataLoader 
from torchvision import datasets
from torchvision.transforms import ToTensor

test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)
test_loader = DataLoader(training_data, batch_size=16, shuffle=False)
data, labels = next(iter(test_loader))
print(data.shape, labels.shape)
```

ในกรณีนี้เราทำการดึงชุดข้อมูลออกมา ด้วย `batch_size = 16` เพื่อให้ได้ชุดข้อมูลและ labels จงพิจารณา `data` และ `labels` และคิดว่าขนาดของแต่ละ dimensions หมายถึงอะไรบ้าง

3.2 หลังจากนั้นลองแสดงผลข้อมูล data ออกมา 1 ภาพด้วยคำสั่งต่อไปนี้

```py
import matplotlib.pyplot as plt

plt.imshow(data[0, :, :, :].squeeze(0), cmap="gray")
plt.show()
```

แสดงผลภาพและอธิบายว่าได้ภาพอะไรจากการรันโค้ดนี้