# 1. Giới thiệu pytorch

Pytorch là một thư viện của Python được dùng để xây dựng mô hình AI. Với sự linh hoạt và cho phép các mô hình học sâu được dễ dàng xây dựng từ python - Pytorch được phát triển bởi nhóm nghiên cứu hàng đầu của facebook đang ngày càng được sử dụng nhiều trong giới nghiên cứu và phát triển các sản phẩm AI. Pytorch cho phép khả năng tăng tốc phần cứng dựa trên GPU qua đó hỗ trợ rất nhiều trong việc huấn luyện mô hình.

## a. Một số đặc trưng của Pytorch
Dưới đây là một vài những thuộc tính quan trọng giúp cho pytorch ngày càng được thịnh hành hơn.
- **Easy Interface**: Pytorch cung cấp API để sử dụng - vì vậy việc triển khải và thực thi code với framework trở nên dễ dàng hơn.
- **Python Usage**: Bên cạnh việc hỗ trợ mạnh mẽ cho AI, DS thì pytorch có thể tận dụng tất cả các dịch vụ, chức năng và môi trường được cung cấp bởi Python.
- **Computational Graph**: Pytorch cung cấp các đồ thị tính toán động (dynamic computational graphs) - do đó người dùng có thể thay đổi chúng trong thời gian thực thi.

## b. Một số tiện ích của Pytorch 
Một số tiện ích khi làm việc với Pytorch:
- Dễ dàng hiểu và debug code.
- Pytorch như một phần mở rộng của Numpy khi hỗ trợ việc tính toán trên GPU.
- Dễ dàng xây dựng triển khai kiến trúc mạng.

# 2. Tensor


## I - Giới thiệu tensor
Tensor là một kiểu dữ liệu cho phép lưu trữ dữ liệu với số chiều tùy ý, dữ liệu lưu trữ này có thể là một giá trí vô hướng, vector, mảng 1 chiều, mảng 2 chiều hay mảng n chiều.
VD: 
- Giá trí vô hướng: 100
- Vector: [1, 2, 3]
- Mảng 2 chiều: [[1, 2, 3], [2, 3, 4]]
- Mảng n chiều (n=3): [[[1, 2], [2, 3]]]

In [None]:
import torch

scalar = torch.empty(1)
print("scalar: ", scalar)
vector = torch.zeros(3)
print("vector: ", vector)
matrix2D = torch.ones(2, 3)
print("matrix2D: ", matrix2D)
matrix3D = torch.rand(2, 2, 3)
print("matrix3D: ", matrix3D)

scalar:  tensor([-4.4937e+35])
vector:  tensor([0., 0., 0.])
matrix2D:  tensor([[1., 1., 1.],
        [1., 1., 1.]])
matrix3D:  tensor([[[0.1457, 0.5940, 0.6230],
         [0.5564, 0.2865, 0.0554]],

        [[0.2726, 0.7267, 0.3061],
         [0.6298, 0.0017, 0.2897]]])


In [None]:
# check size
matrix2D.size()

torch.Size([2, 3])

In [None]:
# check data type
matrix3D.dtype

torch.float32

In [None]:
# specify types, float32 default
x = torch.zeros(2, 2, dtype=torch.float16)
print(x)

tensor([[0., 0.],
        [0., 0.]], dtype=torch.float16)


In [None]:
# construct from data
x = torch.tensor([5.5, 3])
print(x.size())
print(x)

torch.Size([2])
tensor([5.5000, 3.0000])


## II - requires_grad argument
Tham số này cho biết tensor cần được tính đạo hàm - đây là một bước quan trọng trong quá trình training model

In [None]:
x = torch.tensor([6., 9.], requires_grad=True)
print(x)

tensor([6., 9.], requires_grad=True)

## III - Một số phép toán trong tensor

In [None]:
x = torch.rand(3, 3)
y = torch.rand(3, 3)

In [None]:
# elementwise addition
z = x + y
_z = torch.add(x,y)
print(z)
print(_z)

tensor([[1.3293, 0.7568, 1.4145],
        [1.0428, 0.7946, 1.3234],
        [1.0898, 0.6607, 1.8623]])
tensor([[1.3293, 0.7568, 1.4145],
        [1.0428, 0.7946, 1.3234],
        [1.0898, 0.6607, 1.8623]])


In [None]:
# subtraction
z = x - y 
_z = torch.sub(x, y)
print(z)
print(_z)

tensor([[ 0.5927,  0.1054,  0.5787],
        [ 0.2355,  0.5979,  0.1418],
        [ 0.7579, -0.0830,  0.0596]])
tensor([[ 0.5927,  0.1054,  0.5787],
        [ 0.2355,  0.5979,  0.1418],
        [ 0.7579, -0.0830,  0.0596]])


In [None]:
# mutiplication
z = x * y
_z = torch.mul(x, y)
print(z)
print(_z)

tensor([[0.3539, 0.1404, 0.4165],
        [0.2580, 0.0685, 0.4328],
        [0.1533, 0.1074, 0.8661]])
tensor([[0.3539, 0.1404, 0.4165],
        [0.2580, 0.0685, 0.4328],
        [0.1533, 0.1074, 0.8661]])


In [None]:
# division
z = x / y
_z = torch.div(x, y)
print(z)
print(_z)

tensor([[2.6092, 1.3237, 2.3846],
        [1.5834, 7.0800, 1.2400],
        [5.5665, 0.7768, 1.0661]])
tensor([[2.6092, 1.3237, 2.3846],
        [1.5834, 7.0800, 1.2400],
        [5.5665, 0.7768, 1.0661]])


## IV - Slicing

In [None]:
x = torch.rand(3, 5)
print(x)

tensor([[0.2572, 0.7209, 0.1086, 0.1665, 0.0015],
        [0.1595, 0.9509, 0.3414, 0.7213, 0.2124],
        [0.6661, 0.6373, 0.9271, 0.7887, 0.5817]])


In [None]:
# all rows, column 0
print(x[:, 0])

tensor([0.2572, 0.1595, 0.6661])


In [None]:
# row 1, all columns
print(x[1, :])

tensor([0.1595, 0.9509, 0.3414, 0.7213, 0.2124])


In [None]:
# get element at 1, 1
print(x[1, 1])

tensor(0.9509)


Lấy giá trị thực của (sử dụng khi chỉ có 1 phần tử trong tensor)

In [None]:
print(x[1,1].item())

0.9509010910987854


## V - Reshape

In [None]:
x = torch.rand(4, 4)

In [None]:
y = x.view(16)
print(y)
print(y.size())

tensor([0.6913, 0.4079, 0.8190, 0.9249, 0.1724, 0.6053, 0.2285, 0.8250, 0.6965,
        0.8264, 0.9848, 0.0662, 0.6427, 0.4268, 0.2386, 0.5546])
torch.Size([16])


Sử dụng -1 để suy ra chiều mới từ số chiều hiện tại với -1 thì pytorch sẽ tự động quyết định size cần thiết

In [None]:
y = x.view(-1, 8)
print(y)
print(y.size())

tensor([[0.6913, 0.4079, 0.8190, 0.9249, 0.1724, 0.6053, 0.2285, 0.8250],
        [0.6965, 0.8264, 0.9848, 0.0662, 0.6427, 0.4268, 0.2386, 0.5546]])
torch.Size([2, 8])


## VI - Pytorch và Numpy

In [None]:
# torch to numpy
a = torch.ones(3)
print(a)
print(type(a))
b = a.numpy()
print(b)
print(type(b))

tensor([1., 1., 1.])
<class 'torch.Tensor'>
[1. 1. 1.]
<class 'numpy.ndarray'>


Lưu ý: Nếu tensor đang được chạy trên CPU, cả 2 object đều chia sẻ cùng một memory location, vì vậy khi thay đổi một object thì object còn lại cũng sẽ được thay đổi bằng cú pháp sau

In [None]:
a.add(1)
print(a)
print(b)

tensor([1., 1., 1.])
[1. 1. 1.]


In [None]:
a.add_(1)
print(a)
print(b)

tensor([2., 2., 2.])
[2. 2. 2.]


In [None]:
# numpy to torch
import numpy as np 
a = np.ones(6)
b = torch.from_numpy(a)
print(a)
print(type(a))
print(b)
print(type(b))

[1. 1. 1. 1. 1. 1.]
<class 'numpy.ndarray'>
tensor([1., 1., 1., 1., 1., 1.], dtype=torch.float64)
<class 'torch.Tensor'>


Tương tự như cách torch chuyển sang numpy. Thì numpy chuyển sang torch cũng vậy. 

In [None]:
a += 1
print(a)
print(b)

[2. 2. 2. 2. 2. 2.]
tensor([2., 2., 2., 2., 2., 2.], dtype=torch.float64)


## VII - Check and config device

In [None]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
print(device)

cpu


## VIII - Move Tensors to GPU
Để sử dụng GPU tính toán các giá trị tensor ta sử dụng cách sau

In [None]:
x = torch.ones(5)
if torch.cuda.is_available():
  device = torch.device("cuda") # "cpu"
  y = torch.ones(5, device=device)
  z = x.to(device)
  z = x + y 
  print(z)

Lưu ý rằng numpy không chạy được trên GPU vì vậy muốn chuyển torch sang numpy thì phải set device lại thành cpu rồi mới thực hiện bước chuyển.