# Pytorch

- Pytorch 는 Numpy를 대체하면서 GPU연산이 필요한 경우
- 최대한의 유연성과 속도를 제공하는 딥러닝 연구 플랫폼이 필요한 경우 사용됩니다.

### 장점
- autograd 패키지는 Tensors의 모든 연산에 대해 자동 미분을 제공합니다. Define-by-run 프레임워크가 가능합니다.
- Function 클래스를 활용하여, 모든 연산과정을 encode하여 Acyclic graph를 생성합니다.
- Dynamic graph를 제공합니다. 그리고 Device controll하기도 쉽습니다.

### Tensors
Tensor는 Numpy의 ndarray와 유사할 뿐만 아니라, GPU를 사용한 연산 가속도 지원합니다.

- empty : matrix를 생성합니다, 단 uninitalized되어있습니다.
- rand : matrix를 생성합니다. initalize 되어있습니다.
- zeros : 0으로 채워진 행렬을 생성합니다.
- new_ones : 1으로 채워진 텐서행렬을 생성합니다.
- tensor : tensor를 생성합니다.
- randn_like : 존재하는 tensor를 바탕으로 tensor를 생성합니다.

In [1]:
from __future__ import print_function
import torch

In [2]:
x = torch.empty(5,3)
print(x)

tensor([[0.0000e+00, 8.5899e+09, 0.0000e+00],
        [8.5899e+09, 5.6052e-45, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 0.0000e+00, 0.0000e+00],
        [0.0000e+00, 8.5899e+09, 3.5566e-09]])


In [3]:
x = torch.rand(5,3)
print(x)

tensor([[0.9224, 0.1050, 0.6614],
        [0.6773, 0.9408, 0.7300],
        [0.9012, 0.1138, 0.9317],
        [0.6614, 0.3419, 0.5728],
        [0.3419, 0.8541, 0.3237]])


In [4]:
x = torch.zeros(5,3, dtype= torch.long)
print(x)

tensor([[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]])


In [5]:
x = torch.tensor([5.5,3])
print(x)

tensor([5.5000, 3.0000])


In [6]:
x = x.new_ones(5,3,dtype = torch.double)
print(x)

tensor([[1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.],
        [1., 1., 1.]], dtype=torch.float64)


In [7]:
x = torch.randn_like(x, dtype=torch.float)
print(x)

tensor([[ 0.4843, -0.2221,  0.2741],
        [-1.9871, -1.6504, -0.6646],
        [ 1.0557,  0.0565, -0.2571],
        [-2.5493,  0.5218, -1.1862],
        [ 0.0028,  0.6279,  0.5261]])


In [8]:
print(x.size())

torch.Size([5, 3])


### Operations

In [99]:
y= torch.rand(5,3)
print(x+y)

tensor([[ 0.0990,  2.7889,  0.0682],
        [ 1.7139,  0.9944,  0.2267],
        [ 0.3033, -0.6519,  0.8762],
        [ 1.3594,  2.4538, -0.1896],
        [ 0.6345,  0.8023,  0.4416]])


In [100]:
print(torch.add(x,y))

tensor([[ 0.0990,  2.7889,  0.0682],
        [ 1.7139,  0.9944,  0.2267],
        [ 0.3033, -0.6519,  0.8762],
        [ 1.3594,  2.4538, -0.1896],
        [ 0.6345,  0.8023,  0.4416]])


In [101]:
result = torch.empty(5,3)
torch.add(x,y,out=result)
result

tensor([[ 0.0990,  2.7889,  0.0682],
        [ 1.7139,  0.9944,  0.2267],
        [ 0.3033, -0.6519,  0.8762],
        [ 1.3594,  2.4538, -0.1896],
        [ 0.6345,  0.8023,  0.4416]])

### Resizing

tensor의 크기(size)나 모양(shape)을 변경하고 싶을 때, torch.view 를 사용합니다.

In [102]:
x = torch.randn(4,4)
y = x.view(16)
z = x.view(-1,8) 

In [103]:
print(x.size(),y.size(),z.size())
print(x)
print(y)
print(z)

torch.Size([4, 4]) torch.Size([16]) torch.Size([2, 8])
tensor([[-0.5043, -1.0265,  0.8260,  0.0506],
        [-0.9811,  0.2439, -0.1774,  1.6554],
        [ 1.3060,  1.3681,  1.0003,  2.6625],
        [-0.2435, -2.0742, -1.4144,  1.0905]])
tensor([-0.5043, -1.0265,  0.8260,  0.0506, -0.9811,  0.2439, -0.1774,  1.6554,
         1.3060,  1.3681,  1.0003,  2.6625, -0.2435, -2.0742, -1.4144,  1.0905])
tensor([[-0.5043, -1.0265,  0.8260,  0.0506, -0.9811,  0.2439, -0.1774,  1.6554],
        [ 1.3060,  1.3681,  1.0003,  2.6625, -0.2435, -2.0742, -1.4144,  1.0905]])


### Tensor to Numpy

In [104]:
a = torch.ones(5)
print(a)
b = a.numpy()
print(b)

tensor([1., 1., 1., 1., 1.])
[1. 1. 1. 1. 1.]


### Numpy to Tensor

In [105]:
import numpy as np
a = np.ones(5)
b = torch.from_numpy(a)
print(b)

tensor([1., 1., 1., 1., 1.], dtype=torch.float64)


### Autograd

도함수를 계산하기 위해서는, tensor의 .backword()를 호출하면 됩니다. tensor가 스칼라인 경우애눈 backward에 인자를 정해줄 필요가 없습니다.

In [106]:
x = torch.ones(2,2, requires_grad= True)
print(x)

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)


In [107]:
y = x+2
print(y)

tensor([[3., 3.],
        [3., 3.]], grad_fn=<AddBackward>)


In [108]:
print(y.grad_fn)

<AddBackward object at 0x1cd2cc65c0>


In [109]:
z = y*y*3
out = z.mean()
print(z,out)

tensor([[27., 27.],
        [27., 27.]], grad_fn=<MulBackward>) tensor(27., grad_fn=<MeanBackward1>)


In [110]:
out.backward()

In [111]:
print(x.grad)

tensor([[4.5000, 4.5000],
        [4.5000, 4.5000]])


# Neural Networks

신경망은 torch.nn 패키지를 사용하여 생성할 수 있습니다. 지금까지 autograd를 살펴봤는데요. nn은 모델을 정의하고 미분하는데 autograd를 사용합니다. nn.Module은 계층(layer)와 output을 반환하는 foraward(input) 메서드를 포함하고 있습니다.

### Conv-net
간단한 Feed-forward network입니다. 입력을 받아 여러계층에 전달한 후 ouput을 제공합니다.
학습의 과정은 다음과 같습니다.
- 학습 가능한 parameter를 갖는 신경망을 정의합니다.
- 데이터셋(dataset) 입력을 반복합니다.
- 입력을 신경망에서 처리합니다.
- 손실을 계산합니다.
- Gradient를 신경망의 배개변수들에 역으로 전파합니다.
- 신경망의 가중치를 갱신합니다 : Weight* = Weight - (learnign rate x gradient)

### torch.nn
torch.nn은 미니배치만 지원합니다. 즉 torch.nn 패키지 전체는 하나의 샘플이 아닌, 샘플들의 미니매치만을 입력으로 받습니다. 예를들어 nnConv2D는 nsamples x nChannels x Height x Width 의 4차원 Tensor를 입력으로 합니다.

만약 하나의 샘플만 있다면, input.unsqueeze(0)을 사용해서 가짜 차원을 추가해 봅시다.
- torch.Tensor : backward() 같은 autograd 연산을 지원하는 다차원 배열입니다. tensor에 대한 gradient를 가지게 됩니다.
- nn.Module : 신경망 모듈로 매개변수를 Encapsulation 하는 간단한 방법으로, GPU로 이동, exporting, loading 등의 작업을 위한 도움을 줍니다.
- nn.Parameter : Tensor 의 한 종류로 Module에 속성으로 할당될 떄 자동으로 매개변수로 등록됩니다.
- autograd.Function : autograd 연산의 전방향과 역방향 정의를 구현합니다. 모든 tensor 연산은 하나 이상의 Function 노드를 생성하며, 각 노드는 Tensor 를 생성하고 History를 encoding 하는 함수들과 연결되어 있습니다.

In [112]:
import torch
import torch.nn as nn
import torch.nn.functional as F

In [113]:
class Net(nn.Module):
    def __init__(self):
        # super 은 일반적으로 부모 클래스의 init함수를 쓰고 싶을때다.
        # __init__은 클래스 인스턴스 생성과 초기값 입력을 한번에 처리가 가능하지!
        super(Net, self).__init__()
        # 하나의 input image channel, 6개 output channels, 5x5 square convolution
        self.conv1 = nn.Conv2d(1,6,5)
        self.conv2 = nn.Conv2d(6,16,5)
        # affine operation : y = Wx * b
        self.fc1 = nn.Linear(16*5*5, 120)
        self.fc2 = nn.Linear(120,84)
        self.fc3 = nn.Linear(84,10)
        
    def forward(self,x):
        #max pooling (2,2) window에 해주자
        x = F.max_pool2d(F.relu(self.conv1(x)), (2,2))
        x = F.max_pool2d(F.relu(self.conv2(x)), 2)
        x = x.view(-1, self.num_flat_features(x))
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
    
    def num_flat_features(self, x):
        # batch dimension을 빼고 모든 dimension을 호출한다.
        size = x.size()[1:]
        num_features = 1
        for s in size:
            num_features *= s
        return num_features

In [114]:
net = Net()
print(net)

Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)


forward 함수만 정의하고 나면, 변화도를 계산하는 backward 함수는 autograd 를 사용하여 자동으로 정의됩니다. forward 함수에서는 어떠한 Tensor 연산을 사용해도 괜찮습니다.

In [115]:
params = list(net.parameters())
print(len(params), params[0].size())

10 torch.Size([6, 1, 5, 5])


In [116]:
test_input = torch.randn(1,1,32,32)
print(test_input)
out = net(test_input)
print("")
print(out)

tensor([[[[-0.8784,  0.4078, -2.8708,  ...,  0.3359, -0.1096,  0.8136],
          [ 0.8840,  1.7133,  1.0598,  ...,  0.5818, -1.4923, -0.6673],
          [ 0.6061,  0.2849, -0.0810,  ...,  1.0458,  2.3507,  1.6203],
          ...,
          [ 2.0897,  0.9537,  0.3685,  ...,  2.2787,  0.4818, -1.1274],
          [ 1.1480,  1.9860, -0.0816,  ...,  0.6924, -0.3124, -1.2475],
          [ 0.5004,  0.3684,  0.7623,  ...,  0.4964,  0.5886,  0.6396]]]])

tensor([[-0.1328,  0.0522,  0.1381, -0.0128, -0.0110, -0.1656, -0.0469,  0.1008,
         -0.0486,  0.0348]], grad_fn=<ThAddmmBackward>)


In [117]:
net.zero_grad()
out.backward(torch.randn(1,10))

In [118]:
out

tensor([[-0.1328,  0.0522,  0.1381, -0.0128, -0.0110, -0.1656, -0.0469,  0.1008,
         -0.0486,  0.0348]], grad_fn=<ThAddmmBackward>)

### Loss Function

손실합수는 (output, target)을 한 쌍으로 입력받아, output과 target의 distance를 계산합니다.
- nn.MSEloss : mean-squared error

In [119]:
ouput = net(test_input)
# dummy target을 만듭니다.
target = torch.arange(1,11)
# output과 같은 shape을 하나 만들어둡니다.
target = target.view(1,-1)
# LongTensor 에서 FloatTensor로 바꾸어줍니다.
target = target.type(torch.FloatTensor)
criterion = nn.MSELoss()

loss = criterion(ouput, target)
print(loss)

tensor(38.5735, grad_fn=<MseLossBackward>)


이제 ``.grad_fn`` 속성을 사용하여 ``loss``를 역방향으로 따라가 봅시다.

```
    input -> conv2d -> relu -> maxpool2d -> conv2d -> relu -> maxpool2d
          -> view -> linear -> relu -> linear -> relu -> linear
          -> MSELoss
          -> loss
```

따라서 ``loss.backward()``를 실행할 때, 전체 그래프는 손실(loss)에 대해 미분되며, 그래프 내의 ``requires_grad= True``인 모든 Tensor는 Gradient가 누적된 ``.grad`` Tensor를 갖게 됩니다.:


In [120]:
print("MSELoss:", loss.grad_fn)
print("linear:", loss.grad_fn.next_functions[0][0])
print("ReLU:", loss.grad_fn.next_functions[0][0].next_functions[0][0])

MSELoss: <MseLossBackward object at 0x1cd2e0fb38>
linear: <ThAddmmBackward object at 0x1cd2e0fb00>
ReLU: <ExpandBackward object at 0x1cd2e0fb38>


### 역전파 (BackProp)

오차(error)를 역전파하기 위해 할 일은 loss.backword()가 전부입니다. 기존의 변화도를 지우는 작업이 필요합니다. 이제 loss.backward()를 호출하여, 역전파 전후의 bias gradient를 살펴봅시다.

In [121]:
net.zero_grad()
print("before backward: ",net.conv1.bias.grad)
loss.backward()
print('after backward: ', net.conv1.bias.grad)

before backward:  tensor([0., 0., 0., 0., 0., 0.])
after backward:  tensor([-0.1427,  0.0179, -0.0436,  0.0071,  0.0553, -0.0471])


### Weight 갱신

```
    weight* = wegiht - (learning rate * gradient)
```


In [122]:
learning_rate = 0.01
for f in net.parameters():
    f.data.sub_(f.grad.data * learning_rate)

In [123]:
import torch.optim as optim

optimizer = optim.SGD(net.parameters(), lr= 0.01)
optimizer.zero_grad()
output = net(test_input)
loss = criterion(output, target)
loss.backward()
optimizer.step()

In [124]:
def Flatten(self, x: torch.Tensor) -> torch.Tensor:
    return x.view(x.size(0), -1)

In [285]:
import os
import librosa
import librosa.display
import numpy as np
train_audio_path = '../../Music_Genre_Classification/1DConv/gtzan/'
filename = 'hiphop/hiphop.00000.wav'
samples, sample_rate = librosa.load(str(train_audio_path)+filename)

In [72]:
genres = ['pop', 'metal', 'disco', 'reggae', 'classical', 'hiphop', 'country', 'jazz']

In [86]:
for genre in genres:
    temp = librosa.util.find_files(train_audio_path+genre)
    for ttemp in temp:
        samples, sample_rate = librosa.load(str(ttemp))
        print(genre,len(samples))
        break

pop 661504
metal 661504
disco 664180
reggae 661794
classical 661794
hiphop 661504
country 663300
jazz 661794


In [303]:
temp_y = ['hiphop','hiphop','hiphop','hiphop','hiphop','hiphop','hiphop','hiphop','hiphop','hiphop']
y = np.stack(temp_y)

In [293]:
samples = samples[:661500]
sample_list = np.split(samples,10)

In [295]:
len(sample_list[0])

66150

In [297]:
sample_list[0]

array([-0.16915894, -0.021698  ,  0.01956177, ...,  0.07229614,
        0.11206055,  0.05499268], dtype=float32)

In [298]:
temp = []
for X in sample_list:
    temp.append(X)

In [299]:
x = np.stack(temp)

In [319]:
x[0]

array([-0.16915894, -0.021698  ,  0.01956177, ...,  0.07229614,
        0.11206055,  0.05499268], dtype=float32)

In [302]:
from torch.utils.data import Dataset, DataLoader

In [304]:
class sampleDataset(Dataset):
    def __init__(self,x,y):
        self.x = x
        self.y = y
    def __getitem(self,index):
        return self.x[index], self.y[index]
    def __len__(self):
        return self.x.shape[0]

In [305]:
train_set = sampleDataset(x,y)

In [315]:
train_set.x

array([[-0.16915894, -0.021698  ,  0.01956177, ...,  0.07229614,
         0.11206055,  0.05499268],
       [ 0.03643799,  0.0725708 ,  0.09326172, ..., -0.19229126,
        -0.13232422,  0.00460815],
       [-0.01312256, -0.10766602, -0.07131958, ..., -0.14120483,
        -0.02423096,  0.07196045],
       ...,
       [ 0.00939941, -0.0319519 , -0.01092529, ...,  0.13143921,
         0.23727417,  0.17889404],
       [ 0.19100952,  0.22451782,  0.18466187, ..., -0.02914429,
         0.11608887,  0.24005127],
       [ 0.28909302,  0.30187988,  0.38909912, ..., -0.08758545,
         0.02758789,  0.05059814]], dtype=float32)

In [266]:
import torch
import torch.nn as nn

In [341]:
22050*3

66150

In [310]:
class SampleCNN(nn.Module):
    def __init__(self):
        super(SampleCNN, self).__init__()
        
        self.conv1 = nn.Sequential(
            nn.Conv1d(1,128, kernel_size=3, stride=3, padding=0),
            nn.BatchNorm1d(128),
            nn.ReLU()
        )
        self.conv2 = nn.Sequential(
            nn.Conv1d(128,128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(128),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3)
        )
        self.conv3 = nn.Sequential(
            nn.Conv1d(128,128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(128),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3)
        )
        
        self.conv4 = nn.Sequential(
            nn.Conv1d(128,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3)
        )
        self.conv5 = nn.Sequential(
            nn.Conv1d(256,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3)
        )
        self.conv6 = nn.Sequential(
            nn.Conv1d(256,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3),
            nn.Dropout()
        )
        self.conv7 = nn.Sequential(
            nn.Conv1d(256,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3),
        )
        self.conv8 = nn.Sequential(
            nn.Conv1d(256,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3),
        )
        self.conv9 = nn.Sequential(
            nn.Conv1d(256,256, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(256),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3),
        )
        self.conv10 = nn.Sequential(
            nn.Conv1d(256,512, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm1d(512),
            nn.ReLU(),
            nn.MaxPool1d(3, stride=3),
            nn.Dropout(),
        )
        
        self.fc = nn.Linear(512,8)
    
    def forward(self,x):        
        out = self.conv1(x)
        print(out.shape)
        out = self.conv2(out)
        print(out.shape)
        out = self.conv3(out)
        print(out.shape)
        out = self.conv4(out)
        print(out.shape)
        out = self.conv5(out)
        print(out.shape)
        out = self.conv6(out)
        print(out.shape)
        out = self.conv7(out)
        print(out.shape)
        out = self.conv8(out)
        print(out.shape)
        out = self.conv9(out)
        print(out.shape)
        out = self.conv10(out)
        print(out.shape)

        
        out = out.view(x.shape[0], -1)
        print(out.shape)
        out = self.fc(out)
        
        return out

In [336]:
net = SampleCNN()
net = net

In [337]:
returnval =[]
for i in x:
    i = torch.tensor(i)
    i = torch.unsqueeze(i,0)
    i = torch.unsqueeze(i,0)
    print(i.shape)
    returnval.append(net(i))

torch.Size([1, 1, 66150])
torch.Size([1, 128, 22050])
torch.Size([1, 128, 7350])
torch.Size([1, 128, 2450])
torch.Size([1, 256, 816])
torch.Size([1, 256, 272])
torch.Size([1, 256, 90])
torch.Size([1, 256, 30])
torch.Size([1, 256, 10])
torch.Size([1, 256, 3])
torch.Size([1, 512, 1])
torch.Size([1, 512])
torch.Size([1, 1, 66150])
torch.Size([1, 128, 22050])
torch.Size([1, 128, 7350])
torch.Size([1, 128, 2450])
torch.Size([1, 256, 816])
torch.Size([1, 256, 272])
torch.Size([1, 256, 90])
torch.Size([1, 256, 30])
torch.Size([1, 256, 10])
torch.Size([1, 256, 3])
torch.Size([1, 512, 1])
torch.Size([1, 512])
torch.Size([1, 1, 66150])
torch.Size([1, 128, 22050])
torch.Size([1, 128, 7350])
torch.Size([1, 128, 2450])
torch.Size([1, 256, 816])
torch.Size([1, 256, 272])
torch.Size([1, 256, 90])
torch.Size([1, 256, 30])
torch.Size([1, 256, 10])
torch.Size([1, 256, 3])
torch.Size([1, 512, 1])
torch.Size([1, 512])
torch.Size([1, 1, 66150])
torch.Size([1, 128, 22050])
torch.Size([1, 128, 7350])
torch.S

In [340]:
returnval

[tensor([[-0.4222,  0.2320, -0.7943,  0.8741, -0.6898, -0.3004,  0.8019,  0.0081]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-1.0420,  0.4026, -0.0350,  0.5759,  0.1433, -0.1466, -0.5642,  0.3010]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-0.5491, -0.0107, -0.1381, -0.6070, -0.7052,  0.4244, -0.5731,  0.4963]],
        grad_fn=<ThAddmmBackward>),
 tensor([[ 0.0578,  0.6801, -0.4243, -0.7034, -0.6450,  0.0586, -0.0703,  0.7356]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-0.9408,  0.2535, -0.1181, -0.4663, -0.5898,  0.3850,  0.4338,  0.4985]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-0.5821,  0.7450, -0.4027, -0.1331, -1.0143, -0.4056,  0.5895,  0.1177]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-1.1407,  0.6481, -0.7338, -0.1182, -0.2705, -0.7569,  0.0660,  0.5495]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-0.6897,  0.0410, -0.3927, -0.5081, -0.6213, -0.2804,  0.4090, -0.0670]],
        grad_fn=<ThAddmmBackward>),
 tensor([[-0.2041, -0.1265, -0.8923, -0.