Pytorch에서의 Gradient Descent에 대해서 간단하게 먼저 살펴본다.<br>
파이토치를 이용해서 선형회귀 모델을 먼저 만들고,<br>
경사하강법으로 학습하는 과정을 코드로 작성해 보면서<br>
지금까지 PDF로 이해한 내용을 마무리 해 보겠다.<br>

파이토치는 데이터의 기본 단위로 텐서(Tensor)를 사용한다.<br>
Tensor는 Numpy에서의 np.array() 함수와 동일하다.

### Torch Configuration

In [1]:
import torch # 파이토치 프레임워크 불러온다.
import torch.nn as nn
import torchvision # 파이토치 내에서도 vision, 이미지 Processing에 특화된 모델
import torchvision.transforms as transforms # 데이터 변형

### I. Forward Propagation
### Neural Network(NN) Model Generator

In [8]:
x = torch.randn(10, 3) # torch로 랜던 데이터 생성
y = torch.randn(10, 2) # torch로 랜던 데이터 생성
# 위의 행값 10이 batch size

# weight? 3x2
linear = nn.Linear(3, 2)

# 결과값은 내부적으로 transforms를 해서 나옴.
# 그래서 2행 3열로 출력됨.   
print('Weight ', linear.weight)

Weight  Parameter containing:
tensor([[-0.5522,  0.3532,  0.5601],
        [-0.5606,  0.1509, -0.4419]], requires_grad=True)


In [9]:
# bias? 10x2
# static 값이기 때문에 10행 모두 똑같은 2가지 값으로 10줄 나오는 것.
print('Bias ', linear.bias)

Bias  Parameter containing:
tensor([0.3177, 0.0319], requires_grad=True)


### 선정의 - loss function, optimization 
- 무슨 방법을 사용할 지 미리 정의

In [11]:
'''
linear.parameters()
학습의 주체를 해킹하고 있는 객체
parameters() 학습의 주체를 해킹하는 함수
해킹한 다는 의미는 parameters()가 w, b를 갖고 있다는 의미
- w, b
'''
linear.parameters()

<generator object Module.parameters at 0x0000020CF49E2C80>

In [15]:
# 이렇게 선정의 해두고 이런 방식으로 학습 진행
loss_function = nn.MSELoss()
optimizer = torch.optim.SGD(linear.parameters(), lr=0.01)

In [16]:
# 모델에다가 입력값을 넣고, 모델이 예측한 값을 출력
pred = linear(x)

# loss - 얼마나 예측을 잘했나 못했나
loss = loss_function(pred, y)

# 여기까지가 forward propagation의 결과

In [18]:
# torch의 데이터 타입은 tensor
# tensor(1.9875, grad_fn=<MseLossBackward>)
print('Loss before step BackPropagation ', loss) 

# tensor에 있는 값만 추출하고 싶을 때 ->item()
print('Loss before step BackPropagation ', loss.item())

Loss before step BackPropagation  tensor(1.9875, grad_fn=<MseLossBackward>)
Loss before step BackPropagation  1.9875062704086304


### II. Back Propagation

In [19]:
# backward 하면 책임을 물어서 loss가 낮게 값 조정. 미분 진행
# backward만 시켰을 뿐 수정된 값으로 하강을 한 것은 아님.
# Loss값에 따른 weight, bias값의 미분한 값만 알아낸 것...아직 학습이 진행된건 아니다...실질적으로 하강안함

loss.backward()

In [20]:
print('dL/dW : ', linear.weight.grad)
print('dL/db : ', linear.bias.grad)

dL/dW :  tensor([[-1.2079, -0.1326,  0.1025],
        [-0.5358,  0.0892, -0.2418]])
dL/db :  tensor([1.0982, 0.3864])


In [21]:
optimizer.step() # 이때 위에서 변경된 값으로 하강을 진행한다.

In [22]:
# 반복 효과
pred = linear(x)
loss = loss_function(pred, y)

print('Loss after Step BackPropagation ', loss.item())

Loss after Step BackPropagation  1.9557676315307617
