### Pytorch 에서의 Gradient Descent
- 우리는 머신러닝에서 선형회귀(Linear Regression)에 대해서 간단히 살펴 보았습니다.
- 이번에는 파이토치 라이브러리를 이용해서 선형회귀 연산 그래프를 만들고
- 경사하강법을 이해하는 간단한 코드를 살펴보겠습니다.
- 파이토치는 데이터의 기본단위로 텐서(Tensor)를 사용합니다.
    - Numpy의 np.array()와 동일한 겁니다.
- 텐서를 생성하는 방법에는 여러가지가 있지만 가장 단순한 방법으로 torch.Tensor()를 이용합니니다.
- https://github.com/yunjey/pytorch-tutorial/blob/master/tutorials/01-basics/pytorch_basics/main.py
- 베이직 코드라인이 위 Github 사이트 코드를 커스트마이징 했습니다.


In [101]:
import torch #파이토치 프레임워크 불러오고 ... 파이토치는 그냥 torch로 불러온다. 
import torchvision  #파이토치 내에서 vision이 붙으면... Image Processing에 틀화된 라이브러리
import torch.nn as nn # nn은 Neural Net의 약자
import numpy as np
import torchvision.transforms as transforms # 데이타 변형에 특화된 라이브러리 Augmentation

In [102]:
X= torch.Tensor(2,3) #2행 3열의 배열을 하나 생성... 이게 입력데이터가 된다. #토치타입의 텐서.
X.shape #size(동일)
X #값이 랜덤하게 초기화 되어서 들어가있다. 

tensor([[8.4936e+20, 1.9989e+20, 2.1867e+23],
        [2.6583e-06, 4.0746e-11, 4.2330e+21]])

In [103]:
#랜덤하게 초기화되는게 맘에 들지 않는다면 생성과 동시에 초기화.
X=torch.Tensor([[1,2,3],[4,5,6]])
X

tensor([[1., 2., 3.],
        [4., 5., 6.]])

#### tensor 의 인자들

In [104]:
#data입력을 이렇게 키워드 변수로 명시할수도 있다.
#device - (gpu, cpu 중 어느 것으로 돌릴 것인가.)
#requires_grad - 텐서에 기울기를 적용할지 여부. 이게 없으면 미분 불가.

#x = 2,3
x = torch.tensor(data=[2.0,3.0],requires_grad=True) 

#y = 4,9
y = x**2

#pred = 11,21
pred = 2*y +3


In [105]:
#로스 구하기

#label
target = torch.tensor([3.0,4.0])

#loss
loss = torch.sum(torch.abs(pred-target)) # (11-3) + (21-4) =25
print(loss)

'''
Forward 라인이 끝났다.
X --> 학습 --> pred --> loss값 출력   

Backward라인이 시작된다.
loss.backward를 적용한다..

'''

loss.backward() #backward()가 학습 주체(weight, bias)에 대해서 미분이 진행된다. -> 로스를 낮추는 가장 빠른 루트를 찾는다.
'''
loss.backward()
pred값은 미분대상이 아니다. None출력됨.

'''

print(x.grad,pred.grad)

tensor(25., grad_fn=<SumBackward0>)
tensor([ 8., 12.]) None


  print(x.grad,pred.grad)


---

### Creating Tensor,  Neural Network Generation.

In [106]:
x = torch.randn(10,3) #정규분포로 만들어준다
y = torch.randn(10,2)
x,y

(tensor([[ 0.7928,  1.0243, -0.8183],
         [-0.6023,  0.9970, -0.2255],
         [-1.5006,  0.1306,  1.5792],
         [-0.6550, -0.3163, -1.1315],
         [ 0.1642,  0.9358,  0.8347],
         [-0.3821,  1.4423, -0.3366],
         [ 1.5496,  0.2970,  1.0446],
         [-2.3192,  0.8492,  0.5414],
         [-0.9979, -1.4278, -0.2396],
         [-0.4109, -0.8347,  0.5430]]),
 tensor([[ 2.5734, -1.5656],
         [ 1.7894,  0.4850],
         [-0.2732,  2.5391],
         [ 0.9340,  0.2853],
         [-0.8844, -0.0142],
         [-1.0388,  0.9525],
         [ 0.1871,  2.2987],
         [-0.5476, -0.6009],
         [ 0.6439,  0.5809],
         [-0.3201, -0.0240]]))

#### x가 10x3   y가 10x2... w의 행렬모양은? 
- y = x*w +b로 판단.. (3x2)모양이 될 것. 그러나...

In [107]:
# import torch.nn as nn     ->  nn은 Neural Net의 약자


#weight, bias값 랜덤하게 생성
linear = nn.Linear(3,2)
print("weight: ",linear.weight)  #3x2가 아닌 2x3이 나왔다? ->바꾸어 주어야? No. 내부적으로 transpose
print("bias: ",linear.bias) # 10x2가 아닌 1x2가 나왔다? 공통값을 부여해 예측의 오차를 줄이기 위함으로 보인다.

#모델학습의 주체 -> weight,bias 해킹  (for문으로 내용확인 가능. generator형태이다. )
print(linear.parameters())


weight:  Parameter containing:
tensor([[ 0.2850, -0.4702,  0.2208],
        [ 0.2819, -0.5309,  0.0037]], requires_grad=True)
bias:  Parameter containing:
tensor([ 0.1655, -0.5022], requires_grad=True)
<generator object Module.parameters at 0x00000247A4C2EDD0>


#### 선 정의 해야하는 것
- loss function
    - MSELoss()
- optimizer
    - adaBoost
    - SDG 

In [108]:
#로스펑션은 torch.nn이 갖고 있고 exponential, regularizaion 등은 적용되지 않는다. 
loss_func = nn.MSELoss() 



#옵티마이저는 torch.optim.SGD()  
optimizer = torch.optim.SGD(linear.parameters(),lr=0.1)

#-인자는 위에서 weight와 bias를 해킹한 generator가 들어간다.
#안에 들어있는 값이 하강할때 수정되는 값이다. 

#### 예측

In [109]:
#생성한 NN모델에 입력값을 넣으면 예측을 한다. 
pred = linear(x) 

#### Loss구하기

In [110]:
loss = loss_func(pred,y)
print("Loss... before BackPropagation: ",loss.item())  #그냥 loss를 출력해도 되지만.. 

Loss... before BackPropagation:  2.3559229373931885


#### Backward! 

In [111]:
loss.backward() #실질적인 편미분 계산 
print("dL/dw", linear.weight.grad)
print("dL/db", linear.bias.grad)

dL/dw tensor([[ 0.0491, -0.4137,  0.6026],
        [ 0.7257, -0.5973, -0.7988]])
dL/db tensor([-0.3712, -1.2826])


#### 실질적인 하강... 위에서 얻어낸 값으로 step()을 밟는다.

In [112]:
optimizer.step() #수정된 값으로 하강을 한다. #위에서 

In [113]:
#반복

pred = linear(x)
loss = loss_func(pred,y)
print("loss after backpropagation",loss.item())


loss after backpropagation 1.9992380142211914
