[DL 구동 과정]

In [4]:
## 모듈 로딩
import torch						## 텐서 관련 모듈
import torch.nn as nn				## 인공신경망 관련 모듈
import torch.nn.functional as F		## 활성화, 손실 등 함수들 모듈
import torch.optim as optim			

In [5]:
# 현재 실습하고 있는 파이썬 코드를 재실행해도
# 다음에도 같은 결과가 나오도록 랜덤 시드(random seed) 설정
torch.manual_seed(1)

<torch._C.Generator at 0x1cee68ee6f0>

In [6]:
# 데이터 준비 --------------------------------------------------
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [7]:
print(f'x_train : {x_train.shape}, {x_train.ndim} \n{x_train}')
print(f'y_train : {y_train.shape}, {y_train.ndim} \n{y_train}')

x_train : torch.Size([3, 1]), 2 
tensor([[1.],
        [2.],
        [3.]])
y_train : torch.Size([3, 1]), 2 
tensor([[2.],
        [4.],
        [6.]])


In [8]:
# Model 초기화 -------------------------------------------------
# 가중치 W 0으로 초기화하고 학습 통해 값이 변경되는 변수 명시함
# requires_grad=True  <= 학습을 통해 계속 값이 변경되는 변수임 의미
# y= Wx+b = 0x + 0
# torch.zeros(텐서 원소 갯수)
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)

print(f'W : {W}, b : {b}')

W : tensor([0.], requires_grad=True), b : tensor([0.], requires_grad=True)


In [9]:
# 경사하강법 => W,b 업데이트
# W,b 변수, 학습률지정
optimizer = optim.SGD([W, b], lr=0.01)

In [11]:
# 학습 --------------------------------------------------------
nb_epochs = 1999 # 원하는만큼 경사 하강법을 반복

for epoch in range(nb_epochs + 1):

    # H(x) 계산 = XW+b => 예측값
    hypothesis = x_train * W + b

    # cost 계산 = (예측값 - 정답)
    cost = torch.mean((hypothesis - y_train) ** 2)

    # cost로 H(x) 개선
    optimizer.zero_grad()      # gradient를 0으로 초기화
    cost.backward()            # 비용 함수를 미분하여 gradient 계산
    print('수식을 w로 미분한 값 : {}'.format(W.grad))

    optimizer.step()           # W, b 업데이트
    print(f'업데이트 된 W : {W.grad}, b : {b.grad}')


    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print(f'Epoch {epoch:4d}/{nb_epochs} W: { W.item():.3f}, b: {b.item():.3f} Cost: {cost.item():.6f}')

수식을 w로 미분한 값 : tensor([-0.0111])
업데이트 된 W : tensor([-0.0111]), b : tensor([0.0253])
Epoch    0/1999 W: 1.954, b: 0.105 Cost: 0.001595
수식을 w로 미분한 값 : tensor([-0.0111])
업데이트 된 W : tensor([-0.0111]), b : tensor([0.0253])
수식을 w로 미분한 값 : tensor([-0.0111])
업데이트 된 W : tensor([-0.0111]), b : tensor([0.0252])
수식을 w로 미분한 값 : tensor([-0.0111])
업데이트 된 W : tensor([-0.0111]), b : tensor([0.0252])
수식을 w로 미분한 값 : tensor([-0.0110])
업데이트 된 W : tensor([-0.0110]), b : tensor([0.0251])
수식을 w로 미분한 값 : tensor([-0.0110])
업데이트 된 W : tensor([-0.0110]), b : tensor([0.0250])
수식을 w로 미분한 값 : tensor([-0.0110])
업데이트 된 W : tensor([-0.0110]), b : tensor([0.0250])
수식을 w로 미분한 값 : tensor([-0.0110])
업데이트 된 W : tensor([-0.0110]), b : tensor([0.0249])
수식을 w로 미분한 값 : tensor([-0.0109])
업데이트 된 W : tensor([-0.0109]), b : tensor([0.0249])
수식을 w로 미분한 값 : tensor([-0.0109])
업데이트 된 W : tensor([-0.0109]), b : tensor([0.0248])
수식을 w로 미분한 값 : tensor([-0.0109])
업데이트 된 W : tensor([-0.0109]), b : tensor([0.0247])
수식을 w로 미분한 값 : tensor([-0.

In [12]:
## 학습 완료 후의 W, b  텐서 값 확인
W.item(), b.item()

(1.9996228218078613, 0.0008575354586355388)

In [13]:
## x값 넣고 y값 확인
pre_y = W*3+b
pre_y.item()

5.999725818634033

In [14]:
num=12
avg=3.45567

f'num = {num}, {num:*^10}, avg = {avg} {avg:10.3f}'


'num = 12, ****12****, avg = 3.45567      3.456'

In [15]:
## optimizer.zero_grad()가 필요한 이유
## 미분을 통해 얻은 기울기를 이전에 계산된 기울기 값에 누적시키는 특징

w = torch.tensor(2.0, requires_grad=True)

nb_epochs = 20
for epoch in range(nb_epochs + 1):

  z = 2*w

  z.backward()
  print('수식을 w로 미분한 값 : {}'.format(w.grad))

수식을 w로 미분한 값 : 2.0
수식을 w로 미분한 값 : 4.0
수식을 w로 미분한 값 : 6.0
수식을 w로 미분한 값 : 8.0
수식을 w로 미분한 값 : 10.0
수식을 w로 미분한 값 : 12.0
수식을 w로 미분한 값 : 14.0
수식을 w로 미분한 값 : 16.0
수식을 w로 미분한 값 : 18.0
수식을 w로 미분한 값 : 20.0
수식을 w로 미분한 값 : 22.0
수식을 w로 미분한 값 : 24.0
수식을 w로 미분한 값 : 26.0
수식을 w로 미분한 값 : 28.0
수식을 w로 미분한 값 : 30.0
수식을 w로 미분한 값 : 32.0
수식을 w로 미분한 값 : 34.0
수식을 w로 미분한 값 : 36.0
수식을 w로 미분한 값 : 38.0
수식을 w로 미분한 값 : 40.0
수식을 w로 미분한 값 : 42.0
