In [1]:
#!pip3 install torch torchvision torchaudio

- [1] 모듈 로딩 및 데이터 준비 <hr>

In [2]:
### ===> 모듈로딩
import torch                            # 파이토치 텐서 및 기본 함수들 관련 모듈
import torch.nn as nn                   # 인공신경망 층 관련 모듈
import torch.nn.functional as F         # 인공신경망 관련 함수들 모듈
import torch.optim as optim             # 인공신경망 최적화 관련 모듈

In [3]:
### ===> 랜덤 시드(random seed) 설정
torch.manual_seed(1)

<torch._C.Generator at 0x7142a2b47830>

In [4]:
### ===> 데이터 준비 
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[2], [4], [6]])

In [5]:
print(f'x_train : {x_train.shape}, {x_train.ndim} \n{x_train}')
print(f'y_train : {y_train.shape}, {y_train.ndim} \n{y_train}')

x_train : torch.Size([3, 1]), 2 
tensor([[1.],
        [2.],
        [3.]])
y_train : torch.Size([3, 1]), 2 
tensor([[2.],
        [4.],
        [6.]])


- [2] 학습 위한 준비 <hr>

In [6]:
### ===> 가중치 및 절편 데이터 생성 및 초기화
# - 가중치 W            : 0으로 초기화하고 학습 통해 값이 변경되는 변수 명시함
# - requires_grad=True : 학습을 통해 계속 값이 변경되는 변수임 의미
# torch.zeros(텐서 원소 갯수)
W = torch.zeros(1, requires_grad=True) 
b = torch.zeros(1, requires_grad=True)

print(f'W : {W}, b : {b}') 

W : tensor([0.], requires_grad=True), b : tensor([0.], requires_grad=True)


In [7]:
### ===> 경사하강법 설정 : W,b 업데이트 
# W,b 변수, 학습률지정
optimizer = optim.SGD([W, b], lr=0.01)

- [3] 학습 진행 <hr>

In [8]:
### ===> 학습 진행
# - 에포크 : 처음부터~끝까지 학습하는 것 의미 

nb_epochs = 10000                 # 100번 학습

for epoch in range(nb_epochs + 1):

    # H(x) 계산 = XW+b => 예측값
    y_pre = x_train * W + b

    # cost 계산 = 합((예측값 - 정답)**2)
    cost = torch.mean((y_pre - y_train) ** 2)

    # cost로 H(x) 개선
    optimizer.zero_grad()           # gradient 0으로 초기화
    cost.backward()                 # 비용 함수 미분하여 gradient 계산
    # print(f'수식을 w로 미분한 값 : {W.grad}')
    
    optimizer.step()                # W, b 업데이트
    # print(f'업데이트 된 W : {W.grad}, b : {b.grad}')
    

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print(f'Epoch {epoch:4d}/{nb_epochs} W: { W.item():.3f}, b: {b.item():.3f} Cost: {cost.item():.6f}')

Epoch    0/10000 W: 0.187, b: 0.080 Cost: 18.666666
Epoch  100/10000 W: 1.746, b: 0.578 Cost: 0.048171
Epoch  200/10000 W: 1.800, b: 0.454 Cost: 0.029767
Epoch  300/10000 W: 1.843, b: 0.357 Cost: 0.018394
Epoch  400/10000 W: 1.876, b: 0.281 Cost: 0.011366
Epoch  500/10000 W: 1.903, b: 0.221 Cost: 0.007024
Epoch  600/10000 W: 1.924, b: 0.174 Cost: 0.004340
Epoch  700/10000 W: 1.940, b: 0.136 Cost: 0.002682
Epoch  800/10000 W: 1.953, b: 0.107 Cost: 0.001657
Epoch  900/10000 W: 1.963, b: 0.084 Cost: 0.001024
Epoch 1000/10000 W: 1.971, b: 0.066 Cost: 0.000633
Epoch 1100/10000 W: 1.977, b: 0.052 Cost: 0.000391
Epoch 1200/10000 W: 1.982, b: 0.041 Cost: 0.000242
Epoch 1300/10000 W: 1.986, b: 0.032 Cost: 0.000149
Epoch 1400/10000 W: 1.989, b: 0.025 Cost: 0.000092
Epoch 1500/10000 W: 1.991, b: 0.020 Cost: 0.000057
Epoch 1600/10000 W: 1.993, b: 0.016 Cost: 0.000035
Epoch 1700/10000 W: 1.995, b: 0.012 Cost: 0.000022
Epoch 1800/10000 W: 1.996, b: 0.010 Cost: 0.000013
Epoch 1900/10000 W: 1.997, b: 

- [4] 학습 후 모델 파라미터 확인 <hr>

In [9]:
### ===> 학습 완료 후의 W, b  텐서 값 확인
W.item(), b.item()

(1.9999957084655762, 8.701807018951513e-06)

- [5] 예측 <hr>

In [10]:
### ===> x값 넣고 y값 확인
pre_y = W*3+b
pre_y.item()

5.999995708465576

In [11]:
## optimizer.zero_grad()가 필요한 이유
## 미분을 통해 얻은 기울기를 이전에 계산된 기울기 값에 누적시키는 특징

w = torch.tensor(2.0, requires_grad=True)

nb_epochs = 20
for epoch in range(nb_epochs + 1):

  z = 2*w

  z.backward()
  print('수식을 w로 미분한 값 : {}'.format(w.grad))

수식을 w로 미분한 값 : 2.0
수식을 w로 미분한 값 : 4.0
수식을 w로 미분한 값 : 6.0
수식을 w로 미분한 값 : 8.0
수식을 w로 미분한 값 : 10.0
수식을 w로 미분한 값 : 12.0
수식을 w로 미분한 값 : 14.0
수식을 w로 미분한 값 : 16.0
수식을 w로 미분한 값 : 18.0
수식을 w로 미분한 값 : 20.0
수식을 w로 미분한 값 : 22.0
수식을 w로 미분한 값 : 24.0
수식을 w로 미분한 값 : 26.0
수식을 w로 미분한 값 : 28.0
수식을 w로 미분한 값 : 30.0
수식을 w로 미분한 값 : 32.0
수식을 w로 미분한 값 : 34.0
수식을 w로 미분한 값 : 36.0
수식을 w로 미분한 값 : 38.0
수식을 w로 미분한 값 : 40.0
수식을 w로 미분한 값 : 42.0
