In [1]:
## 모듈 로딩
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim


In [3]:
## 랜덤 시드(random_seed) 설정
torch.manual_seed(1)

<torch._C.Generator at 0x14af282f1b0>

In [4]:
## 데이터 준비
x_train = torch.FloatTensor([[1],[2],[3]])
y_train = torch.FloatTensor([[2],[4],[6]])

print(f'x_train : {x_train.shape}, {x_train.ndim} \n{x_train}')
print(f'y_train : {y_train.shape}, {y_train.ndim} \n{y_train}')

x_train : torch.Size([3, 1]), 2 
tensor([[1.],
        [2.],
        [3.]])
y_train : torch.Size([3, 1]), 2 
tensor([[2.],
        [4.],
        [6.]])


# 학습 준비
-requires_grad = True => 값이 계속 변경될 것
-행이 3개 열이 1개인 데이터이므로 feature은 1개!
-torch.zeros 값에 1을 줌

In [5]:
### 가중치 및 절변 데이터 생성 및 초기화
# - 가중치 W ==> 0으로 초기화하고 학습을 통해 값이 변경되는 변수 명시
# requires_grad = True => 학습을 통해 계속 값이 변경되는 변수의 의미
# torch.zeros(텐서 원소 갯수)
w = torch.zeros(1,requires_grad=True) # 1은 피쳐 개수를 의미(3,1)이므로 피쳐1개
b = torch.zeros(1,requires_grad=True)
print(f'w : {w}, b : {b}')

w : tensor([0.], requires_grad=True), b : tensor([0.], requires_grad=True)


In [6]:
## 경사하강법 설정 :w,b 업데이트
# w,b 변수, 학습률 지정
optimizer = optim.SGD([w,b], lr=0.01)

# 학습 진행

In [7]:
### ==> 학습진행
# 에포크 : 처음~끝 까지 학습하는 것을 의미함
nb_epochs = 100
for epoch in range(nb_epochs+1):
    
    # H(x) 계산 = xw + b => 예측값
    y_pre = x_train * w + b
    
    # cost 계산 = 합((예측값 - 정답) **2)
    cost = torch.mean((y_pre - y_train)**2)
    
    # cost로 H(x) 개선
    optimizer.zero_grad()   # gradient 0으로 초기화
    cost.backward()         # 비용 함수 미분하여 gradient 계산
    print(f'수식을 w로 미분한 값 : {w.grad}')
    
    optimizer.step()        # w,b 업데이트
    print(f'업데이트된 w : {w.grad}, b : {b.grad}')
    
    # 100번 마다 로그 출력
    if epoch % 100 == 0:
        print(f'Epoch {epoch:4d}/{nb_epochs} W: { w.item():.3f}, b: {b.item():.3f} Cost: {cost.item():.6f}')

수식을 w로 미분한 값 : tensor([-18.6667])
업데이트된 w : tensor([-18.6667]), b : tensor([-8.])
Epoch    0/100 W: 0.187, b: 0.080 Cost: 18.666666
수식을 w로 미분한 값 : tensor([-16.6044])
업데이트된 w : tensor([-16.6044]), b : tensor([-7.0933])
수식을 w로 미분한 값 : tensor([-14.7710])
업데이트된 w : tensor([-14.7710]), b : tensor([-6.2873])
수식을 w로 미분한 값 : tensor([-13.1408])
업데이트된 w : tensor([-13.1408]), b : tensor([-5.5707])
수식을 w로 미분한 값 : tensor([-11.6915])
업데이트된 w : tensor([-11.6915]), b : tensor([-4.9337])
수식을 w로 미분한 값 : tensor([-10.4030])
업데이트된 w : tensor([-10.4030]), b : tensor([-4.3673])
수식을 w로 미분한 값 : tensor([-9.2573])
업데이트된 w : tensor([-9.2573]), b : tensor([-3.8639])
수식을 w로 미분한 값 : tensor([-8.2388])
업데이트된 w : tensor([-8.2388]), b : tensor([-3.4163])
수식을 w로 미분한 값 : tensor([-7.3332])
업데이트된 w : tensor([-7.3332]), b : tensor([-3.0184])
수식을 w로 미분한 값 : tensor([-6.5280])
업데이트된 w : tensor([-6.5280]), b : tensor([-2.6647])
수식을 w로 미분한 값 : tensor([-5.8121])
업데이트된 w : tensor([-5.8121]), b : tensor([-2.3503])
수식을 w로 미분한 값 : ten

In [8]:
# 학습 후 모델 파라미터 확인
### ==> 학습 완료 후의 w,b 텐서 값 확인
w.item(), b.item()

(1.7456912994384766, 0.5780722498893738)

In [9]:
# 예측
### ==> x값 넣고 y값 확인
pre_y = w*3 + b
pre_y.item()

5.815145969390869

In [10]:
# optimzier.zero_grad()가 필요한 이유
# 미분을 통해 얻은 기울기를 이전에 계산된 기울기값에 누적시키는 특징
w = torch.tensor(2.0, requires_grad=True)
nb_epochs = 20
for epoch in range(nb_epochs + 1):
    z = 2*w

    z.backward()
    print('수식을 w로 미분한 값 : {}'.format(w.grad))

수식을 w로 미분한 값 : 2.0
수식을 w로 미분한 값 : 4.0
수식을 w로 미분한 값 : 6.0
수식을 w로 미분한 값 : 8.0
수식을 w로 미분한 값 : 10.0
수식을 w로 미분한 값 : 12.0
수식을 w로 미분한 값 : 14.0
수식을 w로 미분한 값 : 16.0
수식을 w로 미분한 값 : 18.0
수식을 w로 미분한 값 : 20.0
수식을 w로 미분한 값 : 22.0
수식을 w로 미분한 값 : 24.0
수식을 w로 미분한 값 : 26.0
수식을 w로 미분한 값 : 28.0
수식을 w로 미분한 값 : 30.0
수식을 w로 미분한 값 : 32.0
수식을 w로 미분한 값 : 34.0
수식을 w로 미분한 값 : 36.0
수식을 w로 미분한 값 : 38.0
수식을 w로 미분한 값 : 40.0
수식을 w로 미분한 값 : 42.0
