# Linear Regression

In [None]:
# pytorch와 각종 필요한 재료 Import
import torch
import random

In [None]:
device = 'cuda' if torch.cuda.is_available() else 'cpu'

# 동일한 결과를 출력하기 위한 코드
random.seed(777)
torch.manual_seed(777)
if device == 'cuda':
    torch.cuda.manual_seed_all(777)

In [None]:
# 입력 데이터 쌍 생성 (x, y)
x_train = torch.FloatTensor([[1], [2], [3]])
y_train = torch.FloatTensor([[3], [5], [7]]) # y=2x+1

In [None]:
# weight, bias 초기화
# requires_grad: Backpropagation 과정에서 이루어지는 연산(Autograd 연산)을 모두 추적해야 한다 = 결과를 저장하고 있어라!
W = torch.zeros(1, requires_grad=True)
b = torch.zeros(1, requires_grad=True)

In [None]:
# 선형 회귀 모델 생성
y_hat = x_train * W + b

In [None]:
# cost 함수와 optimizer 선언
cost = torch.nn.MSELoss() # MSE loss
optimizer = torch.optim.SGD([W, b], lr=0.01) # Stochastic Gradient Descent

""" < Optimizer parameter 설정 방법 >
1. torch.optim.SGD([W, b], lr=0.01) -> 우리가 모델의 관계식을 직접 설정해줄 때
2. torch.optim.SGD(model.parameters(), lr=0.01) -> torch가 모델에 대한 정보를 이미 알고 있을 때
* learning rate
: 각 optimizer에서 자주 쓰는 learning rate가 default로 이미 저장 
-> SGD의 경우 우리가 직접 설정해줘야 함 (https://pytorch.org/docs/stable/generated/torch.optim.SGD.html)
""" 


' < Optimizer parameter 설정 방법 >\n1. torch.optim.SGD([W, b], lr=0.01) -> 우리가 모델의 관계식을 직접 설정해줄 때\n2. torch.optim.SGD(model.parameters(), lr=0.01) -> torch가 모델에 대한 정보를 이미 알고 있을 때\n* learning rate\n: 각 optimizer에서 자주 쓰는 learning rate가 default로 이미 저장 \n-> SGD의 경우 우리가 직접 설정해줘야 함 (https://pytorch.org/docs/stable/generated/torch.optim.SGD.html)\n'

In [None]:
for epoch in range(10001):
    # y_hat 계산
    y_hat = x_train * W + b

    # cost 계산
    loss = cost(y_hat, y_train)

    # cost로 모델 개선
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} W: {:.3f}, b: {:.3f} Cost: {:.6f}'.format(
            epoch, 10001, W.item(), b.item(), loss.item()
        )) # item 메소드: torch.tensor 형태로 나타나는 tensor 값에서 우리가 필요한 값(cost, bias, weight 등)만 뽑아내줌

Epoch    0/10001 W: 0.428, b: 0.189 Cost: 21.869318
Epoch  100/10001 W: 2.035, b: 0.921 Cost: 0.000895
Epoch  200/10001 W: 2.027, b: 0.938 Cost: 0.000553
Epoch  300/10001 W: 2.021, b: 0.951 Cost: 0.000342
Epoch  400/10001 W: 2.017, b: 0.962 Cost: 0.000211
Epoch  500/10001 W: 2.013, b: 0.970 Cost: 0.000130
Epoch  600/10001 W: 2.010, b: 0.976 Cost: 0.000081
Epoch  700/10001 W: 2.008, b: 0.981 Cost: 0.000050
Epoch  800/10001 W: 2.006, b: 0.985 Cost: 0.000031
Epoch  900/10001 W: 2.005, b: 0.989 Cost: 0.000019
Epoch 1000/10001 W: 2.004, b: 0.991 Cost: 0.000012
Epoch 1100/10001 W: 2.003, b: 0.993 Cost: 0.000007
Epoch 1200/10001 W: 2.002, b: 0.994 Cost: 0.000004
Epoch 1300/10001 W: 2.002, b: 0.996 Cost: 0.000003
Epoch 1400/10001 W: 2.002, b: 0.997 Cost: 0.000002
Epoch 1500/10001 W: 2.001, b: 0.997 Cost: 0.000001
Epoch 1600/10001 W: 2.001, b: 0.998 Cost: 0.000001
Epoch 1700/10001 W: 2.001, b: 0.998 Cost: 0.000000
Epoch 1800/10001 W: 2.001, b: 0.999 Cost: 0.000000
Epoch 1900/10001 W: 2.000, b: 

# Logistic Regression

In [None]:
# 입력 데이터 쌍 생성 (x, y)
x_train = torch.FloatTensor([[1, 2], [2, 3], [3, 1], [4, 3], [5, 3], [6, 2]])
y_train = torch.FloatTensor([[0], [0], [0], [1], [1], [1]])

In [None]:
# weight, bias 초기화
W = torch.zeros((2, 1), requires_grad=True) 
b = torch.zeros(1, requires_grad=True)
""" 
  weight는 x_train의 shape만큼 초기화 해주어야 함
"""

' \n  weight는 x_train의 shape만큼 초기화 해주어야 함\n'

In [None]:
# Logistic Regression 모델 선언
y_hat = torch.sigmoid(x_train.matmul(W) + b)

In [None]:
# cost 함수와 optimizer 선언
cost = torch.nn.BCELoss().to(device)
optimizer = torch.optim.SGD([W, b], lr=1)

In [None]:
for epoch in range(10001):

    # Cost 계산
    y_hat = torch.sigmoid(x_train.matmul(W) + b)
    loss = cost(y_hat, y_train)

    # cost로 모델 개선
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    # 100번마다 로그 출력
    if epoch % 100 == 0:
        print('Epoch {:4d}/{} Cost: {:.6f}'.format(
            epoch, 10001, loss.item()))

Epoch    0/10001 Cost: 0.693147
Epoch  100/10001 Cost: 0.134722
Epoch  200/10001 Cost: 0.080643
Epoch  300/10001 Cost: 0.057900
Epoch  400/10001 Cost: 0.045300
Epoch  500/10001 Cost: 0.037261
Epoch  600/10001 Cost: 0.031672
Epoch  700/10001 Cost: 0.027556
Epoch  800/10001 Cost: 0.024394
Epoch  900/10001 Cost: 0.021888
Epoch 1000/10001 Cost: 0.019852
Epoch 1100/10001 Cost: 0.018165
Epoch 1200/10001 Cost: 0.016743
Epoch 1300/10001 Cost: 0.015528
Epoch 1400/10001 Cost: 0.014479
Epoch 1500/10001 Cost: 0.013562
Epoch 1600/10001 Cost: 0.012755
Epoch 1700/10001 Cost: 0.012039
Epoch 1800/10001 Cost: 0.011400
Epoch 1900/10001 Cost: 0.010825
Epoch 2000/10001 Cost: 0.010305
Epoch 2100/10001 Cost: 0.009833
Epoch 2200/10001 Cost: 0.009403
Epoch 2300/10001 Cost: 0.009008
Epoch 2400/10001 Cost: 0.008646
Epoch 2500/10001 Cost: 0.008311
Epoch 2600/10001 Cost: 0.008002
Epoch 2700/10001 Cost: 0.007715
Epoch 2800/10001 Cost: 0.007447
Epoch 2900/10001 Cost: 0.007198
Epoch 3000/10001 Cost: 0.006965
Epoch 31

# Softmax Regression

In [None]:
import torchvision.datasets as dataset
import torchvision.transforms as transforms

In [None]:
# MNIST dataset
mnist_train = dataset.MNIST(root='MNIST_data/',
                          train=True,
                          transform=transforms.ToTensor(),
                          download=True)

mnist_test = dataset.MNIST(root='MNIST_data/',
                         train=False,
                         transform=transforms.ToTensor(),
                         download=True)
"""
<torchvision>
: 유명한 데이터셋(MNIST, ciFar10, ciFar100 등), 모델 아키텍처, 컴퓨터 비전 테스크에 알맞도록 이미지 변형이 가능하게 하는 라이브러리

<transform>
: 변형(transform)을 통해 데이터를 조작하고 학습에 적합하게 만듦
-> 여기서는 MNIST 이미지 데이터들을 tensor 형태로 바꾸어라!
"""


Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to MNIST_data/MNIST/raw/train-images-idx3-ubyte.gz


  0%|          | 0/9912422 [00:00<?, ?it/s]

Extracting MNIST_data/MNIST/raw/train-images-idx3-ubyte.gz to MNIST_data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to MNIST_data/MNIST/raw/train-labels-idx1-ubyte.gz


  0%|          | 0/28881 [00:00<?, ?it/s]

Extracting MNIST_data/MNIST/raw/train-labels-idx1-ubyte.gz to MNIST_data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to MNIST_data/MNIST/raw/t10k-images-idx3-ubyte.gz


  0%|          | 0/1648877 [00:00<?, ?it/s]

Extracting MNIST_data/MNIST/raw/t10k-images-idx3-ubyte.gz to MNIST_data/MNIST/raw

Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to MNIST_data/MNIST/raw/t10k-labels-idx1-ubyte.gz


  0%|          | 0/4542 [00:00<?, ?it/s]

Extracting MNIST_data/MNIST/raw/t10k-labels-idx1-ubyte.gz to MNIST_data/MNIST/raw



'\n<torchvision>\n: 유명한 데이터셋(MNIST, ciFar10, ciFar100 등), 모델 아키텍처, 컴퓨터 비전 테스크에 알맞도록 이미지 변형이 가능하게 하는 라이브러리\n\n<transform>\n: 변형(transform)을 통해 데이터를 조작하고 학습에 적합하게 만듦\n-> 여기서는 MNIST 이미지 데이터들을 tensor 형태로 바꾸어라!\n'

In [None]:
# Hyper Parameter
batch_size = 128
lr = 0.01

In [None]:
# DataLoader: 많은 양의 데이터들을 배치(batch) 단위로 학습할 수 있도록 잘라주는 것
data_loader = torch.utils.data.DataLoader(dataset=mnist_train,
                                          batch_size=batch_size,
                                          shuffle=True,
                                          drop_last=True)

In [None]:
# model 선언
model = torch.nn.Linear(784, 10, bias=True).to(device)

"""
input: 784개의 input 이미지
output: 10개의 클래스
"""

'\ninput: 784개의 input 이미지\noutput: 10개의 클래스\n'

In [None]:
# Cost와 Optimizer 선언
criterion = torch.nn.CrossEntropyLoss().to(device) # softmax 연산을 내포하는 CrossEntropyLoss
optimizer = torch.optim.Adam(model.parameters(), lr=lr)

In [None]:
# 학습 (Training)
total_batch = len(data_loader)
for epoch in range(20):
    avg_cost = 0
    for X, Y in data_loader:
        X = X.view(-1, 28 * 28).to(device) # 이미지를 한 줄로 쫙 펴주는 과정
        Y = Y.to(device) # one-hot encoding 안 함

        optimizer.zero_grad()
        Y_hat = model(X) # 대문자 주의!
        cost = criterion(Y_hat, Y)
        cost.backward()
        optimizer.step()

        avg_cost += cost / total_batch # epoch의 오차를 계산하기 위함
    print('Epoch:', '%04d' % (epoch + 1), 'cost =', '{:.9f}'.format(avg_cost))
print('Learning finished')

Epoch: 0001 cost = 0.360792428
Epoch: 0002 cost = 0.293139547
Epoch: 0003 cost = 0.285604358
Epoch: 0004 cost = 0.276128322
Epoch: 0005 cost = 0.273175687
Epoch: 0006 cost = 0.272830486
Epoch: 0007 cost = 0.273756832
Epoch: 0008 cost = 0.268652529
Epoch: 0009 cost = 0.266540766
Epoch: 0010 cost = 0.265599459
Epoch: 0011 cost = 0.266523451
Epoch: 0012 cost = 0.264755428
Epoch: 0013 cost = 0.259720087
Epoch: 0014 cost = 0.261264831
Epoch: 0015 cost = 0.260783643
Epoch: 0016 cost = 0.261681646
Epoch: 0017 cost = 0.257213473
Epoch: 0018 cost = 0.256925344
Epoch: 0019 cost = 0.257890195
Epoch: 0020 cost = 0.260776162
Learning finished


In [None]:
# test 데이터 만들기
#X_test와 Y_test로 나누어주는 과정
X_test = mnist_test.test_data.view(-1, 28 * 28).float().to(device)
Y_test = mnist_test.test_labels.to(device)

"""
https://qlsenddl-lab.tistory.com/38
Expected object of scalar type Float but got scalar type Double for argument
"""



In [None]:
# Test
with torch.no_grad():
    prediction = model(X_test)
    correct_prediction = torch.argmax(prediction, 1) == Y_test 
    # argmax: 행렬에서 가장 큰 값을 가지는 '인덱스(클래스)'로 하겠다! (행렬, dimension)

    accuracy = correct_prediction.float().mean()
    print('Accuracy:', accuracy.item())

Accuracy: 0.8562999963760376
