In [1]:
import torch
# from torch.autograd import Variable # Deprecated -> Torch에 지원 이제 쓸필요 없어! 
import torch.nn as nn # nural network 생성
import torch.nn.functional as F # 관련된 function
import torch.optim as optim  # optimizer 경사하강법을 사용하기 위한 알고리즘들을 모아놓은 모듈 
# 배치학습: 학습을 시킬 때, 모든 데이터를 가공
# 미니배치: 조금씩 잘라서 학습시킨다. 
from torch.utils.data import DataLoader, TensorDataset # DataLoader, TensorDataset

from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split

import pandas as pd

In [2]:
# 와인 데이터 읽어 들이기
wine = load_wine()
wine.keys()

dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])

In [3]:
# 데이터 프레임에 담긴 설명변수 출력
df = pd.DataFrame(wine.data, columns=wine.feature_names)
df.head()

Unnamed: 0,alcohol,malic_acid,ash,alcalinity_of_ash,magnesium,total_phenols,flavanoids,nonflavanoid_phenols,proanthocyanins,color_intensity,hue,od280/od315_of_diluted_wines,proline
0,14.23,1.71,2.43,15.6,127.0,2.8,3.06,0.28,2.29,5.64,1.04,3.92,1065.0
1,13.2,1.78,2.14,11.2,100.0,2.65,2.76,0.26,1.28,4.38,1.05,3.4,1050.0
2,13.16,2.36,2.67,18.6,101.0,2.8,3.24,0.3,2.81,5.68,1.03,3.17,1185.0
3,14.37,1.95,2.5,16.8,113.0,3.85,3.49,0.24,2.18,7.8,0.86,3.45,1480.0
4,13.24,2.59,2.87,21.0,118.0,2.8,2.69,0.39,1.82,4.32,1.04,2.93,735.0


In [4]:
df.shape
# 총 데이터 178, 13개의 features

(178, 13)

In [5]:
wine.target_names
# 와인의 품종을 구분하는 예제

array(['class_0', 'class_1', 'class_2'], dtype='<U7')

In [6]:
wine.target

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 2])

In [7]:
wine_data = wine.data[:130]
wine_data

array([[1.423e+01, 1.710e+00, 2.430e+00, ..., 1.040e+00, 3.920e+00,
        1.065e+03],
       [1.320e+01, 1.780e+00, 2.140e+00, ..., 1.050e+00, 3.400e+00,
        1.050e+03],
       [1.316e+01, 2.360e+00, 2.670e+00, ..., 1.030e+00, 3.170e+00,
        1.185e+03],
       ...,
       [1.179e+01, 2.130e+00, 2.780e+00, ..., 9.700e-01, 2.440e+00,
        4.660e+02],
       [1.237e+01, 1.630e+00, 2.300e+00, ..., 8.900e-01, 2.780e+00,
        3.420e+02],
       [1.204e+01, 4.300e+00, 2.380e+00, ..., 7.900e-01, 2.570e+00,
        5.800e+02]])

In [8]:
wine_target = wine.target[:130]
wine_target

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

In [9]:
train_X, test_X, train_y, test_y = train_test_split(wine_data, wine_target, test_size=.2)
# 분리

In [10]:
print(train_X.shape)
print(test_X.shape)

(104, 13)
(26, 13)


# 텐서 생성 - P.64

In [11]:
# This is the Code
# tensor from numpy
train_X = torch.from_numpy(train_X).float() # double(float64)->float(float32)
train_y = torch.from_numpy(train_y).long() # long -> long (int64)

# from_numpy를 이용하여 tensor형으로 바꿔준다.
# X의 값형태는 float형이여야만 한다. 

In [12]:
test_X = torch.from_numpy(test_X).float()
test_y = torch.from_numpy(test_y)

In [13]:
print(train_X.size()) # ->104행 13열 (2차원배열)
print(train_y.size()) # ->104행 1열  (1차원배열)

torch.Size([104, 13])
torch.Size([104])


In [14]:
# This is the Code
train = TensorDataset(train_X, train_y) # like Dataframe
# TensorDataset는 X와 y를 하나로 합쳐준다. (나중에 빼기 쉽게 만들기 위해서)

In [15]:
train

<torch.utils.data.dataset.TensorDataset at 0xbfa9898>

In [16]:
train.tensors
# 잘 합쳐진 것을 확인할 수 있다.

(tensor([[ 13.6700,   1.2500,   1.9200,  ...,   1.2300,   2.4600, 630.0000],
         [ 13.6400,   3.1000,   2.5600,  ...,   0.9600,   3.3600, 845.0000],
         [ 12.2900,   1.6100,   2.2100,  ...,   0.9060,   1.8200, 870.0000],
         ...,
         [ 12.6900,   1.5300,   2.2600,  ...,   0.9600,   2.0600, 495.0000],
         [ 13.4900,   1.6600,   2.2400,  ...,   0.9800,   2.7800, 472.0000],
         [ 12.1700,   1.4500,   2.5300,  ...,   1.4500,   2.2300, 355.0000]]),
 tensor([1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1,
         1, 0, 1, 0, 1, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 1, 1, 1, 0, 0, 0, 1,
         0, 0, 0, 1, 0, 1, 1, 1, 1, 0, 0, 1, 0, 1, 1, 1, 1, 1, 1, 1, 0, 0, 1, 0,
         1, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 1, 0, 1, 0, 1, 1, 1, 1, 0, 1, 0,
         0, 1, 0, 1, 1, 1, 1, 1]))

In [17]:
print("train_X", train.tensors[0].size())
print("train_y", train.tensors[1].size())

train_X torch.Size([104, 13])
train_y torch.Size([104])


In [18]:
# This is the Code
train_loader = DataLoader(train, batch_size=16, shuffle=True) 
train_loader
# DataLoader: 유틸리티. 편리한 함수.
# 인자 값을 봅시다.
# train: 전달되어야하는 데이터들
# batch_size: 데이터 셋을 받아서, 우리가 원하는 크기만큼 잘라준다. 16개씩 잘라낸다. 
# 왜 자르는데요? 국소 최적해를 방지하기 위해서 미니배치학습을 시켜주는 것 
# shuffle: 

<torch.utils.data.dataloader.DataLoader at 0xb0646d8>

## 신경망 구성 - P.67

In [19]:
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(13, 96) # 입력층 - 중간층 
        # 96은 왜? 걍 연구자 마음대로 
        self.fc2 = nn.Linear(96, 2)  # 중간층 - 출력층
        
    def forward(self, x): # forward가 정의되면 backward도 자동으로 정의된다. 
        # forward propagation - FP
        x = self.fc1(x) # 
        x = F.relu(self.fc1(x)) # 중간층 - Activate Function
        # relu (activate function) 값을 전달할지 말지 결정한다. 
        # 시그모이드 함수를 쓰니까, 계속 값이 작아지는 문제점이 발생. 따라서 relu함수를 사용하게 되었다.
        # relu함수: 값이 0보다 작으면 그 값은 0 이다. 
        # 값이 0보다 크면 그 본래의 값이다. 
        
        x = self.fc2(x)
        # Classification Problem
        return F.log_softmax(x, dim=1) # 출력층 - Activate Function 
        # return F.log_softmax(x, dim=None)

In [20]:
model = Net()

# 모형 학습 - P.69

In [21]:
# Cross Entropy Loss(Cost) Function
criterion = nn.CrossEntropyLoss()
# metric = nn.CrossEntropyLoss()
# CrossEntropyLoss 라는 cost 함수를 사용하겠다. (로지스틱 회귀분석 ppt의 log cost함수와 동일 )

In [22]:
# Stochastic Gradient Decent
optimizer = optim.SGD(model.parameters(), lr=0.01) # learning late

In [23]:
for i in model.parameters():
    print(i)

Parameter containing:
tensor([[ 0.0966, -0.2043, -0.2561,  ..., -0.1538, -0.1560,  0.2363],
        [-0.2079,  0.2127,  0.2705,  ...,  0.1543,  0.1271, -0.0576],
        [-0.2065, -0.2773, -0.0606,  ...,  0.0862,  0.0864, -0.1037],
        ...,
        [ 0.2441, -0.1209, -0.2382,  ...,  0.1289,  0.1460, -0.1977],
        [-0.0750,  0.1880, -0.1478,  ..., -0.2303,  0.2557,  0.0887],
        [ 0.1125,  0.2454,  0.0799,  ..., -0.2108, -0.1495, -0.0957]],
       requires_grad=True)
Parameter containing:
tensor([ 0.1252,  0.0091, -0.0941,  0.0115,  0.1628, -0.0196,  0.2582, -0.0656,
         0.1280,  0.1477, -0.1470, -0.0909,  0.2352,  0.1250,  0.0500, -0.2328,
         0.0487, -0.1144, -0.1266, -0.2314, -0.1299, -0.2656, -0.1162, -0.2019,
         0.1171, -0.2726,  0.2707, -0.2153,  0.0935,  0.0383, -0.2688,  0.1436,
        -0.0400,  0.2516,  0.1591, -0.1771, -0.0242, -0.2243,  0.0139, -0.1068,
        -0.1891,  0.2605,  0.0985,  0.2633,  0.2472, -0.2061,  0.1089, -0.0795,
         0.0851

In [25]:
for epoch in range(300):
    total_loss = 0
    # 원하는 오차가 나올 때 까지하는 방법과
    # 정한 횟수만큼 돌리도록 하는 방법이 있는데, 여기서는 두 번째 방법을 사용한다. 
    
    for train_x, train_y in train_loader:
        # train_x, train_y = Variable(train_x), Variable(train_y) # Deprecated
        
        optimizer.zero_grad() # reset gradient
        
        output = model(train_x)
        
        loss = criterion(output, train_y)
        
        loss.backward()
        
        optimizer.step()
        
        # total_loss += loss.data[0]
        total_loss += loss.item()
    if (epoch+1) % 50 == 0:
        print(epoch+1, total_loss)
        print("="*40)

RuntimeError: size mismatch, m1: [16 x 96], m2: [13 x 96] at c:\n\pytorch_1559129895673\work\aten\src\th\generic/THTensorMath.cpp:940