1. torch: 텐서를 생성하는 라이브러리
2. torch.autograd: 자동 미분 기능을 제공하는 라이브러리
3. torch.nn: 신경망을 생성하는 라이브러리
4. torch.multiprocessing: 병렬처리 기능을 제공하는 라이브러리
5. torch.utils: 데이터 조작 등 유틸리티 기능
6. torch.legacy: Torch로부터 포팅해온 코드

## 1. 학습 데이터 준비

In [26]:
# pyTorch
import torch # tensor
from torch.autograd import Variable # 자동미분
import torch.nn as nn # 신경망구성
import torch.nn.functional as F # 신경망에 사용되는 함수 정의
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset

# scikit-learn 
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split

# pandas
import pandas as pd

In [27]:
wine = load_wine()
wine.keys()

dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names'])

In [28]:
wine_data = wine.data[0:130]
wine_target = wine.target[0:130]

In [29]:
wine_data[-3:], wine_target[-3:]

(array([[1.179e+01, 2.130e+00, 2.780e+00, 2.850e+01, 9.200e+01, 2.130e+00,
         2.240e+00, 5.800e-01, 1.760e+00, 3.000e+00, 9.700e-01, 2.440e+00,
         4.660e+02],
        [1.237e+01, 1.630e+00, 2.300e+00, 2.450e+01, 8.800e+01, 2.220e+00,
         2.450e+00, 4.000e-01, 1.900e+00, 2.120e+00, 8.900e-01, 2.780e+00,
         3.420e+02],
        [1.204e+01, 4.300e+00, 2.380e+00, 2.200e+01, 8.000e+01, 2.100e+00,
         1.750e+00, 4.200e-01, 1.350e+00, 2.600e+00, 7.900e-01, 2.570e+00,
         5.800e+02]]), array([1, 1, 1]))

In [30]:
train_X, test_X, train_Y, test_Y = train_test_split(wine_data, wine_target, test_size=0.2)

In [31]:
print(len(train_X), len(test_X))

104 26


## 2. 텐서 생성

In [32]:
# torch.from_numpy(ndarray)
# Numpy 배열을 텐서로 변환한다.

train_X = torch.from_numpy(train_X).float()
train_Y = torch.from_numpy(train_Y).long()

In [33]:
train_X.shape, train_Y.shape

(torch.Size([104, 13]), torch.Size([104]))

In [34]:
test_X = torch.from_numpy(test_X).float()
test_Y = torch.from_numpy(test_Y).long()

In [35]:
test_X.shape, test_Y.shape

(torch.Size([26, 13]), torch.Size([26]))

## 3. 설명변수와 목적변수를 합침

In [36]:
# torch.utils.data.TensorDataset(data_tensor, target_tensor)
# 설명변수와 목적변수를 합쳐 인덱스를 붙이고 하나의 데이터 집합으로 만든다.

train = TensorDataset(train_X, train_Y)
print(train[0])

(tensor([ 12.3700,   1.1700,   1.9200,  19.6000,  78.0000,   2.1100,   2.0000,
          0.2700,   1.0400,   4.6800,   1.1200,   3.4800, 510.0000]), tensor(1))


In [37]:
# 데이터 집합을 원하는 크기의 미니배치로 나누어 읽어들인다.
train_loader = DataLoader(train, batch_size=16, shuffle=True)

- dataset(Dataset): 읽어들일 데이터 집합
- batch_size: 배치 크기
- shuffle: 각 에폭마다 데이터 셔플링 여부

## 4. 신경망 구성

입력층 노드 수 13개, 중간층 노드 수 96개, 출력 층 노드 수 2개이다.

In [39]:
# 신경망 구성
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        
        # 생성자 메서드에서는 네트워크의 구조를 설정한다.
        self.fc1 = nn.Linear(13, 96)
        self.fc2 = nn.Linear(96, 2)
        
    def forward(self, x):
        # forward 메서에서는 활성화 함수를 정의한다.
        
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return F.log_softmax(x)
    
# 인스턴스 생성
model = Net()

In [40]:
# torch.nn.Linear(in_features, out_features, bias=True)
# 입력 데이터에 대한 선형 변환을 계산한다.

# torch.nn.functional.relu(input)
# Relu 함수를 구현한 함수다

# torch.nn.functional.log_softmax(input)
# softmax 함수를 구현한 함수다

## 5. 모형 학습

In [41]:
# 오차 함수 객체
criterion = nn.CrossEntropyLoss()

# 최적화 객체
optimizer = optim.SGD(model.parameters(), lr=0.01)

# 학습 시작
for epoch in range(300):
    total_loss = 0
    
    # 분할해 둔 데이터를 꺼내옴
    for train_x, train_y in train_loader:
        
        # 계산 그래프 구성 
        train_x, train_y = Variable(train_x), Variable(train_y)
        
        # 경사 초기화
        optimizer.zero_grad()
        
        # 순전파 계산
        output = model(train_x)
        
        # 오차 계산
        loss = criterion(output, train_y)
        
        # 역전파 계산
        loss.backward()
        
        # 가중치 업데이트
        optimizer.step()
        
        # 누적 오차 계산
        total_loss += loss.data[0]
        
    if (epoch + 1) % 50 == 0:
        print(epoch + 1, total_loss)

  from ipykernel import kernelapp as app


50 tensor(4.8509)
100 tensor(4.8537)
150 tensor(4.8540)
200 tensor(4.8499)
250 tensor(4.8522)
300 tensor(4.8549)


In [42]:
# torch.nn.CrossEntropy
# criterion: 오차 함수 인스턴스

# torch.optim.SGD(params)
# 확률적 경사하강법

# torch.autograd.Variable(data)
# 텐서를 래핑하고 계산 과정을 기록한다.

# torch.autograd.backward(variables)
# 경사의 합을 구한다

In [43]:
# 계산 그래프 구성
test_x, test_y = Variable(test_X), Variable(test_Y)

# 출력이 0 혹은 1이 되게함
result = torch.max(model(test_x).data, 1)[1]

# 모형 정확도 측정
accuracy = sum(test_y.data.numpy() == result.numpy()) / len(test_y.data.numpy())

accuracy

  from ipykernel import kernelapp as app


0.6923076923076923

In [44]:
result

tensor([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
        1, 1])