<a href="https://colab.research.google.com/github/TOga1220/pytorch_udemy/blob/main/200409_Wine_DeepNeuralNetwork.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ニューラルネットワークによるワインの分類

In [1]:
import torch                           # tensorを扱えるようにする
from torch.autograd import Variable    # 自動微分の関数
import torch.nn as nn                  # ニューラルネットワーク（nn）のモジュール
import torch.nn.functional as F         # 様々な活性化関数
import torch.optim as optim           # 最適化のアルゴリズム
from torch.utils.data import DataLoader, TensorDataset   # ユーティリティのデータを扱うためのデータローダー、テンソルデータセット

In [2]:
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split 

In [3]:
import pandas as pd

In [4]:
## ワインデータセットの読み込み
wine = load_wine()

In [5]:
wine

 'data': array([[1.423e+01, 1.710e+00, 2.430e+00, ..., 1.040e+00, 3.920e+00,
         1.065e+03],
        [1.320e+01, 1.780e+00, 2.140e+00, ..., 1.050e+00, 3.400e+00,
         1.050e+03],
        [1.316e+01, 2.360e+00, 2.670e+00, ..., 1.030e+00, 3.170e+00,
         1.185e+03],
        ...,
        [1.327e+01, 4.280e+00, 2.260e+00, ..., 5.900e-01, 1.560e+00,
         8.350e+02],
        [1.317e+01, 2.590e+00, 2.370e+00, ..., 6.000e-01, 1.620e+00,
         8.400e+02],
        [1.413e+01, 4.100e+00, 2.740e+00, ..., 6.100e-01, 1.600e+00,
         5.600e+02]]),
 'feature_names': ['alcohol',
  'malic_acid',
  'ash',
  'alcalinity_of_ash',
  'magnesium',
  'total_phenols',
  'flavanoids',
  'nonflavanoid_phenols',
  'proanthocyanins',
  'color_intensity',
  'hue',
  'od280/od315_of_diluted_wines',
  'proline'],
 'target': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
        0, 0, 0, 0, 0, 0, 

In [6]:
wine_data = pd.DataFrame(wine.data,columns=wine.feature_names )
print(wine_data.shape)

(178, 13)


In [7]:
# ラベルが0,1のものだけ使用
wine_data = wine.data[0:130]
wine_target = wine.target[0:130]

In [8]:
wine_target

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,
       1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

In [9]:
train_X, test_X, train_Y, test_Y = train_test_split(wine_data, wine_target, test_size = 0.25) 

In [10]:
len(train_X)

97

In [11]:
len(test_X)

33

## Pytorchへのテンソル変換

In [12]:
train_X = torch.from_numpy(train_X).float()
train_Y = torch.from_numpy(train_Y).long()   # integer
test_X = torch.from_numpy(test_X).float()
test_Y = torch.from_numpy(test_Y).long()   # integer

In [13]:
train_X

tensor([[1.3670e+01, 1.2500e+00, 1.9200e+00,  ..., 1.2300e+00, 2.4600e+00,
         6.3000e+02],
        [1.2250e+01, 1.7300e+00, 2.1200e+00,  ..., 1.0000e+00, 3.1700e+00,
         5.1000e+02],
        [1.3480e+01, 1.8100e+00, 2.4100e+00,  ..., 1.0400e+00, 3.4700e+00,
         9.2000e+02],
        ...,
        [1.3030e+01, 9.0000e-01, 1.7100e+00,  ..., 1.1900e+00, 2.4800e+00,
         3.9200e+02],
        [1.4220e+01, 1.7000e+00, 2.3000e+00,  ..., 9.4000e-01, 3.3100e+00,
         9.7000e+02],
        [1.1610e+01, 1.3500e+00, 2.7000e+00,  ..., 9.6000e-01, 3.2600e+00,
         6.8000e+02]])

In [14]:
train = TensorDataset(train_X, train_Y) 

In [15]:
train[0]

(tensor([1.3670e+01, 1.2500e+00, 1.9200e+00, 1.8000e+01, 9.4000e+01, 2.1000e+00,
         1.7900e+00, 3.2000e-01, 7.3000e-01, 3.8000e+00, 1.2300e+00, 2.4600e+00,
         6.3000e+02]), tensor(1))

In [16]:
# ミニバッチ＝部分集合にわけてトレーニングを何回もする時に使用
train_loader = DataLoader(train, batch_size=15, shuffle=True)

## モデルの定義

In [18]:
# PyTorchではtorch.nnモジュールでニューラルネットワークの基底クラスとなるModuleクラスを定義
# Netクラスはtorch.nn.Moduleクラスを継承する
class Net(nn.Module):
  # インスタンス生成時に呼ばれる初期化の命令
  def __init__(self):
    super(Net, self).__init__()
    self.fc1 = nn.Linear(13, 128)     # 入力は13ノード　、中間層は128とする
    self.fc2 = nn.Linear(128, 128)
    self.fc3 = nn.Linear(128, 128)
    self.fc4 = nn.Linear(128, 128)
    self.fc5 = nn.Linear(128, 128)
    self.fc6 = nn.Linear(128, 2)      # 入力は128, 出力が2

    # 　__init__メソッドで定義した層が実際にどのようにつながっているか（ニューラルネットワークがどのように計算を連ねていくか）はforwardメソッドで定める。
  def forward(self, x):
    x = F.relu(self.fc1(x))   # 活性化関数relu
    x = F.relu(self.fc2(x)) 
    x = F.relu(self.fc3(x))
    x = F.relu(self.fc4(x)) 
    x = F.relu(self.fc5(x))  
    x = self.fc6(x)
    return F.log_softmax(x, dim=0)


In [19]:
model = Net()

## トレーニングの実行

In [20]:
#　損失の計算
# 交差エントロピー
criterion = nn.CrossEntropyLoss()

In [21]:
# 最適化の計算
# 最適化アルゴリズム　　　SGD：確率的勾配効果法
optimizer = optim.SGD(model.parameters(), lr=0.001)

In [22]:
for epoch in range(500):
  total_loss = 0    # 損失を格納するための変数を0で初期化

  for train_x, train_y in train_loader:    # train_loaderのミニバッチのデータの塊がそれぞれtrain_x,train_yにセットされる
    train_x, train_y = Variable(train_x), Variable(train_y)   # torch.autograd.Variable : テンソルをwrapして計算操作を記録
    optimizer.zero_grad()  # optimizerの勾配を最初は０に。学習する旅に増やす
    output = model(train_x)
    loss = criterion(output, train_y)
    loss.backward()    # 誤差を後方に伝播
    optimizer.step()  # で伝播したデータを使ってパラメータを更新
    total_loss += loss.data.item()

  if (epoch+1) % 60 == 0:
    print(epoch+1, total_loss)  

60 1.129446141421795
120 0.9347728667780757
180 0.957983810454607
240 1.0029310886748135
300 1.4713371023535728
360 1.3942904341965914
420 0.9840113110840321
480 0.9788484610617161


## 精度の計算

In [23]:
test_x, test_y = Variable(test_X), Variable(test_Y)
result = torch.max(model(test_x).data, 1)[1]        # 出力が0or1なのか。
accuracy = sum(test_y.data.numpy() == result.numpy()) / len(test_y.data.numpy())

In [24]:
accuracy

0.9393939393939394