In [None]:
from google.colab import drive
drive.mount("/gdrive", force_remount=True)

In [None]:
import os
import numpy as np
import torch
import torch.nn as nn
from torch.utils.data import (DataLoader, RandomSampler, TensorDataset)

class Weltried(nn.Module):

  def __init__(self, config):
    super(Weltried, self).__init__()

    # 입력층 노드 수
    self.inode = config["input_node"]
    # 은닉층 데이터 크기
    self.hnode = config["hidden_node"]
    # 출력층 노드 수: 분류해야 하는 레이블 수
    self.onode = config["output_node"]

    # 활성화 함수로 Sigmoid 사용
    self.activation = nn.Sigmoid()

    # 신경망 설계
    self.linear1 = nn.Linear(self.inode, self.hnode, bias=True)
    self.linear2 = nn.Linear(self.hnode, self.onode, bias=True)  

  def forward(self, input_features):

    output1 = self.linear1(input_features)
    hypothesis1 = self.activation(output1)

    output2 = self.linear2(hypothesis1)
    hypothesis2 = self.activation(output2)

    return hypothesis2



<h2> Load Data

In [1]:
# 데이터 읽기 함수
def load_dataset():
    (train_X, train_y), (test_X, test_y) = 

    #train_X = train_X.reshape(-1, 28*28)
    #test_X  = test_X.reshape(-1, 28*28)

    train_X = torch.tensor(train_X, dtype=torch.float)
    train_y = torch.tensor(train_y, dtype=torch.int)
    test_X = torch.tensor(test_X, dtype=torch.float)
    test_y = torch.tensor(test_y, dtype=torch.int)

    return (train_X, train_y), (test_X, test_y)


SyntaxError: invalid syntax (Temp/ipykernel_2176/2677024153.py, line 3)

<h2> Model test

In [2]:
# 모델 평가 결과 계산을 위해 텐서를 리스트로 변환하는 함수
def tensor2list(input_tensor):
    return input_tensor.cpu().detach().numpy().tolist()

# 평가 수행 함수
def do_test(model, test_dataloader):

    # 평가 모드 셋팅
    model.eval()

    # Batch 별로 예측값과 정답을 저장할 리스트 초기화b
    predicts, golds = [], []
    with torch.no_grad():
        for step, batch in enumerate(test_dataloader):
            # .cuda()를 통해 메모리에 업로드
            batch = tuple(t.cuda() for t in batch)

            input_features, labels = batch
            hypothesis = model(input_features)
            logits = (hypothesis > 0.5).float()
            x = tensor2list(logits)
            y = tensor2list(labels)

            # ont-hot 표현으로 변경
            logits = torch.argmax(hypothesis,-1)

            x = tensor2list(logits)
            y = tensor2list(labels)

            # 예측값과 정답을 리스트에 추가
            predicts.extend(x)
            golds.extend(y)
    
        print("PRED=",predicts)
        print("GOLD=",golds)
        print("Accuracy= {0:f}\n".format(accuracy_score(golds, predicts)))

# 모델 평가 함수
def test(config):

    model = Weltried(config).cuda()

    # 저장된 모델 가중치 로드
    model.load_state_dict(torch.load(os.path.join(config["output_dir"], config["model_name"])))

    # 데이터 load
    (_, _), (features, labels) = load_dataset()

    test_features = TensorDataset(features, labels)
    test_dataloader = DataLoader(test_features, shuffle=True, batch_size=config["batch_size"])

    do_test(model, test_dataloader)

<h2> Model train

In [3]:
# 모델 학습 함수
def train(config):
    
    model = Weltried(config).cuda()
    (input_features, labels), (_, _) = load_dataset()

    # TensorDataset/DataLoader를 통해 배치(batch) 단위로 데이터를 나누고 셔플(shuffle)
    train_features = TensorDataset(input_features, labels)
    train_dataloader = DataLoader(train_features, shuffle=True, batch_size=config["batch_size"])

    loss_func = nn.CrossEntropyLoss()
    optimizer = torch.optim.Adam(model.parameters(), lr = config["learn_rate"])

    for epoch in range(config["epoch"]+1):

        # 학습 모드 셋팅
        model.train()

        # epoch 마다 평균 비용을 저장하기 위한 리스트
        costs = []

        for (step, batch) in enumerate(train_dataloader):
            
            # batch = (input_features[step], labels[step])*batch_size
            # .cuda()를 통해 메모리에 업로드
            batch = tuple(t.cuda() for t in batch)

            # 각 feature 저장
            input_features, labels = batch

            # 역전파 변화도 초기화
            # .backward() 호출 시, 변화도 버퍼에 데이터가 계속 누적한 것을 초기화
            optimizer.zero_grad()

            hypothesis = model(input_features)

            cost = loss_func(hypothesis, labels)

            # 역전파 수행
            cost.backward()
            optimizer.step()

            # 현재 batch의 스텝 별 loss 저장
            costs.append(cost.data.item())

        # 에폭마다 평균 비용 출력하고 모델을 저장
        print("Average Loss= {0:f}".format(np.mean(costs)))
        torch.save(model.state_dict(), os.path.join(config["output_dir"], "epoch_{0:d}.pt".format(epoch)))
        do_test(model, train_dataloader)


In [4]:
if(__name__=="__main__"):

    root_dir = "/gdrive/My Drive/colab/mlp/weltried"
    output_dir = os.path.join(root_dir, "output")
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)

    config = {"mode": "train",
              "model_name":"epoch_{0:d}.pt".format(10),
              "output_dir":output_dir,
              "input_node": 6,
              "hidden_node":,
              "output_node":,
              "learn_rate":,
              "batch_size":,
              "epoch":10,
              }

    if(config["mode"] == "train"):
        train(config)
    else:
        test(config)

SyntaxError: invalid syntax (Temp/ipykernel_2176/1595566699.py, line 12)