### DNN 기반 다중분류 모델 구현
* 데이터셋 : iris.csv
* Feature : 4개 Sepal_Length, Sepal_Width, Petal_Length, Petal_Width
* Target : 1개 Variety
* 학습-방법 : 지도학습 > 분류 > 다중분류(클래스 3개)
* 알고리즘 : 인공신경망(ANN) => MLP,DNN : 은닉층이 많은 구성
* 프레임워크 : Pytorch

[1] 모듈 로딩 및 데이터 준비
<hr>

In [84]:
# 모델 관련 모듈 로딩
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
import torch.optim as optim
from torchmetrics.classification import MulticlassF1Score
from torchinfo import summary

# Data 관련 모듈 로딩
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import *
from sklearn.model_selection import train_test_split

In [85]:
# 활용 패키지 버전 체크
print(f'Pytorch V. {torch.__version__}')
print(f'Pandas V. {torch.__version__}')

Pytorch V. 2.4.1
Pandas V. 2.4.1


In [86]:
# 데이터 로딩
DATA_FILE = '../data/iris.csv'

# CSV => DataFrame
irisDF = pd.read_csv(DATA_FILE)

# 데이터 확인
irisDF.head(1)

Unnamed: 0,sepal.length,sepal.width,petal.length,petal.width,variety
0,5.1,3.5,1.4,0.2,Setosa


In [87]:
# 타겟 변경 => 정수화, 클래스 3개
irisDF['variety'].unique()

array(['Setosa', 'Versicolor', 'Virginica'], dtype=object)

In [88]:
labels = dict(zip(irisDF['variety'].unique().tolist(),range(3)))
print(f'labels => {labels}')

irisDF['variety'] = irisDF['variety'].replace(labels)
irisDF.head(1)

labels => {'Setosa': 0, 'Versicolor': 1, 'Virginica': 2}


Unnamed: 0,sepal.length,sepal.width,petal.length,petal.width,variety
0,5.1,3.5,1.4,0.2,0


[2] 모델 클래스 설계 및 정의
<hr>


* 클래스 목적 : iris 데이터를 학습 및 추론 목적
* 클래스 이름 : IrisMCFModel
* 부모 클래스 : nn.Module
* 매개변수 : 층별 입출력 개수 고정하기때문에 필요 없음
* 속성필드 : 
* 기능 역할 : __init__(): 모델 구조, forward() : 순방향 학습 <= 오버라이딩
* 클래스구조
- 클래스구조
    * 입력층 : 입력  4개(피처)  출력 10개(퍼셉트론/뉴런 10개 존재)
    * 은닉층 : 입력 10개        출력 5개(퍼셉트론/뉴런 5개 존재)
    * 출력층 : 입력  5개        출력 3개(퍼셉트론/뉴런 개 존재 : 다중분류)
- 활성화함수
    * 클래스형태 => nn.MESLoss, nn.ReLU => __init__() 메서드
    * 함수형태 => torch.nn.fuctional 아래에 => forward() 메서드

In [89]:
class IrisMCFModel(nn.Module):

    # 모델 구조 구성 및 인스턴스 생성 메서드
    def __init__(self):
        super().__init__()

        self.in_layer = nn.Linear(4,10)
        self.hd_layer = nn.Linear(10,5)
        self.out_layer = nn.Linear(5,3) # 다중분류

    # 순방향 학습 진행 메서드
    def forward(self,x):
        y = F.relu(self.in_layer(x))
        y = F.relu(self.hd_layer(x))
        return self.out_layer(y)


In [90]:
# 모델 인스턴스 생성
model = IrisMCFModel()
print(model)

IrisMCFModel(
  (in_layer): Linear(in_features=4, out_features=10, bias=True)
  (hd_layer): Linear(in_features=10, out_features=5, bias=True)
  (out_layer): Linear(in_features=5, out_features=3, bias=True)
)


In [91]:
# 모델 사용 메모리 정보 확인
# summary(model, input_size=(1000,4))

[3] 데이터셋 클래스 설계 및 정의
<hr>

* 데이터셋 : iris.csv
* 피쳐개수 : 4개
* 타겟개수 : 1개
* 클래스이름 : IrisDataset
* 부모클래스 : utils.data.Dataset
* 속성필드 : featureDF, targetDF, n_rows, n_featuers
* 필수 메서드
    - __init__(self) : 데이터셋 저장 및 전처리, 개발자가 필요한 속성 설정
    - __len__(self) : 데이터의 개수 반환
    - __getitem__(self,index) : 특정 인덱스의 피쳐와 타겟 반환

In [92]:
class IrisDataset(Dataset):

    def __init__(self,featureDF,targetDF):
        self.featureDF = featureDF
        self.targetDF = targetDF
        self.n_rows = featureDF.shape[0]
        self.n_features = featureDF.shape[1]

    def __len__(self):
        return self.n_rows
    
    def __getitem__(self,index):
        # 넘파이를 텐서로
        featureTS = torch.FloatTensor(self.featureDF.iloc[index].values)
        targetTS=torch.FloatTensor(self.targetDF.iloc[index].values)     
        # 피쳐와 타넷 변환
        return featureTS, targetTS

[3-1] 데이터셋 인스턴스 생성
<hr>

In [93]:
# 피쳐, 타겟 추출
featureDF, targetDF = irisDF[irisDF.columns[:-1]], irisDF[irisDF.columns[-1:]]
print(f'featureDF => {featureDF.shape}, targetDF => {targetDF.shape}')

# 데이터셋 인스턴스 생성
irisDS=IrisDataset(featureDF,targetDF)

featureDF => (150, 4), targetDF => (150, 1)


[4] 학습 준비
* 학습 횟수 : EPOCH <= 처음부터 끝까지 학습하는 단위
* 배치 크기 : BATCH_SIZE <= 한번에 학습할 데이터셋 양
* 위치 지정 : DEVICE <= 텐서 저장 및 실행 위치(GPU/CPU)
* 학습률 : LR 가중치와 절편 업데이트 시 경사하강법으로 업데이트 간격 설정 0.001 ~ 0.1

In [94]:
# 학습 진행 관련 설정
EPOCH = 1000
BATCH_SIZE = 10
BATCH_CNT=irisDF.shape[0]/BATCH_SIZE
DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu'
LR = 0.001

* 인스턴스/객체 : 모델, 데이터셋, 최적화(+ 손실함수, 성능지표)

In [95]:
# 모델 인스턴스
model = IrisMCFModel()

# 데이터셋 인스턴스

# 학습용, 검증용, 테스트용 데이터 분리
X_train,X_test,y_train,y_test = train_test_split(featureDF,targetDF,random_state=1)
X_train,X_val, y_train,y_val = train_test_split(X_train,y_train,random_state=1)
print(f'{X_train.shape} {X_test.shape} {X_val.shape}')
print(f'{y_train.shape} {y_test.shape} {y_val.shape}')

trainDS = IrisDataset(X_train,y_train)
valDS = IrisDataset(X_val,y_val)
testDS = IrisDataset(X_test,y_test)

# 데이터로드 인스턴스
trainDL = DataLoader(trainDS, batch_size = BATCH_SIZE)

(84, 4) (38, 4) (28, 4)
(84, 1) (38, 1) (28, 1)


* 최적화, 손실함수 인스턴스 생성

In [96]:
# 최적화 인스턴스 => W, b 텐서 즉, model.parameters() 전달
optimizer = optim.Adam(model.parameters(),lr=LR)

# 손실함수 인스턴스 => 분류 => 다중분류 CrossEntropyLoss
#                            예측값은 선형식 결과값으로 전달 => AF 처리 X
croosLoss = nn.CrossEntropyLoss()

[5] 학습 준비

In [98]:
len(trainDL), trainDL.__len__()

(9, 9)

In [None]:
# 학습의 효과 확인 손실값과 성능평가값 저장 필요
LOSS_HISTORY, SCORE_HISTORY =[[],[]],[[],[]]

for epoch in range(1,EPOCH+1):
    # 학습 모드로 모델 설정
    model.train()

    # 배치크기 만큼 데이터 로딩해서 학습 진행
    
    for featureTS, targetTS in trainDL:
        