##### DNN 기반 회귀 모델 구현 + 학습 진행 모니터링
- 데이터 : iris.csv
- 피처/속성 : 3개 Sepal.Length, Sepal.Width, Petal.Length
- 타겟/라벨 : 1개 Petal.Width
- 학습-방법 : 지도학습 > 회귀
- 학습 알고리즘 : 인공신경망(ANN) -> 심층 신경망 (MLP, DNN) : 은닉층이 많은 구성
- 프레임워크 : Pytorch
- - -
- 모니터링
    * 기준 : 검증 데이터셋의 loss 또는 score
    * 평가 : 학습 데이터셋의 loss 또는 score와 비교해서 학습 중단여부 결정
    * 선택 : 현재까지 진행된 모델의 파라미터(가중치, 절편) 저장 여부 또는 모델 전체 저장

[1] 모듈 로딩 및 데이터 준비 <hr>

In [1]:
# 모듈 로딩
# 모델 관련 모듈
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import Dataset, DataLoader
import torch.optim as optim
from torchmetrics.regression import R2Score, MeanSquaredError
from torchinfo import summary

# 데이터 및 시각화 관련 모듈
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.preprocessing import *
from sklearn.model_selection import train_test_split

In [2]:
# 활용 패키지 버전 체크 ==> 사용자 정의 함수로 구현하기~~~
print(f'Pytorch v.{torch.__version__}')
print(f'Pandas v.{pd.__version__}')

Pytorch v.2.4.1
Pandas v.2.0.3


In [3]:
### 데이터 로딩
DATA_FILE = '../../ML/Data/iris.csv'

### CSV => DataFrame
irisDF = pd.read_csv(DATA_FILE, usecols=[0,1,2,3])

### 확인
irisDF.head(1)

Unnamed: 0,sepal.length,sepal.width,petal.length,petal.width
0,5.1,3.5,1.4,0.2


[2] 모델 클래스 설계 및 정의 <hr>
- 클래스 목적 : iris 데이터를 학습 및 추론 목적
- 클래스 이름 : IrisRegModel
- 부모 클래스 : nn.Module
- 매 개 변 수 : 층별 입출력 개수 고정하므로 필요 없음
- 속성 / 필드 :
- 기능 / 역할 : __init__() : 모델 구조 설정, forward() : 순방향 학습 <=오버라이딩(상속관계에서만 가능)
- 클래스 구조
    * 입력층 : 입력 3개(피처 개수) / 출력 10개(퍼셉트론/뉴런 개수 10개)
    * 은닉층 : 입력 10개          / 출력 30개
    * 출력층 : 입력 30개          / 출력 1개(너비값)
- - -
- 손실함수 / 활성화 함수
    * 클래스 형태 ==> nn.MESLoss, nn.ReLU ==> __init__() 메서드
    * 함수 형태 ==> torch.nn.fuctional 아래에 ==> forward() 메서드

In [4]:
class IrisRegModel(nn.Module):
    # 모델 구조 구성 및 인스턴스 생성 메서드
    def __init__(self):
        super().__init__()
        self.in_layer = nn.Linear(3,10)
        self.hidden_layer = nn.Linear(10,30)
        self.out_layer = nn.Linear(30,1)

    #순방향 학습 진행 메서드
    def forward(self,x) : 
        # 입력층
        y = self.in_layer(x)    # 
        y=F.relu(y)             # relu 값의 범위 : 0<=y / 시그모이드 : 0~1
        # 은닉층 : 10개 숫자의 값(>=0)
        y = self.hidden_layer(y)
        y = F.relu(y)
        # 출력층 : 30개 숫자값 / 회귀이므로 바로 반환
        return self.out_layer(y)

In [5]:
# 모델 인스턴스 생성
model = IrisRegModel()
print(model)

IrisRegModel(
  (in_layer): Linear(in_features=3, out_features=10, bias=True)
  (hidden_layer): Linear(in_features=10, out_features=30, bias=True)
  (out_layer): Linear(in_features=30, out_features=1, bias=True)
)


In [6]:
# 모델 사용 메모리 정보 확인
summary(model, input_size=(1500,3))

Layer (type:depth-idx)                   Output Shape              Param #
IrisRegModel                             [1500, 1]                 --
├─Linear: 1-1                            [1500, 10]                40
├─Linear: 1-2                            [1500, 30]                330
├─Linear: 1-3                            [1500, 1]                 31
Total params: 401
Trainable params: 401
Non-trainable params: 0
Total mult-adds (M): 0.60
Input size (MB): 0.02
Forward/backward pass size (MB): 0.49
Params size (MB): 0.00
Estimated Total Size (MB): 0.51

[3] 데이터셋 클래스 설계 및 정의 <hr>
- 데이터셋 : iris.csv
- 피처 개수 : 3개
- 타겟 개수 : 1개
- 클래스 이름 : IrisDataset
- 부모 클래스 : utils.data.Dataset
- 속성 / 필드 : featureDF, targetDF, n_rows, n_features
- 필수 메서드
    * _ _init_ _(self) : 데이터셋 저장 및 전처리, 개발자가 필요한 속성 설정
    * _ _len_ _(self) : 데이터의 개수 반환
    * _ _getItem_ _(self, index) : 특정 인덱스의 피처와 타겟 반환

In [7]:
class IrisDataset(Dataset):

    def __init__(self, featureDF, targetDF):
        self.featureDF = featureDF
        self.targetDF = targetDF
        self.n_rows = featureDF.shape[0]
        self.n_features = featureDF.shape[1]

    def __len__(self) : 
        return self.n_rows

    def __getitem__(self, index):
        # 텐서화
        feaureTS = torch.FloatTensor(self.featureDF.iloc[index].values)
        targetTS = torch.FloatTensor(self.targetDF.iloc[index].values)
        
        # 피처와 타겟 반환
        return feaureTS, targetTS

In [8]:
# 피처와 타겟 데이터 추출
featureDF = irisDF[irisDF.columns[:-1]]     # 2D (150,3)
targetDF = irisDF[irisDF.columns[-1:]]      # 2D (150,1)

In [9]:
## 커스텀데이터셋 인스턴스 생성
irisDS = IrisDataset(featureDF, targetDF)

[4] 학습 준비
- 학습 횟수 : EPOCH   <- 처음부터 끝까지 공부하는 단위
- 배치 크기 : BATCH_SIZE   <- 한번에 학습할 데이터셋 양
- 위치 지정 : DEVICE  <- 텐서 저장 및 실행 위치 (GPU/CPU)
- 학 습 율  : LR 가중치와 절편 업데이트 시 경사 하강법으로 업데이트 간격 설정 0.001~0.1 (하이퍼파라미터)

In [10]:
### 학습 진행 관련 설정
EPOCH = 1000
BATCH_SIZE = 10
BATCH_CNT = irisDF.shape[0]//BATCH_SIZE
DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu'
LR = 0.001

- 인스턴스/객체 : 모델, 데이터셋, 최적화 (, 손실함수, 성능지표)

In [11]:
# 모델 인스턴스
model = IrisRegModel()

# 데이터셋 인스턴스
X_train,X_test, y_train, y_test = train_test_split(featureDF, targetDF, random_state=1)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, random_state=1)
print(f'{X_train.shape} {X_test.shape} {X_val.shape}')
print(f'{y_train.shape} {y_test.shape} {y_val.shape}')

# irisDS = IrisDataset(X_train, y_train)
trainDS = IrisDataset(X_train, y_train)
valDS = IrisDataset(X_val, y_val)
testDS = IrisDataset(X_test, y_test)

# 데이터로더 인스턴스
# irisDL = DataLoader(irisDS, batch_size = BATCH_SIZE)

trainDL = DataLoader(trainDS, batch_size = BATCH_SIZE)

(84, 3) (38, 3) (28, 3)
(84, 1) (38, 1) (28, 1)


In [12]:
## [테스트] 데이터 로더
for feature, target in trainDS:
    print(feature.shape, target.shape)

torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Size([3]) torch.Size([1])
torch.Si

In [13]:
val_feaure_TS = torch.FloatTensor(valDS.featureDF.values)
val_target_TS = torch.FloatTensor(valDS.targetDF.values)

In [14]:
# 최적화 인스턴스 => W,b 텐서, 즉 model.parameters() 전달 - 최적화하는 이유 : 오차를 줄이기 위해서!
optimizer = optim.Adam(model.parameters(), lr=LR)

# 손실함수 인스턴스 => 회귀 : MSE, MAE, RMSE
reqLoss = nn.MSELoss()

[5] 학습 진행

In [15]:
## 학습의 효과 확인 - 손실값과 성능평가값 저장 필요
LOSS_HISTORY, SCORE_HISTORY = [[],[]], [[],[]]
CNT = irisDS.n_rows/BATCH_SIZE
print(f'CNT =>{CNT}')

## 학습 모니터링/스케줄링 설정 
# => LOSS_HISTORY, SCORE_HISTORY 활용
# => 임계 기준 : 10번
BREAK_CNT = 0
LIMIT_VALUE = 10

for epoch in range(EPOCH):
    # 학습 모드로 모델 성정
    model.train()

    # 배치크기만큼 데이터 로딩해서 학습 진행
    loss_total, score_total = 0,0
    for featureTS, targetTS in trainDL :
        # 학습 진행
        pre_y = model(featureTS)

        # 손실계산
        loss = reqLoss(pre_y, targetTS)
        loss_total += loss.item()

        # 성능평가 계산
        score = R2Score()(pre_y, targetTS)
        score_total += score.item()

        # 최적화 진행
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
    
    # 에포크 당 검증기능
    # 모델 검증 모드 설정
    model.eval()

    with torch.no_grad():
        # 검증용 데이터셋 생성
        val_feaure_TS = torch.FloatTensor(valDS.featureDF.values)
        val_target_TS = torch.FloatTensor(valDS.targetDF.values)
        # 평가
        pre_val = model(val_feaure_TS)
        # 손실 계산
        loss_val = reqLoss(pre_val, val_target_TS)
        # 성능 평가
        score_val = R2Score()(pre_val, val_target_TS)

    # 에포크 당 손실과 성능평가값 저장
    LOSS_HISTORY[0].append(loss_total/CNT)
    SCORE_HISTORY[0].append(score_total/CNT)
    LOSS_HISTORY[1].append(loss_val)
    SCORE_HISTORY[1].append(score_val)

    print(f'[{epoch}/{EPOCH}]\n- [TRAIN] LOSS : {LOSS_HISTORY[0][-1]} SCORE : {SCORE_HISTORY[0][-1]}')
    print(f'- [VALID] LOSS : {LOSS_HISTORY[1][-1]} SCORE : {SCORE_HISTORY[1][-1]}')

    # 학습 진행 모니터링/스케줄링 - 검증 DS 기준 (둘 중에 하나만 선택)
    # Loss 기준
    if len(LOSS_HISTORY[1]) > 1:
        if LOSS_HISTORY[1][-1] >= LOSS_HISTORY[1][-2] : BREAK_CNT += 1 
    # # Score 기준
    # if len(SCORE_HISTORY[1]) > 1:
    #     if SCORE_HISTORY[1][-1] <= SCORE_HISTORY[1][-2] : BREAK_CNT += 1 

    # 학습 중단 여부 설정
    if BREAK_CNT > LIMIT_VALUE :
        print(f'성능 및 손실 개선이 없어서 {epoch} EPOCH에 학습 중단')
        break

CNT =>15.0
[0/1000]
- [TRAIN] LOSS : 0.9731125593185425 SCORE : -1.5054145495096842
- [VALID] LOSS : 1.0822268724441528 SCORE : -0.6765443086624146
[1/1000]
- [TRAIN] LOSS : 0.5802696307500204 SCORE : -0.6624436140060425
- [VALID] LOSS : 0.5986190438270569 SCORE : 0.0726422667503357
[2/1000]
- [TRAIN] LOSS : 0.30159393946329754 SCORE : -0.05290663639704386
- [VALID] LOSS : 0.341534823179245 SCORE : 0.4709073305130005
[3/1000]
- [TRAIN] LOSS : 0.16641992529233296 SCORE : 0.2522382974624634
- [VALID] LOSS : 0.2787409722805023 SCORE : 0.5681851506233215
[4/1000]
- [TRAIN] LOSS : 0.13390209178129833 SCORE : 0.33330568472544353
- [VALID] LOSS : 0.2902851104736328 SCORE : 0.5503014326095581
[5/1000]
- [TRAIN] LOSS : 0.12963680922985077 SCORE : 0.34394738674163816
- [VALID] LOSS : 0.2734592854976654 SCORE : 0.5763673186302185
[6/1000]
- [TRAIN] LOSS : 0.11845826109250386 SCORE : 0.36492176055908204
- [VALID] LOSS : 0.23875007033348083 SCORE : 0.63013756275177
[7/1000]
- [TRAIN] LOSS : 0.10813

- 모델 저장 방법 <hr>
* 방법 1 : 모델 파라미터만 저장
* 방법 2 : 모델 설계 구조 및 파라미터까지 모두 저장

In [16]:
### 학습된 모델 파라미터 값 확인
model.state_dict()

OrderedDict([('in_layer.weight',
              tensor([[ 0.3657,  0.2113,  0.0178],
                      [-0.5264, -0.5307,  0.0451],
                      [-0.2152,  0.3263,  0.4237],
                      [-0.0765, -0.3207, -0.4920],
                      [ 0.1075, -0.4105,  0.2561],
                      [ 0.1449, -0.3029, -0.3980],
                      [-0.0579,  0.0276,  0.5546],
                      [ 0.3568, -0.4766,  0.3334],
                      [ 0.3347, -0.5861,  0.2508],
                      [ 0.1930, -0.5479, -0.2573]])),
             ('in_layer.bias',
              tensor([-0.0912,  0.5665, -0.5380, -0.3019,  0.3746,  0.4732,  0.4567, -0.6584,
                       0.1613,  0.0709])),
             ('hidden_layer.weight',
              tensor([[-0.2562,  0.0282, -0.1652, -0.2493, -0.2194,  0.0415, -0.0760, -0.2969,
                        0.0807, -0.0536],
                      [-0.1052, -0.1196,  0.4811,  0.2702,  0.1559, -0.0625,  0.2830,  0.3278,
                 

- [방법 1] 모델 파라미터, 즉 층별 가중치와 절편들

In [17]:
### models 폴더 아래 프로젝트 폴더 아래 모델 파일 저장
import os

# 저장 경로
SAVE_PATH = '../models/iris/'
# 저장 파일명
SAVE_FILE = 'model_train_wb.pth'

In [18]:
# 경로상 폴더 존재 여부 체크
if not os.path.exists(SAVE_PATH) : os.makedirs(SAVE_PATH)   # 폴더 / 폴더 / ...  하위폴더까지 생성

In [19]:
# 모델 저장
torch.save(model.state_dict(), SAVE_PATH+SAVE_FILE)

In [20]:
# 모델, 즉 가중치와 절편 로딩
# [1] 가중치와 절편 객체로 로딩
# [2] 모델의 state_dict 속성에 저장

# 읽기
wbTS = torch.load(SAVE_PATH+SAVE_FILE,weights_only=True)
print(type(wbTS))

<class 'collections.OrderedDict'>


In [21]:
# 모델 인스턴스에 저장
model2 = IrisRegModel()         # 층마다 W,b 초기화 
model2.load_state_dict(wbTS)

<All keys matched successfully>

In [22]:
print(model2)

IrisRegModel(
  (in_layer): Linear(in_features=3, out_features=10, bias=True)
  (hidden_layer): Linear(in_features=10, out_features=30, bias=True)
  (out_layer): Linear(in_features=30, out_features=1, bias=True)
)
