### inference.ipynb

inference.ipynb은 아래와 같은 기능이 코드로 구현되어 있습니다.
1. requirements : 필요 라이브러리
2. arguments : 필요 설정 값
3. data load : 추론용 데이터 로드
4. model load : 학습 파이프라인을 통해 저장된 AI 모델 로드
5. model inference : 추론용 데이터 대상으로 AI 모델 예측값 산출
6. result save : 필요한 추론 결과물 저장

### requirements

In [4]:
import os
import argparse
import pandas as pd
import numpy as np
import joblib

from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier

from sklearn.metrics import accuracy_score, f1_score

### arguments

In [5]:
parser = argparse.ArgumentParser(description='classification using wine data')

# base
parser.add_argument('--ckpt_dir', type=str, default='./save_dir', help='모델 저장 경로')

# data
parser.add_argument('--data_dir', type=str, default='./dataset', help='데이터 경로')
parser.add_argument('--file_name', type=str, default='inference', help='데이터 파일 이름')

# model name
parser.add_argument('--model_file', type=str, default='best_model.joblib', help='저장된 모델 파일명')


args = parser.parse_args('')  # running in ipynb

### data load

In [6]:
# 데이터셋 로드
data = pd.read_csv(os.path.join(args.data_dir, f'{args.file_name}.csv'))

# 데이터셋 샘플 확인
data.head(3)

Unnamed: 0,fixed acidity,volatile acidity,citric acid,residual sugar,chlorides,free sulfur dioxide,total sulfur dioxide,density,pH,sulphates,alcohol
0,7.7,0.27,0.68,3.5,0.358,5.0,10.0,0.9972,3.25,1.08,9.9
1,7.3,0.735,0.0,2.2,0.08,18.0,28.0,0.99765,3.41,0.6,9.4
2,5.4,0.74,0.09,1.7,0.089,16.0,26.0,0.99402,3.67,0.56,11.6


### model load

In [9]:
model = joblib.load(os.path.join(args.ckpt_dir, "model", args.model_file))

### model inference

In [21]:
prediction = model.predict(data)
predict_probability = model.predict_proba(data)
class_probability = np.max(predict_probability, axis=1)

In [22]:
data['pred_class'] = prediction
data['pred_proba'] = class_probability

### result save

In [25]:
output_dir = os.path.join(args.ckpt_dir, "output")
os.makedirs(output_dir, exist_ok=True)

data.to_csv(os.path.join(output_dir, "results.csv"))