# Business Understanding

비지니스의 이해를 통해 풀어야 할 문제에 대한 정의와 프로젝트의 목표 및 결과를 설정.

## Business Problem

우편물 분류에 우편 번호를 현재는 사람을 통해서 분류하고 있어 시간과 비용이 많이 들고 있음.

자동 우편 분류를 위한 프로젝트를 진행 중이며, 해당 프로젝트에서 우편 번호 6자리의 위치 및 사진 촬영을 자동화하였음.

## Project Objective

촬영된 우편 번호 숫자 0~9를 판별.

## Project Outcome

* 숫자 판별을 위한 모델
  * Accuracy: 90% 이상
* 진행 중인 프로젝트와 연동을 위한 인터페이스

# Analytic Approach

통계, 머신러닝 기술을 이용하여 프로젝트 결과를 위한 접근방법 정의.

이 프로젝트는 손 글씨 사진을 0~9 숫자로 판별하는 Classification 문제임.

주요 Classification Method

* XGboost, RandomForest, DNN, CNN

# Data Requirements

데이터 모델링에 사용될 알고리즘에 따라 필요한 데이터의 요구 사항정의.

손 글씨 분류를 위해 0~9 각 클래스에 대한 램덤 샘플링된 5천개 이상의 데이터가 필요함.

# Data Collection

데이터 모델링에 사용될 데이터 Raw Data 수집 방법 정의.

자동 우편 분류 프로젝트에서 AWS 상에 램덤 샘플 데이터를 제공.

매일 AWS 상에 제공된 데이터를 다운 받아 데이터 모델링에 사용.

* Collecting Raw Data
  * Srouce: ./src/backend/crd.ipynb
 
# Data Understanding

제공된 데이터에 대한 통계적, 시각적 방법을 통해 초기 데이터를 이해.

이를 토대로 다른 분석 프로세스의 방향과 추가 필요 사항들에 대한 영향을 줌.

* Exploratory Data Analysis 
  * Source: ./src/backend/eda.ipynb, eda-tsne.ipynb

# Data Preparation

Data Collection 을 통해 수집된 Raw Data 를 각 모델에서 필요한 입력 데이터 형태에 맞게 변형.

* ETL(Extract Transform Load)
  * Source: ./src/backend/etl-dnn.ipynb, etl-rf.ipynb

# Data Modeling

Data Preparation 을 통해 제공된 훈련용 입력 데이터를 이용해 데이터 모델 훈련.

* Fit Data Model
  * Source: ./src/backend/fdm-dnn.ipynb, fdm_dnn_model.py

# Model Evaluation

Data Modeling 을 통해 훈련된 모델을 이용해 테스트 데이터에 대한 모델 성능을 평가.

* Evaluate Data Model
  * Source: ./src/backend/edm-dnn.ipynb

# Build Data Product

최종 선택된 데이터 모델을 이용하여 Data Product 을 구축.

* Frontend
  * Source: ./src/frontend
* Backend
  * Data Pipeline
    * Source: ./src/backend/edp.py
    * Execute: daily
    * DAG Id: MNIST-edp
    * Task Id: crd -> etl-dnn -> fdm-dnn 
  * REST API
    * Source: ./src/backend/sdm.py, sdm_dnn.py
* Run
```
./skp.sh docker_run_nginx --set NAME="nginx-skp-mnist",PORT="7180",VOLUME="/root/mnt/dfs/notebooks-skp/mnist"
./skp.sh docker_run_flask --set NAME="flask-skp-mnist",PORT="7190",VOLUME="/root/mnt/dfs/notebooks-skp/mnist"
```

# Feedback
