# 문제 유형별 MLP 네트워크
- MLP(Multi Layer Perceptron), ANN(Artificial Neural Network), DNN (Deep Neural Network)
    - Fully Connected Layer(Dense)로 구성된 네트워크

# Regression(회귀)

## Boston Housing Dataset
보스턴 주택가격 dataset은 다음과 같은 속성을 바탕으로 해당 타운 주택 가격의 중앙값을 예측하는 문제.
- CRIM: 범죄율
- ZN: 25,000 평방피트당 주거지역 비율
- INDUS: 비소매 상업지구 비율
- CHAS: 찰스강에 인접해 있는지 여부(인접:1, 아니면:0)
- NOX: 일산화질소 농도(단위: 0.1ppm)
- RM: 주택당 방의 수
- AGE: 1940년 이전에 건설된 주택의 비율
- DIS: 5개의 보스턴 직업고용센터와의 거리(가중 평균)
- RAD: 고속도로 접근성
- TAX: 재산세율
- PTRATIO: 학생/교사 비율
- B: 흑인 비율
- LSTAT: 하위 계층 비율
<br><br>
- **Target**
    - MEDV: 타운의 주택가격 중앙값(단위: 1,000달러)

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers

import numpy as np
import matplotlib.pyplot as plt

from sklearn.preprocessing import StandardScaler

import random

In [None]:
# random seed값 설정
tf.random.set_seed(0)
np.random.seed(0)
random.seed(0)

##### 데이터 로딩

In [None]:
(train_X, y_train), (test_X, y_test) = keras.datasets.boston_housing.load_data()
print(train_X.shape, y_train.shape)
print(test_X.shape, y_test.shape)

In [None]:
print(train_X[0])
print(y_train[0])

##### 하이퍼파라미터, 변수 정의
- 하이퍼파라미터와 중복되서 사용할 변수들을 미리 모아서 정의하면 관리하기 편리하다.

In [None]:
#하이퍼파라미터 변수

# 학습율 => 파라미터 업데이트시 계산된 gradient를 파라미터에 적용할 비율. 0 ~ 1 사이 실수를 지정한다. optimizer 생성때 설정.
LEARNING_RATE = 0.001  
N_EPOCH = 100 # 에폭수
N_BATCH = 200 # Train 배치사이즈

##### X, y 전처리
- MLP는 선형모델을 기반으로 하므로 Feature scaling을 해준다.

In [None]:
scaler = StandardScaler()
X_train = scaler.fit_transform(train_X)
X_test = scaler.transform(test_X)

##### 모델 구현

1. 모델 객체 생성 - Sequential
2. 모델에 Layer들 추가
    - Input Layer 추가
        - 입력 데이터의 shape을 지정한다.
        1. InputLayer 객체를 생성해서 추가한다.
        2. 첫번째 Hidden Layer에 input_shape 매개변수에 shape을 지정하여 추가한다.
    - Hidden Layer들 추가
        - Layer의 개수와 Layer의 Unit의 개수는 튜닝대상으로 성능에 영향을 준다.
        - 활성함수는 ReLU 를 사용한다.
        - Layer의 개수와 Unit 개수가 많을 수록 복잡한 모델, 적을 수록 단순한 모델이된다.
    - Output Layer 추가
        - 풀려는 문제에 따라 unit개수와 활성함수를 지정한다.

In [None]:
def get_model_boston(lr=0.01):
    model = keras.Sequential()
   
    model.add(layers.Dense(units=32, activation='relu', input_shape=(13, )))
    model.add(layers.Dense(units=16, activation='relu'))
    model.add(layers.Dense(units=8, activation='relu'))
    

    # 집값 한개의 값을 추론하므로 unit수를 1로 지정. 
    model.add(layers.Dense(units=1))
    
    # 컴파일
    # optimizer를 파라미터값들을 모두 default로 설정해서 생성할 경우 문자열로 지정. ("adam")    
    model.compile(optimizer=keras.optimizers.Adam(learning_rate=lr),
                  loss='mse')
    return model

In [None]:
model_boston = get_model_boston()

# 딥러닝 모델의 구조 확인
model_boston.summary()

In [None]:
keras.utils.plot_model(model_boston, show_shapes=True)

##### 학습(Train)

In [None]:
hist = model_boston.fit(X_train, 
                        y_train,
                        epochs=N_EPOCH, 
                        batch_size=N_BATCH,
                        validation_split=0.2
                        
                        )

##### 결과 시각화
- 학습 시 epoch별 검증 결과를 시각화한다.

In [None]:
hist.history.keys()

In [None]:
# hist.history : 에폭별 검증 결과
# hist.epoch : 에폭리스트
plt.plot(hist.epoch, hist.history['loss'], label='Train set')
plt.plot(hist.epoch, hist.history['val_loss'], label='Validation set')

plt.title('Loss')
# plt.ylim(0, 30)
plt.legend()
plt.show()

##### 최종 테스트

In [None]:
loss = model_boston.evaluate(X_test, y_test)
print(loss)

##### 모델 네트워크 저장

In [None]:
import os
#### 전체 경로 안에 한글이 있으면 안된다.
saved_dir = 'saved_model/boston_model'

In [None]:
model_boston.save(saved_dir)

##### 새로운 데이터 추론

In [None]:
# 저장된 모델을 불러와서 추론
saved_model = keras.models.load_model(saved_dir)
saved_model.evaluate(X_test, y_test)

In [None]:
X_new = X_test[:5]
pred = saved_model.predict(X_new)
print(pred)

In [None]:
y_test[:5]

# 분류 (Classification)

## Fashion MNIST Dataset - 다중분류(Multi-Class Classification) 문제

10개의 범주(category)와 70,000개의 흑백 이미지로 구성된 [패션 MNIST](https://github.com/zalandoresearch/fashion-mnist) 데이터셋. 
이미지는 해상도(28x28 픽셀)가 낮고 다음처럼 개별 의류 품목을 나타낸다:

<table>
  <tr><td>
    <img src="https://tensorflow.org/images/fashion-mnist-sprite.png"
         alt="Fashion MNIST sprite"  width="600">
  </td></tr>
  <tr><td align="center">
    <b>그림</b> <a href="https://github.com/zalandoresearch/fashion-mnist">패션-MNIST 샘플</a> (Zalando, MIT License).<br/>&nbsp;
  </td></tr>
</table>

이미지는 28x28 크기이며 Gray scale이다. *레이블*(label)은 0에서 9까지의 정수 배열이다. 아래 표는 이미지에 있는 의류의 **클래스**(class)들이다.

<table>
  <tr>
    <th>class index</th>
    <th>class name</th>
  </tr>
  <tr>
    <td>0</td>
    <td>T-shirt/top</td>
  </tr>
  <tr>
    <td>1</td>
    <td>Trousers</td>
  </tr>
    <tr>
    <td>2</td>
    <td>Pullover</td>
  </tr>
    <tr>
    <td>3</td>
    <td>Dress</td>
  </tr>
    <tr>
    <td>4</td>
    <td>Coat</td>
  </tr>
    <tr>
    <td>5</td>
    <td>Sandal</td>
  </tr>
    <tr>
    <td>6</td>
    <td>Shirt</td>
  </tr>
    <tr>
    <td>7</td>
    <td>Sneaker</td>
  </tr>
    <tr>
    <td>8</td>
    <td>Bag</td>
  </tr>
    <tr>
    <td>9</td>
    <td>Ankle boot</td>
  </tr>
</table>

각 이미지는 하나의 레이블에 매핑되어 있다. 데이터셋에 클래스 이름이 들어있지 않기 때문에 나중에 이미지를 출력할 때 사용하기 위해 별도의 변수를 만들어 저장한다.

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models, optimizers

import numpy as np
import matplotlib.pyplot as plt

import os
import random

# seed 값 설정
random.seed(0)
np.random.seed(0)
tf.random.set_seed(0)

In [None]:
class_names = np.array(['T-shirt/top', 'Trousers', 'Pullover', 'Dress', 'Coat', 'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot'])

##### Data 로딩

In [None]:
(train_image, y_train), (test_image, y_test) = keras.datasets.fashion_mnist.load_data()
train_image.shape, y_train.shape, test_image.shape, y_test.shape

In [None]:
np.unique(y_train, return_counts=True)

##### validatation dataset set  분리
- Train set을 Train/validation set으로 분리

##### 이미지 확인

In [None]:
cnt = 25  # 확인할 이미지개수 (5배수)
plt.figure(figsize=(7,7))
for i in range(cnt):
    plt.subplot(5, int(cnt/5), i+1)
    plt.imshow(train_image[i], cmap='Greys')  # gray: 0-black, 255: white,  Greys: 0-white, 255-black
    label = class_names[y_train[i]]
    plt.title(label)
    
plt.tight_layout()
plt.show()

#### 하이퍼파라미터, 변수 설정

In [None]:
LEARNING_RATE = 0.001  # 학습률
N_EPOCH = 20          # 에폭수
N_BATCH = 1000         # 배치 사이즈

#### X, y  전처리
- y값 처리
    1. 다중 분류에서 label encoding 형식의 label을 one hot encoding 처리 ==> loss: categorical_crossentropy
    2. label encoding 형식의 label을 그대로 모델에 전달. => loss: sparse_categorical_crossentropy
        - one hot encoding 처리를 loss가 대신 한다.

- x값(이미지) 처리
    - dtype을 uint8에서 float32로 변환한다.
    - 0 ~ 1 정규화. X/255.0으로 나눈다.

In [None]:
X_train = train_image.astype('float32')/255.0
X_test = test_image.astype('float32')/255.0

In [None]:
print(train_image.min(), train_image.max())
print(X_train.min(), X_train.max())

In [None]:
X_train.shape, X_test.shape

##### 모델 생성 및 컴파일

In [None]:
def get_model_fashion(lr=0.01):
    model = keras.Sequential()
    
    model.add(layers.Flatten(input_shape=(28, 28)))
    
    # Dense Layer의 Unit개수는 점점 줄여나가는 패턴을 사용.
    model.add(layers.Dense(256, activation='relu'))
    model.add(layers.Dense(128, activation='relu'))
    model.add(layers.Dense(64, activation='relu'))
    model.add(layers.Dense(32, activation='relu'))
    
    # output layer
    ## class 별 확률을 출력해야하므로 activation은 softmax를 사용하고 fashion mnist class개수인 10을 unit개수로 지정한다.
    model.add(layers.Dense(10, activation='softmax', name='output'))
    
    # 컴파일
    # 다중분류 loss함수:
    #   y가 one hot encoding이 안된 경우: sparse_categorical_crossentropy  (원핫인코딩 후 loss를 계산한다.)
    #   y를 one hot encoding 한 경우: categorical_crossentropy
    model.compile(optimizer=optimizers.Adam(learning_rate=lr), 
                  loss='sparse_categorical_crossentropy',   
                  metrics=['accuracy']
                 )
    return model

In [None]:
model_fashion = get_model_fashion(LEARNING_RATE)
model_fashion.summary()

In [None]:
keras.utils.plot_model(model_fashion, show_shapes=True)

##### Train(학습)

In [None]:
hist = model_fashion.fit(X_train, y_train, epochs=N_EPOCH, batch_size=N_BATCH, validation_split=0.2)

##### 결과 시각화
- 학습 시 epoch별 검증 결과를 시각화한다.

In [None]:
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.plot(hist.epoch, hist.history['loss'], label="train")
plt.plot(hist.epoch, hist.history['val_loss'], label='validation')
plt.title('Loss')
plt.xlabel('Epoch')
plt.ylabel('loss')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(hist.epoch, hist.history['accuracy'], label='train')
plt.plot(hist.epoch, hist.history['val_accuracy'], label='validation')
plt.title('Accuracy')
plt.xlabel('Epoch')
plt.ylabel('accuracy')
plt.legend()

plt.tight_layout()
plt.show()

#### 최종평가

In [None]:
loss, acc = model_fashion.evaluate(X_test, y_test)

In [None]:
print(f"테스트결과: Loss: {loss}, 정확도: {acc}")

#### 모델저장

In [None]:
save_dir_fashion = 'saved_model/fashion_mnist_model'

In [None]:
model_fashion.save(save_dir_fashion)

#### 새로운 데이터 추론

In [None]:
# 저장된 모델을 loading해서 추론
saved_model_fashion = keras.models.load_model(save_dir_fashion)
saved_model_fashion.evaluate(X_test, y_test)

In [None]:
new_X = X_test[1000:1010]
new_X.shape

In [None]:
pred = saved_model_fashion.predict(new_X)
pred.shape

In [None]:
# 모델 추론결과에 대한 후처리 작업
## class, class name 조회
label = np.argmax(pred, axis=-1)
label_name = class_names[label]
## 확률 조회
proba = np.max(pred, axis=-1) 

In [None]:
for idx, (n, p) in enumerate(zip(label_name, proba), start=1):
    print(f"{idx}. {n} - {int(p*100)}%")

In [None]:
# 정답과 비교
class_names[y_test[1000:1010]]

## 위스콘신 유방암 데이터셋 - 이진분류(Binary Classification) 문제

- **이진 분류 문제 처리 모델의 두가지 방법**
    1. positive(1)일 확률을 출력하도록 구현
        - output layer: units=1, activation='sigmoid'
        - loss: binary_crossentropy
    2. negative(0)일 확률과 positive(1)일 확률을 출력하도록 구현 => 다중분류 처리 방식으로 해결
        - output layer: units=2, activation='softmax', y(정답)은 one hot encoding 처리
        - loss: categorical_crossentropy
        
- 위스콘신 대학교에서 제공한 종양의 악성/양성여부 분류를 위한 데이터셋
- Feature
    - 종양에 대한 다양한 측정값들
- Target의 class
    - 0 - malignant(악성종양)
    - 1 - benign(양성종양)

In [None]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models, optimizers

from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

import random
import numpy as np
import matplotlib.pyplot as plt

random.seed(0)
np.random.seed(0)
tf.random.set_seed(0)

##### 데이터 로딩, train/validation/test set 나누기

In [None]:
X, y = load_breast_cancer(return_X_y=True)
X.shape, y.shape

In [None]:
# Test set 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y, random_state=0)
# Train / Validation 분리
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.2, stratify=y_train, random_state=0)

In [None]:
X_train.shape, X_val.shape, X_test.shape

#### 하이퍼파라미터, 변수 정의

In [None]:
LEARNING_RATE = 0.001
N_EPOCH = 50
N_BATCH = 100

#### 데이터 전처리
- y (label) 처리
    - 이진 분류
        - 양성의 확률을 출력하도록 모델을 구성하는 경우 그대로 사용.
        - 양성일 확률, 음성일 확률을 출력하도록 모델을 구성하는 경우(다중분류 방식으로 처리) one hot encoding 처리한다.
- X (feature) 처리
    - 문자열(범주형): one hot encoding
    - 연속형(수치형): feature scaling

In [None]:
# Feature scaling
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_val_scaled = scaler.transform(X_val)
X_test_scaled = scaler.transform(X_test)

#### model 생성, 컴파일

In [None]:
from tensorflow.keras.metrics import Recall, Precision

def get_model_cancer(lr=0.01):
    model = keras.Sequential()
    
    #Hidden layer
    model.add(layers.Dense(32, activation='relu', input_shape=(30,)))
    model.add(layers.Dense(16, activation='relu'))
    
    # Output Layer
    # 이진분류(양성일 확률을 출력):
    ##  unit개수-1개(positive-양성일 확률), activation: "sigmoid(logistic)"
    model.add(layers.Dense(1, activation='sigmoid', name='output_layer'))
    
    # 컴파일 - 이진분류의 loss함수: binary_crossentropy
    model.compile(optimizer=optimizers.Adam(learning_rate=lr), 
                  loss='binary_crossentropy', 
                  metrics=['accuracy', Recall(), Precision()])  # Recall, Precision은 문자열을 지원안하므로 직접 객체생성한다.
    
    return model

In [None]:
model_cancer = get_model_cancer(LEARNING_RATE)
model_cancer.summary()

In [None]:
keras.utils.plot_model(model_cancer, show_shapes=True, to_file='model_cancer.png')

#### Train(학습)

In [None]:
hist = model_cancer.fit(X_train_scaled, y_train, epochs=N_EPOCH, batch_size=N_BATCH, validation_data=(X_val_scaled, y_val))

#### 결과 시각화

In [None]:
plt.figure(figsize=(10, 5))
plt.subplot(1, 2, 1)
plt.plot(hist.epoch, hist.history['loss'], label="train")
plt.plot(hist.epoch, hist.history['val_loss'], label='validation')
plt.title('Loss')

plt.xlabel('epoch')
plt.ylabel('loss')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(hist.epoch, hist.history['accuracy'], label='train')
plt.plot(hist.epoch, hist.history['val_accuracy'], label='validation')
plt.title('Accuracy')
plt.xlabel('epoch')
plt.ylabel('accuracy')
plt.legend()

plt.tight_layout()
plt.show()

#### 최종평가

In [None]:
loss, acc, recall, precision = model_cancer.evaluate(X_test_scaled, y_test)
print(loss, acc, recall, precision)

#### 모델저장

In [None]:
save_dir_path = 'saved_model/cancer_model'

In [None]:
model_cancer.save(save_dir_path)

#### 새로운 데이터 추론

In [None]:
saved_model = models.load_model(save_dir_path)
saved_model.evaluate(X_test_scaled, y_test)

In [None]:
new_X = X_test_scaled[:10]
pred = saved_model.predict(new_X)
pred.shape

##### 모델출력결과 후처리

In [None]:
np.where(pred >= 0.5, '양성- 1', '악성- 0')

In [None]:
np.where(y_test[:10] == 1, "양성", "악성")