# 다층 퍼셉트론 (Multi-Layer Perceptron : MLP) 
### with Classification(분류)

 - 목적) 
     회귀파트에서 연습한 MLP 모델을 만들어 Classification(분류) 문제에 적용해 본다.
     
## MLP의 Classification Task(분류 과업) 적용
 
 - Classification Task : 머신러닝에서 예측하고자하는 변수(y)가 카테고리 속성을 가질
                         때(categorical)를 일컫는다.
                         
 * 예로 이미지 분류, 이탈/잔존(churn/retention) 예층 등에 적합.
 
분류 과업에서 loss function은 Cross-Entropy(혹은 Softmax) loss가 흔히 사용되며 평가 지표(evaluation metric)로는 정확도(accuracy)가 널리 사용된다.

## Breast Cancer 데이터 셋 불러오기

In [5]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

whole_data = load_breast_cancer()

x_data = whole_data.data
y_data = whole_data.target

# 학습 데이터 : 검증 데이터 = 0.7 : 0.3 으로 설정
x_train, x_test, y_train, y_test = train_test_split(
    x_data, y_data, test_size = 0.3, random_state = 7)

print(x_train.shape, x_test.shape, y_train.shape, y_train.shape)

(398, 30) (171, 30) (398,) (398,)


## Model 생성 및 Layer 추가

회귀 파트와 동일;

In [12]:
from keras.models import Sequential
from keras.layers import Activation, Dense

model = Sequential()

# input layer
model.add(Dense(10, input_shape = (30,), activation = 'sigmoid'))

# hidden layer (first)
model.add(Dense(10, activation = ('sigmoid')))

# hidden layer (second)
model.add(Dense(10, activation = ('sigmoid')))

# output layer
model.add(Dense(1, activation = ('sigmoid')))

## Model 컴파일 및 출력

 위에서 언급한것과 같이 loss function과 optimizer를 각각 Cross-Entropy와
 accuracy로 설정한다.

In [13]:
from keras import optimizers

# stochastic gradient descent optimizer
sgd = optimizers.SGD(lr = 0.01)

model.compile(
    optimizer = sgd,
    loss = 'binary_crossentropy',
    metrics = ['acc']
)

model.summary()

Model: "sequential_3"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_3 (Dense)              (None, 10)                310       
_________________________________________________________________
dense_4 (Dense)              (None, 10)                110       
_________________________________________________________________
dense_5 (Dense)              (None, 10)                110       
_________________________________________________________________
dense_6 (Dense)              (None, 1)                 11        
Total params: 541
Trainable params: 541
Non-trainable params: 0
_________________________________________________________________


## Model 학습

In [14]:
model.fit(
    x_train, 
    y_train, 
    batch_size = 50,
    epochs = 100,
    verbose = 1
)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


<tensorflow.python.keras.callbacks.History at 0x7f80fe1ecf10>

## Model 평가

 - Regression(회귀)에서는 손실과 오차를 결과로 반환하지만 classification(분류) 문제
   에서는 손실과 정확도(accuracy)로 평가하는 것에 유의

In [17]:
result = model.evaluate(x_test, y_test)

print(model.metrics_names)
print(result)

print('loss     : ', result[0])
print('accuracy : ', result[1])

['loss', 'acc']
[0.6394336819648743, 0.6783625483512878]
loss     :  0.6394336819648743
accuracy :  0.6783625483512878
