In [1]:
# 사용 상의 편의를 위한 Initial Setting

# 실행결과를 한 창에 표시
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

# numpy 소숫점 setting
import numpy as np
np.set_printoptions(precision=7)

# pandas이용하여 grid display
import numpy as np
import pandas as pd
pd.set_option('display.max_rows', None)         # 최대 표시 줄 수 제한 해제
pd.set_option('display.max_columns', None)  # 최대 표시 컬럼 수 제한 해제
pd.set_option('display.max_colwidth', -1)        # 컬럼내 데이터 표시 제한 해제

### Iris 품종 (Versicolor, Virginica, Setosa)
![title](./image/iris(1).jpg)

### Iris Petal(꽃잎) width / length 에 따른 Categorize
![title](./image/iris(2).jpg)

#### 출처 : http://articles.concreteinteractive.com/

In [2]:
# from IPython.display import Image
# Image("./image/iris(1).jpg")
# Image("./image/iris(2).jpg")

In [3]:
# 사이킷런의  load_iris method를 import 하여 iris data, label을 얻음
from sklearn.datasets import load_iris
iris = load_iris()
iris_data = iris.data
iris_label = iris.target

In [4]:
# 사이킷런 의  train_test_split method를 import 하여 train_data : test_data = 6:4 의 비율로 split 함
from sklearn.model_selection import train_test_split
(train_data, test_data, train_label, test_label) = train_test_split(iris_data, iris_label, test_size=0.4)

In [5]:
# 전체 iris data의 shape을 확인 (150건의 row가 존재하고, 각 row에는  다음과 같이 붓꽃의 꽃잎과 꽃받침의  length, width 임
# iris_data shape : (150 , 4)      --> 전체 150 건의 Data,  [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’] 로 구성
# train_data shape : (90 , 4)     --> 전체의 60%인 90 row의 Data, [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’] 로 구성
# test_data shape : (60 , 4)       --> 전체의 40%인 60 row의 Data, [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’] 로 구성
# train_label shape : (90,)         --> 전체의 60%인 90 row의 Data, 각 Data는 0, 1, 2 중 하나로 구성 (0:Setosa, 1:Versicolor, 2:Virginica)
# test_label shape : (60,)           --> 전체의 40%인 60 row의 Data, 각 Data는 0, 1, 2 중 하나로 구성 (0:Setosa, 1:Versicolor, 2:Virginica)
#------------------------------------------------------------------------------------------------------------------------------------------------------------------------
#  Train/Test Data : [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]    * sepal: 꽃받침 / petal: 꽃잎
#  Train/Test Label :   0: Setosa
#                                   1: Versicolor
#                                   2: Virginica
#------------------------------------------------------------------------------------------------------------------------------------------------------------------------

iris_data.shape
train_data.shape
test_data.shape
train_label.shape
test_label.shape

(150, 4)

(90, 4)

(60, 4)

(90,)

(60,)

In [13]:
# Network에 주입하기 위해 train_label, test_label을 one-hot-encoding 형식으로 변환
from keras.utils import to_categorical
train_labels = to_categorical(train_label)
test_labels = to_categorical(test_label)

In [7]:
# keras를 import 하고, 계층을 선형적으로 쌓는 sequential 모델을 사용
# add method를 이용하여 쉽게 layer를 쌓을 수 있음
# 활성화 함수는 relu를 사용하고, input shape는 4개의 iris sepal/petal의 length/width 임 
# 즉, [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]    * sepal: 꽃받침 / petal: 꽃잎)
# 출력함수로 softmax 함수를 이용, 4개의 입력 값을 0~1 사이의 값으로 정규화 하고, argmax method를 이용하여 one-hot encoding

from keras import models
from keras import layers

network = models.Sequential()
network.add(layers.Dense(64, activation='relu', input_shape=(4,)))
# 입력층 : 입력 parameter는 4이고, 출력 parameter는 64 임, 활성화 함수는 relu
# 즉 [‘sepal length (cm)’, ‘sepal width (cm)’, ‘petal length (cm)’, ‘petal width (cm)’]

network.add(layers.Dense(64, activation='relu'))
# 은닉층 : 입력 parameter는 64(이전 layer의 출력)이고, 출력 parameter는 64 임, 활성화 함수는 relu

network.add(layers.Dense(3, activation='softmax'))
# 출력층 : 입력 parameter는 64(이전 layer의 출력) 이고, 출력 parameter는 3임, 활성화 함수는 softmax
# 즉  0: Setosa, 1: Versicolor, 2: Virginica

In [8]:
network.summary()

Model: "sequential_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
dense_1 (Dense)              (None, 64)                320       
_________________________________________________________________
dense_2 (Dense)              (None, 64)                4160      
_________________________________________________________________
dense_3 (Dense)              (None, 3)                 195       
Total params: 4,675
Trainable params: 4,675
Non-trainable params: 0
_________________________________________________________________


In [9]:
# compile method를 이용하여 학습 과정을 구성
# 옵티마이저는 Adam을사용하고, 손실함수는 교차 엔트로피 오차(Cross Entropy Error) 함수를 이용

network.compile(optimizer='Adam', loss='categorical_crossentropy', metrics=['accuracy'])

In [10]:
# fit method를 이용해서 정해진 epoch 만큼  Training을 수행
# 이때 위에서 재 정의한 train_data, train_label을 주입하고, epoch를 지정

network.fit(train_data, train_labels, epochs=40)


Epoch 1/40
Epoch 2/40
Epoch 3/40
Epoch 4/40
Epoch 5/40
Epoch 6/40
Epoch 7/40
Epoch 8/40
Epoch 9/40
Epoch 10/40
Epoch 11/40
Epoch 12/40
Epoch 13/40
Epoch 14/40
Epoch 15/40
Epoch 16/40
Epoch 17/40
Epoch 18/40
Epoch 19/40
Epoch 20/40
Epoch 21/40
Epoch 22/40
Epoch 23/40
Epoch 24/40
Epoch 25/40
Epoch 26/40
Epoch 27/40
Epoch 28/40
Epoch 29/40
Epoch 30/40
Epoch 31/40
Epoch 32/40
Epoch 33/40
Epoch 34/40
Epoch 35/40
Epoch 36/40
Epoch 37/40
Epoch 38/40
Epoch 39/40
Epoch 40/40


<keras.callbacks.callbacks.History at 0x7f41a9902fd0>

In [11]:
# evaluate method를 이용하여 입력 test data에 대한 loss, accuracy를 계산
test_loss, test_acc = network.evaluate(test_data, test_labels)



In [12]:
print('test_acc : ', test_acc)
print('test_loss : ', test_loss)

test_acc :  0.9666666388511658
test_loss :  0.23805705606937408
