# Keras LIB
---
- Tensorflow 기반의 Keras 패키지
- 기본 데이터 Tensor타입
- 모델을 직접 설계/생성 해야함


In [231]:
import tensorflow as tf

In [232]:
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense
import numpy as np
import pandas as pd

In [233]:
from sklearn.datasets import load_iris

iris = load_iris()

data = iris['data']
target = iris['target']

print(data.shape, target.shape)

(150, 4) (150,)


In [234]:
from sklearn.preprocessing import OneHotEncoder

ohe = OneHotEncoder()
target1 = ohe.fit_transform(target.reshape(-1,1))

In [235]:
target2 = target1.toarray()

In [236]:
target2.shape

(150, 3)

## [1] 모델 구성

In [237]:
# 모델 객체 생성
model = Sequential(name="Hello_Model")

# l1 을 Dense로 구성
# 첫번째 층은 반드시 입력 정보 파라미터 설정 -> input_shape=()
# 각 노드는 4개 입력, 1개 출력
l1 = Dense(10, activation='relu', input_shape=(4,))

# l2, l3
l2 = Dense(30, activation='relu')

# 출력 layer
l3 = Dense(3, activation='softmax') 

# 모델에 입력
model.add(l1)
model.add(l2)
model.add(l3)

In [238]:
# 모델 구성 확인
model.summary()

Model: "Hello_Model"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_101 (Dense)           (None, 10)                50        
                                                                 
 dense_102 (Dense)           (None, 30)                330       
                                                                 
 dense_103 (Dense)           (None, 3)                 93        
                                                                 
Total params: 473
Trainable params: 473
Non-trainable params: 0
_________________________________________________________________


## [2] 모델 생성
---
- 손실함수, 최적화 기법, 성능평가항목 설정
- compile() 메서드
    * optimizer : str 타입의 최적화 기법명 입력 또는 객체(기본값X)
    * loss : 손실함수, str타입으로 이름 입력
        - 분류 : categorical_crossentropy, sparse_categorical_crossentropy, binary_crossentropy
        - 회귀 : mean_squared_error, mean_absolute_error
    * metrics : 모델 평가 항목
        - accuracy

In [239]:
model.compile(
    optimizer="adam",
    loss="categorical_crossentropy",
    metrics=['accuracy']
)

## [3] 학습
---
- fit() 메서드
    * 훈련용 데이터
    * 훈련용 타겟
    * epochs : 학습 횟수 (처음 - 끝까지)
    * batch size : 한번 학습량(기본:32)
    * validation_split / validation_data=(,) : 검증 데이터 설정
    * callbacks : 이벤트 처리 함수 목록 (예: 학습중단 이벤트, 모델 검증 및 저장 이벤트)
    * verbose : 학습과정 출력 여부 설정

In [240]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    data, target2, stratify=target, random_state=42
)

In [241]:
with tf.device('/device:GPU:0'):
    model.fit(
        X_train,
        y_train,
        epochs=100,
        batch_size=20,
        validation_split=0.2,
        verbose=False
    )

In [242]:
model.evaluate(X_test, y_test)



[0.19837622344493866, 0.9473684430122375]

In [243]:
model.evaluate(X_train, y_train)



[0.14456699788570404, 0.9732142686843872]