In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt 

import tensorflow as tf
from tensorflow import keras

# 가중치 초기화

층을 만들 때 kernel_initializer로 지정할 수 있다

* 글로럴 | 하이퍼볼릭 탄젠트, 로지스틱, 소프트맥스 (케라스의 디폴트 : Uniform 기반의 글로럿 초기화)

* He | Relu,  RRelu, PRelu, ELU, LeakyRelu

* 르쿤 | SELU

In [2]:
# 예시
keras.layers.Dense(10, activation="relu", kernel_initializer="he_normal")

<tensorflow.python.keras.layers.core.Dense at 0x2936c8b67c0>

# 활성화 함수

SELU > ELU > LeakyRelu > Relu > tanh > 로지스틱 순으로 사용한다

SELU는 자기 정규화 성질이 있다 (완전연결 신경망에만 해당, 반드시 르쿤 초기화, 반드시 Feature를 정규화 해야함)

Grid-Search로 최적의 파라미터를 찾을 수 있다

In [3]:
# LeakyRelu를 사용한 예시

(X_train_full, y_train_full), (X_test, y_test) = keras.datasets.fashion_mnist.load_data()
X_train_full = X_train_full / 255.0
X_test = X_test / 255.0
X_valid, X_train = X_train_full[:5000], X_train_full[5000:]
y_valid, y_train = y_train_full[:5000], y_train_full[5000:]

# 모델 만들기
model = keras.models.Sequential([
    keras.layers.Flatten(input_shape=[28, 28]),
    keras.layers.Dense(300, kernel_initializer="he_normal"),
    keras.layers.LeakyReLU(),
    keras.layers.Dense(100, kernel_initializer="he_normal"),
    keras.layers.LeakyReLU(),
    keras.layers.Dense(10, activation="softmax")
])

model.compile(loss="sparse_categorical_crossentropy",
              optimizer=keras.optimizers.SGD(learning_rate=1e-3),
              metrics=["accuracy"])

history = model.fit(X_train, y_train, epochs=10,
                    validation_data=(X_valid, y_valid))

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


In [None]:
# Elu  -> keras.layers.Dense(10, activation="elu", kernel_initializer="he_normal")
# SELU -> keras.layers.Dense(10, activation="selu", kernel_initializer="lecun_normal")

# 배치 정규화