In [1]:
# 파이썬 ≥3.5 필수
import sys
assert sys.version_info >= (3, 5)

# 사이킷런 ≥0.20 필수
import sklearn
assert sklearn.__version__ >= "0.20"

# 텐서플로 ≥2.0 필수
import tensorflow as tf
from tensorflow import keras
assert tf.__version__ >= "2.0"

%load_ext tensorboard

# 공통 모듈 임포트
import numpy as np
import os

# 노트북 실행 결과를 동일하게 유지하기 위해
np.random.seed(42)

# 깔끔한 그래프 출력을 위해
%matplotlib inline
import matplotlib as mpl
import matplotlib.pyplot as plt
mpl.rc('axes', labelsize=14)
mpl.rc('xtick', labelsize=12)
mpl.rc('ytick', labelsize=12)

In [2]:
### 기존의 logistic 활성화 함수와 평균이 0이고 표준편차가 1인 정규분포에서의 가중치 초기화 방법은
### 역전파의 과정에서 하위층에서 그레디언트가 과도하게 커지거나 작아지는 그레디언트 폭주/소실 문제를 발생시킨다.

#### logistic / softmax / tanh : Xavier 초기화
#### relu / relu의 변종들 : He 초기화
#### selu : 르쿤 초기화

# Xavier 초기화(= Glorot 초기화)

In [9]:
keras.layers.Dense(10, activation="softmax", kernel_initializer="glorot_normal")

<keras.layers.core.dense.Dense at 0x7f07834e7450>

# He 초기화

In [3]:
keras.layers.Dense(10, activation="relu", kernel_initializer="he_normal")

<keras.layers.core.dense.Dense at 0x7f07f9d41bd0>

In [4]:
init = keras.initializers.VarianceScaling(scale=2., mode='fan_avg',
                                          distribution='uniform')
keras.layers.Dense(10, activation="relu", kernel_initializer=init)

<keras.layers.core.dense.Dense at 0x7f0783723f50>

# 르쿤 초기화

In [10]:
keras.layers.Dense(10, activation="selu", kernel_initializer="LecunNormal")

<keras.layers.core.dense.Dense at 0x7f07834fcc90>