# 드롭아웃(dropout)
* mnist를 이용해서 신경망을 구성
* 신경망에 과적합이 있다.
* 학습시 전체 신경망 중에 일부만응 사용한다.
* 일부 뉴런을 사용하지 않으므로, 일부 특징이 특정 뉴런에 고정되는 것을 막아 가중치 균형을 잡아준다.
* 일부 뉴런을 학습 시키지 않기 때문에 시간이 걸린다.

In [0]:
import tensorflow as tf
import numpy as np
from tensorflow.examples.tutorials.mnist import input_data

In [2]:
mnist = input_data.read_data_sets('./mnist/data/', one_hot = True)

Instructions for updating:
Please use alternatives such as official/mnist/dataset.py from tensorflow/models.
Instructions for updating:
Please write your own downloading logic.
Instructions for updating:
Please use urllib or similar directly.
Successfully downloaded train-images-idx3-ubyte.gz 9912422 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./mnist/data/train-images-idx3-ubyte.gz
Successfully downloaded train-labels-idx1-ubyte.gz 28881 bytes.
Instructions for updating:
Please use tf.data to implement this functionality.
Extracting ./mnist/data/train-labels-idx1-ubyte.gz
Instructions for updating:
Please use tf.one_hot on tensors.
Successfully downloaded t10k-images-idx3-ubyte.gz 1648877 bytes.
Extracting ./mnist/data/t10k-images-idx3-ubyte.gz
Successfully downloaded t10k-labels-idx1-ubyte.gz 4542 bytes.
Extracting ./mnist/data/t10k-labels-idx1-ubyte.gz
Instructions for updating:
Please use alternatives such as official/mnist/datas

## 신경망 모델 구성

In [0]:
# 28*28 => 784개의 특징
# Label 0~9 까지의 10개 분류
# 입력 X, 출력 Y

In [0]:
X = tf.placeholder(tf.float32, [None, 784])
Y = tf.placeholder(tf.float32, [None, 10])

## 구성하고자 하는 신경망
* 784개의 특징(28*28)
* 256개의 은닉층의 뉴런 개수
* 256개의 은닉층의 뉴런 개수
* 10개의 결과 뉴런

## 신경망 구성시에
* (1) 임의의 w값을 설정한다.
* (2) 신경망 층을 쌓는다.
* (3) cost 함수를 지정, optimizer 함수 지정
* (4) 신경망의 모델을 학습
* (5) 좋은 모델을 가지고 예측 수행

In [0]:
keep_prob = tf.placeholder(tf.float32)

W1 = tf.Variable(tf.random_normal([784, 256], stddev = 0.01))

L1 = tf.nn.relu(tf.matmul(X, W1))
L1 = tf.nn.dropout(L1, keep_prob)

W2 = tf.Variable(tf.random_normal([256, 256], stddev = 0.01))

L2 = tf.nn.relu(tf.matmul(L1, W2))
L2 = tf.nn.dropout(L2, keep_prob)

W3 = tf.Variable(tf.random_normal([256, 10], stddev = 0.01))
model = tf.matmul(L2, W3)

In [0]:
### cost, optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits = model, labels = Y))
optimizer = tf.train.AdamOptimizer(0.001).minimize(cost)

In [0]:
### 모델 학습
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

In [8]:
batch_size = 100
total_batch = int(mnist.train.num_examples/batch_size) # 500

for epoch in range(30):
  total_cost = 0
  for i in range(total_batch):
    batch_xs, batch_ys = mnist.train.next_batch(batch_size)
    
    _, cost_val = sess.run([optimizer, cost], feed_dict={X:batch_xs, Y:batch_ys, keep_prob:0.8})
    total_cost += cost_val
  print('Epoch {} Avg cost = {}'.format(epoch+1, total_cost/total_batch))

Epoch 1 Avg cost = 0.43305880596014584
Epoch 2 Avg cost = 0.16584588108414952
Epoch 3 Avg cost = 0.11530092805285345
Epoch 4 Avg cost = 0.09166127300059254
Epoch 5 Avg cost = 0.07341238337653605
Epoch 6 Avg cost = 0.061222568316046486
Epoch 7 Avg cost = 0.05319348062134602
Epoch 8 Avg cost = 0.047824090075975455
Epoch 9 Avg cost = 0.042028678569265385
Epoch 10 Avg cost = 0.03831807693085548
Epoch 11 Avg cost = 0.03189928762762892
Epoch 12 Avg cost = 0.032718339633429426
Epoch 13 Avg cost = 0.02896508825900541
Epoch 14 Avg cost = 0.02783498698517426
Epoch 15 Avg cost = 0.02706777623992159
Epoch 16 Avg cost = 0.025668048902007287
Epoch 17 Avg cost = 0.021295449913992674
Epoch 18 Avg cost = 0.02227773681314747
Epoch 19 Avg cost = 0.021293383978402497
Epoch 20 Avg cost = 0.020820055703701323
Epoch 21 Avg cost = 0.019444515997919635
Epoch 22 Avg cost = 0.02046521708906353
Epoch 23 Avg cost = 0.017394219884114468
Epoch 24 Avg cost = 0.01647827794047771
Epoch 25 Avg cost = 0.01985189273841652

In [9]:
is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y, 1)) # 예측값, 실제값
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
accuracy

<tf.Tensor 'Mean_1:0' shape=() dtype=float32>

In [10]:
print('정확도', sess.run(accuracy, feed_dict={X:mnist.test.images,
                                          Y:mnist.test.labels,
                                          keep_prob:1}))

정확도 0.9829


## 실습

In [0]:
keep_prob = tf.placeholder(tf.float32)

W1 = tf.Variable(tf.random_normal([784, 128], stddev=0.01))

L1 = tf.nn.relu(tf.matmul(X, W1))
L1 = tf.nn.dropout(L1, keep_prob)

W2 = tf.Variable(tf.random_normal([128, 128], stddev=0.01))

L2 = tf.nn.relu(tf.matmul(L1, W2))
L2 = tf.nn.dropout(L2, keep_prob)

W3 = tf.Variable(tf.random_normal([128, 10], stddev=0.01))
model = tf.matmul(L2, W3)

In [0]:
### cost, optimizer
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits = model, labels=Y))
optimizer = tf.train.AdamOptimizer(0.001).minimize(cost)

In [0]:
### 모델 학습
init = tf.global_variables_initializer()
sess = tf.Session()
sess.run(init)

In [0]:
import time
start_time = time.time()

In [16]:
batch_size =100
total_batch = int(mnist.train.num_examples/batch_size) # 500

for epoch in range(30):
  total_cost = 0
  for i in range(total_batch):
    batch_xs, batch_ys = mnist.train.next_batch(batch_size)
    
    _, cost_val = sess.run([optimizer, cost], feed_dict={X:batch_xs, Y:batch_ys, keep_prob:0.5})
    total_cost += cost_val
  print('Epoch {} Avg cost = {}'.format(epoch+1, total_cost/total_batch))
  
print('--- %s seconds ---' %(time.time() - start_time))

Epoch 1 Avg cost = 0.7054379110173745
Epoch 2 Avg cost = 0.3407763865048235
Epoch 3 Avg cost = 0.27548802337863226
Epoch 4 Avg cost = 0.2427270949564197
Epoch 5 Avg cost = 0.22205849602141164
Epoch 6 Avg cost = 0.20661419117992574
Epoch 7 Avg cost = 0.19275341174141927
Epoch 8 Avg cost = 0.1831839122250676
Epoch 9 Avg cost = 0.17614049482751976
Epoch 10 Avg cost = 0.17091489126059142
Epoch 11 Avg cost = 0.16419079366732728
Epoch 12 Avg cost = 0.1603831361979246
Epoch 13 Avg cost = 0.1557085796919736
Epoch 14 Avg cost = 0.1469537132301114
Epoch 15 Avg cost = 0.1503774639489976
Epoch 16 Avg cost = 0.14600667924366215
Epoch 17 Avg cost = 0.14180555211210794
Epoch 18 Avg cost = 0.1386242729391564
Epoch 19 Avg cost = 0.13972005956552244
Epoch 20 Avg cost = 0.13305315388197247
Epoch 21 Avg cost = 0.1320198329910636
Epoch 22 Avg cost = 0.1316459025916728
Epoch 23 Avg cost = 0.126786503019658
Epoch 24 Avg cost = 0.12694192786108363
Epoch 25 Avg cost = 0.12690055581317705
Epoch 26 Avg cost = 0.

In [17]:
is_correct = tf.equal(tf.argmax(model, 1), tf.argmax(Y, 1)) # 예측값, 실제값
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))
accuracy

<tf.Tensor 'Mean_3:0' shape=() dtype=float32>

In [18]:
print('정확도', sess.run(accuracy, feed_dict={X:mnist.test.images,
                                          Y:mnist.test.labels,
                                          keep_prob:1}))

정확도 0.975


# GAN
* 비지도 학습 방법

In [19]:
import tensorflow as tf
import matplotlib.pyplot as plt
import numpy as np

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('./mnist/data/', one_hot=True)

Extracting ./mnist/data/train-images-idx3-ubyte.gz
Extracting ./mnist/data/train-labels-idx1-ubyte.gz
Extracting ./mnist/data/t10k-images-idx3-ubyte.gz
Extracting ./mnist/data/t10k-labels-idx1-ubyte.gz


## 01. 기본 옵션 설정

In [0]:
total_epoch = 100 # epoch 수 설정 (왕복 횟수)
batch_size = 100 # 배치 사이즈
learning_rate = 0.0002 # 학습률 ( 매우 느리게)

# 신경망 레이어 구성 옵션
## 은닉층의 노드 수 결정
n_hidden = 256
## 입력층의 갯수
n_input = 28*28
## 페이크 생성기의 입력값으로 사용할 노이즈(데이터)의 크기(갯수)
n_noise = 128

## 02. 신경망 모델 구성
* 노이즈를 이용한 데이터 생성
* 비지도 학습으로 Y가 없음

In [0]:
## 판별기에 들어갈 입력
X = tf.placeholder(tf.float32, [None, n_input])

## 페이크 생성기에 들어갈 입력
Z = tf.placeholder(tf.float32, [None, n_noise])

## 생성기의 가중치(W)와 바이어스(b)

In [0]:
# 128*256 개의 W1
# 128 개의 b1

G_W1 = tf.Variable(tf.random_normal([n_noise, n_hidden], stddev = 0.01))
G_b1 = tf.Variable(tf.zeros([n_hidden])) # 256

G_W2 = tf.Variable(tf.random_normal([n_hidden, n_input], stddev=0.01))
G_b2 = tf.Variable(tf.zeros([n_input])) # 784

#G_W1 = tf.Variable(tf.random_normal([128, 256], stddev=0.01))
#G_b1 = tf.Variable(tf.zeros([256])) # 256

#G_W2 = tf.Variable(tf.random_normal([256, 784], stddev=0.01))
#G_b2 = tf.Variable(tf.zeros([784])) # 784

## 구분자의 신경망 변수 선언(W, b)
* 은닉층이 들어가면 선형 뿐만 아니라 비선형 문제도 풀 수 있다.
* 은닉층이 없으면 선형문제만 풀 수 있다.

In [0]:
D_W1 = tf.Variable(tf.random_normal([784, 256], stddev=0.01))
D_b1 = tf.Variable(tf.zeros([n_hidden])) # 258

D_W2 = tf.Variable(tf.random_normal([256, 1], stddev = 0.01))
D_b2 = tf.Variable(tf.zeros([1])) # 1

## 생성기의 신경망 구성

In [0]:
def generator(noise_z):
  hidden = tf.nn.relu(tf.matmul(noise_z, G_W1) + G_b1) # 은닉층 거친 결과
  output = tf.nn.sigmoid(tf.matmul(hidden, G_W2) + G_b2) # 2번째 거친 결과(128)
  return output

## 구분자의 신경망 구성

In [0]:
def discriminator(inputs):
  hidden = tf.nn.relu(tf.matmul(inputs, D_W1) + D_b1)
  output = tf.nn.sigmoid(tf.matmul(hidden, D_W2) + D_b2)
  return output

In [0]:
#def discriminator(inputs):
#  hidden = tf.nn.relu(tf.matmul(inputs, D_W1) +D_b1) # 은닉층 거친 결과
#  output = tf.nn.sigmoid(tf.matmul(hidden, D_W2) + D_b2)
#  return output

## 위의 noise_z를 발생시킬 노이즈 생성 함수

In [0]:
def get_noise(batch_size, n_noise):
  return np.random.normal(size = (batch_size, n_noise))

In [0]:
# 노이즈를 이용해서 랜덤한 이미지를 생성
G = generator(Z)

# 노이즈를 이용해서 생성한 이미지(정보)를 구분자에 넣어서 결과(판별값0~1)을 본다.
D_fake = discriminator(G)

# 진짜 이미지를 이용해서 판별한 값을 구한다.
D_real = discriminator(X)

## 3.
* loss
* optimizer
* 진짜 이미지를 넣었을 때, 최대값(tf.log(D_real))
* 가짜 이미지를 넣었을 때, 최대값 tf.log(1-D_fake)

In [0]:
loss_D = tf.reduce_mean(tf.log(D_real) + tf.log(1-D_fake))
## 생성자의 loss
loss_G = tf.reduce_mean(tf.log(D_fake))

In [0]:
D_var_list = [D_W1, D_b1, D_W2, D_b2] # 구분자의 변수들
G_var_list = [G_W1, G_b1, G_W2, G_b2] # 생성자의 변수들

In [0]:
# GAN 논문의 수식에 따르면 loss를 극대화 해야하지만, minimize 하는 최적화 함수를 사용하기 때문에
# 최적화 하려는 loss_D와 loss_G에 음수 부호를 붙여준다.
train_D = tf.train.AdamOptimizer(learning_rate).minimize(-loss_D, var_list = D_var_list)
train_G = tf.train.AdamOptimizer(learning_rate).minimize(-loss_G, var_list = G_var_list)

In [0]:
sess = tf.Session()
sess.run(tf.global_variables_initializer())
total_batch = int(mnist.train.num_examples/batch_size)
loss_val_D, loss_val_G = 0, 0

In [0]:
!mkdir samples

In [37]:
%%time
for epoch in range(total_epoch):
  for i in range(total_batch):
    batch_xs, batch_ys = mnist.train.next_batch(batch_size)
    noise = get_noise(batch_size, n_noise)
    # 판별기와 생성기 신경망을 각각 학습시킨다.
    _, loss_var_D = sess.run([train_D, loss_D],
    feed_dict = {X: batch_xs, Z:noise})
    _, loss_val_G = sess.run([train_G, loss_G],
                            feed_dict={Z:noise})
  print('Epoch:', '%04d' % epoch,
       'D loss: {:.4}'.format(loss_val_D),
       'G loss: {:.4}'.format(loss_val_G))
  
  # 학습이 되어가는 모습을 보기 위해 주기적으로 이미지를 생성하여 저장
  if epoch == 0 or (epoch + 1) % 10 ==0:
    sample_size = 10
    nise = get_noise(sample_size, n_noise)
    samples = sess.run(G, feed_dict={Z:noise})
    fig, ax = plt.subplots(1, sample_size, figsize = (sample_size, 1))
    
    for i in range(sample_size):
      ax[i].set_axis_off()
      ax[i].imshow(np.reshape(samples[i], (28,28)))
    plt.savefig('samples/{}.png'.format(str(epoch).zfill(3)), bbox_inches='tight')
    plt.close(fig)
print('최적화 완료')

ValueError: ignored