# (실습) 케라스와 텐서플로우

## 텐서 관련

**문제 1**

[텐서 소개(Introduction to Tensors)](https://www.tensorflow.org/guide/tensor)를 정리하라.

## 케라스 관련

**문제 1**

[TensorFlow Playground](https://playground.tensorflow.org)에서 분류 모델 네 개를 살펴 보면서 각 문제를 해결하는 최선의 모델을 찾은 다음에 최선의 모델을 찾는 과정을 설명하라.
즉, 아래 요소들에 적절한 값이 선택된 이유를 (추정해서) 설명하라.

- 학습률(learning rate)
- 활성화 함수(activation function)
- 규제(regularization)와 규제율(regularization rate)
- 배치 크기(batch size)
- 은닉층(hidden layer)과 유닛(unit 또는 neuron) 수

**문제 2**

다음 분류 과제와 관련해서 문제 1에서 찾은 최선의 모델을 직접 `Dense` 층과 `Sequence` 모델을 이용하여 케라스로 구현하라. 
아래 이미지에서 보이는 모델은 하나의 예시일 뿐이다.

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/dlp2/master/jupyter-book/imgs/ch03-tf-playground.jpg" style="width:700px;"></div>


**문제 3**

다음 분류 과제와 관련해서 문제 1에서 찾은 최선의 모델을 직접 `Dense` 층과 `Sequence` 모델을 이용하여 케라스로 구현하라. 
아래 이미지에서 보이는 모델은 하나의 예시일 뿐이다.

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/dlp2/master/jupyter-book/imgs/ch03-tf-playground-2.jpg" style="width:700px;"></div>


**문제 4**

다음 분류 과제와 관련해서 문제 1에서 찾은 최선의 모델을 직접 `Dense` 층과 `Sequence` 모델을 이용하여 케라스로 구현하라. 
아래 이미지에서 보이는 모델은 하나의 예시일 뿐이다.

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/dlp2/master/jupyter-book/imgs/ch03-tf-playground-3.jpg" style="width:700px;"></div>


**문제 5**

다음 분류 과제와 관련해서 문제 1에서 찾은 최선의 모델을 직접 `Dense` 층과 `Sequence` 모델을 이용하여 케라스로 구현하라. 
아래 이미지에서 보이는 모델은 하나의 예시일 뿐이다.

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/dlp2/master/jupyter-book/imgs/ch03-tf-playground-4.jpg" style="width:700px;"></div>


## 텐서플로우 관련

아래 코드는 순수 텐서플로우를 이용하여 이진분류 문제를 해결하는 코드이다.

In [None]:
import numpy as np
import tensorflow as tf

# 데이터셋 크기
num_samples_per_class = 1000

# 음성 데이터셋
negative_samples = np.random.multivariate_normal(
    mean=[0, 3], cov=[[1, 0.5],[0.5, 1]], size=num_samples_per_class)

# 양성 데이터셋
positive_samples = np.random.multivariate_normal(
    mean=[3, 0], cov=[[1, 0.5],[0.5, 1]], size=num_samples_per_class)

# 입력 및 타깃 데이터셋
inputs = np.vstack((negative_samples, positive_samples)).astype(np.float32)

targets = np.vstack((np.zeros((num_samples_per_class, 1), dtype="float32"),
                     np.ones((num_samples_per_class, 1), dtype="float32")))

# 가중치와 편향        
input_dim = 2     # 입력 샘플의 특성이 2개
output_dim = 1    # 하나의 값으로 출력

# 가중치: 무작위 초기화
W = tf.Variable(initial_value=tf.random.uniform(shape=(input_dim, output_dim)))

# 편향: 0으로 초기화
b = tf.Variable(initial_value=tf.zeros(shape=(output_dim,)))

# 모델 지정(하나의 층 사용)
def model(inputs):
    return tf.matmul(inputs, W) + b

# 손실함수
def square_loss(targets, predictions):
    per_sample_losses = tf.square(targets - predictions)
    return tf.reduce_mean(per_sample_losses)

# 학습률
learning_rate = 0.1

# 훈련 스텝
def training_step(inputs, targets):
    with tf.GradientTape() as tape:
        predictions = model(inputs)
        loss = square_loss(targets, predictions)
    grad_loss_wrt_W, grad_loss_wrt_b = tape.gradient(loss, [W, b])
    W.assign_sub(grad_loss_wrt_W * learning_rate)
    b.assign_sub(grad_loss_wrt_b * learning_rate)
    return loss

# 모델 학습
for step in range(40):
    loss = training_step(inputs, targets)
    print(f"Loss at step {step}: {loss:.4f}")

Loss at step 0: 0.9927
Loss at step 1: 0.1929
Loss at step 2: 0.1130
Loss at step 3: 0.0973
Loss at step 4: 0.0898
Loss at step 5: 0.0839
Loss at step 6: 0.0787
Loss at step 7: 0.0739
Loss at step 8: 0.0695
Loss at step 9: 0.0655
Loss at step 10: 0.0619
Loss at step 11: 0.0586
Loss at step 12: 0.0556
Loss at step 13: 0.0529
Loss at step 14: 0.0504
Loss at step 15: 0.0481
Loss at step 16: 0.0461
Loss at step 17: 0.0442
Loss at step 18: 0.0425
Loss at step 19: 0.0409
Loss at step 20: 0.0395
Loss at step 21: 0.0382
Loss at step 22: 0.0370
Loss at step 23: 0.0359
Loss at step 24: 0.0350
Loss at step 25: 0.0341
Loss at step 26: 0.0333
Loss at step 27: 0.0325
Loss at step 28: 0.0318
Loss at step 29: 0.0312
Loss at step 30: 0.0307
Loss at step 31: 0.0302
Loss at step 32: 0.0297
Loss at step 33: 0.0293
Loss at step 34: 0.0289
Loss at step 35: 0.0285
Loss at step 36: 0.0282
Loss at step 37: 0.0279
Loss at step 38: 0.0277
Loss at step 39: 0.0274


위 코드의 실행결과는 다음과 같이 이진분류 모델이다.

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/HighResolutionFigures/figure_3-8.png" style="width:500px;"></div>

<p><div style="text-align: center">&lt;그림 출처: <a href="https://www.manning.com/books/deep-learning-with-python-second-edition">Deep Learning with Python(2판)</a>&gt;</div></p>

**문제 1**

위 코드는 학습과정에서 전체 데이터셋을 하나의 배치로 사용한다.
미니배치 학습을 지원하도록 코드를 수정한 후에 훈련을 진행하여 최선의 모델을 구현하라.
배치 크기는 32로 한다.

**문제 2**

위 코드는 입력값에서 바로 출력값을 계산한다. 
순전파에서 네 개의 유닛으로 구성된 층(layer)을 통과하도록 모델을 수정한 모델을 훈련시켜서
최선의 모델을 구현하라.
단, 활성화 함수는 사용하지 않는다.

힌트: 그레이디언트 테이프를 활용하여 역전파를 적절하게 구현해야 한다.