# 딥러닝이란 무엇인가?
딥러닝은 머신러닝의 특정한 한 분야로서 연속된 **층(layer)** 에서 점진적으로 의미 있는 표현을 배우는 데 강점이 있으며, 데이터로부터 표현을 학습하는 새로운 방식

## 딥러닝의 특징
딥러닝은 머신러닝 중에서 가장 중요한 단계인 특성 공학(feature engineering)을 완전히 자동화하기 때문에 문제 해결을 더 쉽게 만들어 줌  
딥러닝은 특성을 직접 찾는 대신 한 번에 모든 특성을 학습할 수 있음
1. 층을 거치면서 점진적으로 더 복잡한 표현이 만들어 짐
2. 점진적인 중간 표현이 공동으로 학습

## 딥러닝이 현재 발전할 수 있는 이유
1. 하드웨어
2. 데이터셋과 벤치마크
3. 알고리즘 향상
    - 활성화 함수(activation function)
    - 가중치 초기화(weight initialization) 방법
    - 최적화 방법(옵티마이저)

# 신경망의 수학적 구성 요소
> 머신러닝에서 분류 문제의 범주(category)를 클래스(class)라고 하고, 데이터 포인트는 샘플(sample), 특정 샘플의 클래스는 레이블(label)이라고 함
## 신경망 예시

In [1]:
# MNSIT
from tensorflow.keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/mnist.npz


훈련 세트(train set)와 테스트 세트(test set) 구성  
이미지는 넘파이 배열로 인코딩되어 있고 레이블은 0부터 9까지의 숫자 배열

In [2]:
train_images.shape, len(train_labels)

((60000, 28, 28), 60000)

In [3]:
test_images.shape, len(test_labels)

((10000, 28, 28), 10000)

`train_images`와 `train_labels`를 네트워크에 입력 -> 이미지와 레이블을 연관시킬 수 있도록 학습 -> 예측

In [4]:
from tensorflow.keras import models
from tensorflow.keras import layers

network = models.Sequential()
network.add(layers.Dense(512, activation="relu", input_shape=(28*28, )))
network.add(layers.Dense(10, activation="softmax"))

신경망의 핵심 구성 요소는 데이터 처리 필터라고 생각할 수 있는 **층(layer)**  
-> 어떤 데이터가 들어가면 더 유용한 형태로 출력  
-> 층은 주어진 문제에 더 의미 있는 **표현(representation)** 을 추출

In [5]:
network.compile(
    optimizer="rmsprop",
    loss="categorical_crossentropy",
    metrics=["accuracy"]
)

- 옵티마이저(optimizer): 입력된 데이터와 손실 함수를 기반으로 네트워크를 업데이트하는 메커니즘
- 손실함수(loss function): 훈련 데이터에서 신경망의 성능을 측정하는 방법으로, 네트워크가 옳은 방향으로 학습될 수 있도록 도와줌

In [6]:
train_images = train_images.reshape((60000, 28*28))
train_images = train_images.astype("float32")/255

test_images = test_images.reshape((10000, 28*28))
test_images = test_images.astype("float32")/255

In [7]:
from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)

훈련 데이터에 모델을 학습시킴

In [9]:
network.fit(train_images, train_labels, epochs=5, batch_size=128, verbose=1)

Epoch 1/5
Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<tensorflow.python.keras.callbacks.History at 0x171395a30>

예측

In [11]:
test_loss, test_acc = network.evaluate(test_images, test_labels)



## 신경망을 위한 데이터 표현
최근 모든 머신러닝 시스템은 일반적으로 텐서(Tensor)를 기본 데이터 구조로 사용