<a href="https://colab.research.google.com/github/hizieun/ML-yahac/blob/main/yahac_CNN_Flatten.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

이미지셋 데이터를 표 형태의 데이터로 변형해서 학습하는 법을 배웁니다. 딥러닝 모델의 "특징 자동 추출기"라는 별명의 의미를 이해합니다.

※ 텐서플로우의 fit 함수

학습을 할 때 전체 관측치를 모두 넣어서 학습을 하는 것이 아니고, batch size로 나누어서 1 epochs에 여러 개의 batch를 가지고 학습을 하도록 구현 되어있다.

학습 알고리즘 중에 가장 기본적인 알고리즘인 gradient descent(GD) 알고리즘은 1 epoch에 모든 데이터를 넣어서 결과를 내고 loss를 구하고, loss가 낮아지는 방향으로 weight를 조정하여 학습을 한다. 이 경우 관측치가 100개이든 10000개이든 1 epoch에 weight를 한 번 조정하게 되는데, 데이터가 많아질수록 weight를 조정하는 횟수로 인해 연산의 비효율이 생긴다.

이를 해결하기 위해서 batch로 나누어서 학습을 하는 방법을 고안했고, 그 방법을 stochastic gradient descent (SGD) 라고 한다. 10000개의 관측치가 있다고 할 때 1000개씩 나누면, 1 epoch에 10변의 weight 조정을 할 수 있게 된다.

텐서플로우는 batch size의 기본값으로 32개씩 나누어서 학습하도록 되어있고, 60000 / 32를 하여 1875개의 batch로 나누고, 1epoch당 1875회의 weight 조정을 한다. model.fit(독립, 종속, epochs=10, batch_size=100) 이라고 넣으면 1 epoch에 600회 학습하는 걸 볼 수 있다.

**라이브러리 사용**

In [1]:
import tensorflow as tf
import pandas as pd

**데이터 로드**

In [3]:
(var_x, var_y), _ = tf.keras.datasets.mnist.load_data()
var_x = var_x.reshape(60000, 784)
var_y = pd.get_dummies(var_y)
print(var_x.shape, var_y.shape)

(60000, 784) (60000, 10)


**모델 생성**

In [4]:
X = tf.keras.layers.Input(shape=[784])
H = tf.keras.layers.Dense(84, activation='swish')(X)
Y = tf.keras.layers.Dense(10, activation='softmax')(H)
model = tf.keras.models.Model(X, Y)
model.compile(loss='categorical_crossentropy', metrics='accuracy')

**모델 학습**

In [5]:
model.fit(var_x, var_y, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f3045a71898>

**모델 사용**

In [6]:
pred = model.predict(var_x[0:5])
print(pd.DataFrame(pred).round(2))
print(var_y[0:5])

     0    1    2    3    4    5    6    7    8    9
0  0.0  0.0  0.0  0.0  0.0  1.0  0.0  0.0  0.0  0.0
1  1.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
2  0.0  0.0  0.0  0.0  1.0  0.0  0.0  0.0  0.0  0.0
3  0.0  1.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
4  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  1.0
   0  1  2  3  4  5  6  7  8  9
0  0  0  0  0  0  1  0  0  0  0
1  1  0  0  0  0  0  0  0  0  0
2  0  0  0  0  1  0  0  0  0  0
3  0  1  0  0  0  0  0  0  0  0
4  0  0  0  0  0  0  0  0  0  1


**with flatten**
**데이터 준비**

In [7]:
(var_x, var_y), _ = tf.keras.datasets.mnist.load_data()

**var_x = var_x.shape(60000, 784)**

In [9]:
var_y = pd.get_dummies(var_y)
print(var_x.shape, var_y.shape)

(60000, 28, 28) (60000, 10)


**모델 생성**

In [10]:
X = tf.keras.layers.Input(shape=[28, 28])
H = tf.keras.layers.Flatten()(X)
H = tf.keras.layers.Dense(84, activation='swish')(H)
Y = tf.keras.layers.Dense(10, activation='softmax')(H)
model = tf.keras.models.Model(X, Y)
model.compile(loss='categorical_crossentropy', metrics=['accuracy'])

**모델 학습**

In [11]:
model.fit(var_x, var_y, epochs=10)

Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<tensorflow.python.keras.callbacks.History at 0x7f3037635630>

**모델 사용**

In [12]:
pred = model.predict(var_x[0:5])
print(pd.DataFrame(pred).round(2))
print(var_y[0:5])

     0    1    2    3    4    5    6    7    8    9
0  0.0  0.0  0.0  0.0  0.0  1.0  0.0  0.0  0.0  0.0
1  1.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
2  0.0  0.0  0.0  0.0  1.0  0.0  0.0  0.0  0.0  0.0
3  0.0  1.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0
4  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  0.0  1.0
   0  1  2  3  4  5  6  7  8  9
0  0  0  0  0  0  1  0  0  0  0
1  1  0  0  0  0  0  0  0  0  0
2  0  0  0  0  1  0  0  0  0  0
3  0  1  0  0  0  0  0  0  0  0
4  0  0  0  0  0  0  0  0  0  1
