<a href="https://colab.research.google.com/github/instar94/ml_study/blob/main/07_02.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 심층 신경망

## 1) 패션 데이터 불러오기
- 28*28의 2차원 데이터를 1차원 784 픽셀 데이터로 변경
- 변경 뒤 해당 데이터를 훈련 / 테스트 세트로 나눔

In [None]:
import keras
(train_input, train_target),(test_input,test_target) = keras.datasets.fashion_mnist.load_data()

In [None]:
from sklearn.model_selection import train_test_split

### 0~255 인데이터를 0~1 데이터로 변경
train_scaled = train_input / 255.0

### 28*28 > 784
train_scaled = train_scaled.reshape(-1,28*28)
train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled, train_target, test_size=0.2, random_state=42)

## 은닉층
- 입력층과 출력층 사이 밀집층이 추가된 층
- `활성화 함수` : 신경망 층의 선형 방정식의 계산 값에 적용하는 함수
- 출력층에 적용되는 활성화 함수는 제한됨
  - 이진 분류 : 시그모이드
  - 다중 분류 : 소프트맥스
- 하지만 은닉층의 활성화 함수는 비교적 자유로움 (시그모이드함수, 렐루 함수 등..)

### 은닉층에 활성화 함수가 적용되는 이유
- 은닉층에서 선형적인 산술 계산만 수행한다면 수행 역할이 없어짐
- 따라서 비선형함수로 변경하여 역할이 없어지지 않도록 함

## 은닉층 + 출력층 만들기
- 은닉층 : 시그모이드 활성화 함수 / 뉴런 100개  
- 출력층 : 소프트맥스 함수 / 뉴런 10개
- 뉴런 갯수의 기준은 따로 없으나, **은닉층이 출력층보다 많아야함**

In [None]:
inputs = keras.layers.Input(shape=(784,))

## 은닉층
dense1 = keras.layers.Dense(100, activation="sigmoid")
### 출력층
dense2 = keras.layers.Dense(10,activation="softmax")

## 3) 심층 신경망 만들기 (DNN)
- `keras.Sequential([입력층, 은닉층, 출력층])`

In [None]:
model = keras.Sequential([inputs, dense1, dense2])

- 층에 대한 정보 확인
  - 출력크기 (None, 100) :
  - None : 케라스 모델의 fit()은 데이터를 주입하면 잘게 나누어 여러번 경사하강법 사용
    --> 미니 배치 경사하강법 사용
  - 기본적인 미니배치 크기 32
    --> `batch_size`  옵션을 이용해 바꿀 수 있음
  - 따라서 샘플 개수를 고정하지 않고 None으로 선정
  - 100 : 은닉층 유닛 100개
    - 784개의 특성이 100개의 유닛으로 압축됨

- 출력층의 파라미터 수 : 1010개
  - 은닉층 유닛 100개
  - 출력층 유닉 10개
  - 은닉층 - 출력층 조합 : 1000개
  - 출력층의 절편 10개
  - 총 1010개

- 특성 하나당 1010개 * 특성 총 784개

In [None]:
model.summary()

### 생성자를 이용해 층 추가
- 생성자에서 바로 클래스를 만들 수도 있음

In [None]:
model = keras.Sequential([
keras.layers.Input(shape=(784,)),
keras.layers.Dense(100, activation="sigmoid", name="은닉층"),
keras.layers.Dense(10, activation="softmax",name="출력층")
], name="패션 MNIST 모델")

In [None]:
model.summary()

### `add()`를 이용해 층 추가

In [None]:
model = keras.Sequential()
model.add(keras.layers.Input(shape=(784,)))
model.add(keras.layers.Dense(100,activation="sigmoid"))
model.add(keras.layers.Dense(10,activation="softmax"))
model.summary()

### 학습 진행
- 87% 까지 정확도가 올라옴

In [None]:
model.compile(loss="sparse_categorical_crossentropy", metrics=["accuracy"])
model.fit(train_scaled, train_target, epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.7540 - loss: 0.7757
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.8474 - loss: 0.4171
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.8615 - loss: 0.3851
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.8687 - loss: 0.3574
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.8773 - loss: 0.3346


<keras.src.callbacks.history.History at 0x7b974e002f10>

# 렐루 함수
## 시그모이드 함수의 단점
- 오른쪽과 왼쪽끝으로 갈수록 그래프가 누워 있어 올바른 출력을 만드는데 신속하게 대응하지 못함
- 신경망이 많을수록 누적되어 더 여려워짐

## 렐루(ReLU) 함수
- 표현 $max(0,z)$
- 입력이 양수 = 입력값 그대로 통과
- 입력이 음수 = 0

### Flatten 층
- 배치 차원을 제외한 나머지 입력차원을 모두 일렬로 만듦
- 가중치나 절편이 없기 때문에 성능에 기여하는 바 X
- 하지만 입력층과 은닉층 사이에 추가하기 때문에 층이라고 부름

In [None]:
model = keras.Sequential()
model.add(keras.layers.Input(shape=(28,28)))model.add(keras.layers.Flatten())
model.add(keras.layers.Dense(100,activation="sigmoid"))
model.add(keras.layers.Dense(10,activation="softmax"))
model.summary()