심층 신경망

구성 요소
* 입력층(Input Layer): 입력 데이터를 받는 부분
* 은닉층(Hidden Layers): 여러 개의 뉴런이 연결되어 특징을 추출
* 출력층(Output Layer): 최종 예측 결과

학습 절차:
* Forward Propagation(순전파): 입력 → 출력으로 값 전달
* Loss Computation(손실함수 계산): 예측값과 실제값의 차이 계산
* Backpropagation(역전파): 오차를 기반으로 가중치 업데이트

은닉층이 2개부터 심층

은닉층(hidden layer): 입력층과 출력층 사이의 모든 층. 입력층에서부터 출력층으로 노드개수가 줄어드는 방향으로 설계하는게 좋다. 노드수가 출력층보다는 많아야함.

밀집층(dense)(완전연결층): complete 구조(모두 연결되어 있는 구조)를 말함. 앞뒤 레이어의 노드랑 빠짐없이 연결되어 있음.

은닉층의 활성화 함수: 은닉층에서 계산된 값을 처리하는 함수. 비교적 자유로움

출력층 활성화 함수: 소프트맥스 같은거

In [None]:
from tensorflow import keras
from sklearn.model_selection import train_test_split

(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input/255.0
train_scaled = train_scaled.reshape(-1,28*28)

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,test_size=0.2,random_state=42)

inputs = keras.layers.Input(shape=(784,)) #입력층
dense1 = keras.layers.Dense(100,activation='sigmoid',name='hidden') #은닉층
dense2 = keras.layers.Dense(10,activation='softmax',name='output') #출력층
model = keras.Sequential([inputs,dense1,dense2], name='fashion') #이름 한글로 적으면 오류
model.summary()
#28*28은 784인데, 값이 78,500인 이유는 28*28*100 + 100(바이어스) 구조라서 그렇다.
#사실상 지금 구조는 심층은 아님(은닉층이 1개라서)
model.compile(loss='sparse_categorical_crossentropy',metrics=['accuracy'])
model.fit(train_scaled,train_target,epochs=5)

Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 3ms/step - accuracy: 0.7470 - loss: 0.7753
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.8492 - loss: 0.4244
Epoch 3/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8627 - loss: 0.3774
Epoch 4/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.8698 - loss: 0.3589
Epoch 5/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 3ms/step - accuracy: 0.8785 - loss: 0.3358


<keras.src.callbacks.history.History at 0x7dca8a51fec0>

In [1]:
from tensorflow import keras
from sklearn.model_selection import train_test_split

(train_input, train_target),(test_input, test_target) = keras.datasets.fashion_mnist.load_data()

train_scaled = train_input/255.0
#train_scaled = train_scaled.reshape(-1,28*28)

train_scaled, val_scaled, train_target, val_target = train_test_split(train_scaled,train_target,test_size=0.2,random_state=42)

inputs = keras.layers.Input(shape=(28,28)) #입력층
flat = keras.layers.Flatten(name='flatten') #플랫층: 데이터 구조 변환용 층(무조건 1차원)
dense1 = keras.layers.Dense(100,activation='relu',name='hidden') #은닉층(완전연결층)
dense2 = keras.layers.Dense(10,activation='softmax',name='output') #출력층
model = keras.Sequential([inputs,flat,dense1,dense2], name='fashion') #이름 한글로 적으면 오류
#model.summary()

model.compile(loss='sparse_categorical_crossentropy',metrics=['accuracy'])
model.fit(train_scaled,train_target,epochs=5)

#relu함수 쓰니까 정확성이 조금 높아진다.

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
[1m29515/29515[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
[1m26421880/26421880[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
[1m5148/5148[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0us/step
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
[1m4422102/4422102[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 0us/step
Epoch 1/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.7642 - loss: 0.6714
Epoch 2/5
[1m1500/1500[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 3ms/step - accuracy: 0.8535 - loss: 0.4087


<keras.src.callbacks.history.History at 0x7b69074135f0>