# 2장. 딥러닝 핵심 미리보기

## 나의 첫 딥러닝: '10장 폐암 수술 환자의 생존율 예측' 코드 미리보기

### 1. 환경 준비

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import numpy as np
# tensorflow.keras.models는 모델 생성 및 관리에 필요한 도구들을 모아놓은 모듈(.py 파일)입니다.
# tensorflow.keras.layers 모듈은 Keras API에서 다양한 신경망 층(layer)을 정의하고 사용할 수 있도록 제공하는 모듈(.py 파일)입니다.
# 순차적 구성: 층들이 입력층부터 출력층까지 순차적으로 연결됩니다. 한 층의 출력이 다음 층의 입력으로 사용되는 구조입니다.--> Sequential 모델의 특징!
# Sequential 모델의 본질은 신경망의 층을 순차적으로 쌓아서 단방향으로 정보를 전달하는 구조입니다.
# 구조(Structure)는 어떤 시스템이나 물체가 내부적으로 구성되고 조직된 방식을 의미합니다.(추상적임!)
# Dense의 본질은 완전 연결층으로, 입력 데이터의 모든 특성을 고려하여 출력 뉴런과 연결하고, 가중치와 편향을 통해 새로운 특징을 학습하는 층입니다.
# Sequential은 신경망 모델을 구성하는 틀로서, 여러 층(layers)을 순차적으로 쌓는 클래스(class)입니다.
# Dense 는 신경망의 완전 연결층(fully connected layer) 를 정의하는 클래스(class) 입니다.
# Sequential 모델의 독립적인 역할?--> 각 층(0층부터 시작)에 동그라미가 몇개인지 모르지만 존재한다면 각 층에서 그 동그라미들을 다음 층의 동그라미들로 순차적으로 연결해나간다는 추상적인 사고 가능하게 하는 역할!
# 완전 연결층(fully connected layer) 또는 Dense 층은 신경망에서 가장 기본적인 층으로, 모든 입력 뉴런이 모든 출력 뉴런과 연결되는 층을 말합니다.

### 2. 데이터 준비

In [None]:
!git clone https://github.com/taehojo/data.git   # 깃허브에 준비된 데이터를 가져옵니다.

Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",")  # 수술 환자 데이터를 불러옵니다.
X = Data_set[:,0:16]                                                 # 환자의 진찰 기록을 X로 지정합니다.
y = Data_set[:,16]                                                   # 수술 후 사망/생존 여부를 y로 지정합니다.

fatal: destination path 'data' already exists and is not an empty directory.


### 3. 구조 결정

In [None]:
model = Sequential()                                                  # 딥러닝 모델의 구조를 결정합니다.
model.add(Dense(30, input_dim=16, activation='relu'))  # input_dim=16 에서 16이라는 값은 편향(bias)을 포함하지 않습니다.
model.add(Dense(1, activation='sigmoid'))

### 4. 모델 실행

In [None]:
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])  # 딥러닝 모델을 실행합니다. // binary_crossentropy 는 이진 분류할때 사용한다!
history=model.fit(X, y, epochs=5, batch_size=16)
# 출력층의 시그모이드 함수의 값을 확률로 해석해서 교차 엔트로피 오차를 계산해서 가중치들을 adam 경사하강법을 통해 5번 재조정한다!
# 경사하강법을 시작하기 전, 딥러닝 모델의 처음 가중치들은 일반적으로 랜덤하게 초기화됩니다.
# 출력층의 시그모이드 함수는 예측값을 0과 1 사이의 확률로 변환합니다. 이 예측값은 입력 데이터와 가중치의 조합(곱셈과 더하기)에 의해 결정됩니다. 따라서, 시그모이드 함수의 출력값은 가중치의 함수입니다.
# 교차 엔트로피 오차는 시그모이드 함수의 출력값(예측 확률)과 실제 라벨을 비교하여 계산됩니다. 예측 확률은 가중치에 따라 달라지기 때문에, 교차 엔트로피 오차도 가중치에 의해 결정됩니다. 즉, 오차는 가중치가 바뀔 때마다 변하게 됩니다.
# Adam 경사하강법을 통해 모델은 이 교차 엔트로피 오차를 최소화하기 위해 가중치를 업데이트합니다. 경사하강법은 **가중치에 대한 오차의 기울기(미분)**를 계산하여 가중치를 수정하는 방식입니다. 이 과정에서 오차는 가중치의 함수로 작용합니다.
# 따라서 "교차 엔트로피 오차는 가중치의 함수"라고 할 수 있습니다. 모델은 가중치를 변화시키면서 교차 엔트로피 오차를 최소화하려고 시도하며, 이는 학습 과정의 핵심입니다.

Epoch 1/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 16ms/step - accuracy: 0.8577 - loss: 0.5222
Epoch 2/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8374 - loss: 0.4706  
Epoch 3/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8614 - loss: 0.4200
Epoch 4/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8539 - loss: 0.4300 
Epoch 5/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8628 - loss: 0.4043 
