# 2장. 딥러닝 핵심 미리보기

## 나의 첫 딥러닝: '10장 폐암 수술 환자의 생존율 예측' 코드 미리보기

### 1. 환경 준비

In [1]:
from tensorflow.keras.models import Sequential  # 텐서플로의 케라스 API에서 필요한 함수들을 불러옵니다.
from tensorflow.keras.layers import Dense       # 데이터를 다루는 데 필요한 라이브러리를 불러옵니다.
import numpy as np

1)**Sequential**  
**역할**: 신경망 모델의 가장 기본적인 틀(컨테이너)입니다.

**의미**: 'Sequential'은 '순차적인'이라는 뜻입니다. 이 모델은 레고 블록을 바닥부터 위로 하나씩 쌓아 올리듯이, 레이어(층)를 순서대로 쌓아서 만드는 방식을 의미합니다.

**작동 방식**:
빈 Sequential 모델을 만듭니다. (빈 박스 준비)
여기에 .add() 명령어를 통해 층을 하나씩 추가합니다.
데이터는 이 순서대로 통과하며 처리됩니다.



2)**Dense**

**역할**: 실제로 계산이 일어나는 신경망 층(Layer)의 한 종류입니다.

**의미**: 'Dense'는 '빽빽한/밀집한'이라는 뜻입니다. 전문 용어로는 완전 연결 층(Fully Connected Layer)이라고 부릅니다.

**왜 Dense인가?**: 이 층에 있는 모든 뉴런(노드)이 바로 앞 단계의 모든 뉴런과 선 하나도 빠짐없이 빽빽하게 연결되어 있기 때문입니다. 가장 기본적이고 널리 쓰이는 층입니다.




---



### 2. 데이터 준비

In [2]:
!git clone https://github.com/taehojo/data.git   # 깃허브에 준비된 데이터를 가져옵니다.

Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",")  # 수술 환자 데이터를 불러옵니다.
X = Data_set[:,0:16]                                                 # 환자의 진찰 기록을 X로 지정합니다.
y = Data_set[:,16]                                                   # 수술 후 사망/생존 여부를 y로 지정합니다.

Cloning into 'data'...
remote: Enumerating objects: 36, done.[K
remote: Counting objects: 100% (36/36), done.[K
remote: Compressing objects: 100% (29/29), done.[K
remote: Total 36 (delta 9), reused 26 (delta 4), pack-reused 0 (from 0)[K
Receiving objects: 100% (36/36), 483.12 KiB | 18.58 MiB/s, done.
Resolving deltas: 100% (9/9), done.


1)data 폴더 안에 있는 **데이터**들은 ./data/데이터명 형식으로 불러올 수 있다.

2)넘파이 라이브러리의 **loadtxt()함수**를 사용해 csv 데이터셋을 불러온다

**3)기술적 유형 (Data Type)**: numpy.ndarray (N-dimensional Array).
모든 데이터가 동일한 자료형이어야 합니다. (보통 실수형 float64로 불러와집니다.)
수학적 계산(행렬 연산)에 최적화되어 있습니다.

판다스(Pandas)의 DataFrame과는 다릅니다. (Dataframe은 엑셀처럼 인덱스와 컬럼명이 있지만, NumPy 배열은 순수하게 숫자들의 집합입니다.)

4)**csv 파일 구조**를 살펴볼 것. 어디가 종속변수이고 어디 반응 변수인가.
: 이 파일의 경우, 1-16열은 의료기록에 관한 속성 (atttributes)
: 17열은 클래스 (Class), 환자의 사망/생존여부

5)**딥러닝에서는 속성과 클래스를 서로 다른 데이터셋으로 지정**해주어야 하니, 각각 X=, Y=으로 나누어서 정의해줄 것



---



### 3. 구조 결정

In [3]:
model = Sequential()                                                  # 딥러닝 모델의 구조를 결정합니다.
model.add(Dense(30, input_dim=16, activation='relu'))
model.add(Dense(1, activation='sigmoid'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


**텐서플로**는 구글에서 만든 딥러닝 전용 라이브러리

장점: 여러 알고리즘으로 다양한 딥러닝 작업 O
단점: 사용법이 쉽지 않음

==>
텐서플로라는 복잡한 비행기를, **케라스라는 조종사**를 통해 거의 모든 작업을 쉽게 처리할 수 있음.

0)딥러닝은 여러 층이 쌓여 있는 구조이다;

e.g., 1층 분석 모델 -> 2층 분석 모델 -> 3층 분석 모델 -> 출력층. 여러 개의 층이 각자 자신의 작업을 하면서 앞뒤로 정보를 주고 받는다.

1)Sequential() 함수를 모델로 선언함

2)model.add()함수를 통해 딥러닝의 한 층 한층을 추가해주는 것.; 이 함수 안의 케라스 API layers 클래스에서 불러온 Dense 함수가 포함되어 있다 ==> 각 층의 입력과 출력을 촘촘하게 모두 연결하라는 뜻



---



### 4. 모델 실행

In [4]:
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])  # 딥러닝 모델을 실행합니다.
history=model.fit(X, y, epochs=5, batch_size=16)

Epoch 1/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.1575 - loss: 8.9046    
Epoch 2/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.1912 - loss: 2.9078 
Epoch 3/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8471 - loss: 0.4763 
Epoch 4/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8379 - loss: 0.4900 
Epoch 5/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8543 - loss: 0.4517


1. model.compile() = 앞서 만든 model의 설정을 그대로 실행하라는 의미
1.1. 이 안에 loss, optimizer, metrics 등의 인자들을 최적 설정하여, 딥러닝 구조를 어떤 방식으로 구동시키고 어떻게 마무리할지 선정하는 것임.



---



# 미분의 의미

1. 1차함수 y=ax+b에서 a,b를 구하는 것이 딥러닝이다.
2. 2차함수 y=ax^2 -> y=a(x-p)^2 + q에서, 포물선의 최솟값을 구하는 것이 딥러닝이다.
3. 미분한다 = 순간변화율을 구하는 것
4. 순간변화율은 접선을 그엇을 때의 기울기로 정의된다.

: x값의 증가량 = b-a = dx

: y값의 증가량 = f(b)-f(a) = f(a+dx)-f(a)

: 직선의 기울기 = f(a + dx) - f(a) / dx

: 여기에서 x값의 증가량, dx가 0에 가까울 만큼 아주 작을 때의 기울기를 알고 싶다: dx -> 0 까지 될때까지 극한으로 보낸다. : "lim dx ->0"

: 기울기 = y값의 증가량/x값의 증가량

: lim dx->0  y값의 증가량/x값의 증가량

: lim dx->0 dy/dx

: f'(x) = df(x)/dx

5. 함수 f(x)를 미분하라 = x의 증가량이 0에 가까울 만큼 작을때의 y 변화량을, x변화량으로 나누어 순간 기울기를 구하라.

6. 딥러닝에서 자주 만나는 미분 공식 5

f(x)=x -> f'(x) = 1

f(x)=a (a는 상수) -> f'(x) = 0

f(x)=ax (a는 상수) -> f'(x) = a

f(x)=x^a (a는 자연수) -> f'(x) = ax ^a-1

f(g(x))에서, f(x)와 g(x)가 미분 가능할 때 -> {f(g(x))}' = f'(g(x)) * g'(x)





---



# 편미분

: 여러 가지 변수가 식안에 있을 때, 모든 변수를 미분하는 것이 아니라, 우리가 원하는 한 가지 변수만 미분하고, 그 외에는 상수 취급하는 것

e.g.)
f(x,y) = x^2 + yx + a (a는 상수)

함수f를 x에 대하여 편미분하면,

**af/ax** = 2x +y




---



# 지수와 로그


**1. 지수 함수**


y = a^x (a != 1, a>0)

이때, a>1이면, 지수 함수는 우상향

이때 0<a<1이면, 지수 함수는 좌상향




---


**2. 시그모이드 함수**

= 지수의 밑이 자연 상수인 경우를 말함

f(x) = 1/1+e^-x

e=2.178281828 ... (무리수)

x가 커지면 f(x)는 1에 가까워지고,

x가 작아지면, f(x)는 0에 가까워지는 S 형태.

딥러닝의 내부는 입력받은 신호를 얼마나 출력할지 계산하는 과정이 무수히 반복됨.

이때, 출력값을 얼마나 내보낼지 계산하는 함수를 활성화 함수라고 한다.

이 활성화 함수가 여러 가지 형태로 개발되어 왔는데, 가장 먼저 배우는 중요한 함수는 바로 시그모이드 함수이다.

==> (속성이 0 또는 1 두개의 값 중 하나를 고를 때 유용하게 쓰이는 함수)


(reminder)  딥러닝은 여러 층을 위아래로 여러차례 오가며 최적의 모델을 찾는 것.


---


**3. 로그 함수**

로그함수는 지수함수의 역함수이다.

y = a^x 에서,

로그의 정의 (지수식에서 a,b의 위치를 바꿔쓰는 것)에 따라,

x = log_a (y)

역함수이므로, y = log_a (x)는 지수 함수를 기준으로 y=x 선에서 대칭으로 그려진다.

==> 이 함수를 각각 x축, y축 평행이동하면 다음과 같다.

1)y=-log_a(x) (x축에 대한 대칭이동)

2)y=-log_a(-x) (x,y축에 대한 대칭이동)

3)y=-log_a(1-x) (앞선 그래프를 오른쪽 +1만큼 평행이동)

==> 우리는 x가 1에 가까워지거나, 0에 가까워질 수록 오차가 커지는 이 로그 함수가 필요하다. ==> **로지스틱 회귀 모델**에서 사용.



