<a href="https://colab.research.google.com/github/HyeonGilHwang/Modu_DL/blob/main/%EC%B2%AB%EC%A7%B8%EB%A7%88%EB%8B%B9_%EB%94%A5%EB%9F%AC%EB%8B%9D_%EC%8B%9C%EC%9E%91%EC%9D%84_%EC%9C%84%ED%95%9C_%EC%A4%80%EB%B9%84_%EC%9A%B4%EB%8F%99.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 1장 나의 첫 딥러닝



## 1 딥러닝 실행을 위한 준비 사항
#### 데이터  
- 정답이 있는 데이터를 이용해 정답을 맞추는 것을 '지도 학습'이라 한다.
- 정답이 없는 데이터를 이용해 정답을 맞추는 것을 '비지도 학습'이라 한다.  

#### 컴퓨터(CPU? GPU?)
- 딥러닝을 일반 CPU 컴퓨터에서 동작시킬지 아니면 고속 그래픽 처리에 특화된 전용 프로세서인 GPU에서 동작시킬지 선객할 수 있다. 데이터의 용량이 클 경우에는 GPU 작업 환경이 좋다.

#### 프로그램
- 딥러닝을 구동할 수 있게끔 프로그래밍을 해야한다.

## 2 딥러닝 작업 환경 만들기
- 하나는 자신의 컴퓨터에 필요한 프로그램을 설치해 사용하는 방법
- 다른 하나는 구글 코랩(Google Colab)을 이용하는 방법

## 3 미지의 일을 예측하는 원리
- 머신러닝은 데이터 안에서 규칙을 발견하고 그 규칙을 새로운 데이터에 적용해서 새로운 결과를 도출하는 데 초점이 맞춰져 있다.
- 머신런닝은 기존 데이터를 이용해 아직 일어나지 않은 미지의 일을 예측하기 위해 만들어진 기법이다.
- 데이터가 입력되고 패턴이 분석되는 과정을 학습(training)이라고 한다.

## 4 폐암 수술 환자의 생존율 예측하기

In [None]:
# 딥러닝을 구동하는데 필요한 케라스 함수 호출
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 필요한 라이브러리 불러오기
import numpy as np
import tensorflow as tf

# 실행할 때마다 같은 결과를 출력하기 위해 설정하는 부분
np.random.seed(3)
tf.random.set_seed(3)

# 준비된 수술 환자 데이터를 불러오기
Data_set = np.loadtxt('/content/drive/MyDrive/dataset/ThoraricSurgery.csv', delimiter = ",")

# 환자의 기록과 수술 결과를 X와 Y로 구분하여 저장
X = Data_set[:, 0:17]
Y = Data_set[:, 17]

# 딥러닝 구조를 결정(모델을 설정하고 실행)
model = Sequential()
model.add(Dense(30, input_dim = 17, activation = 'relu'))
model.add(Dense(1, activation = 'sigmoid'))

# 딥러닝 실행
model.compile(loss = 'binary_crossentropy', optimizer = 'adam', metrics = ['accuracy'])
model.fit(X, Y, epochs = 100, batch_size=10)

# 결과 창에서 눈여겨 보아야 할 값은 맨 아래 줄의 loss(손실 값)와 accuracy(정확도)다.
# loss는 예측에서 빗나간 정도, accuracy는 예측이 성공할 확률이다.

## 5 딥러닝의 개괄 잡기
- 첫 번째 부분: 데이터 분석과 입력
  - 데이터를 불러와서 사용할 수 있게 만들어 주는 부분이다.

In [None]:
# 필요한 라이브러리를 불러옴
import numpy as np

In [None]:
# ThoraricSurgery.csv 라는 외부데이터 셋을 불러와 Data_set에 저장
# 데이터는 총 18개 항목 470개로 구성
# 1~17까지는 속성(attribute), 마지막 18번은 클래스(class)다.
Data_set = np.loadtxt('/content/drive/MyDrive/dataset/ThoraricSurgery.csv', delimiter = ",")

In [None]:
# 입력과 정답을 나뉘어서 저장
X = Data_set[:, 0:17]
Y = Data_set[:, 17]

- 두 번째 부분: 딥러닝 실행
  - 딥러닝을 실제로 실행하는 부분

In [None]:
# 케라스 라이브러리 중에서 Sequential()함수와 Dense()함수 불러오기
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

In [None]:
# Sequential()함수는 딥러닝의 구조를 한 층 한 층 쉽게 쌓아올릴 수 있게 한다.
# model.add()를 통해 필요한 층을 차례로 추가
# Dense()는 각 층이 제각각 어떤 특성을 가질지 옵션을 설정하는 역할을 한다.
# activation은 다음 층으로 어떻게 값을 넘길지 결정하는 부분이다. 여기서는 가장 많이 사용되는 relu와 sigmoid 함수를 지정
model = Sequential()
model.add(Dense(30, input_dim=17, activation='relu'))
model.add(Dense(1, activation = 'sigmoid'))

In [None]:
# 딥러닝의 구조와 층별 옵션을 정하고 나면 compile()함수를 이용해 이를 실행
# loss는 한 번 신경망이 실행될 때마다 오차 값을 추적하는 함수다.
# optimizer는 오차를 어떻게 줄여 나갈지 정하는 함수다.
model.compile(loss='mean_squared_error', optimizer='adam', metrics=['accuracy'])
model.fit(X, Y, epochs = 100, batch_size=10)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<tensorflow.python.keras.callbacks.History at 0x7f2df13f1e50>

# 2장 딥러닝을 위한 기초 수학

## 1 일차 함수, 기울기와 y절편
- 함수란 두 집합 사이의 관계를 설명하는 수학 개념이다.
- 일차 함수는 y가 x에 관한 일차식으로 표현된 경우를 말한다.



$$y = ax + b (a\neq0)$$



- p41 그림참고

## 2 이차 함수와 최솟값
- 이차 함수란 y가 x에 관한 이차식으로 표현되는 경우를 말한다.
- 포물선의 맨 아래에 위치한 지점이 최솟값이 되는데, 딥러닝을 실행할 때는 이 최솟값을 찾아내는 과정이 매우 중요하다.



$$y =ax^{2}(a \neq0) $$

## 3 미분, 순간 변화율과 기울기
- 미분은 딥러닝을 이해하는 데 가장 중요한 수학 원리다.
- x가 왼쪽이나 오른쪽으로 조금씩 이동했을 때, y 값 역시 매우 미세하게 변화하는데, 이 순간의 변화를 놓고 순간 변화율이라고 한다. 따라서, 미분을 한다는 것은 쉽게 말해 순간 변화율을 구한다는 것이다.
- 순간변화율은 다음과 같다.




$$\lim_{\nabla x \to \infty}\frac{f(a+\nabla x)-f(a)}{\nabla x} $$


- 그래프와 맞닿은 접선을 기울기라고 한다.
- 어느 순간에 어떤 변화가 일어나고 있는지를 숫자로 나타낸 것을 미분 계수라 한다.
- a와 b를 지나는 직선의 기울기는 다음과 같다.

$$ \;\;\;\;\; \frac{f(b)-f(a)}{b-a} = \frac{f(a+\nabla x)-f(a)}{\nabla x} $$




- 미분의 4가지 성질
  - f(x) = a에서 a가 상수일 때 미문 값은 0이다.
  - f(x) = x일때의 미분값은 1이다.
  - f(x) = ax에서 a가 상수이면 미문 값은 a이다.
  - f(x) = $x^{a}$에서 a가 자연수이면 미분 값은 $ax^{a-1}$이다.

- p43~p45 그림 참고 

## 4 편미분
- 편미분은 모든 변수를 미분하는 것이 아니라 우리가 원하는 한 가지 변수만 미분하고 그 외에는 모두 상수로 취급한다.




$$f(x,y) = x^{2}+xy + a$$

$$\frac{\partial f}{\partial x}=2x +y$$

## 5 지수와 지수 함수
- 지수란 다음과 같은 형태를 말한다.


$$a^{x}$$


- 여기서 a를 '밑'이라 하고 x를 '지수'라고 부른다. a를 x만큼 반복해서 곱한다는 뜻이다.
- 지수 함수는 다음과 같은 형태다.


$$y = a^{x}(a \neq 1, a > 0)$$


- p47 그림참고

## 6 시그모이드 함수
- 시그모이드 함수는 지수 함수에서 밑의 값이 자연 상수 e인 함수를 말한다.
- 자연 상수 $e$가 지수 함수에 포함되어 분모에 들어가면 시그모이드 함수가 된다.


$$f(x) = \frac{1}{1+e^{-x}}$$


- x가 큰 값을가지면 1에 가까워지고, 작은 값을 가지면 0에 가까원진다. 
- S자 형태로 그려지는 이 함수의 속성은 0 또는 1, 두 개의 값 중 하나를 고를 떄 유용하다.
- p48 그림참고

## 7 로그와 로그 함수
- 로그 함수와 지수 함수는 역함수의 관계다.
- 역함수는 x와 y를 서로 바꾸어 가지는 함수다.


$$a^{x}= y \rightarrow  y = log_{a}x$$


- p50~p51 그림참고