In [None]:
# keras
# 케라스(keras)는 파이썬으로 구현된 간결한 딥러닝 라이브러리 입니다.
# 딥러닝 비전문가라도 각자가 필요한 분야에서 손쉽게 딥러닝 모델을 개발하고 활용할 수 있도록
# 케라스는 직관적인 API를 제공하고 있습니다.
# 내부적으로는 텐서플로우(Tensorflow), 티아노(Theano), CNTK 등의 딥러닝 전용 엔진이 구동
# 되지만 케라스 사용자는 복잡한 내부 엔진까지는 알 필요는 없습니다.
# 직관적인 API로 쉽게 다층퍼셉트론 신경망 모델, 컨볼루션 신경망 모델 또는 이를 조합한 모델은
# 물론 다중 입력 또는 다중 출력 등 다양한 기능을 구현할 수 있습니다.

In [None]:
# keras의 주요 특징

# 파이썬 기반
# - Caffe 처럼 별도의 모델 설정 파일이 필요 없으며 파이썬 코드로 모델들이 정의된다.
# 최소주의 (Minimalism)
# - 각 모듈은 짧고 간결하다.
# - 모든 코드는 한 번 훑어보는 것으로도 이해가 가능하다.
# 모듈화(Modularity)
# - 케라스에서 제공되는 모듈은 독립적으로 설정 가능하며, 가능한 최소한의 제약사항으로 서로 연결될 수 있다.
# 모델은 시퀀스 또는 그래프로 이러한 모듈들을 구성한 것이다.
# - 특히 신경망 층, 비용함수, 최적화 기법, 활성화 함수, 정규화 기법은 모두 독립적인 모듈이며, 새로운 모델을
# 만들기 위해서는 이러한 모듈을 조합할 수 있다.
# 쉬운 확장성
# - 새로운 클래스나 함수로 모듈을 아주 쉽게 추가할 수 있다.
# - 고급 연구에 필요한 다양한 표현을 할 수 있다.

In [None]:
# keras 프로그램 작업 순서

# 1. 데이터 생성
# - 원본데이터를 불러오거나 시뮬레이션을 통해 데이터를 생성한다.
# - 데이터로부터 훈련셋, 시험셋, 검증셋을 생성한다.
# - 이때 딥러닝 모델의 학습 및 평가를 할 수 있도록 포맷 변환을 한다.

# 2. 모델 설정 : Sequential()
# - 시퀀스 모델을 생성한 뒤 필요한 레이어를 추가하여 구성한다.
# - 좀 더 복잡한 모델이 필요할 때는 케라스 함수 API를 사용한다.

# 3. 모델 학습과정 설정 : compile()
# - 모델 학습을 하기 전에 모델 학습에 대한 설정을 수행한다.
# - 손실함수 및 최적화 방법을 정의한다.
# - 케라스에서는 compile() 함수를 사용한다.

# 4. 모델 학습 : fit()
# - 구성한 모델을 훈련셋으로 학습시킨다.
# - 케라스에서는 fit() 함수를 사용한다.

# 5. 학습과정 살펴보기
# - 모델 학습시 훈련셋, 검증셋의 손실 및 정확도를 측정한다.
# - 반복 횟수에 따른 손실 및 정확도 추이를 보면서 학습 상황을 판단한다.

# 6. 모델 평가 : evaluate()
# - 준비된 시험셋으로 학습한 모델의 성능을 평가한다.
# - 케라스에서는 evaluate() 함수를 사용한다.

# 7. 모델 사용 : predict()
# - 임의의 입력 데이터를 모델을 사용하여 예측한다.
# - 케라스에서는 predict() 함수를 사용한다.

In [1]:
# Keras 예제

# keras 를 이용해서 model을 만들고, 입력 데이터(train data)를 가지고 오차가 최소가 되도록
# 15,000회 학습을 한다.

# 이렇게 학습이 이루어진 다음에 테스트 데이터(test data)가 주어졌을 때 
# 결과를 예측하는 예제
# first_keras.py

import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

np.random.seed(1234)      # 실행할 때마다 같은 결과를 출력하기 위해 설정하는 부분

# 학습 데이터
x_train = [1,2,3,4]
y_train = [2,4,6,8]

# 모델 정의
model = Sequential()
model.add(Dense(1, input_dim=1))    # 출력 노드 1개, 입력 노드 1개

# 모델 학습 방식 설정
model.compile(loss='mse', optimizer='adam')     # 평균 제곱 오차

# 모델 학습
model.fit(x_train, y_train, epochs=1500)       # 15000번 학습(여건상 1500번 실행)

# 모델을 이용해서 예측
y_predict = model.predict(np.array([1,2,3,4]))
print(y_predict)

# 모델을 이용해서 예측
y_predict = model.predict(np.array([7,8,9,100]))
print(y_predict)

# 1500번 학습 결과
# [[2.289495 ]
#  [4.130784 ]
#  [5.972073 ]
#  [7.8133616]]

# [[ 13.337228]
#  [ 15.178516]
#  [ 17.019806]
#  [184.57709 ]]


Epoch 1/1500
Epoch 2/1500
Epoch 3/1500
Epoch 4/1500
Epoch 5/1500
Epoch 6/1500
Epoch 7/1500
Epoch 8/1500
Epoch 9/1500
Epoch 10/1500
Epoch 11/1500
Epoch 12/1500
Epoch 13/1500
Epoch 14/1500
Epoch 15/1500
Epoch 16/1500
Epoch 17/1500
Epoch 18/1500
Epoch 19/1500
Epoch 20/1500
Epoch 21/1500
Epoch 22/1500
Epoch 23/1500
Epoch 24/1500
Epoch 25/1500
Epoch 26/1500
Epoch 27/1500
Epoch 28/1500
Epoch 29/1500
Epoch 30/1500
Epoch 31/1500
Epoch 32/1500
Epoch 33/1500
Epoch 34/1500
Epoch 35/1500
Epoch 36/1500
Epoch 37/1500
Epoch 38/1500
Epoch 39/1500
Epoch 40/1500
Epoch 41/1500
Epoch 42/1500
Epoch 43/1500
Epoch 44/1500
Epoch 45/1500
Epoch 46/1500
Epoch 47/1500
Epoch 48/1500
Epoch 49/1500
Epoch 50/1500
Epoch 51/1500
Epoch 52/1500
Epoch 53/1500
Epoch 54/1500
Epoch 55/1500
Epoch 56/1500
Epoch 57/1500
Epoch 58/1500
Epoch 59/1500
Epoch 60/1500
Epoch 61/1500
Epoch 62/1500
Epoch 63/1500
Epoch 64/1500
Epoch 65/1500
Epoch 66/1500
Epoch 67/1500
Epoch 68/1500
Epoch 69/1500
Epoch 70/1500
Epoch 71/1500
Epoch 72/1500
E

In [15]:
# 폐암 수술환자의 생존율 예측하기

# 470명 폐암 수술환자의 생존율 정보가 저장된 파일(ThoraricSurgery.csv)을 읽어와서 모델을 정의하고,
# 모델을 학습한 다음에 정확도를 구해보자?

# 폐암 수술환자 생존율 데이터 : dataset/ThoraricSurgery.csv

# 모델 정의
# model = Sequential()
# - keras에서 모델을 만들때는 Sequential()함수를 사용함

# 은닉층
# model.add(Dense(30, input_dim=17, activation='relu'))
# - model에 새로운 층을 추가할때는 add()함수를 사용함
# - model에 추가된 각 층은 Dense()함수를 통해서 구체적인 구조를 설정한다.
# - 출력node 30개, 입력 데이터 17개, 활성화 함수는 relu 함수를 사용함
# - 첫번째 Dense()가 입력층 + 은닉층 역할을 한다.

# 출력층
# model.add(Dense(1, activation='sigmoid'))
# - 출력층에서 활성화 함수는 sigmoid함수를 사용해서 
# 폐암환자의 생존유무를 결정한다. ( 1 or 0 )

# 모델 학습과정 설정 및 모델 학습

# 모델 학습과정 설정
# model.compile(loss='mean_squared_error', optimizer='adam', metrics=['accuracy'])
# - 오차함수는 평균제곱오차(mean_squared_error) 사용
# - 최적화 방법(optimizer)는 adam 사용
# - metrics=[‘accuracy’]는 모델이 컴파일될 때 모델의 정확도(accuracy)를 출력

# 모델학습
# model.fit(X, Y, epochs=30, batch_size=10)
# - 학습 프로세스가 모든 샘플에 대해 한번 실행하는 것을 1 epoch(에포크)라고 한다.
# - epochs=30 은 각 샘플을 처음 부터 끝까지(470개) 30번 반복 실행한다는 의미
# - batch_size=10 은 전체 470개의 샘플을 10개씩 끊어서 학습하라는 의미

# 시그모이드 함수(sigmoid function)
# Sigmoid 함수는 S와 같은 형태로 미분 가능한 0~1 사이의 값을 반환하기에 Logistic Classification과
# 같은 분류 문제의 가설과 비용 함수(Cost Function)에 많이 사용됩니다.

# 활성화 함수
# 은닉층 에서 자주 이용하는 활성화 함수
# 이전에는 활성화 함수로 tanh나 Sigmoid함수를 자주 사용했으나 최근에는
# ReLU 함수를 사용 -> 상대적으로 학습 속도가 빠르고 학습이 잘 됨.

# deeplearning_ex01.py

# 필요한 라이브러리를 불러옴
import numpy
import tensorflow as tf
import pandas as pd
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 실행할 때마다 같은 결과를 출력하기 위해 설정하는 부분
seed = 0
numpy.random.seed(seed)
tf.random.set_seed(seed)

# 준비된 수술 환자 데이터를 불러옴
# dataset = numpy.loadtxt('../dataset/ThoraricSurgery.csv', delimiter=',')
dataset = pd.read_csv('/content/drive/My Drive/workspace-total/workspace-python/2020_07_24_t2/dataset/ThoraricSurgery.csv')

# 환자의 기록과 수술 결과를 X와 Y로 구분하여 저장
# X = dataset[:,0:17]           # 0 ~ 16번 까지 : 환자들의 정보
# Y = dataset[:,17]             # 17번 : 환자들의 생존유무 (0 or 1)
X = dataset.iloc[ : , 0:17] # 0 ~ 16번 까지 : 환자들의 정보
Y = dataset.iloc[ : ,17]    # 17번 : 환자들의 생존유무 (0 or 1)

# 모델을 설정
model = Sequential()      # 모델 정의
model.add(Dense(30, input_dim=17, activation='relu')) # 은닉층: 출력 node 30개, 입력데이터 17개
model.add(Dense(1, activation='sigmoid'))             # 출력층: 입력 node 30개, 출력 node 1개

# 모델 학습고정 설정 및 모델 학습
# 전체 데이터 470개를 10개씩 끊어서, 30번 학습함
model.compile(loss='mean_squared_error', optimizer='adam', metrics=['accuracy'])
model.fit(X,Y,epochs=30,batch_size=10)

# 모델 평가: 정확도
# print('\n Accuracy: %.4f' %(model.evaluate(X,Y)[1]))

#  Accuracy: 0.8529

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30

 Accuracy: 0.8529
