In [1]:
# 필요한 라이브러리와 모듈을 가져옵니다.
from tensorflow.keras.models import Sequential  # 신경망 모델을 순차적으로 구성할 때 사용하는 클래스
from tensorflow.keras.layers import Dense       # 완전 연결(Dense) 레이어를 추가할 때 사용하는 클래스
import numpy as np                              # 수치 계산을 위한 라이브러리
import tensorflow as tf                         # 딥러닝 프레임워크

# 랜덤 시드를 고정하여 실행할 때마다 동일한 결과를 얻도록 설정합니다.
np.random.seed(3)        # numpy의 랜덤 시드 고정
tf.random.set_seed(3)    # TensorFlow의 랜덤 시드 고정

# 데이터를 불러옵니다.
#  - np.loadtxt: CSV 파일을 불러와서 numpy 배열로 변환
#  - "./data/ThoraricSurgery.csv": 데이터 파일의 경로
#  - delimiter=",": CSV 파일의 구분자를 쉼표(,)로 설정
Data_set = np.loadtxt("./data/ThoraricSurgery.csv", delimiter=",")

In [2]:
# 환자의 기록과 수술 결과를 X와 Y로 구분하여 저장합니다.
X = Data_set[:,0:17]
Y = Data_set[:,17]

In [3]:
# Sequential 객체를 생성하여 모델을 순차적으로 쌓기 시작합니다.
model = Sequential()

# 첫 번째 Dense 레이어 추가
#  - 뉴런 수: 30개
#  - 입력 차원: 17개 (input_dim=17)
#  - 활성화 함수: 'relu' (Rectified Linear Unit, 비선형 활성화 함수)
model.add(Dense(30, input_dim=17, activation='relu'))

# 출력 레이어 추가
#  - 뉴런 수: 1개 (이진 분류를 위한 출력)
#  - 활성화 함수: 'sigmoid' (출력을 0과 1 사이의 값으로 변환)
model.add(Dense(1, activation='sigmoid'))

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [4]:
# 모델을 컴파일합니다.
#  - loss: 손실 함수로 'binary_crossentropy'를 사용합니다. (이진 분류 문제에서 사용)
#  - optimizer: 최적화 알고리즘으로 'adam'을 사용합니다. (효율적인 학습을 위한 알고리즘)
#  - metrics: 모델 성능을 평가할 지표로 'accuracy'를 사용합니다.
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

# 모델을 학습시킵니다.
#  - X: 입력 데이터
#  - Y: 정답(레이블) 데이터
#  - epochs: 전체 데이터를 몇 번 반복 학습할지 설정 (여기서는 100번 반복)
#  - batch_size: 한 번에 처리할 데이터 샘플의 수 (여기서는 10개씩 나누어 학습)
model.fit(X, Y, epochs=100, batch_size=10)

Epoch 1/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 5ms/step - accuracy: 0.8083 - loss: 2.2446
Epoch 2/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.8198 - loss: 1.1630
Epoch 3/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.7910 - loss: 0.7521
Epoch 4/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.8308 - loss: 0.5752
Epoch 5/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.8482 - loss: 0.5188
Epoch 6/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 7ms/step - accuracy: 0.8485 - loss: 0.5086
Epoch 7/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8512 - loss: 0.5012
Epoch 8/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8515 - loss: 0.4933
Epoch 9/100
[1m47/47[0m [32m━━━━━━━━━━━━━━━━━

<keras.src.callbacks.history.History at 0x1b2cbff95b0>

In [5]:
model.evaluate(X, Y)

[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 6ms/step - accuracy: 0.8337 - loss: 0.5620


[0.522055447101593, 0.8510638475418091]

In [6]:
type(Data_set)

numpy.ndarray

In [7]:
print("\n Accuracy: %.4f" % (model.evaluate(X, Y)[1]))

[1m15/15[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 4ms/step - accuracy: 0.8337 - loss: 0.5620

 Accuracy: 0.8511


In [8]:
len(X), len(Y)

(470, 470)