<a href="https://colab.research.google.com/github/parksuejin1026/2025-ANN/blob/main/middle/Study.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 1주차 수업 / 시그모이드는 0,1 로 출력 생존인지 사망인지 결정할 때 사용하기 좋은 예시

In [1]:
from tensorflow.keras.models import Sequential # 텐서플로우/케라스의 핵심 모델 구조인 Sequential 모델을 불러옵니다.
from tensorflow.keras.layers import Dense # 인공신경망의 기본 구성 요소인 Dense(완전 연결) 레이어를 불러옵니다.
import numpy as np # 배열 및 행렬 계산을 위한 핵심 라이브러리인 NumPy를 np라는 별칭으로 불러옵니다.

# ----------------- 1. 데이터 로드 및 분리 -----------------
# './data/ThoraricSurgery3.csv' 파일에서 데이터를 불러옵니다.
# delimiter=","는 데이터가 쉼표(comma)로 구분되어 있음을 나타냅니다.
Data_set = np.loadtxt("./data/ThoraricSurgery3.csv", delimiter=",")

# 입력 데이터(특성, 피처)를 정의합니다.
# Data_set의 모든 행(:)과 0번째 열부터 15번째 열까지(16은 포함하지 않음)의 데이터를 선택합니다.
# 이 데이터(X)가 모델의 입력(흉부 수술 전 의료 기록 16가지 특성)이 됩니다.
X = Data_set[:, 0:16]

# 출력 데이터(레이블, 타겟)를 정의합니다.
# Data_set의 모든 행(:)과 마지막 열(16번째 열, 0부터 시작)의 데이터를 선택합니다.
# 이 데이터(y)가 모델이 예측해야 하는 값(수술 생존 여부: 0 또는 1)이 됩니다.
y = Data_set[:, 16]

# ----------------- 2. 모델 구조 정의 -----------------
model = Sequential() # 순차적으로 레이어를 쌓아 올리는 딥러닝 모델 객체를 생성합니다.

# 첫 번째 은닉 레이어를 추가합니다.
model.add(Dense(
    30,                 # 출력 뉴런(노드)의 개수를 30개로 설정합니다.
    input_dim=16,       # 이 레이어가 받을 입력 데이터의 차원(특성 수)을 16으로 설정합니다. (첫 레이어에만 필요)
    activation='relu'   # 활성화 함수로 ReLU(Rectified Linear Unit)를 사용합니다. (음수를 0으로 만듦)
))

# 출력 레이어를 추가합니다. (이진 분류 문제이므로 출력은 1개)
model.add(Dense(
    1,                  # 출력 뉴런의 개수를 1개로 설정합니다. (생존 여부 0 또는 1 예측)
    activation='sigmoid'# 활성화 함수로 Sigmoid를 사용합니다. (출력을 0과 1 사이의 확률 값으로 변환)
))

# ----------------- 3. 모델 컴파일 (학습 설정) -----------------
# 모델을 학습시키기 위한 환경 설정을 합니다.
model.compile(
    loss='binary_crossentropy', # 손실 함수(Loss Function)로 이진 교차 엔트로피를 사용합니다. (이진 분류에 적합)
    optimizer='adam',           # 최적화 도구(Optimizer)로 Adam 알고리즘을 사용합니다. (가중치를 업데이트하는 효율적인 방식)
    metrics=['accuracy']        # 모델의 성능을 측정할 평가 지표로 '정확도(accuracy)'를 사용합니다.
)

# ----------------- 4. 모델 학습 (훈련) -----------------
# 컴파일된 모델을 실제 데이터로 학습시킵니다.
history = model.fit(
    X,                  # 학습에 사용할 입력 데이터(의료 기록)
    y,                  # 학습에 사용할 정답 데이터(생존 여부)
    epochs=5,           # 전체 학습 데이터셋을 총 5번 반복 학습합니다.
    batch_size=16       # 한 번에 16개의 샘플씩 묶어서 가중치를 업데이트합니다.
)

Epoch 1/5


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step - accuracy: 0.8629 - loss: 3.4036   
Epoch 2/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8632 - loss: 1.6254 
Epoch 3/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8151 - loss: 0.4756 
Epoch 4/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step - accuracy: 0.8585 - loss: 0.4060 
Epoch 5/5
[1m30/30[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step - accuracy: 0.8473 - loss: 0.4272


## 시그모이드 함수 = 0,1 중 하나를 출력해야되는 상황일 때 사용
## $$\sigma(x) = \frac{1}{1 + e^{-x}}$$

# 선형회귀는 직선으로 나타냄

---
*최소제곱법 공식은 최적의 기울기와 최적의 y절편의 값을 찾는 공식임*

$$a = \frac{\sum_{i=1}^{n} (x_i - \bar{x})(y_i - \bar{y})}{\sum_{i=1}^{n} (x_i - \bar{x})^2}$$




In [13]:
# 선형회귀 직선 만들기
import numpy as np

# 이동거리에 따른 택시요금
x = np.array([2 ,4 ,6, 8]) # 이동거리 x
y = np.array([77, 88, 100, 123]) # 택시 요금 y

# x,y 값의 평균을 구해주는 np함수 np.mean
mx = np.mean(x)
my = np.mean(y)

# 출력으로 확인
print("x의 평균값 : ", mx) # m은 mean 평균이라는 의미
print("y의 평균값 : ", my,"\n")

divisor =sum([(i - mx) ** 2 for i in x]) # 분모값 구하기 i 값을 x의 값들인 2,4,6,8로 한번씩 총 4번 대입

def top(x, mx, y, my): # 분자 구하기
  d = 0
  for i in range(len(x)):
    d += (x[i] - mx) * (y[i] - my)
  return d
dividend = top(x, mx, y, my)

print("분모 :", divisor)
print("분자 : ", dividend,"\n" )

# 기울기 a를 구하는 공식 (최소 제곱법 공식)
a = dividend / divisor

# y절편 b를 구하는 공식 y의 평균값 - (x의 평균값 * 기울기)
b = my - (mx * a)

# 출력으로 확인
print("기울기 a = ", a, "\ny절편 b =" , b)

print("따라서 최적의 선형회귀직선을 나타내는 함수 f(x) = %.1fx + %.1f" %(a,b))

x의 평균값 :  5.0
y의 평균값 :  97.0 

분모 : 20.0
분자 :  150.0 

기울기 a =  7.5 
y절편 b = 59.5
따라서 최적의 선형회귀직선을 나타내는 함수 f(x) = 7.5x + 59.5


## 평균제곱오차

In [15]:
import numpy as np

# 가상의 기울기 a와 y절편 b 만들기
fake_a = 3
fake_b = 76

# 이동거리 x와 금액 y의 넘파이 배열 생성
x = np.array([2, 4, 6, 8])
y = np.array([81, 93, 91, 97])

# y = ax + b에 가상의 a,b 값을 대입한 결과를 출력하는 함수
def predict(x):
  return fake_a * x + fake_b

# 예측 값이 들어갈 빈 리스트를 만들기
predict_result = []

# 모든 x값을 한 번씩 대입하여 predict_result 리스트를 완성하기
for i in range(len(x)):
  predict_result.append(predict(x[i]))
  print("이동거리 = %.f km, 실제점수 = %.f , 예측점수 = %.f" % (x[i], y[i], predict(x[i])))

# 평균 제곱 오차 함수를 각 y값에 대입하여 최종 값을 구하는 함수
n = len(x)
def mse(y, y_pred):
  return (1/n) * sum((y - y_pred) ** 2  )

# 평균 제곱 오차 값을 출력
print("평균 제곱 오차 : " + str(mse(y,predict_result)))

이동거리 = 2 km, 실제점수 = 81 , 예측점수 = 82
이동거리 = 4 km, 실제점수 = 93 , 예측점수 = 88
이동거리 = 6 km, 실제점수 = 91 , 예측점수 = 94
이동거리 = 8 km, 실제점수 = 97 , 예측점수 = 100
평균 제곱 오차 : 11.0
