In [1]:
# 기본
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# 경고 뜨지 않게...
import warnings
warnings.filterwarnings('ignore')

# 그래프 설정
plt.rcParams['font.family'] = 'Malgun Gothic'
# plt.rcParams['font.family'] = 'AppleGothic'
plt.rcParams['font.size'] = 16
plt.rcParams['figure.figsize'] = 20, 10
plt.rcParams['axes.unicode_minus'] = False

# 랜덤 모듈
import random

# 학습 모델 저장 및 복원
import pickle

# 딥러닝 라이브러리
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.layers import Activation

# 평가함수
# 분류용
from sklearn.metrics import accuracy_score
from sklearn.metrics import precision_score
from sklearn.metrics import recall_score
from sklearn.metrics import f1_score
from sklearn.metrics import roc_auc_score

# 회귀용
from sklearn.metrics import r2_score
from sklearn.metrics import mean_squared_error

# 랜덤시드 설정
# 데이터를 랜덤하게 섞거나 가중치를 랜덤하게 설정하는 등..
# 작업에서 랜덤을 적용하는 경우가 더러 있다.
# 이에, 시드를 고정시킨다.
random_seed = 1
np.random.seed(random_seed)
random.seed(random_seed)
tf.random.set_seed(random_seed)

# 현재 프로젝트에서 GPU 메모리 사용을 필요한 만큼만 쓸 수 있도록 한다.
# 컴퓨터에 있는 GPU 정보들을 가져온다.

gpus = tf.config.experimental.list_physical_devices('GPU')
# gpu가 있다면...
if len(gpus) > 0 :
    try :
        for gpu in gpus :
            tf.config.experimental.set_memory_growth(gpu, True)
    except RuntimeError as e :
        print(e)

# gpus = tf.config.experimental.list_logical_devices('GPU')
# # GPU가 있다면...
# if len(gpus) > 0:
#     try :
#         for gpu in gpus :
#             tf.config.experimental.set_memory_growth(gpu, True)
#     except RuntimeError as e :
#         print(e)

### 평균 제곱 오차
- 앞서 살펴본 최소 제곱법을 이용하면 최적의 기울기와 y절편을 계산할 수 있다.
- 최소 제곱법은 입력데이터의 컬럼이 하나일 경우 정확한 계산이 가능하다.
- 허나 세상의 모든 데이터는 그 형태가 다르고 컬럼이 하나인 것만 존재하는 것은 아니다.
- 이에 세상의 모든 데이터를 대응하기 위한 공식을 만들기가 어렵다.
- 따라서 최적의 선을 찾기 위해 임의 선을 하나 그리고 진짜 데이터와 얼마나 오차가 발생하는지 파악한 다음 오차가 최소가 되는 선을 찾기 위해 기울기와 y절편을 조금씩 수정해 나가는 방식을 사용한다.
- 이 때, 오차 정도를 구하기 위해서 평균 제곱 오차라는 공식을 사용한다.

In [3]:
# 학습 데이터
공부한시간 = [2, 4, 6, 8]
성적 = [81, 93, 91, 97]

In [4]:
# 기울기와 절편
기울기 = 2.3
y절편 = 79.0

In [6]:
# 예측 결과를 가져온다
예측성적 = []
for v1 in 공부한시간:
    a1 = (기울기 * v1) + y절편
    예측성적.append(a1)
예측성적

[83.6, 88.2, 92.8, 97.4]

In [7]:
# 계산의 편리성을 위해 ndarray를 생성한다.
array1 = np.array(성적)
array2 = np.array(예측성적)

In [11]:
# 진짜 결과 예측 결과를 뺀다.
array3 = array1 - array2
array3

array([-2.6,  4.8, -1.8, -0.4])

In [16]:
# 각각의 제곱을 구한다.
array4 = array3 ** 2
array4

array([ 6.76, 23.04,  3.24,  0.16])

In [17]:
# 평균을 구한다.
mse = array4.mean()
mse

8.299999999999985