# 손실함수 (loss function)
신경망 성능의 '나쁨'을 나타내는 지표.   
출력값이 높으면 성능이 나쁘다.

## 1. 오차제곱합 (sum of squares for error, SSE)

In [1]:
import numpy as np

In [2]:
def sum_squares_error(y, t):
  return 0.5 * np.sum((y - t)**2)

In [3]:
# 정답은 2
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예1: 정답이 2일 확률이 높다고 예측
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(sum_squares_error(np.array(y), t))

# 예2: 7일 확률이 높다고 예측
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(sum_squares_error(np.array(y), t))

0.09750000000000003
0.5975


## 2. 교차 엔트로피 (cross entropy error, CEE)

In [None]:
def cross_entropy_error_single(y, t):
  delta = 1e-7
  return -np.sum(t * np.log(y+delta))

In [4]:
def cross_entropy_error_batch(y, t):
  delta = 1e-7
  if y.ndim == 1: # 맨 아래 cell에서 보충 설명
    t = t.reshape(1, t.size)
    y = y.reshape(1, y.size)
  
  batch_size = y.shape[0]
  return -np.sum(t * np.log(y + delta)) / batch_size # one-hot-encoding
  # return -np.sum(np.log(y[np.arange(batch_size), t] + delta)) / batch_size # label-encoding

In [5]:
# 정답은 2
t = [0, 0, 1, 0, 0, 0, 0, 0, 0, 0]

# 예1: 정답이 2일 확률이 높다고 예측
y = [0.1, 0.05, 0.6, 0.0, 0.05, 0.1, 0.0, 0.1, 0.0, 0.0]
print(cross_entropy_error_single(np.array(y), np.array(t)))

# 예2: 7일 확률이 높다고 예측
y = [0.1, 0.05, 0.1, 0.0, 0.05, 0.1, 0.0, 0.6, 0.0, 0.0]
print(cross_entropy_error_single(np.array(y), np.array(t)))

0.510825457099338
2.302584092994546


In [6]:
y = np.zeros((2, 3, 4))
y

array([[[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]],

       [[0., 0., 0., 0.],
        [0., 0., 0., 0.],
        [0., 0., 0., 0.]]])

In [8]:
y.ndim

3

In [11]:
k = np.array([1, 2, 3])
k.ndim
k.reshape(1, k.size)
k.ndim
k

array([1, 2, 3])

In [24]:
k = np.array([1, 2, 3])
print("batch_size == 1 이어서 하나만 온 데이터 :", k)
print("k.ndim =", k.ndim)
print("k.shape =", k.shape)
k = k.reshape(1, k.size) # 1차원 데이터 k를 1*3 형태의 2차원 배열로 변환
print("2차원으로 변환된 데이터 :", k)
print("데이터 형태 :", k.shape)

batch_size == 1 이어서 하나만 온 데이터 : [1 2 3]
k.ndim = 1
k.shape = (3,)
2차원으로 변환된 데이터 : [[1 2 3]]
데이터 형태 : (1, 3)
