# Chapter 05

- 학습을 통해 최적의 가중치를 찾아가는 방법에 대해 알아본다.
- 신경망 학습의 지표인 Loss function에 대해 알아본다.

## 1. 데이터 주도학습
<img src="./images/compare.png" alt="Neural" style="height: 300px;"/>
- 신경망은 이미지를 '있는 그대로' 학습한다.
- Deeplearning == End-to-end machine learning

## 2. 데이터 분할
- 데이터를 훈련데이터와 시험데이터로 분할 (Training Data & Test Data)
- 훈련데이터를 사용해 가중치 학습 및 모델 생성
- 시험데이터를 사용해 생성된 모델의 정확성 테스트
- 분할하는 이유 : 모델의 범용적인 능력을 평가하기 위해. 오버피팅 방지
- Overfitting : 특정 데이터들에만 지나치게 정확성이 높은 데이터.

## 3. Loss function
- 신경망 성능의 ***나쁨*** 을 나타내는 지표
- 값이 클 수록 정답과의 오차가 크다.
- ***나쁨*** 이 점점 적어진다 => 성능이 점점 좋아진다.

### 1) 평균제곱오차 (Mean Square Error)
- 계산의 편의를 위해 1/2를 사용한다. 원래는 1/n 이다.
<img src="./images/mse.jpeg" alt="Neural" style="height: 100px;"/>

- y : 신경망이 추측한 값
- t : 정답 레이블의 값

In [7]:
import numpy as np

def mean_squared_error(y, t):
    return 0.5 * np.sum((y-t)**2)

In [8]:
t= [0,1,0,0,0,0,0,0,0,0]
y = [0.1,0.4,0.1,0.15,0.05,0.05,0.06,0.04,0.05,0]

t= [0,1,0,0,0,0,0,0,0,0]
y = [0.1,0.6,0,0.05,0.05,0.05,0.06,0.04,0.05,0]

mean_squared_error(np.array(y),np.array(t))

0.09260000000000002

### 2) 교차 엔트로피 오차 (Cross Entropy Error)
<img src="./images/cee_1.jpeg" alt="Neural" style="height: 100px;"/>
- y : 신경망이 추측한 값
- t : 정답 레이블의 값

In [9]:
def cross_entropy_error_normal(y, t):
    delta = 1e-7 # log에 0이 안 들어가게 하려는 값.
    return -np.sum(t*np.log(y+delta))

#### 복수의 데이터를 위한 CEE
<img src="./images/cee_2.jpeg" alt="Neural" style="height: 100px;"/>
- N으로 나누어 정규화.
- N으로 나누어 평균손실함수를 구한다.

## 4. 미니배치
- 무작위로 N개의 데이터를 추출하여 학습한다.
- 자세한 내용은 생략

In [10]:
def cross_entropy_error_batch(y, t):
    delta = 1e-7
    if y.dim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
        
    batch_size = y.shape[0]
    return -np.sum(t*np.log(y)) / batch_size

In [11]:
def cross_entropy_error_general(y, t):
    if y.ndim == 1:
        t = t.reshape(1, t.size)
        y = y.reshape(1, y.size)
        
    # 훈련 데이터가 원-핫 벡터라면 정답 레이블의 인덱스로 반환
    if t.size == y.size:
        t = t.argmax(axis=1)
             
    batch_size = y.shape[0]
    return -np.sum(np.log(y[np.arange(batch_size), t] + 1e-7)) / batch_size