# 3.5 출력층 설계하기

신경망은 분류와 회귀 모두에서 아용이 가능함  
어떤 문제냐에 따라 출력층에서 사용하는 활성화 함수가 달라짐  

    - 회귀: 항등함수  
    - 분류: 소프트맥스 함수  


## 3.5.1 항등 함수와 소프트맥스 함수 구현하기

    - 항등함수: 입력값과 출력값이 동일

분류에서 사용하는 소프트맥스 함수는 다음과 같다.  

![image](./image/e_3_10.png)

exp(x) = e^x을 의미하는 지수함수 (e는 자연상수)  
a는 입력층이고 y는 출력층이다. 분모를 보면 모든 입력층에서 영향을 받는 것을 알 수 있다.  

In [1]:
# 소프트맥스 함수 구현
import numpy as np

a = np.array([0.3, 2.9, 4.0])
exp_a = np.exp(a) # 지수 함수
print(exp_a)

sum_exp_a = np.sum(exp_a) #지수 함수의 합
print(sum_exp_a)

y = exp_a/sum_exp_a
print(y)

[ 1.34985881 18.17414537 54.59815003]
74.1221542101633
[0.01821127 0.24519181 0.73659691]


In [2]:
# 앞으로 사용하기 위해 함수로 구현

def softmax(a):
    exp_a = np.exp(a)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

## 3.5.2 소프트맥스 함수 구현 시 주의점

앞의 소프트 맥스 함수를 구현한 softmax() 함수는 오버플로 문제가 있을 수 있음.  
왜냐하면 지수함수가 굉장히 커질 수 있기 때문  
이것이 개선 가능한 소프트맥스 함수를 구현해보자  

![image](./image/e_3_11.png)  

C: 임의의 정수
C': C를 exp 함수 안으로 옮기면서 logC가 되고 이것을 C'로 정의  
위 식을 보면 소프트 맥싀 지수함수를 계산할 때 어떤 정수를 더해도 결과는 바뀌지 않는다.  
따라서 각 값의 최대 값들을 빼주면 오버플로의 발생을 방지가 가능하다.

In [5]:
a = np.array([1010,1000,990])
print(softmax(a))

c = np.max(a)
print(a-c)

print(softmax(a-c))

[nan nan nan]
[  0 -10 -20]
[9.99954600e-01 4.53978686e-05 2.06106005e-09]
  exp_a = np.exp(a)
  y = exp_a / sum_exp_a


In [7]:
# 오버플로 방지 구문을 추가한 새로운 softmax 함수

def softmax(a):
    c = np.max(a)
    exp_a = np.exp(a-c)
    sum_exp_a = np.sum(exp_a)
    y = exp_a / sum_exp_a
    return y

softmax(np.array([1010, 1000, 990]))

array([9.99954600e-01, 4.53978686e-05, 2.06106005e-09])

## 3.5.3 소프트맥스 함수의 특징

    1. 소프트맥스 함수의 출력은 0~1.0사이의 실수이다.
    2. 소프트맥스 함수의 출력의 총합은 1이다. (즉 확률로의 생각이 가능해짐)
    3. 소프트맥스 함수를 적용해서 각 원소의 대소 관계를 변하지 않음 (입력의 크기순 = 출력의 크기순)
 3.5.3 소프트맥스 함수의 특징

    1. 소프트맥스 함수의 출력은 0~1.0사이의 실수이다.
    2. 소프트맥스 함수의 출력의 총합은 1이다. (즉 확률로의 생각이 가능해짐)
    3. 소프트맥스 함수를 적용해서 각 원소의 대소 관계를 변하지 않음 (입력의 크기순 = 출력의 크기순)
        - 따라서 신경망 분류시에는 소프트맥스 함수를 생략해도 상관 없음
    

## 3.5.4 출력층의 뉴런 수 정하기

풀려는 문제에 따라 적절한 개수 선정
