In [5]:
import numpy as np

## 신경망 모델 : 입력 벡터(텐서)에 가중치를 곱하고 결과를 더하거나 비선형처리하여 유용한 정보를 추출
#### - 이런 작업을 여러 레이어로 수행하는데 레이어가 2개 이산인 경우 딥러닝모델이라 함
#### - 입력을 받는 계층을 입력계층이며 마지막 계층은 출력계층이며 중간층은 은닉계층
#### - 선형 회귀분석 모델이 여러 단계로 연속적으로 구성 ( Y = WX + b)
#### - 벡터 : 1차원, 텐서 : 다차원 벡터
#### - 입력값은 연산이 필요하므로 벡터여야하며 넘파이배열여야 함
#### - 전 결합층(fully connected) : 신경망의 기본 구조로 각 계층의 출력층이 다음 계층의 입력층에 모두 연결되는 구조로 케라스에서는 Dense층으로 불림 Y = (Wij * Xij + Bi)

##  활성화 함수 : 출력층의 값을 결정하는 함수로 sigmoid, relu, softmax, tahn 등이 있음
#### - 신경망에서는 한계층의 값을 다음 계층으로 그대로 전달하지 않고 비선형적인 활성화함수를 거친
#### - 비선형함수를 사용하는 것은 다음 계층으로 약한 신호는 전달하지 않기 위함 후에 값을 전달
#### - 활성화 함수의 특징은 선형 함수가 아닌 비선형 함수로 선형 함수란 출력이 입력의 상수(가중치, 편향)배만큼 변하는 함수로 
#### - 예를 들어 f(x) = wx + b 라는 함수가 있을 때, w와 b는 상수이며 이 식을 그래프로 시각화하면 직선이며 
#### - 반대로 비선형 함수는 직선 1개로는 그릴 
#### - 중간층 활성화 : sigmoid, relu, tahn 등을 주로 사용
#### - 출력층 활성화 : sigmoid(이진분류), 다중분류(softmax)


## 손실함수 : 실제값과 예측값의 오차를 계산하여 성능을 평가하기 위해 사용
#### - 분류 : categorical_crossentropy, SparseCategoricalCrossentropy
#### - 회귀 : mse, rmse, cross entropy
---
## 옵티마이져 : 모델의 가중치를 조정하여 오차값을 업데이트하여 최소화하기 위함이며 이를 통해 손실함수의 오차률이 줄어듦
#### - GD, SGD, Momentum, Adagrad, Adam, Rmsprop 등이 있음
![image.png](attachment:373300f0-9981-49e3-9df6-65318cd8e24e.png)

## 참고사이트 : https://wikidocs.net/37406
![image.png](attachment:fa5ce1a1-98de-4831-be13-2c58cdc6f0f1.png)

#### sigmoid(0-1), tanh (-1-1) 사이의 평탄화된 신호값을 전달하므로 약한 신호는 전달이 제대로 되지 않는다
#### - 이를 보완한것이 Relu(0~무한대)이며 기울기손실(vanishing gradient) 문제를 해결한 활성화함수이다.
#### - 활성화함수는 계층마다 다르게 사용되며 은닉층은 Relu, 출력층은 분류나 확률을 구할때 Sigmoid를 사용한다

## 순전파 계산 : 1단계 활성화함수(입력값 * 가중치) -> 2단계 활성화함수(1단계출력값 * 가중치) -> ...
#### 오차계산 : 각 뉴런 1/2(실제값 - 마지막 출력층값)2 -> 합계(각 뉴런오차값)
![image.png](attachment:2758c074-a518-4d64-a43c-bde96d8fc9aa.png)
#### 1단계
![image.png](attachment:841d5388-42b7-4ddb-a16c-3d6525f28357.png)
![image.png](attachment:57e618eb-a8c1-4709-91d1-672e0b4de4fa.png)
#### 2단계
![image.png](attachment:184009a7-00d7-4759-ae46-e1e2a2b6c064.png)
![image.png](attachment:1b295542-ba0d-47d8-8584-0a4c2c002924.png)
#### 오차계산
![image.png](attachment:ec3f8f26-aafd-4dc8-892e-5a7d3266c770.png)

---
## 역전파 (back propagation) : 오차를 보정하기 위해 사용하는 경사하강법으로 출력층에서 입력층방향으로 계산하면서 가중치를 업데이트함
#### 출력층 - 2단계
![image.png](attachment:3fa4312e-ea24-4d60-a6cb-e05b9dd9ed5c.png)
![image.png](attachment:1dd87680-8eba-427e-a157-00a15c853861.png)
![image.png](attachment:8e11a2b1-29c5-4132-a766-4a65d26b76d0.png)
![image.png](attachment:426df7aa-fba5-4e14-a606-cd36dd2d40ae.png)
![image.png](attachment:f79c6225-4636-4701-b11a-14fb61fd73b6.png)
![image.png](attachment:ead85406-bd43-4d58-8caa-1b34e26a9ae7.png)
#### 출력층 - 1단계
![image.png](attachment:e411c4cf-5906-4954-98d7-b393268a4548.png)
![image.png](attachment:67178c05-0c58-4960-97fc-104a438c7a04.png)

## 역전파로 가중치가 갱신된 결과로 순전파 학습을 통해 오차가 감소
![image.png](attachment:4813729e-c01f-4032-893d-4d3be12bccde.png)

In [10]:
# 입력값은 연산이 필요하므로 벡터여야하며 넘파이배열여야 함
x = np.array([[-0.82, 0.94, -1.15, 0.25],
     [-0.82, 0.94, -1.15, 0.25]])
x

array([[-0.82,  0.94, -1.15,  0.25],
       [-0.82,  0.94, -1.15,  0.25]])

In [8]:
x.shape

(2, 4)

In [11]:
y = x.tolist()
y

[[-0.82, 0.94, -1.15, 0.25], [-0.82, 0.94, -1.15, 0.25]]

In [12]:
def sigmoid(x):
    return 1/(1 + np.exp(-x))

In [13]:
sigmoid(5)

0.9933071490757153

In [14]:
sigmoid(-5)

0.0066928509242848554

In [15]:
sigmoid(0.1)

0.52497918747894

In [16]:
sigmoid(-0.99)

0.27091207765069353

In [20]:
np.maximum(0,-5)

0

In [27]:
1/(np.exp(10)+1)

4.5397868702434395e-05