선형수식 (막대기)를 여러개 써서 복잡한 함수를 만들 수 있음을 증명 논문

- 원 함수에 근사한 막대기로 이루어진 함수를 만드는 것
- 작은 막대기를 여러개 써서 근사한 함수를 만드는 것을 증명
#
[Multilayer feedforward networks are universal approximators ( 1989 )](https://www.sciencedirect.com/science/article/abs/pii/0893608089900208)
- X와 Y사이에 특정 함수가 존재 한다면, Multi Layer는 인공신경망이 어떤 함수든 근사(Approximate)할 수 있다.
]

아무리 복잡한 함수라도 막대기로 표현할 수 있다.

따라서, 딥러닝은 **모방은 천재** 라고 할 수 있다.

---


# Tensorflow Keras

데이터 준비 (전처리)
- 결측치, 이상치 처리
- 수치형 : normalization (일반화-데이터 분포가 다르므로) & 범주형 : one-hot encoding
- feature extraction & feature engineering
- augmentation

### 모델구성 방식
- Funcional (Model)
- Sequentail

In [2]:
import tensorflow as tf

# Sequential

model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Input(shape=(13,)))
model.add(tf.keras.layers.Dense(5, activation='relu'))
model.add(tf.keras.layers.Dense(1))
model.complie(optimizer='adam', loss='mes')
model.fit(x_train, y_train, epochs=100)   

In [None]:
# Model (구형)

X = tf.keras.layers.Input(shape=(13,))
H = tf.keras.layers.Dense(5, activation='relu')(X))
Y = tf.keras.layers.Dense(1)(H)
model = tf.keras.models.Model(X, Y)
model.compile(optimizer='adam', loss='mse')
model.fit(x_train, y_train, epochs=100)

# 자유로운 구성을 위해서는 Funcional (Model) 방식이 필요

---

### Neuron (우리 신경의 과정)
![img](./img/neuron.jpg)
1. 근처 뉴들들에게서 이진 신호를 받고
2. 그 신호들을 잘 조합해서
3. 일정 기준치가 넘으면 흥분을 하고
4. 흥분을 하면 terminal로 신호를 보냄

### Perceptron (Neuron의 수학적인 모델링)

<img src="./img/perceptron.jpg" width=70% height=70%>

### 인공신경망
- perceptron 이 모여 Layer를 이루는 것  

<img src="./img/neuralnet.png" width=70% height=70%>

---

## Machine Learning Process

1. 데이터를 준비한다. (전처리)
    - 결측치, 이상치 처리
    - normalization & one-hot encoding
    - feature extraction & feature engineering
    - augmentation  
    

2. 적절한 모델을 선택한다. (혹은 구성한다.)

3. 모델을 학습시킨다.

4. 학습된 모델을 평가한다.

---
### normalization & one-hot encoding

- 수치형 - normalization
    - minmax normalization
    - standardization
#
- 범주형 - one-hot encoding
    - tf.keras.utils.to_categorical

---

### Computer?
 - Nand Gate 를 쌓아 Not gate , And gate , Or gate 를 만듦
 - Nand Gate 만으로 컴퓨터를 완성할 수 있음
 - Nand Gate 는 Universal Gate 라고도 불림

<img src="./img/a1.png" width=70% height=700%>

<img src="./img/a2.png" width=50% height=50%>

- Nand gate 들을 연결하면 Not, and, or 다 만들 수 있음

---

### tf.keras.layers

- 신경망 모델을 구성하는 기본 빌딩 블럭
- 주요 블럭 종류 (링크 가서 찾아보기)

    - tf.keras.layers.InputLayer
    - [tf.keras.layers.Dense](https://www.tensorflow.org/api_docs/python/tf/keras/layers/Dense)
    - tf.keras.layers.Activation
    - tf.keras.layers.Dropout
    - tf.keras.layers.BatchNormalization
    - tf.keras.layers.Conv2D, tf.keras.layers.MaxPool2D, tf.keras.layers.Flatten
    - tf.keras.layers.SimpleRNN, tf.keras.layers.LSTM, tf.keras.layers.GRU

---

### Linear Regression / Logistic Regression
- 선형 회귀 / 로지스틱 회귀

1. 평균과 분산

$$
s^2 = {\sum^n_{i=1}(x_i - \bar x)^2 \over n-1}
$$

- 평균: 자료의 중심값으로 자료를 대표하는 값
- 분산: 자료들이 평균을 중심으로 퍼져있는 평균적인 거리
- 분산 = 편차제곱합의 평균
- 평균 = 편차제곱합이 최소가 되도록 하는 값
- 평균과 표준편차는 이상치에 취약하다. 


- 모평균 = $m$
- 모분산 = $\sigma^2$
- 모표준편차 = $\sigma$

- 표본평균 = $\bar X$
- 표본분산 = $S^2$
- 표본표준편차 = $S$

In [7]:
import numpy as np
x = [40, 42, 44, 46, 48]

1.1 예제

판매량이 40, 42, 44, 46, 48 일때.

### - 평균 
$$
(모평균) : m =  {\sum^n_{i=1}x_i \over n}
$$
$$
(표본평균) : \bar x =  {\sum^n_{i=1}x_i \over n}
$$

In [6]:
# 따라서 평균은 
y = (40 + 42 + 44 + 46  + 48) / 5

print(y)

print(np.mean(x))

44.0
44.0


### - 분산과 표준편차

- 모집단의 분산(모분산) / 모집단의 표준편차(모표준편차)

$$
(모분산(\sigma^2)) : v =  {\sum^n_{i=1}(x_i - \bar x)^2 \over n}
$$

$$
(모표준편차(\sigma)) : \sigma = \sqrt \sigma^2 =  \sqrt{{\sum^n_{i=1}(x_i - \bar x)^2 \over n}}
$$

- 표본의 분산(표본분산) / 표본의 표준편차(표본표준편차)
$$
(표본분산(s^2)) : v =  {\sum^n_{i=1}(x_i - \bar x)^2 \over n-1}
$$

$$
(표본표준편차(s)) : s = \sqrt s^2 =  \sqrt{{\sum^n_{i=1}(x_i - \bar x)^2 \over n-1}}
$$

### - Loss (mse : 평균 제곱 오차) => 모분산과 같다

In [21]:
# 평균 = 44 => np.mean(x)

# loss 는 각 값과 평균의 차를 제곱한 값들을 합하고, n으로 나눠준다.

# 각 값과 평균값의 차
lo = []
for i in x:
    k = i - np.mean(x)
    lo.append(k)

# 구한 값의 제곱
lo2 = []
for i in lo:
    k = i ** 2
    lo2.append(k)
    
# 나누기 n
lo3 = np.sum(lo2) / len(lo2)

print(lo)
print(lo2)
print(lo3)

[-4.0, -2.0, 0.0, 2.0, 4.0]
[16.0, 4.0, 0.0, 4.0, 16.0]
8.0


### - RMSE = 분산의 Root = 모표준편차

In [22]:
np.sqrt(lo3)

2.8284271247461903

---

### 선형회귀와 로지스틱회귀

- 최적의 그래프 찾기
    - a. 그래프와 각데이터의 오차구하기
    - b. 오차를 모두 더한다.
    - c. 오차의 합이 최소가 되게 한다.

<img src="./img/d1.png" width=30% height=30%>  

만일 위 그래프가 온도/판매량 그래프라 하면,  
빨간 점들을 가장 잘 설명하는 직선을 찾아야 한다.  
=> 선형 회귀

<img src="./img/d2.png" width=40% height=40%> class => sigmoid 함수로 대체

만일 위 그래프가 체온/감염여부 라면,  
빨간 점들은 정상(0), 감염(1)로 표현한다.  
이 0과 1의 관계를 가장 잘 설명하는 곡선을 찾아야 한다.  
=> 로지스틱 회귀

---

### 선형회귀와 최소제곱추정

<img src="./img/d3.png" width=40% height=40%>

예측값 직션 y = wx + b 를 추정하고, 각 점과 직선의 차이 만큼이 loss.

이 loss 를 제곱하여 더하면 = mse = 분산


In [None]:
3월 29일 = 1시간 39분