# 인공신경망 (Artificial Neural Network : ANN)

## 인공신경망 개념

### 인간의 신경망과 뉴런

- 인간의 뇌는 약 1000억개의 뉴런으로 구성
- 뉴런은 시냅스라는 구조를 통해 전기, 화학적 신호를 주고 받음으로써 다양한 정보를 받아들이고 저장
- 하나의 뉴런은 가지돌기(Dendrites), 신경세포체(Cell Body), 축색(Axon)으로 구성
- 작동원리
    - 가지돌기는 다른 뉴런으로부터의 입력을 받음
    - 신경세포체는 가지돌기로부터 입력받은 값을 하나의 신호로 통합하고, 통합된 신호값이 어떤 임계값을 넘으면 하나의 신호가 생성
    - 축색은 앞에서 만들어진 신호를 다른 신경세포로 전달
    
    
![image.png](attachment:image.png)

위 그림은 사람의 신경망과 이를 모방해 만든 알고리즘에 대한 그림. x(입력)을 받아서 w(가중치)를 계산한 후 합산(b)하여 출력(y)한다.

### 구조 및 파라미터의 종류

- 단일계층신경망은 입력층(Input Layer), 출력층(Output Layer)로 구성
- 다층신경망은 입력층, 은닉층(Hidden Layer), 출력층으로 구성

인공신경망의 각 노드(x)는 사람의 신경망에서 뉴런에 해당하는 역할. 각 노드에 데이터가 입력되고 이렇게 입력된 데이터는 각 입력층의 노드와 출력층 노드 사이에 존재하는 가중치(w)를 곱해 합산 후 출력층의 노드에 전달됨. 출력층에 도착한 데이터는 활성화함수 f(x)의 연산을 거쳐 출력 값으로 나옴

### 활성화 함수

- 활성화 함수는 출력 값을 내보낼 때 사용하는 함수이며 f로 나타냄 
- 활성화 함수 종류는 선형함수, 계단함수, 임계논리함수, 시그모이드 함수 등이 사용
- 어떤 활성화 함수를 선택하느냐 따라 출력 값이 달라질 수 있음.

![image.png](attachment:image.png)

### 단일계층신경망

- Hidden Layer없이 Input Layer와 Output Layer로만 구성된 신경망
- Input Layer의 노드와 Weight값들의 연산을 통해 활성화 함수로 전달
- 전달받은 값들을 활성화 함수를 이용해 계산 후 값을 출력하는 구조


![image.png](attachment:image.png)

### OR, AND, NOT 연산을 예시로 단일계층신경망 작동원리 학습

- OR, AND, NOT 연산은 0과 1로만 이루어짐

1) AND 연산

- 모든 입력이 1일 경우에만 출력값은 1
- f = x >= 0 출력 : 1
- f = x < 0 출력 : 0
- 위 활성화 함수는 계단 활성화 함수로 양수일 때 1을 출력하며 0이나 음수일 때 0을 출력함

![image.png](attachment:image.png)

일반적인 경우 위의 데이터 셋을 Training 시켜서 인공신경망의 가중치와 b(편차)값을 구해내지만 예시를 위해 가중치를 임의로 설정함  

- 편차노드 : 전체 값을 계산 시 오차를 줄이는 역할
- 위 경우에서 편차노드 (x0)은 1, 가중치는 -1.5로 임의로 설정함 
- x1, x2의 가중치는 각각 1,1 을 초기값으로 설정

![image.png](attachment:image.png)

AND 연산의 경우 위와 같은 수식이 나오며 x1과 x2에 모두 0이 들어갈 경우 가중치를 곱하여 -1.5라는 중간 합산값이 나옴 이를 활성화함수인 f(x)에 입력하면 -1.5는 1보다 작기 때문에 0이라는 결과값이 출력됨

다른 예시로 x1과 x2모두 1이 들어갈 경우 합산값은 0.5가 나옴 활성화함수에 의해 0보다 큰 값이 입력되므로 출력값은 1이 됨. 즉 이 신경망은 AND연산을 잘 실행하는 모델이 되는 것을 확인할 수 있음

2) OR 연산
- 모든 입력이 0이 아닌경우에 결과값이 1이 되는 연산
- f = x >= 0 출력 : 1
- f = x < 0 출력 : 0
- 이 경우 편차노드는 1 가중치는 -0.5로 설정

![image.png](attachment:image.png)


x1, x2 노드에 모두 0이 들어간다면 중간 합산값은 -0.5로 결과값은 0이 나오게됨. x1에는 1 x2 에는 0 을 입력하면 중간 합산값은 0.5로 활성화함수에의해 1이라는 결과값이 출력됨. 따라서 이 신경망 역시 OR연산을 잘 실행하는 모델이 되는 것을 확인

3) NOT 연산

- 모든 입력값이 반대 값으로 나오는 연산
- 1이 입력되면 0이 출력되고 0이 입력되면 1이 출력됨
- f = x >= 1 출력 1
- f = x < 1 출력 0
- NOT 연산은 위의 연산들과는 달리 하나의 노드로 연산이 되며 편차의 가중치는 1로 설정
- x1 노드의 가중치는 -2 로 설정


![image.png](attachment:image.png)

x1에 0을 넣으면 중간합산값이 1이 되고 활성화함수에 따라 1이 출력됨. 반대로 x1에 1을 넣으면 중간합산값이 -1이 되고 활성화함수에 따라 0이 출력됨


### 다층신경망

- 다층신경망은 입력, 은닉, 출력층으로 구분
- 다층신경망은 하나 혹은 그 이상의 은닉층이 있는 신경망
- 입력층에서 입력신호(데이터)를 받아들여이 신호를 은닉층의 모든 뉴런으로 재분배
- 입력층 데이터를 받은 은닉층 뉴런은 데이터의 특성을 파악하는 역할
- 은닉층 하나를 추가할 때마다 계산량은 지수적으로 증가
- 출력층은 은닉충의 신호를 전달받아 전체 신경망의 출력패턴을 정하는 역할

![image.png](attachment:image.png)

위 그림처럼 입력층의 데이터를 가중치를 곱해서 은닉층으로 가며, 은닉층에서 나온 값에 최종 가중치를 곱하고 출력층으로 이동하는 구조를 순방향 신경망이라고 함

#### 역전파 알고리즘 (Backpropagation Neural Network)

- 역전파 알고리즘은 오차 값들을 조절해 오차가 최소가 되게 하는 방법
- 역방향으로 가중치 오차를 전파해 최적의 학습 결과를 찾아가는 것을 말함
- 가중치의 오차가 최소가 되거나 정해진 오차범위내에 들어가는 경우 알고리즘은 종료

![image.png](attachment:image.png)

위 그림처럼 순전파 -> 역전파 -> 순전파 형식으로 반복하다보면 오차가 최소가 되는 시점에 가까워짐. 이것이 딥러닝의 기본적 개념

### 인공신경망 실습

In [1]:
from sklearn.datasets import load_iris

iris = load_iris()

In [2]:
iris.keys()

dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'])

In [3]:
X = iris['data']
y = iris['target']

In [4]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X,y)

In [5]:
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
scaler.fit(X_train)

StandardScaler(copy=True, with_mean=True, with_std=True)

In [6]:
#X_train과 X_test 데이터를 정규화
X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

In [7]:
from sklearn.neural_network import MLPClassifier
#3개의 은닉층을 만들고 각 계층별로 10개의 노드씩 할당하라는 명령어
mlp = MLPClassifier(hidden_layer_sizes=(10,10,10))
mlp.fit(X_train,y_train)



MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
       beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(10, 10, 10), learning_rate='constant',
       learning_rate_init=0.001, max_iter=200, momentum=0.9,
       n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
       random_state=None, shuffle=True, solver='adam', tol=0.0001,
       validation_fraction=0.1, verbose=False, warm_start=False)

In [8]:
#X_test 값으로 결과 예측
predictions = mlp.predict(X_test)

In [9]:
from sklearn.metrics import classification_report, confusion_matrix

print(confusion_matrix(y_test,predictions))

[[ 9  0  0]
 [ 0 13  0]
 [ 0  0 16]]


컨퓨전 매트릭스 모듈을 사용하여 예측값과 실제값이 맞는지 확인. 모든 경우를 정확히 예측한 것을 확인할 수 있다

In [10]:
print(classification_report(y_test,predictions))

              precision    recall  f1-score   support

           0       1.00      1.00      1.00         9
           1       1.00      1.00      1.00        13
           2       1.00      1.00      1.00        16

   micro avg       1.00      1.00      1.00        38
   macro avg       1.00      1.00      1.00        38
weighted avg       1.00      1.00      1.00        38



평가결과 정확률, 재현율, f1-score 모두 100%의 높은 결과를 얻음