# Artificial Neural Networks

## Perceptron 
- Binary Classification을 위한 "Linear" 모델
- XOR 문제를 해결 할 수 없음

## Artificial Neural Networks(ANN)

- 여러개의 Perceptron으로 구성
- Perceptron의 한계를 해결 할 수 있음
- NonLinear 모델
- Classification과 Regression에 활용


- Perceptron = 1 단위의 Neuron
- ANN = Neural Net = 뇌

## Nonlinear Decision Boundaries

![title](images/4가지.jpg)


Perceptron으로 AND/ NAND/ OR/ 해결 가능

### XOR의 조건 2가지
 1. 최소 하나의 입력값이 1이어야 한다 = OR의 특성
 2. 입력값 모두 1이면 안된다 = NAND의 특성

### XOR의 조합
![title](images/XOR1.jpg)
![title](images/XOR2.jpg) 

A XOR B = (A OR B) AND (A NAND B) 

## Feedforward and feedback artificial neural networks

### ANN의 3가지 구성요소
1. Architecture
2. Activation Function
3. Learning algoritm : 최적의 해를 찾음

### ANN의 종류 2가지
1. Feedforward Neural Network(순방향 신경망)

    입력 데이터는 모든 노드를 딱 한번만 거쳐 출력층에 출력

2. Recurrent Neural Network(순환 신경망)

    가장 보편적으로 사용
    
    하지만 Scikit-Learn에는 포함되어 있지 않으니 본 장에서는 제외

## Multilayer Perceptrons(MLP)


![title](images/Overall.jpg) 

1. MLP는 가장 보편적으로 사용되는 ANN
2. Layer에는 다음 Layer의 모든 노드와 연결되어 있음
3. 3개 이상의 Layer를 포함하고 있음







구성요소
1. Input Layer : 입력값 뉴런
2. Hidden Layer : Latent Variables 나타냄/ Training Data에서 관측 불가 
3. Output Layer : 마지막 Hidden Layer과 연결
4. +1 Bias neurons : 보통 Diagram에서 나타내지 않음





Hidden Layer에서 활용하는 Nonlinear Activation Functions

![title](images/function1.jpg) 







지도 학습이기 때문에 Cost Function을 최소화 하는 것이 목표
![title](images/function2.jpg) 


- m = Training Instances의 개수 

## Minimizing the cost function - Backpropagation(역전파)
- 최적화 알고리듬
- 네트워크 내 Error 흐름
- Feedforward Network의 Hidden units을 Train하기 위함
- Gradient Descent와 유사(Cost Function의 기울기를 업데이트하기 위함)
- Hidden Units은 Latent Variables를 포함하고 있음
- Hidden Units이 정확히 어떤 영향을 주는지 알수 없음

# Forward Propagation
![title](images/ForwardPropagation1.jpg) 

![title](images/ForwardPropagation2.jpg) 

g(x)는 Activation Function

순서
1. Hidden1의 가중치합 확인
2. Hidden1에 대하여 Activation Function으로 가중치 계산
3. BiasWeight 추가
4. 모든 노드에 대하여 이를 반복 실시



## BackPropagation(역전파)

![title](images/backwardPropagation1.jpg) 
![title](images/error2.jpg) 

- 가중치를 더 좋게 업데이트 하기 위함
- Hidden Units은 Latent Variables을 나타냄
- Output부터 역순으로 계산
- Error = (True - Predicted Output)*(Ouput1의 편미분)



![title](images/Bias1.jpg) 
 
![title](images/Bias2.jpg) 
 

- Error를 바탕으로 BiasWeight를 구함
- a = Learning Rate



# 코드 예시
### 와인 데이터 활용
https://kofboy2000.tistory.com/30
 1. 와인 데이터 읽기
 2. 데이터 정규화
 3. 트레이닝
 4. Cultivation(품종) 예측

In [5]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler # Data Normalization
from sklearn.neural_network import MLPClassifier # Training the model
from sklearn.metrics import classification_report,confusion_matrix # Prediction and Evaluation

In [5]:
# Data
wine = pd.read_csv('C:/Users/dudwo/Desktop/wine.csv',
                 names = ["Cultivator", "Alchol", "Malic_Acid", "Ash",
                                             "Alcalinity_of_Ash", "Magnesium", "Total_phenols",
                                             "Falvanoids", "Nonflavanoid_phenols",
                                             "Proanthocyanins", "Color_intensity", "Hue",
                                             "OD280", "Proline"])
X = wine.drop('Cultivator',axis=1) # Input Data는 Cultivator를 제외한 나머지
y = wine['Cultivator']             # Output Data는 Cultivator

X_train, X_test, y_train, y_test = train_test_split(X,y)

In [5]:
# 데이터 정규화
scaler = StandardScaler()
scaler.fit(X_train)

StandardScaler(copy=True, with_mean=True, with_std=True)

X_train = scaler.transform(X_train)
X_test = scaler.transform(X_test)

In [5]:
# Training the model
mlp = MLPClassifier(hidden_layer_sizes=(30,30,30)) # hidden layer 30개짜리 3개
mlp.fit(X_train,y_train)

In [7]:
# Prediction and Evaluation
predictions = mlp.predict(X_test)

print(confusion_matrix(y_test,predictions))

[[15  1  0]
 [ 0 17  0]
 [ 0  0 12]]


In [8]:
print(classification_report(y_test,predictions))

              precision    recall  f1-score   support

           1       1.00      0.94      0.97        16
           2       0.94      1.00      0.97        17
           3       1.00      1.00      1.00        12

   micro avg       0.98      0.98      0.98        45
   macro avg       0.98      0.98      0.98        45
weighted avg       0.98      0.98      0.98        45

