# Perceptron

In [7]:
import tensorflow as tf
import numpy as np
from sklearn.datasets import load_iris

이번엔 Iris 데이터 중 두 종류를 분류하는 퍼셉트론을 제작한다. y값은 1 또는 -1을 사용하고 활성화 함수로는 하이퍼탄젠트(hypertangent)함수를 사용한다.

$$\Large{ \hat{y} = tanh(w^Tx) }$$

비용 함수로는 다음 식을 사용한다. 

$$
\large{
Loss = \sum_{i=1}^N \max(0, -y_i \hat{y_i})
}
$$
- y값은 1 또는 -1 이니까 y와 y_hat이 동일하면 곱한 값은 1, 다르면 곱한 값은 -1 이 된다.
- 0과 -(곱한값) 중 큰값만 취한다 = y와 y_hat이 다른 경우의 개수를 센다

In [3]:
iris = load_iris()
print(iris.DESCR)

.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

                    Min  Max   Mean    SD   Class Correlation
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)

    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
    :

---
```
특성 중에서
sepal length in cm
sepal width in cm 
만 사용하고, 
    
클래스는Iris-Setosa와 Iris-Virginica 만 사용할 예정
```
---

In [4]:
idx = np.in1d(iris.target, [0, 2])
X_data = iris.data[idx, 0:2]
y_data = (iris.target[idx] - 1.0)[:, np.newaxis]

In [5]:
X_data.shape, y_data.shape

((100, 2), (100, 1))

### 이 데이터를 이용해 Perceptron을 구현
 - 데이터 하나당 한번씩 weights 업데이트
 - step size == 0.0003
 - iteration == 200

In [10]:
lr = 0.0003
iter_num = 500

zero = tf.constant(0, dtype=tf.float64)
w = tf.Variable(tf.random.normal([2, 1], dtype=tf.float64))
b = tf.Variable(tf.random.normal([1, 1], dtype=tf.float64))


for epoch in range(iter_num):
    for i in range(X_data.shape[0]):
        x = X_data[i:i+1]
        y = y_data[i:i+1]
        
        with tf.GradientTape() as tape:
            logit = tf.matmul(x, w) + b
            y_hat = tf.tanh(logit)
            loss = tf.maximum(zero, tf.multiply(-y, y_hat))
            
        grad = tape.gradient(loss, [w, b])
        
        w.assign_sub(lr * grad[0])
        b.assign_sub(lr * grad[1])

- 솔직히 무슨말인지 이해 못함
- 위에 있는 식들을 코드로 표현한 것인디...허허

In [11]:
y_pred = tf.tanh(tf.matmul(X_data, w) + b)

In [12]:
print("예측치 :", y_pred[0].numpy(),  "정답 :", y_data[0])
print("예측치 :", y_pred[51].numpy(), "정답 :", y_data[51])
print("예측치 :", y_pred[88].numpy(), "정답 :", y_data[88])

예측치 : [0.99999955] 정답 : [-1.]
예측치 : [0.99999766] 정답 : [1.]
예측치 : [0.99999913] 정답 : [1.]


In [13]:
print("예측치 :", -1 if y_pred[0] < 0 else 1,  "정답 :", y_data[0])
print("예측치 :", -1 if y_pred[51] < 0 else 1, "정답 :", y_data[51])
print("예측치 :", -1 if y_pred[88] < 0 else 1, "정답 :", y_data[88])

예측치 : 1 정답 : [-1.]
예측치 : 1 정답 : [1.]
예측치 : 1 정답 : [1.]
