# 퍼셉트론

In [1]:
import tensorflow as tf
import numpy as np 

이번엔 Iris 데이터 중 두 종류를 분류하는 퍼셉트론을 제작한다. y값은 1 또는 -1을 사용하고 활성화 함수로는 하이퍼탄젠트(hypertangent)함수를 사용한다.

$$\Large{ \hat{y} = tanh(w^Tx) }$$

비용 함수로는 다음 식을 사용한다. 

$$
\large{
Loss = \sum_{i=1}^N \max(0, -y_i \hat{y_i})
}
$$

In [2]:
from sklearn.datasets import load_iris
iris = load_iris()
print(iris.DESCR)

.. _iris_dataset:

Iris plants dataset
--------------------

**Data Set Characteristics:**

    :Number of Instances: 150 (50 in each of three classes)
    :Number of Attributes: 4 numeric, predictive attributes and the class
    :Attribute Information:
        - sepal length in cm
        - sepal width in cm
        - petal length in cm
        - petal width in cm
        - class:
                - Iris-Setosa
                - Iris-Versicolour
                - Iris-Virginica
                
    :Summary Statistics:

                    Min  Max   Mean    SD   Class Correlation
    sepal length:   4.3  7.9   5.84   0.83    0.7826
    sepal width:    2.0  4.4   3.05   0.43   -0.4194
    petal length:   1.0  6.9   3.76   1.76    0.9490  (high!)
    petal width:    0.1  2.5   1.20   0.76    0.9565  (high!)

    :Missing Attribute Values: None
    :Class Distribution: 33.3% for each of 3 classes.
    :Creator: R.A. Fisher
    :Donor: Michael Marshall (MARSHALL%PLU@io.arc.nasa.gov)
    :

In [3]:
idx = np.in1d(iris.target, [0, 2])      # 1차원 배열 데이터 iris.target에서 0 과 2 를 True로 반환 // 
                            # 0, 2 말고 [0,1,2] , [1,2] 등을 넣어 진행하는 방법인듯 
X_data = iris.data[idx, 0:2]        # True 로 반환되는 iris 데이터 중에서, 0:2 칼럼을 X_data로 저장
y_data = (iris.target[idx] - 1.0)[:, np.newaxis]        
        # iris.target[idx] - 1.0 을 하면, iris.target[idx]의 모든 원소에 -1을 한 배열을 반환
                                # 1차원 배열에 [:, np.newaxis] 를 통해 (100,1) shape로 만듦

In [44]:
X_data.shape, y_data.shape

((100, 2), (100, 1))

#### 이 데이터를 이용해 Perceptron을 구현해보세요! 
 - 데이터 하나당 한번씩 weights 업데이트
 - step size == 0.0003
 - iteration == 500

In [5]:
num_iter = 500
lr = 0.0003

-----

In [6]:
w = tf.Variable(tf.random.normal([2, 1], dtype=tf.float64))
b = tf.Variable(tf.random.normal([1, 1], dtype=tf.float64))     # bias

In [10]:
zero = tf.constant(0, dtype=tf.float64)


for epoch in range(num_iter):
    for i in range(X_data.shape[0]):    # X 데이터 개수만큼 데이터를 돌리겠다. // 100
        x = X_data[i:i+1]               # 0 <= i < 100 // [0:1] ~ [99 : 100] 까지 index
        y = y_data[i:i+1]

        with tf.GradientTape() as tape:     # loss (비용함수) 구하는 식
            logit = tf.matmul(x, w) + b
            y_hat = tf.tanh(logit)
            loss = tf.maximum(zero, tf.multiply(-y, y_hat))
                    # maximum
                                    # multiply : 곱하기
        
        grad = tape.gradient(loss, [w, b])      # 미분

        w.assign_sub(lr * grad[0])
        b.assign_sub(lr * grad[1])

In [8]:
X_data.shape

(100, 2)

In [9]:
X_data[0].shape

(2,)

In [11]:
y_pred = tf.tanh(tf.matmul(X_data, w) + b)

In [16]:
print('예측치 : ', -1 if y_pred[0] <0 else 1, '정답 : ', y_data[0])
print('예측치 : ', -1 if y_pred[51] <0 else 1, '정답 : ', y_data[51])

예측치 :  -1 정답 :  [-1.]
예측치 :  1 정답 :  [1.]
