<a href="https://colab.research.google.com/github/LeeHuiJong/SkillTreePython-DataAnalysis/blob/main/ch05_05_%EA%B8%B0%EC%B4%88%EB%AA%A8%EB%8D%B8%EA%B5%AC%ED%98%84_Adaline.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ch05.05. 기초모델 구현 - Adaline
---
* 날짜:
* 이름:

## 학습내용
    - 이진 분류 개념에 대해 이해한다.
    - Adaline 프로세스를 이해한다. 
    - Adaline 알고리즘을 구현한다.
    - 경사하강법에 대해 이해한다.

```
import numpy as np
import matplotlib.pyplot as plt
```

In [1]:
import numpy as np
import matplotlib.pyplot as plt

## 클래스 작성
---

In [None]:
class AdalineGD():
  def __init__(self, lr=0.001, random_state=1):
    self.lr=lr
    self.seed = np.random.RandomState(random_state)

  def init_weights(self, X): # 처음의 가중치를 설정해준다.
    size = X.shape[1]
    self.w = self.seed.normal(0, 0.01, size=size+1) # 정규분포를 따르는 랜덤한 값을 뽑는다 (seed를 정했으므로 값은 계속 바뀌지 않고 뽑힌 그대로 유지된다.)
  
  def model(self, X): # X에 관한 모델 
    return np.dot(X, self.w[:-1])+self.w[-1] # w의 마지막을 뺀 값을 전부 곱해서 더한 값에 w의 마지막을 더해준다.

  def predict(self, X): # y_hat의 값을 판단해서 0,과 1로 변경해준다.
    y_hat = self.model(X)
    logit = np.where(y_hat >= 0.5,1,0)
    return logit

  def loss(self, y, y_hat):
    return 1/2 * ( (y-y_hat)**2) # loss 를 구하는 공식이 perceptron과 다르다. 

  def accuracy(self, y, y_logit): # 정확도를 구하는 함수 
    return np.count_nonzero(y == y_logit) / len(y) # y_logit 에 0이 아닌 값들(정답인 값들)의 개수에 평균을 낸값.

  def evaluate(self, X, y):
    y_logit = self.predict(X) # y_logit 은 X의 predict 값
    loss = self.loss(y, y_logit) # 위에 클래스의 내장함수 loss를 토대로 y와 y_logit 의 손실을 구한다.
    loss = loss.sum()/len(y)  # loss는 모든 합의 평균을 구하는 것
    acc = self.accuracy(y, y_logit) # accuracy 내장함수를 토대로 정확도를 구한다.
    return loss, acc # 위에서 구한 loss 값과 acc 값이 평가의 값이다.

  def fit(self, X, y, epochs=10, show_params=False):

    self.init_weights(X) # 가중치 초기화
    self.history=dict(loss=[], acc=[]) # history 초기화

    for epoch in range(epochs):
      # 최적화
      y_hat = self.model(X) # y의 예측값
      self.w[:-1]+= self.lr * np.dot(X.T , (y-y_hat)) # 최적화 함수를 토대로 X를 transpose 한 후 y-y_hat과 내적을 구한다.
      self.w[-1] += self.lr * np.sum(y-y_hat) # b와 x에 대한 미분이 다른 공식을 가지고 있기 때문에 따로 식을 만들어 준다.


      
      # 평가 및 결과 저장
      loss, acc = self.evaluate(X, y)
      self.history['loss'].append(loss)
      self.history['acc'].append(acc)
      print(f'[Epoch {epoch}] loss: {np.round(loss,2)}  acc: {np.round(acc,2)}')
      if show_params: print(self.w)

  # 데이터 흐름 시각화
  def draw_dflow(self, X, y, title='', figsize=(8,4)):
    y_hat = self.model(X)
    y_pred = self.predict(X)

    plt.figure(figsize=figsize)
    plt.title(title)
    plt.plot(y, label='y', marker='o')
    plt.plot(y_hat, label='$\hat{y}$', marker='.', linestyle='--')
    plt.plot(y_pred, label='$\logit$', marker='.', linestyle='--')
    plt.legend()
    plt.show()

  # 학습 곡선 시각화
  def draw_lcurve(self, title='', figsize=(8,4)):
    plt.figure(figsize=figsize)
    plt.title(title)
    plt.plot(self.history['acc'], label='acc', marker='o')
    plt.plot(self.history['loss'], label='loss', marker='o')
    plt.xlabel('epoch')
    plt.legend()
    plt.show()

## Iris 데이터로 분류 진행
---

### **데이터 로드**

### **학습전 성능 평가**

### **학습**

### **학습 후 성능평가**

### **테스트셋 성능평가**

### **학습곡선**

### **하이퍼파라미터에 따른 성능평가**