### 머신러닝 분류

#### [1] 지도학습(Supervised Learning) : 답이 주어진 상태에서 학습
* 회귀(Regression)
* 분류(Classification)

#### [2] 비지도학습(Unsupervised Learning) : 답을 모르고 학습
* 군집화(Clustering)
* 차원 축소(Dimension Reduction) : PCA(주성분 분석, Pricipal Component Analysis)

#### [3] 강화 학습(Reinforcement Learning) : 답을 모르고 있는 상태에서 답을 알아가는 강한 인공지능(자아를 갖음, 인간수준), 게임, 알파고(DQN)

### 퍼셉트론과 XOR Problem
https://ko.wikipedia.org/wiki/%ED%8D%BC%EC%85%89%ED%8A%B8%EB%A1%A0

In [None]:
def AND(x1,x2):
    w1,w2,theta = 0.5,0.5,0.5
    tmp = w1*x1 + w2*x2
    if tmp <= theta : # 임계가
        return 0
    elif tmp > theta:
        return 1
    
print(AND(0,0))    
print(AND(0,1))    
print(AND(1,0))
print(AND(1,1))        

In [None]:
def NAND(x1,x2):
    w1,w2,theta = 0.5,0.5,0.5
    tmp = w1*x1 + w2*x2
    if tmp <= theta : # 임계가
        return 1
    elif tmp > theta:
        return 0
    
print(NAND(0,0))    
print(NAND(0,1))    
print(NAND(1,0))
print(NAND(1,1))  

In [None]:
def OR(x1,x2):
    w1,w2,theta = 0.5,0.5,0.4
    tmp = w1*x1 + w2*x2
    if tmp <= theta : # 임계가
        return 0
    elif tmp > theta:
        return 1
    
print(OR(0,0))    
print(OR(0,1))    
print(OR(1,0))
print(OR(1,1))  

In [None]:
# 단층 퍼셉트론의 한계
# XOR Problem : 아무리 학습시켜도 weight을 구할 수 가 없음
# def XOR(x1,x2):
#     w1,w2,theta = _,_,_
#     tmp = w1*x1 + w2*x2
#     if tmp <= theta :  # 임계값
#         return 0
#     elif tmp > theta:
#         return 1

# print(XOR(0,0))    # 0 
# print(XOR(0,1))    # 1
# print(XOR(1,0))    # 1
# print(XOR(1,1))    # 0

### 다층퍼셉트론(MLP)으로 XOR Problem 해결

In [None]:
# XOR Problem : 서로 다른 weight을 갖는 다층신경망을 사용하여 해결
def XOR(x1,x2):
    s1 = NAND(x1,x2)
    s2 = OR(x1,x2)
    y = AND(s1,s2)
    return y

print(XOR(0,0))    # 0 
print(XOR(0,1))    # 1
print(XOR(1,0))    # 1
print(XOR(1,1))    # 0

### 회귀(Regression)모델
#### [1] 선형 회귀(Linear Regression) : 1차 함수, 직선의 방정식
#### [2] 가중치(Weight) : 입력변수가 출력에 영향을 미치는 정도를 설정, 기울기 값 , 회귀 계수
#### [3] 편향(Bias) : 기본 출력 값이 활성화 되는 정도를 설정, y 절편
#### [4] 비용함수(Cost Function) : 2차 함수, 포물선의 방정식, (예측값 - 실제값)^2
* cost(비용) = 오차 = 에러 = 손실(loss)
* cost(W,b) = (H(x) - y)^2

#### [5] 예측(가설,Hypothesis)함수: predict, H(x) : 예측값, y값:답,결정값,target,label, x:입력, 피쳐(feature)
* H(X) = W*X + b

#### [6] 경사 하강법(Gradient Descent Algorithm)
#### : 비용(cost) 이 가장 작은 Weight(가중치) 값을 구하는 알고리즘

#### : Opitmizer : 비용함수를 최소화 하는 w와 b를 구하는 최적의 알고리즘

In [None]:
# 비용 함수의 구현
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

def cost(x,y,w):
    c = 0
    for k in range(len(x)):
        hx = w * x[k]          # 예측함수(방정식)
        loss = (hx - y[k])**2  # (예측값 - 실제값)^2
        c += loss              # c = c + loss
    return c/len(x)            # 평균 제곱 오차
    
x = [1,2,3]
y = [1,2,3]

print('w:-1, cost:', cost(x,y,-1)) # hx = [-1,-2,-3], cost: 18.666666666666668
print('w:0, cost:', cost(x,y,0)) # hx = [0,0,0], cost: 4.666666666666667
print('w:1, cost:', cost(x,y,1)) # hx = [1,2,3], cost: 0.0,  최저점
print('w:2, cost:', cost(x,y,2)) # hx = [2,4,6], cost: 4.666666666666667
print('w:3, cost:', cost(x,y,3)) # hx = [2,4,6], cost: 18.666666666666668

# 비용함수의 시각화 : x축은 weight, y축은 cost로 하는 2차 함수, 포물선의 방정식
for k in range(-30,50):
    w = k/10
    c = cost(x,y,w)
#   print(w,c)
    plt.plot(w,c,'ro')  # 'r':red , 'o': 점으로 출력

plt.title(' ** Cost Function Graph')    
plt.xlabel('weight')    
plt.ylabel('cost')
plt.grid()
plt.show()       

### 미분 : 순간 변화량, 기울기, x축으로 1만큼 움직였을 때 y축으로 움직인 거리
#### 함수의 미분 공식 정리 :  f(x) = x^n   ====> f'(x) = n*x^(n-1)
* y = 3            ===> y' = 0
* y = 2*x          ===> y' = 2
* y = x^2          ===> y' = 2*x
* y = (x + 1)^2    ===> y' = 2**(x + 1) # y = x^2 + 2**x + 1  ===> 2**x + 2

* 곱셈 공식 : (a + b)^2 = a^2 + 2**a**b + b^2

In [None]:
# 경사 하강법 알고리즘 함수 구현, 미분 적용
def gradient_descent(x,y,w):
    c = 0
    for k in range(len(x)):
        hx = w*x[k]
        loss = (hx - y[k])*x[k]   # 곱하기 2를 생략한 비용함수의 미분
        # 비용함수의 미분 : cost(w) = (w*x[k] - y[k])^2 의 미분
        # cost(w) = w^2 * x[k]^2 - 2*w*x[k]*y[k] + y[k]^2
        # cost'(w) = 2*w*x[k]^2 - 2*x[k]*y[k] = 2*x[k]*(w*x[k] - y[k])
        # =  2*x[k]*(hx - y[k])
        c += loss
    return c/len(x)

# x = [1,2,3]
# y = [1.2,3.2,5.4]

# 학습 시작(train,fit) 시작
print('--------------------- start learning!!')
w , old = 10, 100
for k in range(1000):
    c = cost(x,y,w)
    grad = gradient_descent(x,y,w)
    w -= 0.1* grad   # 0.1:학습율(learning rate),하이퍼 파라메터,가중치의 업데이트실행
    print('[%03d]'%k,'cost:',c,'old:',old,'weight:',w)
#   if c == old : # cost의 변화가 없을때
    if c >= old and abs(c - old) < 1.0e-15: # cost가 1.0e-15값 보다도 더 줄지 않을 때
        break
    old = c
print('--------------------- end learning!!')
print('weight:',w,'train:',k+1,'회')
    

In [None]:

def cost(x,y,w):
    c = 0
    for k in range(len(x)):
        hx = w * x[k]          
        loss = (hx - y[k])**2 
        c += loss              
    return c/len(x)            


def gradient_descent(x,y,w):
    c = 0
    for k in range(len(x)):
        hx = w*x[k]
        loss = (hx - y[k])*x[k]   
        # 비용함수의 미분 : cost(w) = (w*x[k] - y[k])^2 의 미분
        # cost(w) = w^2 * x[k]^2 - 2*w*x[k]*y[k] + y[k]^2
        # cost'(w) = 2*w*x[k]^2 - 2*x[k]*y[k] = 2*x[k]*(w*x[k] - y[k])
        # =  2*x[k]*(hx - y[k])
        c += loss
    return c/len(x)


def fit(x,y):
    print('--------------------- start learning!!')
    w , old = 10, 100
    for k in range(1000):
        c = cost(x,y,w)
        grad = gradient_descent(x,y,w)
        w -= 0.1* grad   
        print('[%03d]'%k,'cost:',c,'old:',old,'weight:',w)
   
        if c >= old and abs(c - old) < 1.0e-15: 
            break
        old = c
    print('--------------------- end learning!!')
    return w


def predict(x,w):
    hx = w*np.array(x)
    return list(hx)


def get_accuaracy(x_test,y_test,w):
    y_pred = predict(x_test,w)
    print(y_pred)
    correct = 0
    for k,_ in enumerate(y_test) :
        if y_test[k] == y_pred[k] :  
            correct += 1
    accuracy = round(correct/len(y_test),2)  
    return accuracy                


def get_rmse(x_test,y_test,w):
    y_pred = predict(x_test,w)
    print(y_pred)
    squared_error = 0
    for k,_ in enumerate(y_test):
        squared_error += (y_pred[k] - y_test[k])**2  
    mse = squared_error/len(y_test)   
    rmse = np.sqrt(mse)               
    return rmse    

In [None]:

x_train = [1,2,3,4,5]
y_train = [2,4,6,8,10]

w = fit(x_train,y_train)  
print('weight:',w)  


x_pred = [6,7,8,9,10]   
y_pred = predict(x_pred,w)
print('y_pred:',y_pred)



x_test = [10,20,30]
# y_test = [20,40,60]
y_test = [20,40,70]
accuracy = get_accuaracy(x_test,y_test,w)
print('Accuracy:',accuracy)  


x_test = [10,20,30]
# y_test = [20,40,60]
y_test = [20,40,70]
rmse = get_rmse(x_test,y_test,w)
print('RMSE:',rmse)     

### class를 사용한 Linear Regression 알고리즘 구현

In [None]:


class LinearRegression:
    def __init__(self,weight=10):
        self.w = weight
        print('LinearRegression 생성자')
        
 
    def cost(self,x,y) :
        c = 0
        for k in range(len(x)):
            hx = self.w * x[k]     
            loss = (hx - y[k])**2  
            c += loss
        return c/len(x)           


    def gradient_descent(self,x,y):
        c = 0
        for k in range(len(x)):
            hx = self.w*x[k] 
            loss = (hx - y[k])*x[k]     
            c += loss
           
        return c/len(x)

   
    def fit(self,x,y):
        print('----------- start learning!!')
        old =  100
        for k in range(1000):
            c = self.cost(x,y)
            grad = self.gradient_descent(x,y)
            self.w -= 0.1*grad 
            print('[%03d]'%k,'cost:',c,'old:',old,'weight:',self.w)

            if c >= old and abs(c - old) < 1.0e-15: 
                break
            old = c
        print('----------- end learning!!')  
#         return self.w


    def predict(self,x):
        hx = self.w*np.array(x)
        return list(hx)

    def get_accuaracy(self,x_test,y_test):
        y_pred = self.predict(x_test)
        print(y_pred)
        correct = 0
        for k,_ in enumerate(y_test) :
            if y_test[k] == y_pred[k] :  
                correct += 1
        accuracy = round(correct/len(y_test),2)  
        return accuracy                

  
    def get_rmse(self,x_test,y_test):
        y_pred = self.predict(x_test)
        print(y_pred)
        squared_error = 0
        for k,_ in enumerate(y_test):
            squared_error += (y_pred[k] - y_test[k])**2  
        mse = squared_error/len(y_test)   
        rmse = np.sqrt(mse)              
        return rmse    

In [None]:


x_train = [1,2,3,4,5]
y_train = [2,4,6,8,10]

lr = LinearRegression()  
lr.fit(x_train,y_train) 
print('weight:',lr.w)    


x_pred = [6,7,8,9,10]  
y_pred = lr.predict(x_pred)  
print('y_pred:',y_pred)


x_test = [10,20,30]
# y_test = [20,40,60]
y_test = [20,40,70]

accuracy = lr.get_accuaracy(x_test,y_test)  
print('Accuarcy:',accuracy)  

# 회귀 모델인 경우
x_test = [10,20,30]
# y_test = [20,40,60]
y_test = [20,40,70]

rmse = lr.get_rmse(x_test,y_test)  
print('RMSE:',rmse) 