# Anomaly Detection : 1-SVM / SVDD 

## 과거 SVM, SVR과 동일하게 cvxopt 모듈이 Error가 계속 발생함. 추후 한꺼번에 해결이 필요하겠음. 


## 1- SVM 

1. 목적함수 및 라그랑주 함수 정의 

> $L = \frac{1}{2}||w||^2 + \frac{1}{vl}\sum_{i=1}^l \xi_i - \rho - \sum_{i=1}^l \alpha_i(w * \phi(x_i) - \rho + \xi_i) - \sum_{i=1}^l \beta_i \xi_i$ 

2. 듀얼문제로 전환 및 Kernel Trick 적용 

> $min L =\frac{1}{2}\sum_{i=1}^l \sum_{j=1}^l \alpha_i \alpha_jK(x_i,x_j)$ 

>s.t. $\sum_{i=1}^l \alpha_i = 1, 0 <= \alpha_i <= \frac{1}{vl}$

3. 2번에서 도출한 Convex 식의 해($\alpha$) 값 산출하기 

4. 도출한 $\alpha$ 값을 기반으로 w, $\beta$ 계산하기 

> $w = \sum_{i=1}^l \alpha_i\phi(x_i)$ 


**구현해야 하는 것**
- Kernel 함수
- 제한 조건이 있는 Convex 함수 해 찾기 

**필요한 것**
- X 
- y
- kernel 함수 
- convex 함수를 풀 모듈 : cvxopt 
- vl 

**함수의 형태** 
- def __init__(self,X,kernel_type, v,l) : 

- def kernel(self, kernel_type) : -> K(x_i, x_j)의 값을 가진 n x n 행렬. 

- def find_alpha(self,kernel_matrix) : alpha 값 반환   



In [32]:
import numpy as np
import pandas as pd
import random as rand

from sklearn.datasets import load_iris
X = load_iris()['data']

import matplotlib.pyplot as plt
import scipy as sc
from scipy.stats import norm
from sys import maxsize

In [28]:
import cvxopt
import cvxopt.solvers

class One_SVM() : 
    def __init__(self,X,y, kernel_type, v,l) : 
        self.X = X 
        self.y = y 
        self.n = np.shape(X)[0]
        self.m = np.shape(X)[1] 
        
        self.kernel_type = kernel_type 
        self.k_matrix = self.kernel_matrix()
        
        self.v = v
        self.l = self.n
        
    def kernel(self, x1, x2, b = 1, d =3, sigma = 0.1, kappa = 2, theta = 3) : 
        if self.kernel_type == "polynomial" : 
            return (np.dot(x1, x2) +b) ** d 
        
        elif self.kernel_type == "RBF" : 
            return np.exp(-np.linalg.norm(x1-x2)**2 / (sigma **2))
        
        elif self.kernel_type == "MLP" : 
            return np.tanh(kappa * np.dot(x1, x2) + theta) 
    
    def kernel_matrix(self) : 
        k_matrix = np.zeros((self.n, self.n))
        for i in range(self.n) : 
            for j in range(self.n) : 
                k_matrix[i,j] = self.kernel(self.X[i], self.X[j])
        return k_matrix
    
    def find_alpha(self) : 
        P = cvxopt.matrix(self.k_matrix) 
        q = cvxopt.matrix(np.zeros((self.n,1)))
        G = cvxopt.matrix(np.vstack((np.identity(self.n), -np.identity(self.n)))) 
        h = cvxopt.matrix(np.hstack((np.ones(self.n,)/(self.v*self.l), np.zeros(self.n))))
        A = cvxopt.matrix(np.ones((1, self.n)))
        b = cvxopt.matrix(np.zeros(1))
                          
        sol = cvxopt.solvers.qp(P,q,G,h,A,b)
        alphas = np.array(sol['x'])
        threshold = 1e-4 
                          
        return alphas
        
                          
                          
        
            
        
        
    

In [35]:
test = One_SVM(X, "", 0.1, 150)

# 또다시 듀얼문제 해답 찾는 부분에서 오류 발생.. 
test.find_alpha()

     pcost       dcost       gap    pres   dres
 0:      nan      nan  nan    nan    nan


ValueError: domain error

In [11]:
np.vstack((np.identity(3), -np.identity(3)))

array([[ 1.,  0.,  0.],
       [ 0.,  1.,  0.],
       [ 0.,  0.,  1.],
       [-1., -0., -0.],
       [-0., -1., -0.],
       [-0., -0., -1.]])