# 6장 Support Vector Machine

> 기계 학습의 분야 중 하나로 패턴 인식, 자료 분석을 위한 지도 학습 모델이며, 주로 분류와 회귀 분석을 위해 사용한다. 두 카테고리 중 어느 하나에 속한 데이터의 집합이 주어졌을 때, SVM 알고리즘은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 카테고리에 속할지 판단하는 **비확률적 이진 선형 분류** 모델을 만든다.

**장점**
- 일반화의 오류가 낮고 계산 비용이 적게 들며 결과 해석이 용이
- 학습 데이터 Over fitting을 방지
- 비선형 데이터 분류도 가능 (Kernel method)

**단점**
- 매개변수의 조정과 커널 선택에 민감
- 학습 데이터의 Margin이 작은 경우 문제가 발생
- Support Vector 근처의 데이터만을 고려
----

### Support Vector Machine의 아이디어
1. 우리가 ● 샘플과 ○샘플을 구별하고 싶다면 어떤식으로 나눠야 하는가?
2. 만약 선을 그어 구별한다면 어떤 선이어야 할 것인가?

    - 일반적인 분류기
        - H3는 두 종류의 샘플을 구별할 수 없다.
        - 신경망의 경우 H1을 찾는다.
        - SVM의 경우 H2를 찾는다.
        - H1보다 H2의 일반화 능력이 더 뛰어나다.

<img src="Svm_separating_hyperplanes.png", width=400, height=400>

### Decision Boundary 직관적 비교
<img src="svm_figure1.png", width=400, height=400/>
<img src="svm_figure3.png", width=400, height=400/>
<img src="svm_figure2.png", width=400, height=400/>

### Decision Rule ($H_3$를 찾는 방법)
Decision Rule이란 새로운 입력 $\vec{\mathbf{u}}$ 에 대해서 이 입력의 class가 + 인지 - 인지 결정하는 방법에 대한 것이다.
다음과 같이 2차원 공간 위에 Decision Boundary (Hyperplane)와 법선 벡터$\vec{\mathbf{w}}$가 있다고 하자.
<img src="Decision_rule.png"\>
아직 $\vec{\mathbf{w}}$ 가 무엇인지는 모르지만 우리가 설정하려고 하는 것은 가운데 dashed line 보다 위에 있으면 +로, 아래에 있으면 -로 classify하려는 것이다. 즉, 우리는 Decision Rule을 다음과 같이 설정할 수 있다.

$$
\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}\ge c
$$

이 때 **c**는 임의의 상수이다. 즉, 아직 $\vec{\mathbf{w}}$ 와 **c**가 정해진 값은 아니지만 이 조건을 만족하면 +라고 하자라고 Decision Rule을 정할 수 있는 것이다. 이 식을 약간 변형시키면,
$$
\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b\ge 0
$$

으로 변형시킬 수 있다. 이 식은 2차원에서의 직선을 의미하지만, Hyperplane으로 확장해 생각할 수 있다. 이제 우리가 알아야 하는 것은$\vec{\mathbf{w}}$ 와 **b**이다.

<img src="hyperplane.png", width=400, height=400/>
샘플은 + 샘플과 - 샘플이 구별되어있고, Decision Boundary를 기준으로 위쪽에 있는 샘플은 임의의 수(+1) 이상이고, 아래쪽에 있는 샘플은 1 이하라고 생각할 수 있다.
$$
\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b\ge 1\\
\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b\ge -1
$$

이 두 개의 식을 하나로 묶을 수 있는 변수를 설정하고, 설정한 변수를 사용하여 두 식을 합칠 수 있다.

$$
y_i(\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b)\ge 1
$$


$$
y_i = 
\begin{cases}
+1, & \text{for} &x_+\\
-1, & \text{for} &x_-
\end{cases}
$$

따라서, Decision Boundary와 평행한 실선에 위치한 샘플에 대한 조건을 다음과 같이 표현이 가능하다. 또한 이 샘플들을 우리는 **Support Vector**라고 부른다.

$$
y_i(\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b)-1 = 0
$$


### n차원 공간에서 벡터를 이용한 Hyperplane의 표현

Hyperplane is 'a subspace of one dimension less than its ambient space'

즉 n차원의 공간에서의 hyperplane은 n-1차원의 subspace를 의미하는 것이며, 3차원의 경우 hyperplane은 2차원의 면이 되고, 2차원의 경우는 hyperplane은 1차원의 선이된다. 복잡한 문제에 대해 쉽게 접근하기 위해 3차원과 2차원의 hyperplane의 방정식에 대해 생각해보고 이것을 n차원에 대해 일반화 시켜보도록 하자.

<img src="hyperplane2.png"/>

평면의 방정식은 다음과 같다. 법선 벡터 $\vec{\mathbf{v}}=(a,b,c)$에 대해서 원점과의 거리가 $d$인 평면의 방정식은 $ax+by+cz+d=0$이다. 그렇다면, 2차원의 경우를 생각해보자. 이것을 그대로 적용시킨다면 직선의 방정식은 직선에 수직한 벡터 $\vec{\mathbf{w}} =(a,b)$에 대해 원점과의 거리가 $d$인 직선의 방정식은 $ax+by+d=0$이 될 것이다.

다시 이것을 약간만 고쳐보면 $y=−\frac{a}{b}x−\frac{d}{b}$임을 알 수 있으며, 이 1차 함수의 기울기는 벡터 $\vec{\mathbf{w}}$와 수직이라는 사실을 알 수 있다. 따라서 법선 벡터와 임의의 실수를 이용하면 n차원 공간에서의 hyperplane을 쉽게 생각해낼 수 있다.

## 6.1 최대 마진으로 데이터 분리하기
- 지지 벡터 머신
- 선형 분리(linearly separable)
    - 하나의 직선을 그려 선의 한쪽에는 한 가지 분류 항목만을 가지는 데이터 점들이 오도록 하고, 선의 다른 한쪽에는 다른 분류 항목을 가진 데이터 점들이 오게 함으로써 데이터 점들을 분리하는 것
- 초평면 분리(separating hyperplane)
    - 선 : 데이터 집합을 분리하는데 사용하는 것
    - 초평면 (hyperplane) : N-1차원 (의사 결정 범위)
    - (의사 결정 범위 : 하나의 측면에 있는 모든 것은 하나의 분류 항목에 속하며, 또 다른 측면에 있는 모든 것은 다른 분류 항목에 속하게 됨)
- N-1차원 - 초평면 ~> 의사 결정 범위(decision boundary)
- 마진
    - 초평면 분리에 가장 가까운 지점을 찾기를 원하면서, 이 지점이 가능한 한 분리선에서 멀리 떨어져 있기를 원하는 것 (※ 마진이 가능한 한 큰게 좋음)
- 지지 벡터
    - 초평면 분리에 가장 가까운 지점 (※ 분리선에서 지지 벡터까지의 거리를 가장 크게 해야하며, 이 문제를 최적화하는 방법을 찾아야 함)
- 여백(margin)이라는 개념을 어떻게 공식화 할 것인가?
- 여백을 최대로 하는 결정 초평면은 어떻게 찾아 낼 것인가?

<img src="Decision_rule2.png"/>

위 그림에서 실선 위에 있는 $x_+$와 $x_−$에 대한 원점으로부터의 벡터 $\vec{\mathbf{x_+}}$와 $\vec{\mathbf{x_-}}$에 대하여, $\vec{\mathbf{x_+}}-\vec{\mathbf{x_-}}$를 생각해보자. 이것을 이용해서 두 실선 사이의 거리를 생각할 수 있다.$\vec{\mathbf{w}}$ 는 dashed line에 수직하기 때문에 $\vec{\mathbf{w}}$와 방향은 같고 크기는 1인 벡터를 이용하면 두 실선 사이의 거리를 생각할 수 있다. 두 실선사이의 거리는

$$
\frac{\vec{\mathbf{w}}}{\lVert\vec{\mathbf{w}}\rVert}\cdot(\vec{\mathbf{x_+}}-\vec{\mathbf{x_-}})
$$

이다. 위 식과 이전에 도출했던 식을 대입해보자.

$$
\frac{\vec{\mathbf{w}}}{\lVert\vec{\mathbf{w}}\rVert}\cdot(\vec{\mathbf{x_+}}-\vec{\mathbf{x_-}})\\ 
= \frac{1}{\lVert\vec{\mathbf{w}}\rVert}(\vec{\mathbf{w}}\cdot\vec{\mathbf{x_+}}-\vec{\mathbf{w}}\cdot\vec{\mathbf{x_-}})\\
= \frac{1}{\lVert\vec{\mathbf{w}}\rVert}(1-b+1+b)\\
= \frac{2}{\lVert\vec{\mathbf{w}}\rVert}
$$

즉 두 실선 사이의 거리는 $\frac{2}{\lVert\vec{\mathbf{w}}\rVert}$이다. 우리는 이것을 우리는 **Margin**이라 부르며, SVM은 이것을 최대화하는 Decision Boundary를 찾는것을 목표로한다. 수학적 편의를 위해 $\frac{2}{\lVert\vec{\mathbf{w}}\rVert}$는 $max\frac{1}{\lVert\vec{\mathbf{w}}\rVert}$로 생각할 수 있고, 이것은 다시 $min\frac{1}{2}\lVert\vec{\mathbf{w}}\rVert^2$의 문제로 바꿀 수 있다.

## 6.2 최대 마진 찾기

최대 마진을 찾기 위한 최적화 문제는 다음과 같이 정리할 수 있다.   
- 조건함수(Constraints): $y_i(\vec{\mathbf{w}}\cdot\vec{\mathbf{u}}+b)-1 = 0$
- 목적함수: $min\frac{1}{2}\lVert\vec{\mathbf{w}}\rVert^2$

최적화 문제는 **라그랑주 승수법(Lagrange multiplier method)** 으로 해결이 가능하다. 라그랑주 승수법은 제약식에 형식적인 라그랑지안 승수를 곱한 항을 최적화하려는 목적식에 더하여, 제약된 문제를 제약이 없는 문제로 바꾸는 기법이다.

우리가 이미 정의한 목적식과 제약식을 라그랑지안 문제로 해석하면 다음과 같은 수식으로 생각할 수 있다.

<img src="라그랑지승수법.png"/>
원 문제의 제약식의 범위가 0 이상이므로 $L_p$의 제약은 다음과 같다.
<img src="제약식.png"/>
$L_p$를 미지수로 각각 편미분한 식이 0이 되는 지점에서 최적해를 갖을 수 있다는 라그랑주 기법을 적용한다.
<img src="편미분.png"/>
위 식을 L에 대해 정리해보자. 우선 첫번째 항을 대입한다.
<img src="첫째항대입.png"/>
두번째 항을 대입해보자.
<img src="둘째항대입.png"/>


지금까지 도출한 결과를 토대로 $L_p$를 정리하면 다음과 같고, $a$의 최고차항의 계수가 음수이므로 최소값을 찾는 문제가 최대값을 찾는 문제로 바뀌었다.
<img src="결과식.png"/>
제약식은 다음과 같다.
<img src="결과식의제약식.png"/>


### SVM의 해
우리가 찾고자 한 답은 마진이 최대화된 분류경계면 $w^Tx+b$이다. $w$와 $b$를 찾으면 SVM의 해를 구할 수 있게 된다. 위 조건을 탐색하는 과정에서 $w$는 다음과 같이 도출됐다.
<img src="w.png"/>

$x_i$와 $y_i$는 우리가 가지고 있는 학습데이터이므로 라그랑지안 승수인 $α$값들만 알면 $w$를 찾을 수 있다. 그런데 여기에서 $α_i$가 0인 관측치들은 분류경계면 형성에 아무런 영향을 끼치지 못한다. 바꿔 말해 i번째 관측치에 대응하는 라그랑지안 승수 $α_i$가 0보다 커야 마진 결정에 유의미하다.

한편 $b$는 이미 구한 $w$와 학습데이터, $y_i(w^T\cdot{x_i}+b)-1 = 0$ 식을 활용해 바로 구할 수 있게 된다. 새로운 데이터가 들어왔을 때는 해당 관측치를 $y_i(w^T\cdot{x_i}+b)-1 = 0$에 넣어서 0보다 크면 1, 0보다 작으면 -1 범주로 예측하면 된다.

### 라그랑주 승수법
라그랑주 승수법은 최적화 문제에서 사용되는 수학적 기법으로써 최대 또는 최소값을 찾으려는 문제에서 해결방법으로 사용된다. 라그랑주 승수법을 사용하는 방법은 목적 함수 $f(x,y)$와 제약 조건 $g(x,y)=0$에 대해 새로운 변수 $λ$를 이용하여 다음의 보조 방정식을 만든 다음, 보조방정식에 대해 모든 변수에 대한 편미분 값이 0이되는 변수의 해를 찾는 것이다.


이렇게 목적 함수와 제약 조건에 대해 위와 같은 보조 방정식을 만들고 문제를 풀 수 있게 되는 이유는 제약 조건을 만족시키면서 목적 함수를 최대화 또는 최소화 시키는 점에서는 목적함수의 gradient(쉽게 말해 기울기)와 제약 조건의 gradient가 평행하기 때문이다. 아래의 그림을 보면서 조금 더 자세하게 알아보자.

<img src="L1.png"/>

<img src="L2.png"/>
위 그림에서 $f(x,y)$가 $d_1$이라는 값에서부터 $d3$라는 값까지 변할 수 있으며, $g(x,y)=c$라는 제약 조건이 붙었다고 하자. 그렇다면 $g(x,y)=c$라는 제약조건을 만족시키면서 $f(x,y)$가 커질 수 있는 최대값은 얼마일까? 직관적으로 $d_1$이라고 생각할 수 있다.

두번째 그림보면 $f(x,y)$와 $g(x,y)=c$가 접점을 이루는 곳이 제한된 조건을 만족하는 $f(x,y)$의 최대값이라는 것을 알 수 있다. 그렇다면 접점을 찾는 조건은 무엇일까? 바로 두 곡선의 기울기가 접점에서 평행을 이룬다는 사실이다. 곡선의 기울기는 미분을 통해 알 수 있는데 변수가 많아지면 편미분을 통해서, 조금더 자세하게는 gradient를 통해서 구할 수 있다. 즉, 접점의 값을 구하는 조건은 아래와 같다.

<img src="L3.png"/>

또한 일반적으로 여러개의 제약 조건이 붙는 경우는 다음과 같이 식을 추론할 수 있다.
<img src="L4.png"/>

즉 이러한 경우에는 다음 식의 해를 구하게 되면 최적화 조건을 찾을 수 있다.
<img src="L5.png"/>

### 6.2.1 분류기 관점에서의 최적화 문제 구성하기

### 6.2.2 일반적인 기본 구조로 지지 벡터 머신에 접근하기

## 6.3 SMO 알고리즘으로 효율적인 최적화하기
이전에 사람들은 최적화 문제를 해결하기 위해 이차 방정식 솔버를 사용
- 이차방정식 솔버(Quadratic solver)
    - 선형적인 제약 조건이 있는 여러 변수를 가지고 이차 방정식 함수를 최적화하는 소프트웨어의 한 부분
    - 강력한 계산을 가지며 복잡함
    - 최적화를 다루는 이유는 분류기를 훈련시키기 위함
    - 최적의 ∝값을 찾으므로써 분리 초평면 또는 2D에서 선을 구할 수 있으며, 데이터를 쉽게 분류할 수 있게 됨

### 6.3.1 플랫의 SMO 알고리즘
- SMO (Sequential Minimal Optimization)
    - 순차적 최소 최적화
    - 커다란 최적화 문제를 가짐
    - 이 문제는 다시 작은 문제들로 나누어짐
    - 작은 문제들을 쉽게 해결 할 수 있으며 순차적으로 해결 가능
    - 순차적으로 해결된 문제들의 답은 모두 같게 됨
    - 이는 모든 문제를 다함께 처리하는 것과 같은 효과가 있음
    - 결론적으로, 같은 답을 얻게 됨으로써 처리 시간이 크게 줄어듦 

- SMO 알고리즘은 알파와 b의 집합을 찾는 것
    - 알파의 집합을 구하게 되면 가중치 w는 쉽게 계산되며 분피 초평면을 구할 수 있음 

- SMO 알고리즘의 동작 방식
    1. 각각의 사이클을 최적화하기 위하여 두 개의 알파를 선택
    2. 적당한 알파의 쌍을 찾게 되면, 그 중 하나는 값을 증가시키고 다른 하나는 줄임    
    (※ 적당한 알파를 구하기 위해서는 알파 집합이 조건을 정확하게 충족해야 함)
    3. 첫 번째 조건은 알파 쌍 모두가 그들의 마진 경계 밖에 있어야 한다는 것
    4. 두 번째 조건은 알파가 이미 고정되어 있거나 경계를 갖지 않아야 한다는 것

### 6.3.2 간략한 형태의 SMO로 적은 양의 데이터 집합 해결하기
- 간략화 알고리즘은 적은 양의 코드를 사용하지만 실행 시간이 오래 걸림
- 플랫 SMO 알고리즘의 바깥쪽 반복문에서는 최적화를 위해 가장 좋은 알파를 결정
- 간략화 형태의 알고리즘에서는 이 부분을 건너뛰고 데이터 집합에 있는 모든 알파를 대상으로 알파의 쌍을 먼저 선택
- 그런 다음, 남아 있는 알파들에서 임의로 두 번째 알파 선택   
(※ 여기서 주의해야 할 점은 두 알파를 동시에 변경해야 한다는 것)
    - 다음과 같은 제약 조건
    <img src="제약조건.jpg"/>
- 알파 하나만을 변경하는 것은 제약 조건을 위반하는 것이므로 항상 알파 두 개를 한꺼번에 변경
    - 이를 수행하기 위해 도움 함수를 생성
    - 이 함수는 범위 내에서 임의로 하나의 정수를 선택
    - 또한, 너무 큰 값을 얻지 않도록 값을 고정하는 도움 함수도 필요

#### 리스팅 6.1 SMO 알고리즘을 위한 도움 함수

In [4]:
from numpy import *
from time import sleep

def loadDataSet(fileName):
    dataMat = []; labelMat = []
    fr = open(fileName)
    for line in fr.readlines():
        lineArr = line.strip().split('\t')
        dataMat.append([float(lineArr[0]), float(lineArr[1])])
        labelMat.append(float(lineArr[2]))
    return dataMat,labelMat


"""
i는 첫 번째 알파의 인덱스; m은 알파 전체의 갯수
임의로 선택된 하나의 값은 i와 동일하지 않을 때까지 반복하여 선택한 값으로 반환
"""
def selectJrand(i,m):
    j=i #we want to select any J not equal to i
    while (j==i):
        j = int(random.uniform(0,m))
    return j


"""
알파 값이 H보다 크거나 L보다 작은 값이 ㄹ경우 더 크거나 더 작아지지 않도록 고정시킴
"""
def clipAlpha(aj,H,L):
    if aj > H: 
        aj = H
    if L > aj:
        aj = L
    return aj

In [9]:
dataArr, labelArr = loadDataSet('testSet.txt')
print(labelArr)

[-1.0, -1.0, 1.0, -1.0, 1.0, 1.0, 1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, 1.0, -1.0, 1.0, 1.0, -1.0, 1.0, -1.0, -1.0, -1.0, 1.0, -1.0, -1.0, 1.0, 1.0, -1.0, -1.0, -1.0, -1.0, 1.0, 1.0, 1.0, 1.0, -1.0, 1.0, -1.0, -1.0, 1.0, -1.0, -1.0, -1.0, -1.0, 1.0, 1.0, 1.0, 1.0, 1.0, -1.0, 1.0, 1.0, -1.0, -1.0, 1.0, 1.0, -1.0, 1.0, -1.0, -1.0, -1.0, -1.0, 1.0, -1.0, 1.0, -1.0, -1.0, 1.0, 1.0, 1.0, -1.0, 1.0, 1.0, -1.0, -1.0, 1.0, -1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0, -1.0, -1.0, -1.0, -1.0, 1.0, -1.0, 1.0, 1.0, 1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0, -1.0]


In [11]:
print(dataArr)

[[3.542485, 1.977398], [3.018896, 2.556416], [7.55151, -1.58003], [2.114999, -0.004466], [8.127113, 1.274372], [7.108772, -0.986906], [8.610639, 2.046708], [2.326297, 0.265213], [3.634009, 1.730537], [0.341367, -0.894998], [3.125951, 0.293251], [2.123252, -0.783563], [0.887835, -2.797792], [7.139979, -2.329896], [1.696414, -1.212496], [8.117032, 0.623493], [8.497162, -0.266649], [4.658191, 3.507396], [8.197181, 1.545132], [1.208047, 0.2131], [1.928486, -0.32187], [2.175808, -0.014527], [7.886608, 0.461755], [3.223038, -0.552392], [3.628502, 2.190585], [7.40786, -0.121961], [7.286357, 0.251077], [2.301095, -0.533988], [-0.232542, -0.54769], [3.457096, -0.082216], [3.023938, -0.057392], [8.015003, 0.885325], [8.991748, 0.923154], [7.916831, -1.781735], [7.616862, -0.217958], [2.450939, 0.744967], [7.270337, -2.507834], [1.749721, -0.961902], [1.803111, -0.176349], [8.804461, 3.044301], [1.231257, -0.568573], [2.074915, 1.41055], [-0.743036, -1.736103], [3.536555, 3.96496], [8.410143, 0.0

#### 리스팅 6.2 간략한 형태의 SMO 알고리즘

In [12]:
"""
다음 함수의 Parameter
(데이터 집합, 분류 항목 표시, 상수 C, 오차 범위, 종료 전 최대 반복 횟수)
"""
def smoSimple(dataMatIn, classLabels, C, toler, maxIter):
    dataMatrix = mat(dataMatIn); labelMat = mat(classLabels).transpose()
    b = 0; m,n = shape(dataMatrix)
    alphas = mat(zeros((m,1)))
    iter = 0
    # 1. 알파가 변경가능하다면 최적화 입력
    while (iter < maxIter):
        alphaPairsChanged = 0
        for i in range(m):
            fXi = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[i,:].T)) + b
            Ei = fXi - float(labelMat[i])#if checks if an example violates KKT conditions
            if ((labelMat[i]*Ei < -toler) and (alphas[i] < C)) or ((labelMat[i]*Ei > toler) and (alphas[i] > 0)):
                # 2. 임의로 두 번째 알파 선택
                j = selectJrand(i,m)
                fXj = float(multiply(alphas,labelMat).T*(dataMatrix*dataMatrix[j,:].T)) + b
                Ej = fXj - float(labelMat[j])
                alphaIold = alphas[i].copy(); alphaJold = alphas[j].copy();
                # 3. 알파가 0과 C 사이의 값이 되도록 함
                if (labelMat[i] != labelMat[j]):
                    L = max(0, alphas[j] - alphas[i])
                    H = min(C, C + alphas[j] - alphas[i])
                else:
                    L = max(0, alphas[j] + alphas[i] - C)
                    H = min(C, alphas[j] + alphas[i])
                if L==H: print("L==H"); continue
                eta = 2.0 * dataMatrix[i,:]*dataMatrix[j,:].T - dataMatrix[i,:]*dataMatrix[i,:].T - dataMatrix[j,:]*dataMatrix[j,:].T
                if eta >= 0: print("eta>=0"); continue
                alphas[j] -= labelMat[j]*(Ei - Ej)/eta
                alphas[j] = clipAlpha(alphas[j],H,L)
                # 4. 반대쪽 j와 동일하게 계산된 값으로 i를 갱신
                if (abs(alphas[j] - alphaJold) < 0.00001): print("j not moving enough"); continue
                alphas[i] += labelMat[j]*labelMat[i]*(alphaJold - alphas[j])#update i by the same amount as j
                                                                        #the update is in the oppostie direction
                b1 = b - Ei- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[i,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[i,:]*dataMatrix[j,:].T
                # 5. 상수의 간격을 설정
                b2 = b - Ej- labelMat[i]*(alphas[i]-alphaIold)*dataMatrix[i,:]*dataMatrix[j,:].T - labelMat[j]*(alphas[j]-alphaJold)*dataMatrix[j,:]*dataMatrix[j,:].T
                if (0 < alphas[i]) and (C > alphas[i]): b = b1
                elif (0 < alphas[j]) and (C > alphas[j]): b = b2
                else: b = (b1 + b2)/2.0
                alphaPairsChanged += 1
                print("iter: %d i:%d, pairs changed %d" % (iter,i,alphaPairsChanged))
        if (alphaPairsChanged == 0): iter += 1
        else: iter = 0
        print("iteration number: %d" % iter)
    return b,alphas

In [13]:
b, alphasalphas = smoSimple(dataArr, labelArr, 0.6, 0.001, 40)

iter: 0 i:0, pairs changed 1
iter: 0 i:2, pairs changed 2
iter: 0 i:3, pairs changed 3
L==H
iter: 0 i:6, pairs changed 4
iter: 0 i:8, pairs changed 5
j not moving enough
j not moving enough
iter: 0 i:12, pairs changed 6
j not moving enough
L==H
j not moving enough
L==H
iter: 0 i:30, pairs changed 7
iter: 0 i:33, pairs changed 8
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
L==H
L==H
L==H
iter: 0 i:50, pairs changed 9
j not moving enough
iter: 0 i:54, pairs changed 10
j not moving enough
j not moving enough
L==H
j not moving enough
iter: 0 i:83, pairs changed 11
j not moving enough
j not moving enough
j not moving enough
iteration number: 0
iter: 0 i:0, pairs changed 1
j not moving enough
j not moving enough
iter: 0 i:6, pairs changed 2
j not moving enough
j not moving enough
iter: 0 i:12, pairs changed 3
j not moving enough
iter: 0 i:25, pairs changed 4
j not moving enough
j not moving enough
iter: 0 i:31, pairs changed 5
j not movi

j not moving enough
iteration number: 7
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
iter: 8 i:23, pairs changed 1
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iteration number: 1
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iteration number: 2
iter: 2 i:17, pairs changed 1
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
j not moving enough
j not moving enough
iter: 0 i:55, pairs changed 1
iter: 0 i:69, pairs changed 2


j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
j not moving enough
iteration number: 5
j not moving enough
j not moving enough
j not moving enough
iteration number: 6
j not moving enough
j not moving enough
j not moving enough
iteration number: 7
j not moving enough
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
j not moving enough
j not moving enough
iteration number: 9
j not moving enough
j not moving enough
j not moving enough
iteration number: 10
j not moving enough
j not moving enough
j not moving enough
iteration number: 11
iter: 11 i:17, pairs changed 1
j not moving enough
iter: 11 i:54, pairs changed 2
j not moving enough
iteration number: 0
j not moving enough
iter: 0 i:52, pairs changed 1
j not moving enough
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
j not moving enough
iterat

j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
j not moving enough
iteration number: 4
iter: 4 i:52, pairs changed 1
j not moving enough
iteration number: 0
iter: 0 i:17, pairs changed 1
j not moving enough
j not moving enough
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
j not moving enough
iteration number: 1
j not moving enough
j not moving enough
j not moving enough
iteration number: 2
j not moving enough
j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
j not moving enough
iteration number: 5
j not moving enough
j not moving enough
j not moving enough
iteration number: 6
j not moving enough
j not moving enough
j not moving enough
iteration number: 7
j not moving enough
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
j not moving enough


j not moving enough
j not moving enough
iteration number: 6
j not moving enough
j not moving enough
j not moving enough
iteration number: 7
j not moving enough
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
j not moving enough
j not moving enough
iteration number: 9
j not moving enough
j not moving enough
j not moving enough
iteration number: 10
j not moving enough
j not moving enough
j not moving enough
iteration number: 11
j not moving enough
j not moving enough
j not moving enough
iteration number: 12
j not moving enough
j not moving enough
j not moving enough
iteration number: 13
j not moving enough
j not moving enough
j not moving enough
iteration number: 14
j not moving enough
j not moving enough
j not moving enough
iteration number: 15
j not moving enough
j not moving enough
j not moving enough
iteration number: 16
j not moving enough
j not moving enough
j not moving enough
iteration number: 17
j not moving enough
j not moving enough
j not moving

j not moving enough
iteration number: 30
j not moving enough
iteration number: 31
j not moving enough
iteration number: 32
j not moving enough
iteration number: 33
j not moving enough
iteration number: 34
iter: 34 i:52, pairs changed 1
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
iteration number: 1
j not moving enough
j not moving enough
iteration number: 2
j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
iteration number: 5
j not moving enough
j not moving enough
iteration number: 6
j not moving enough
j not moving enough
iteration number: 7
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
j not moving enough
iteration number: 9
j not moving enough
j not moving enough
iteration number: 10
j not moving enough
j not moving enough
iteration number: 11
j not moving enough
j not moving enough
iteration number: 12
j

j not moving enough
j not moving enough
iteration number: 1
j not moving enough
j not moving enough
j not moving enough
iteration number: 2
j not moving enough
j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
j not moving enough
iteration number: 5
j not moving enough
iter: 5 i:52, pairs changed 1
j not moving enough
iteration number: 0
iter: 0 i:17, pairs changed 1
j not moving enough
j not moving enough
j not moving enough
iteration number: 0
j not moving enough
j not moving enough
j not moving enough
iteration number: 1
j not moving enough
j not moving enough
j not moving enough
iteration number: 2
j not moving enough
j not moving enough
j not moving enough
iteration number: 3
j not moving enough
j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
j not moving enough
iteration number: 5
j not moving enough


j not moving enough
j not moving enough
iteration number: 4
j not moving enough
j not moving enough
iteration number: 5
j not moving enough
j not moving enough
iteration number: 6
j not moving enough
j not moving enough
iteration number: 7
j not moving enough
j not moving enough
iteration number: 8
j not moving enough
j not moving enough
iteration number: 9
j not moving enough
j not moving enough
iteration number: 10
j not moving enough
j not moving enough
iteration number: 11
j not moving enough
j not moving enough
iteration number: 12
j not moving enough
j not moving enough
iteration number: 13
j not moving enough
j not moving enough
iteration number: 14
j not moving enough
j not moving enough
iteration number: 15
j not moving enough
j not moving enough
iteration number: 16
j not moving enough
j not moving enough
iteration number: 17
j not moving enough
j not moving enough
iteration number: 18
j not moving enough
j not moving enough
iteration number: 19
j not moving enough
j not movi

iteration number: 33
iter: 33 i:29, pairs changed 1
j not moving enough
iteration number: 0
j not moving enough
iteration number: 1
j not moving enough
iteration number: 2
j not moving enough
iteration number: 3
j not moving enough
iteration number: 4
j not moving enough
iteration number: 5
j not moving enough
iteration number: 6
j not moving enough
iteration number: 7
j not moving enough
iteration number: 8
j not moving enough
iteration number: 9
j not moving enough
iteration number: 10
j not moving enough
iteration number: 11
j not moving enough
iteration number: 12
j not moving enough
iteration number: 13
j not moving enough
iteration number: 14
j not moving enough
iteration number: 15
j not moving enough
iteration number: 16
j not moving enough
iteration number: 17
j not moving enough
iteration number: 18
j not moving enough
iteration number: 19
j not moving enough
iteration number: 20
j not moving enough
iteration number: 21
j not moving enough
iteration number: 22
j not moving en