# Scikit-learn 소개

- 파이썬 머신러닝 라이브러리
    - 분류, 클러스터링, 추천, 회귀, 차원 축소 등의 알고리즘, 샘플 데이터를 지원
- Scikit-learn, scipy, matplotlib, pandas, numpy등 미리 설치 필요

### 1. XOR 예제를 수동으로 구현하기

|p|q|res|
|:-:|:-:|:-:|
|0|0|0|
|0|1|1|
|1|0|1|
|1|1|0|

In [7]:
# 라이브러리 로딩
from sklearn import svm

# 데이터 준비: [p, q, res]
xor_data = [
    [0, 0, 0],
    [0, 1, 1],
    [1, 0, 1],
    [1, 1, 0]
]

# 주어진 데이터를 학습데이터와 레이블로 분리
training_data = []
lable = []

for row in xor_data:
    p = row[0]
    q = row[1]
    res = row[2]
    
    training_data.append([p, q])
    lable.append(res)
    
print("training_data:", training_data)
print("lable:", lable)

# SVM(Support Vector Machine) 알고리즘: 분류, 회귀 모두 가능
# SVM 알고리즘을 이용하여 분류에 사용하는 머신러닝 객체를 만듦
clf = svm.SVC()

# fit(): 학습 기계에 데이터를 학습시킴
clf.fit(training_data, lable)

# predict(): 학습 데이터를 이용한 예측
pre = clf.predict(training_data)
print("predicted result:", pre)

# 정확도 측정
ok = 0
total = 0

for idx, answer in enumerate(lable):
    p = pre[idx]
    if p == answer:
        ok += 1
    total += 1

print("ok:{0} total:{1} accuracy:{2}".format(ok, total, ok/total))

training_data: [[0, 0], [0, 1], [1, 0], [1, 1]]
lable: [0, 1, 1, 0]
predicted result: [0 1 1 0]
ok:4 total:4 accuracy:1.0


### 2. XOR 예제 Sckit-learn을 이용하여 구현하기

In [18]:
import pandas as pd
from sklearn import svm, metrics

# XOR 연산 데이터
inputData = [
    [0, 0, 0],
    [0, 1, 1],
    [1, 0, 1],
    [1, 1, 0]
]

xor_df = pd.DataFrame(inputData)

# 학습데이터와 레이블을 분리
training_data = xor_df.loc[:, 0:1]
lable = xor_df.loc[:, 2]

# 머신러닝 객체 만들기
clf = svm.SVC()

# 데이터의 학습과 예측
clf.fit(training_data, lable)
pre = clf.predict(training_data)

# 정확도 측정(정답률 확인)
# Metrics 모듈에 accuracy_score() 함수를 이용하면 성공율을 구할 수 있음
accuracy = metrics.accuracy_score(lable, pre)
print("Accuracy:", accuracy)

Accuracy: 1.0
