### 머신러닝 (Machine Learning) 종류

- 지도학습 (Supervised Learning)
- 비지도학습 (Unsupervised Learning)
- 강화학습 (Reinforcement Learning)

In [5]:
from sklearn import svm
#svm = support vector machine

# XOR의 계산 결과 데이터
xor_input = [
    #P, Q, R
    [0,0,0],
    [0,1,1],
    [1,0,1],
    [1,1,0]
]

# 학습을 위해 데이터의 레이블 분리하기 -- (#1)
xor_data = []
xor_label = [] #결과

for row in xor_input:
    p = row[0]
    q = row[1]
    r = row[2]
    xor_data.append([p,q])
    xor_label.append(r)

# 데이터 학습시키기 -- (#2)
model = svm.SVC()
model.fit(xor_data, xor_label)

# 데이터 예측하기 -- (#3)
pre = model.predict(xor_data)
print("예측데이터 : ", xor_data)
print("예측 결과:", pre)

# 결과 확인하기 -- (#4)
ok = 0; total = 0
for idx, answer in enumerate(xor_label):
    p = pre[idx]
    if p == answer:
        ok += 1
    total +=1

print("정답률: ", ok, "/", total, "=", ok/total)


예측데이터 :  [[0, 0], [0, 1], [1, 0], [1, 1]]
예측 결과: [0 1 1 0]
정답률:  4 / 4 = 1.0


In [11]:
# pandas 라이브러리를 사용하여 코드 간략화
from sklearn import svm
import sklearn.metrics as metrics
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
# XOR 연산
xor_input = [
    #P, Q, R
    [0,0,0],
    [0,1,1],
    [1,0,1],
    [1,1,0]
]

# 입력을 학습 전용 데이터와 테스트 전용 데이터로 분류하기 -- (#1)
xor_df = pd.DataFrame(xor_input)
xor_data = xor_df[ [0,1]] #0번째 1번째 column 가져오기
xor_label = xor_df[2]

# 데이터 학습과 예측하기 -- (#2)
model = svm.SVC()
model.fit(xor_data, xor_label)
pre = model.predict(xor_data)

model2 = KNeighborsClassifier(n_neighbors=1)
model2.fit(xor_data, xor_label)
pre2 = model2.predict(xor_data)

# 정답률 구하기 -- (#3)
ac_score = metrics.accuracy_score(xor_label, pre)
print("정답률", ac_score)
ac_score2 = metrics.accuracy_score(xor_label, pre)
print("정답률2", ac_score2)

정답률 1.0
정답률2 1.0


진행순서 

    1. clf =  머신러닝 모델 생성 #svm.SVC() or KNeighborsClassifier(n_neighbors = 1)
    2. clf.fit(문제, 답)
    3. clf.predict(값을 얻고 싶은 데이터)
    4. ac_score = metrics.accuracy_score(실제답, 예측결과)
    
clf (classifier)

용어집 정리 https://developers.google.com/machine-learning/glossary?hl=ko

### 모델 저장과 불러오기

In [16]:
import pickle

with open("xor_model.pkl", "wb") as f:
    pickle.dump(model, f)
    
with open("xor_model.pkl", "rb") as f:
    model = pickle.load(f)
    
#문제
x_test = [
    [1,1]
]

# 모델 예측
y_predict = model.predict(x_test)
print(y_predict[0])

0


### 모델 저장과 불러오기2 (joblib)

In [18]:
from sklearn.externals import joblib

joblib.dump(model, "xor_model_2.pkl")

###불러오기

model = joblib.load("xor_model_2.pkl")

#문제
x_test = [
    [1,1]
]

# 모델 예측
y_predict = model.predict(x_test)
print(y_predict[0])

0


### 연습문제 01 
AND 연산 모델 작성

In [19]:
from sklearn import svm
import sklearn.metrics as metrics
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier

#AND 연산
xand_input = [
    #P, Q, R
    [0,0,0],
    [0,1,0],
    [1,0,0],
    [1,1,1]
]

# 입력을 학습 전용 데이터와 테스트 전용 데이터로 분류하기 -- (#1)
xand_df = pd.DataFrame(xand_input)
xand_data = xand_df[[0,1]]
xand_label = xand_df[2]

# 데이터 학습과 예측하기 -- (#2)
model = svm.SVC()
model.fit(xand_data, xand_label)
pre = model.predict(xand_data)


# 정답률 구하기 -- (#3)
ac_score = metrics.accuracy_score(xand_label, pre)
print("정답률", ac_score)


정답률 1.0
