In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.svm import SVR
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error

np.set_printoptions(suppress=True) # 숫자 프린팅 옵션 설정

data = np.loadtxt("house_prices.txt",delimiter=",")

In [None]:
# 데이터셋을 X와 Y로 분리
X = data[:,:2]  # 모든 행, 첫 열(index 0인 열)부터 index 2인 열 직전까지
Y = data[:,-1] # 모든 행, 마지막 열 => Y = data[:,2] 이것과 동일

In [None]:
# 데이터를 학습 데이터와 테스트 데이터로 분리
# [option] test_size: 테스트 데이터 비중, random_state: (아무)숫자를 입력하여 랜덤으로 선택되는 데이터 고정
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size = 0.2, random_state = 4)

In [None]:
# SVR 모델 선언
model = SVR(kernel='rbf')

# 모델 학습
model.fit(X_train, Y_train)

In [None]:
# 테스트 데이터를 모델에 넣어 결과 예측
result = model.predict(X_test)

In [None]:
print(X_test)

In [None]:
result

In [None]:
# 실제 가격과 예측한 가격 비교
print(np.column_stack((X_test, Y_test, result)))


In [None]:
mae = mean_absolute_error(Y_test, result)
print(mae)

In [None]:
# 실제 가격과 예측한 가격 plot - X 데이터 중 집크기가 x축, 가격이 y축
real = plt.scatter(X_test[:,0], Y_test,  color='red')   # 실제 가격
predict = plt.scatter(X_test[:,0], result, color='blue')  # 예측한 가격
plt.legend((real, predict), ('real', 'prediction'))
plt.title('Real price vs. Predicted price')
plt.ylabel('Price')
plt.xlabel('House size')
plt.show()

In [None]:
# 학습된 선형 모델 plot
plt.plot([min(X_train[:,0]), max(X_train[:,0]) ], 
         [min(model.predict(X_train)), max(model.predict(X_train))])
# 예측한 결과 plot
plt.scatter(X_test[:,0], Y_test,  color='red')   # 실제 결과
plt.scatter(X_test[:,0], result, color='blue')  # 예측한 결과
plt.show()