In [1]:
# 基本パッケージ（numpy,Pandas,matplotlib）
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# サポートベクターマシーン
from sklearn import svm
# train_test_split（データを分割出してくれる）
from sklearn.model_selection import train_test_split
# accuracy_score（正解率を測れる）
from sklearn.metrics import accuracy_score
# グリッドサーチ（ハイパーパラメータを自動的に最適化してくれる）
from sklearn.model_selection import GridSearchCV
# 正規化、標準化用
from sklearn.preprocessing import StandardScaler
from sklearn.preprocessing import MinMaxScaler
# 特徴量選択用
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import mutual_info_classif
from sklearn.feature_selection import SelectFromModel
from sklearn.ensemble import RandomForestRegressor
from sklearn.feature_selection import RFE
# 交差検証用
from sklearn.model_selection import cross_val_score
# 多項式特徴量生成用
from sklearn.preprocessing import PolynomialFeatures

In [2]:
# 表示関連
# DataFrameの列数設定
pd.set_option('display.max_columns', 500)

In [3]:
# 株価データの読み込み
stock_data = pd.read_csv("stock_Price_Prediction_v2.csv", encoding="shift-jis")

# 読み込みデータの表示
stock_data.head()

Unnamed: 0,始値,高値,安値,出来高,終値調整値,米ドル,英ポンド,ユーロ,カナダドル,スイスフラン,スウェーデンクローネ,デンマーククローネ,ノルウェークローネ,オーストラリアドル,ニュージーランドドル,南アフリカランド,バーレーンディナール,インドネシアルピア,中国人民元,香港ドル,インドルピー,フィリピンペソ,シンガポールドル,韓国ウォン,タイバーツ,クウェートディナール,サウジアラビアリアル,UAEディルハム,メキシコペソ,台湾ドル,month_1,month_2,month_3,month_4,month_5,month_6,month_7,month_8,month_9,month_10,month_11,month_12,day_1,day_2,day_3,day_4,day_5,day_6,day_7,day_8,day_9,day_10,day_11,day_12,day_13,day_14,day_15,day_16,day_17,day_18,day_19,day_20,day_21,day_22,day_23,day_24,day_25,day_26,day_27,day_28,day_29,day_30,day_31,weekday_0,weekday_1,weekday_2,weekday_3,weekday_4,answer,カナダドル_if,始値_bin_1,始値_bin_2,始値_bin_3,始値_bin_4,始値_bin_5,始値_bin_6,始値_bin_7,始値_bin_8,始値_bin_10,安値_bin_1,安値_bin_2,安値_bin_3,安値_bin_4,安値_bin_5,安値_bin_6,安値_bin_7,安値_bin_8,安値_bin_9,安値_bin_10,出来高_bin_1,出来高_bin_2,出来高_bin_3,出来高_bin_4,出来高_bin_5,出来高_bin_6,出来高_bin_7,出来高_bin_10,終値調整値_bin_1,終値調整値_bin_2,終値調整値_bin_3,終値調整値_bin_4,終値調整値_bin_5,終値調整値_bin_6,終値調整値_bin_7,終値調整値_bin_8,終値調整値_bin_10,米ドル_bin_1,米ドル_bin_2,米ドル_bin_3,米ドル_bin_4,米ドル_bin_5,米ドル_bin_6,米ドル_bin_7,米ドル_bin_8,米ドル_bin_9,米ドル_bin_10,英ポンド_bin_1,英ポンド_bin_3,英ポンド_bin_4,英ポンド_bin_5,英ポンド_bin_6,英ポンド_bin_7,英ポンド_bin_8,英ポンド_bin_10,ユーロ_bin_1,ユーロ_bin_2,ユーロ_bin_3,ユーロ_bin_4,ユーロ_bin_5,ユーロ_bin_6,ユーロ_bin_7,ユーロ_bin_8,ユーロ_bin_10,カナダドル_bin_1,カナダドル_bin_2,カナダドル_bin_3,カナダドル_bin_4,カナダドル_bin_5,カナダドル_bin_6,カナダドル_bin_7,カナダドル_bin_8,カナダドル_bin_9,カナダドル_bin_10,スイスフラン_bin_1,スイスフラン_bin_2,スイスフラン_bin_3,スイスフラン_bin_4,スイスフラン_bin_5,スイスフラン_bin_10,スウェーデンクローネ_bin_1,スウェーデンクローネ_bin_2,スウェーデンクローネ_bin_3,スウェーデンクローネ_bin_4,スウェーデンクローネ_bin_5,スウェーデンクローネ_bin_6,スウェーデンクローネ_bin_7,スウェーデンクローネ_bin_8,スウェーデンクローネ_bin_9,スウェーデンクローネ_bin_10,デンマーククローネ_bin_1,デンマーククローネ_bin_2,デンマーククローネ_bin_3,デンマーククローネ_bin_4,デンマーククローネ_bin_5,デンマーククローネ_bin_6,デンマーククローネ_bin_7,デンマーククローネ_bin_8,デンマーククローネ_bin_10,オーストラリアドル_bin_1,オーストラリアドル_bin_2,オーストラリアドル_bin_3,オーストラリアドル_bin_4,オーストラリアドル_bin_5,オーストラリアドル_bin_6,オーストラリアドル_bin_7,オーストラリアドル_bin_8,オーストラリアドル_bin_9,オーストラリアドル_bin_10,ニュージーランドドル_bin_1,ニュージーランドドル_bin_2,ニュージーランドドル_bin_3,ニュージーランドドル_bin_4,ニュージーランドドル_bin_5,ニュージーランドドル_bin_6,ニュージーランドドル_bin_7,ニュージーランドドル_bin_8,ニュージーランドドル_bin_9,ニュージーランドドル_bin_10,南アフリカランド_bin_1,南アフリカランド_bin_2,南アフリカランド_bin_3,南アフリカランド_bin_4,南アフリカランド_bin_5,南アフリカランド_bin_6,南アフリカランド_bin_7,南アフリカランド_bin_8,南アフリカランド_bin_10,バーレーンディナール_bin_1,バーレーンディナール_bin_2,バーレーンディナール_bin_3,バーレーンディナール_bin_4,バーレーンディナール_bin_5,バーレーンディナール_bin_6,バーレーンディナール_bin_7,バーレーンディナール_bin_8,バーレーンディナール_bin_9,バーレーンディナール_bin_10,インドルピー_bin_1,インドルピー_bin_2,インドルピー_bin_3,インドルピー_bin_4,インドルピー_bin_5,インドルピー_bin_6,インドルピー_bin_7,インドルピー_bin_8,インドルピー_bin_10,シンガポールドル_bin_1,シンガポールドル_bin_2,シンガポールドル_bin_3,シンガポールドル_bin_4,シンガポールドル_bin_5,シンガポールドル_bin_6,シンガポールドル_bin_7,シンガポールドル_bin_8,シンガポールドル_bin_10,韓国ウォン_bin_1,韓国ウォン_bin_2,韓国ウォン_bin_3,韓国ウォン_bin_4,韓国ウォン_bin_5,韓国ウォン_bin_6,韓国ウォン_bin_10,タイバーツ_bin_1,タイバーツ_bin_3,タイバーツ_bin_4,タイバーツ_bin_5,タイバーツ_bin_6,タイバーツ_bin_7,タイバーツ_bin_8,タイバーツ_bin_9,タイバーツ_bin_10,クウェートディナール_bin_1,クウェートディナール_bin_2,クウェートディナール_bin_3,クウェートディナール_bin_4,クウェートディナール_bin_5,クウェートディナール_bin_6,クウェートディナール_bin_7,クウェートディナール_bin_8,クウェートディナール_bin_9,クウェートディナール_bin_10,UAEディルハム_bin_1,UAEディルハム_bin_2,UAEディルハム_bin_3,UAEディルハム_bin_4,UAEディルハム_bin_5,UAEディルハム_bin_6,UAEディルハム_bin_7,UAEディルハム_bin_8,UAEディルハム_bin_9,UAEディルハム_bin_10,メキシコペソ_bin_1,メキシコペソ_bin_2,メキシコペソ_bin_3,メキシコペソ_bin_4,メキシコペソ_bin_5,メキシコペソ_bin_6,メキシコペソ_bin_7,メキシコペソ_bin_10
0,-0.00625,0.024889,-0.003604,2.643314,0.0187,0.0,-0.002711,-0.001877,0.003238,-0.001622,-0.003846,-0.001268,-0.000656,0.00169,-0.000849,0.009338,0.0,-0.007246,0.0,0.0,0.003663,0.0,-0.000831,-0.008893,-0.006536,0.003609,0.0,0.0,-0.002027,0.0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,1.0,0.016191,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0
1,0.026954,0.004337,0.028933,0.208818,0.000874,-0.000751,-0.00068,0.001624,0.000837,0.002,-0.001544,0.00127,0.006566,-0.004639,-0.004931,0.010934,-0.000735,0.0,-0.000622,-0.001171,-0.00365,-0.003817,0.001941,-0.000997,0.003289,-0.003367,-0.000844,-0.000827,-0.001354,0.0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0.0,0.004184,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0
2,0.0,-0.011226,-0.002636,-0.317789,-0.003493,-0.006011,-0.007273,-0.007085,-0.009078,-0.008855,-0.00464,-0.007609,-0.007175,-0.006779,-0.002734,-0.015807,-0.006025,0.0,-0.006219,-0.005862,-0.007326,-0.003831,-0.005674,0.000998,-0.003279,-0.006665,-0.005915,-0.005795,-0.006102,-0.005236,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,1.0,-0.036312,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0
3,-0.004374,0.001747,-0.003524,-0.435145,-0.002629,-0.005669,-0.006324,-0.005416,-0.001929,-0.005914,-0.003885,-0.005112,-0.005913,-0.008105,-0.015936,0.007608,-0.005663,0.007299,-0.005632,-0.005307,-0.00369,-0.007692,-0.001253,-0.012961,-0.003289,-0.005992,-0.005667,-0.006106,-0.002729,-0.007895,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0.0,-0.007715,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0
4,0.0,-0.004359,-0.012378,1.40135,-0.017575,0.0,-0.00122,-0.005532,-0.004227,-0.006835,-0.01014,-0.00578,-0.003305,-0.003727,-0.003831,-0.010906,0.0,0.007246,0.0,0.0,0.0,0.0,-0.001254,0.00101,-0.0033,0.003608,0.0,0.000559,-0.002052,0.002653,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,1.0,-0.016908,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0,0,0,1,0,0,0,0


In [4]:
# DataFrameをNumPy配列へ変換
# 正解ラベルの変換
answers = stock_data.answer.values
# 説明変数の変換
stock_data.drop(columns=['answer'], inplace=True)
explanatory_variable = stock_data.values

In [5]:
# データの正規化        
ms = MinMaxScaler()
ms.fit(explanatory_variable)
explanatory_variable = ms.transform(explanatory_variable)

In [6]:
# 多項式特徴量を追加
poly = PolynomialFeatures(degree=2, include_bias=False)
poly.fit(explanatory_variable)
explanatory_variable_poly = poly.transform(explanatory_variable)

In [7]:
# データの分割（データの80%を訓練用に、20％をテスト用に分割する）
X_train, X_test, y_train, y_test = train_test_split(explanatory_variable_poly, answers, test_size=0.2, random_state=1,shuffle = False)

In [None]:
# グリッドサーチするパラメータを設定
parameters = [{'C': [0.01,0.1,1, 10, 100, 1000], 'kernel': ['rbf'], 'gamma': [0.001, 0.0001]}]
 
# グリッドサーチを実行
clf = GridSearchCV(svm.SVC(), parameters)
clf.fit(X_train, y_train) 
 
# グリッドサーチ結果(最適パラメータ)を取得
print ("最適パラメータ：{}".format(clf.best_params_))

In [None]:
# 最適パラメーターを指定して学習
clf = svm.LinearSVC(loss=GS_loss, C=GS_C, random_state=1)
clf.fit(X_train , y_train)

In [None]:
# 学習後のモデルによるテスト
# トレーニングデータを用いた予測
y_train_pred = clf.predict(X_train)
# テストデータを用いた予測
y_val_pred = clf.predict(X_test)

In [None]:
# 正解率の計算
train_score = accuracy_score(y_train, y_train_pred)
test_score = accuracy_score(y_test, y_val_pred)
# 正解率を表示
print("トレーニングデータに対する正解率：" + str(train_score * 100) + "%")
print("テストデータに対する正解率：" + str(test_score * 100) + "%")

In [None]:
scores = cross_val_score(clf, explanatory_variable_poly, answers)
# 各分割におけるスコア
print('Cross-Validation scores: {}'.format(scores))
# スコアの平均値
print('Average score: {}'.format(np.mean(scores)))