## 株価データの正規化について


正規化とは 

>データ等々を一定のルール（規則）に基づいて変形し、利用しやすくすること。別の言い方をするならば、正規形でないものを正規形（比較・演算などの操作のために望ましい性質を持った一定の形）に変形することをいう。


株価データを機械が学習する場合 生の株価データではうまく予測できないことが多いそうです

ここで、学習する株価を正規化して扱うことがあるそうなので、今回は正規化の話

In [1]:
# 株価を扱うためのライブラリのインポート
import sqlite3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import mpl_finance as mpf
import matplotlib.dates as mdates

ModuleNotFoundError: No module named 'mpl_finance'

In [None]:
# 機械学習のためのライブラリのインポート
from sklearn.preprocessing import MinMaxScaler
from sklearn.metrics import mean_absolute_error
import tensorflow as tf

株価データを読み込む

In [2]:
# データベース接続とカーソル生成
connection = sqlite3.connect("prices.sqlite")
df = pd.read_sql("SELECT * FROM t{}".format(2432), connection)#, index_col='Date', parse_dates=True)
print(df)

DatabaseError: Execution failed on sql 'SELECT * FROM t2432': no such table: t2432

データの前処理と正規化

ニューラルネットワークへ学習させるためにデータの前処理を行いましょう。

正規化するために時間に関する行がジャマなので削除します。

In [3]:
## time（時間）を削除
del df['Date']
del df['id']
 
# データセットのサイズを確認
df.head()

NameError: name 'df' is not defined

次に「正規化」を行います。今回はScikit-learnに組み込まれているMinMaxScaler()を使います。

In [4]:
scaler = MinMaxScaler(feature_range=(-1, 1))
scaler.fit(df)
df_norm = scaler.transform(df)

print(df_norm)

NameError: name 'MinMaxScaler' is not defined

データは正規化されていますので、予測される値も正規化されます。実際にトレードの指標として使うには、元のレートのデータへ戻す必要があります。

元のレートのデータへ戻すには、Scikit-learnのscaler.inverse_transform()を使うことで、正規化した値から元のレートへ戻せます。

In [5]:
# 正規化から通常の値へ戻す
test_inv = scaler.inverse_transform(df_norm)

NameError: name 'scaler' is not defined

確認

In [6]:
# 正規化の前のテストデータ
print(df.values[0])

NameError: name 'df' is not defined

In [7]:
# 正規化後のテストデータ
print(df_norm[0])

NameError: name 'df_norm' is not defined

In [8]:
# 正規化から戻したデータ
print(test_inv[0])

NameError: name 'test_inv' is not defined