### 讓我們看看 決策樹 模型能不能幫我們預測股價

### 加入模組

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split

### 設定常數

In [None]:
# 訓練樣本數比例
SPLIT_RATIO = 0.8

### 加入資料

In [None]:
spy_prices = pd.read_csv('../input/quantitative-trading/uantitative-trading/ut/put/put/quantitative-trading/quantitative-trading/quantitative-trading/t/t/t/quantitative-trading/SPY_2018.csv')

## 檢查資料完整性

In [None]:
spy_prices.isnull().sum()

### 拆分 訓練資料、測試資料

In [None]:
# 特徵 Features
x = spy_prices.loc[:, 'High':'Volume']
# 標籤 Label
y = spy_prices.loc[:, 'Open']

In [None]:
x_train, x_test, y_train, y_test = train_test_split(x, y, train_size=SPLIT_RATIO, random_state=5)

In [None]:
x_train.tail()

In [None]:
y_train.tail()

## 建立決策樹模型

### max_depth 為決策深度，可以防止過擬和

In [None]:
Model_5 = DecisionTreeRegressor(max_depth=5)
Model_7 = DecisionTreeRegressor(max_depth=7)

In [None]:
Model_5.fit(x_train, y_train)

Model_7.fit(x_train, y_train)

### 預測價格

In [None]:
y_predict_5 = Model_5.predict(x_test)

y_predict_7 = Model_7.predict(x_test)

### 使用 MSE 評估訓練結果

In [None]:
from sklearn.metrics import mean_squared_error

### 決策深度 5 的誤差

In [None]:
mean_squared_error(y_test, y_predict_5)

### 決策深度 7 的誤差

In [None]:
mean_squared_error(y_test, y_predict_7)

In [None]:
prediction_5 = Model_5.predict(x_test)
prediction_7 = Model_7.predict(x_test)

In [None]:
table = pd.DataFrame(y_test[:10])
table['模型決策深度 5'] = prediction_5[:10]
table['模型決策深度 7'] = prediction_7[:10]
table

## 結論

我們無法利用 決策樹 預測股價，因為我們的預測存在巨大的誤差，但其實我們只參考了當日的價格、交易量，還有很多市場因素我們沒有考慮到：

- 時間序列
- 市場走向
- 價格波動率
- 市場信心度

而且使用了單一決策模型，無法泛化到各種情況，可以試著用 隨機森林 模型來看看成果