<a href="https://colab.research.google.com/github/monda00/horse-race-notebook/blob/master/predict_show_neural_network.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# ニューラルネットワークで予測

学習データの作成から予測の考察までやってみる。

# 概要

- ライブラリ・データ読み込み
- データ整形
- 前処理
- 学習
- 予測
- 考察

## 参考

- [データ収集からディープラーニングまで全て行って競馬の予測をしてみた](https://qiita.com/kami634/items/55e49dad76396d808bf5#%E5%8F%96%E5%BE%97%E3%81%97%E3%81%9Furl%E3%82%92%E3%82%82%E3%81%A8%E3%81%ABhtml%E3%82%92%E5%BE%97%E3%82%8B)
- [競馬の予測をガチでやってみた](http://stockedge.hatenablog.com/entry/2016/01/03/103428)
- [ディープラーニングさえあれば、競馬で回収率100%を超えられる](https://qiita.com/yossymura/items/334a8f3ef85bff081913)
- [競馬予想AIを作る 〜ニューラルネットワークによる相対評価データセットの取り扱い例〜](https://cocon-corporation.com/cocontoco/horseraceprediction_ai/)

# ライブラリ・データ読み込み

In [2]:
import numpy as np
import pandas as pd

from sklearn.preprocessing import LabelEncoder
from sklearn.model_selection import train_test_split

In [5]:
DATA_PATH = '/content/drive/My Drive/data/horse-race/'

In [6]:
df = pd.read_csv(DATA_PATH + 'train_raw.csv')

In [7]:
df

Unnamed: 0,agari,age,frame_number,horse_number,horse_weight,jockey,name,popular,race_date,race_id,race_name,rank,time,weight,win,show,clockwise,distance,field_condition,field_type,place,race_round,start_time,weather
0,38.1,牡3,7.0,13,511(-5),森泰斗,ワイルドホース,2.0,2020/6/22,202044062212,タイタン賞競走,1,1:28.5,54.0,3.7,1,右,1400,不,ダ,大井,12R,20:50,雨
1,38.1,牝5,6.0,11,475(-2),山崎誠士,クインズオライリー,12.0,2020/6/22,202044062212,タイタン賞競走,2,1:28.7,54.0,81.4,1,右,1400,不,ダ,大井,12R,20:50,雨
2,38.6,セ6,3.0,4,469(+2),西啓太,メダーリアフレイム,4.0,2020/6/22,202044062212,タイタン賞競走,3,1:28.8,56.0,8.6,1,右,1400,不,ダ,大井,12R,20:50,雨
3,37.9,牡4,8.0,14,526(+6),藤本現暉,ゴールドプリンス,8.0,2020/6/22,202044062212,タイタン賞競走,4,1:28.8,56.0,34.4,0,右,1400,不,ダ,大井,12R,20:50,雨
4,38.5,牝5,4.0,7,475(+6),藤田凌,イグレット,9.0,2020/6/22,202044062212,タイタン賞競走,5,1:28.9,54.0,34.8,0,右,1400,不,ダ,大井,12R,20:50,雨
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
253631,40.9,牝7,1.0,1,448(0),小杉亮,スピカプレイス,7.0,2019/1/1,201945010102,C3七　八,6,1:34.1,54.0,22.1,0,左,1400,良,ダ,川崎,2R,11:50,晴
253632,40.3,牡4,7.0,7,481(-14),町田直希,ドルドルエイト,5.0,2019/1/1,201945010102,C3七　八,7,1:34.5,56.0,15.6,0,左,1400,良,ダ,川崎,2R,11:50,晴
253633,40.9,牡6,4.0,4,449(+7),櫻井光輔,ベルクール,6.0,2019/1/1,201945010102,C3七　八,8,1:34.6,55.0,22.0,0,左,1400,良,ダ,川崎,2R,11:50,晴
253634,41.3,牡6,6.0,6,445(-1),内田利雄,ケイエムキング,10.0,2019/1/1,201945010102,C3七　八,9,1:35.3,56.0,136.0,0,左,1400,良,ダ,川崎,2R,11:50,晴


# データ整形

以下のデータに整形する。

馬体重と差分はレース直前の木曜ぐらいにわかる。

|分類	|項目 |
|---|---|
|馬情報	|馬番 |
| |枠番 |
| |年齢 |
| |性別 |
| |体重（現在） | 
| |体重（前走との差分） |
| |負担重量 |
| 当日レース情報 |レース場 |
| |出走馬数 |
| |コース距離 |
| |コース種類 |
| |コースタイプ（ダ/芝/障） |
| |天気 |
| |馬場状態 |
|同馬の過去レース情報（×5走分）	|オッズ |
| |人気 |
| |順位 |
| |タイム（秒） |
| |着差 |
| |前走からの経過日数 |
| |コース距離 |
| |コース種類 |
| |コースタイプ（ダ/芝/障） |
| |天気 |
| |馬場状態 |