Python 2.7.6
- ipython (2.1.0)
- chainer (1.5.0.2)
- matplotlib (1.3.1)
- numpy (1.10.1)
- pandas (0.16.2)
- scikit-learn (0.16.1)
- scipy (0.16.0)
EstimationMethod.pdfにおいて,図付きで紹介
- 用いた手法(アルゴリズム,その手法を用いた理由等)
- アルゴリズム : ディープラーニング
input[392] → MLP[50,50]→ 192 → VAE[20,20] → output[2]- MLP - 事前学習として,ラベルの実際の試合のデータに近づける
- VAE - 事前学習として,潜在変数を活用したAutoEncoder
- 理由 : ディープラーニングの勉強のため
- アルゴリズム : ディープラーニング
- 使用した変数(出力可能なアルゴリズムであれば変数重要度も)
- CBPファイル
- 出場・実出場時間・シュートCBP・パスCBP・クロスCBP・ドリブルCBP・攻撃CBP・守備CBPの8次元を利用
- スタメンのフォーメーションを 5 * 4 のグリッドに配置し,2 * 2 のsumプーリングを行うことで4 * 3 に変形
- aとbの作業を各試合毎に作成(各試合各チーム,96次元)
チーム平均
各シーズン,チーム毎に96次元の平均値を作成
同年の別試合
1stの試合を予想する場合は,2ndの試合.2ndの試合を予想する場合は,1stの同チーム同士の試合のデータ準備
- Scorerファイル
- 各試合のチーム毎に,シュート・PK・FK・オウンゴールの4次元をカウント(計8次元)
- 同年の別試合のデータを準備
以上の各試合計392次元のデータを利用
- CBPファイル
- 使用したデータ(全期間用いた,直近〇〇節のみ用いた等)
- 2015年2ndシーズンのラスト2節で行われたチーム同士が2015年1stシーズンで戦った試合を除く全試合(試合).
- データ拡張のために,cbpデータを右サイドと左サイド入れ替えたデータを作成しデータ数を2倍とした.(計試合)