# Pokemon コンペティション

### コンペ概要
ポケモンの能力値等を示すいくつかの変数からポケモンの対戦結果を予測するコンペです.
(期間: ~ 5/28 23:59)

### 配布データ
- train.csv: 訓練用のデータです. `pokemon.csv`のidに対応しています．
  - First_pokemon: ポケモンのid
  - Second_pokemon: ポケモンのid
  - Winner: 対戦で勝利したポケモンのid
- test.csv: このファイルのデータに対して勝利するポケモンを予測してもらいます.
- pokemon.csv: ポケモンの能力値のデータです． `#` カラムがidを表しています．

### 提出物

test.csvのデータに対して, `First_pokemon` が勝利する確率 `probability` を予測し, 以下のような形式のcsvファイル```submission.csv```を作成してiLect上で提出してください. ただし, 予測値は0以上1以下の値を出力してください.

```
id,probability
0,0.5
1,0.5
...

```

注意点
- 1行目はヘッダーです. 必ず```id,probability```と書いてください.
- 2行目以降は, test.csvのデータの順番と対応させる形でidと予測値を各行に1つずつ出力してください. (idは昇順に並んでいます)
- sample_submission.csvが提出形式のサンプルになので, こちらも参照してみてください.
- **提出前にフォーマットが合っているか必ず確認してください**

### 評価指標
LogLossで評価します.
データ数: N, 真の値: $y$, 予測値: $\hat{y}$ とすると, LogLossは

$$
LogLoss = -\frac{1}{N} \sum_{i=1}^{N}y_i \log(\hat{y_i}) + (1 - y_i) \log(1 - \hat{y_i})
$$

で定義されます.

### 賞金
```
1位: 15,000円
2位: 10,000円
3位: 5,000円
```


In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline

In [3]:
data = pd.read_csv('train.csv')
pokemon = pd.read_csv('pokemon.csv')

In [4]:
data.head()

Unnamed: 0,id,First_pokemon,Second_pokemon,Winner
0,0,88,85,85
1,1,466,408,466
2,2,715,120,715
3,3,467,377,467
4,4,416,206,206


In [5]:
pokemon.head()

Unnamed: 0,#,Name,Type 1,Type 2,HP,Attack,Defense,Sp. Atk,Sp. Def,Speed,Generation,Legendary
0,1,Bulbasaur,Grass,Poison,45,49,49,65,65,45,1,False
1,2,Ivysaur,Grass,Poison,60,62,63,80,80,60,1,False
2,3,Venusaur,Grass,Poison,80,82,83,100,100,80,1,False
3,4,Mega Venusaur,Grass,Poison,80,100,123,122,120,80,1,False
4,5,Charmander,Fire,,39,52,43,60,50,65,1,False


In [6]:
data.shape

(40000, 4)

In [7]:
wins = np.zeros(len(pokemon))
loses = np.zeros(len(pokemon))
for d in data.values:
    if d[1] == d[3]:
        loses[d[2]-1] += 1
    else:
        loses[d[1]-1] += 1
    wins[d[3]-1] += 1

In [8]:
win_rate = wins / (wins + loses)

  """Entry point for launching an IPython kernel.


In [9]:
win_rate

array([0.28440367, 0.41747573, 0.65789474, 0.54716981, 0.48913043,
       0.55789474, 0.86538462, 0.84070796, 0.85436893, 0.17021277,
       0.36734694,        nan, 0.56666667, 0.14583333, 0.11538462,
       0.62626263, 0.20731707, 0.13333333, 0.63207547, 0.97802198,
       0.35643564, 0.54639175, 0.87619048, 0.94949495, 0.5       ,
       0.72727273, 0.45454545, 0.81443299, 0.39      , 0.56074766,
       0.65714286, 0.87777778,        nan, 0.53333333, 0.17894737,
       0.39655172, 0.5483871 , 0.25225225, 0.42574257, 0.57522124,
       0.15384615, 0.42105263, 0.38834951, 0.81081081, 0.11428571,
              nan, 0.34513274, 0.75471698, 0.06542056, 0.22321429,
       0.34020619, 0.1       , 0.20325203, 0.20833333, 0.68103448,
       0.57142857, 0.82828283, 0.6446281 , 0.84946237, 0.3364486 ,
       0.69892473, 0.5       , 0.77906977, 0.43678161, 0.81521739,
              nan, 0.70873786, 0.47524752, 0.29032258, 0.62037037,
       0.75438596, 0.79347826, 0.13114754, 0.22916667, 0.40659

In [11]:
matches = wins + loses

In [22]:
0 in matches

True

In [25]:
matches[matches == 0]

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])