# Финал Академии ИИ

## Доступные данные

Как и в задаче он-лайн этапа, будут доступны обучающая и тестовая выборки:
- `academy2019_final_train.csv`, `academy2019_final_test.csv`: признаки от организаторов
- `academy2019_final_train.jsonlines`, `academy2019_final_test.jsonlines`: расширенный набор данных в формате строчек с JSON объектами

Дополнительные поля, которые добавлены в JSONLines:

- `kills_log`, `deaths_log`: списки убийств и смертей героя во время игры, указано время и координаты события на карте
- `wards`: список установленных игроком "вардов" — специальных игровых предметов, которые дают обзор карты в некотором радиусе
- `gold_by_reason`: информация о том, по какой причине сколько золота было получено
- `actions`: действия мышкой за первые 10 минут игры, в колоночном формате со следующими полями:
  - `time`: время действия
  - `order_type`: тип действия
  - `camera_(x,y)`: положение камеры в момент действия
  - `cursor_(x,y)`: положение курсора на экране в момент действия
  - `pos_(x,y)`: координаты действия на игровой карте; в случае если действие не относится к карте — (0, 0)
- `pings`: "пинги" — сообщения, которые делал игрок союзникам о некоторой важной точке на карте, в колоночном формате

Данные он-лайн этапа доступны могут также быть полезны для решения задачи.

## Предсказание

Необходимо для каждого тестового примера оценить вероятность `P(skilled = 1)`. Для этого в моделях SciKit-Learn можно использовать методы `model.predict_proba()`. 

Для оценки качества предсказаний будет использоваться метрика ROC-AUC.

## Чтение таблиц с признаками

In [1]:
import pandas

df_train = pandas.read_csv('data/final/academy2019_final_train.csv', index_col='id')
df_test = pandas.read_csv('data/final/academy2019_final_test.csv', index_col='id')

In [2]:
df_train.head()

Unnamed: 0_level_0,skilled,player_team,winner_team,duration,pre_game_duration,first_blood_time,first_blood_claimed,hero_id,hero_pick_order,leaver_status,...,avg_deaths_x16,avg_assists_x16,avg_gpm_x16,avg_xpm_x16,best_kills_x16,best_assists_x16,best_gpm_x16,best_xpm_x16,win_streak,best_win_streak
id,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
0,0,radiant,radiant,1761,90,52,0,6,5,0,...,7,11,514,601,24,28,681,797,5,5
1,0,dire,dire,2609,90,108,0,7,4,0,...,9,14,412,515,23,40,624,796,1,5
2,1,radiant,radiant,1811,90,102,1,108,5,0,...,7,15,458,499,5,15,458,499,1,1
3,0,radiant,radiant,2668,90,0,0,9,6,0,...,4,18,372,483,14,27,462,650,5,5
7,1,dire,radiant,1716,90,52,0,31,2,0,...,11,15,290,387,16,37,513,744,0,5


## Пример обработки расширенного набора данных

In [3]:
import json

with open('data/final/academy2019_final_train.jsonlines') as fin:
    for line in fin:
        record = json.loads(line)
        
        record_id = record['id']
        df_actions = pandas.DataFrame(record['actions'])
        df_pings = pandas.DataFrame(record['pings'])
        
        # обработка записи
        
        break

In [4]:
df_actions.head()

Unnamed: 0,time,order_type,camera_x,camera_y,cursor_x,cursor_y,pos_x,pos_y
0,-192.85,16,130,122,306,211,0,0
1,-192.52,16,130,122,320,213,0,0
2,-192.25,16,130,122,334,211,0,0
3,-191.99,16,130,122,348,210,0,0
4,-189.79,16,130,122,321,211,0,0


## Облачные вычисления

Для решения задачи можно использовать ТОЛЬКО:
- рабочие персональные компьютеры
- [Google Colab](https://colab.research.google.com)

Данные в Colab доступны по адресам:
- данные финала `https://s3.eu-central-1.amazonaws.com/ai-academy-2019/public/final/{filename}`
- данные он-лайн этапа `https://s3.eu-central-1.amazonaws.com/ai-academy-2019/public/online/{filename}`

In [5]:
df = pandas.read_csv(
    'https://s3.eu-central-1.amazonaws.com/ai-academy-2019/public/final/academy2019_final_train.csv',
    index_col='id',
)

## Вопросы по задачам и обсуждение

Добавляйтесь в Discord чат [Party Parrot](https://discord.gg/APmbju), в канале `#ai_academy_final` можно обсуждать постановку задачи.

**Помните**, что решать задачу необходимо самостоятельно. Обсуждение решения во время соревнования не допускается.