# Utilização de mineração de dados para propor métricas de avaliação de jogadores de DOTA2
#### Gabriel Franco
#### Orientadores: Marcos Ribeiro e Giovanni Comarela

## Sumário
- Contextualizando
- Evolução do trabalho
    - Seleção de atributos com GRASP  
        **1)** O que é GRASP  
        **2)** Modelagem: *Set Packing Problem*  
        **3)** Custo de Inserção da Solução  
        **4)** Penalização de Soluções Inviáveis  
        **5)** Algoritmos  
    - Coeficiente de correlação tau de Kendall
    - Definição das métricas
- Próximos passos
- Referências

## Contextualizando

- **DOTA2**: Jogo de MOBA (*Multiplayer Online Battle Arena*) onde o jogador controla um personagem em uma batalha entre dois times de cinco jogadores cada, cujo objetivo é derrotar a base principal inimiga

- **Objetivo:** Propor métricas para avaliar diferentes estilos e perfis de jogadores

## Evolução do trabalho

### Seleção de atributos com GRASP

#### O que é GRASP

- GRASP (*Greedy Randomized Adaptive Search Procedure*) é uma meta-heurística que consiste em criar uma solução inicial e após isso, efetuar uma busca local para melhorar a qualidade da solução

- De maneira geral, o algoritmo consiste de duas fases: **construção** e **busca local**.

- **Construção**: tenta-se construir uma solução viável com um método que é um pouco guloso e um pouco aleatório 

- **Busca local**: consiste em explorar vizinhos de uma solução até encontrar uma solução ótima local

- Essas duas fases são repetidas por um certo número de iterações

#### Modelagem: *Set Packing Problem*

- Consiste em maximizar a métrica de **silhueta** da clusterização dos dados, feita segundo um conjunto $c$ de atributos

- Deseja-se encontrar qual é o conjunto $c \subset S$ que maximize a silhueta, onde:
    - $S$ é o conjunto completo, com todos atributos da base
    - $tam\_min \leq tam(c) \leq tam\_max$, parâmetros informados pelo usuário

- Ainda, $c$ está sujeito a restrições que consistem em conjuntos de itens que não podem ocorrer simultaneamente na solução do problema

- Dois itens não poderão ocorrer simultaneamente em $c$ se sua métrica de correlação for superior a um limite $th$.

- Nos testes feitos, dois itens $el_{a}$ e $el_{b}$ não poderão ocorrer simultaneamente se $corr(el_{a}, el_{b}) \geq th = 0,75$

- As restrições produzidas serão conjuntos de pares de atributos que não podem estar presentes simultaneamente numa solução

- Além destas restrições há a restrição dos tamanhos máximo e mínimo de uma solução

- O procedimento de busca local do GRASP penaliza soluções inviáveis de acordo com o número de restrições de pares de conjuntos violadas

- Se a restrição de tamanhos máximo e mínimo for violada, aplica-se a penalidade como se a solução tivesse violado todos os pares de restrições, mais um (objetivo: evitar ao máximo estas soluções)

#### Custo de Inserção na Solução

- O custo $ C_{ins}(i)$ de inserção de um item $i$ em uma solução é dado por:  
$$C_{ins}(i) = \frac{10 \cdot var(i)}{1 + NR(i)}\nonumber$$  
onde:
    - $var(i)$ é a variância do item (atributo) $i$ na base de dados  
    - $NR(i)$ é o número de restrições em que $i$ está envolvido

#### Penalização de Soluções Inviáveis

- O custo de uma solução $c$ é composto pela métrica base da silhueta ($sil$) diminuída de um fator de penalidade ($pen$):
$$C_{sol}(c) = sil(\textit{k-means}(c)) - pen(c)\nonumber$$  
com:  
$$pen(c) = log(1 + NV(c))\nonumber$$  
- sendo $NV(c)$ o número de restrições violadas por $c$ (se limites de tamanho, todas $+1$)
- Quando $NV(c) = 0$, $pen(c) = 0$

#### Algoritmos

![title](data/algoritmo_1.PNG)

<div align="center"><b><h4>Figura 1 - GRASP para Seleção de Atributos (Set Packing Problem)</h4></b></div>

![title](data/algoritmo_2.PNG)

<div align="center"><b><h4>Figura 2 - GRASP: Procedimento Construtivo</h4></b></div>

![title](data/algoritmo_3.PNG)

<div align="center"><b><h4>Figura 3 - GRASP: Busca Local</h4></b></div>

![title](data/algoritmo_4.PNG)

<div align="center"><b><h4>Figura 4 - GRASP: Atualização da Elite</h4></b></div>

<style type="text/css">
.tg  {border-collapse:collapse;border-spacing:0;}
.tg td{font-family:Arial, sans-serif;font-size:14px;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg th{font-family:Arial, sans-serif;font-size:14px;font-weight:normal;padding:10px 5px;border-style:solid;border-width:1px;overflow:hidden;word-break:normal;border-color:black;}
.tg .tg-yw4l{vertical-align:top}
</style>
<table class="tg">
  <tr>
    <th class="tg-yw4l">Solution</th>
    <th class="tg-yw4l" colspan="9">Binary Representation</th>
    <th class="tg-yw4l">Solution Evaluation</th>
  </tr>
  <tr>
    <td class="tg-yw4l"></td>
    <td class="tg-yw4l">assists</td>
    <td class="tg-yw4l">deaths</td>
    <td class="tg-yw4l">denies</td>
    <td class="tg-yw4l">gpm</td>
    <td class="tg-yw4l">hd</td>
    <td class="tg-yw4l">hh</td>
    <td class="tg-yw4l">kills</td>
    <td class="tg-yw4l">lh</td>
    <td class="tg-yw4l">xpm</td>
    <td class="tg-yw4l">Fitness</td>
  </tr>
  <tr>
    <td class="tg-yw4l">deaths,gpm,hh</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.189951</td>
  </tr>
  <tr>
    <td class="tg-yw4l">deaths,hh,xpm</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0.187349</td>
  </tr>
  <tr>
    <td class="tg-yw4l">deaths,denies,hh,xpm</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0.170163</td>
  </tr>
  <tr>
    <td class="tg-yw4l">assists,deaths,gpm,hh</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.150208</td>
  </tr>
  <tr>
    <td class="tg-yw4l">deaths,denies,gpm,hh</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.149013</td>
  </tr>
  <tr>
    <td class="tg-yw4l">assists,deaths,denies,gpm,hh</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.145158</td>
  </tr>
  <tr>
    <td class="tg-yw4l">assists,deaths,hh,lh</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.130658</td>
  </tr>
  <tr>
    <td class="tg-yw4l">deaths,denies,hh,kills</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.119486</td>
  </tr>
  <tr>
    <td class="tg-yw4l">assists,deaths,hh,xpm</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0.119165</td>
  </tr>
  <tr>
    <td class="tg-yw4l">assists,deaths,denies,hh</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">1</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0</td>
    <td class="tg-yw4l">0.113329</td>
  </tr>
  <tr>
    <td class="tg-yw4l">Attribute Evaluation</td>
    <td class="tg-yw4l">44.661</td>
    <td class="tg-yw4l">100.000</td>
    <td class="tg-yw4l">47.281</td>
    <td class="tg-yw4l">43.021</td>
    <td class="tg-yw4l">0.000</td>
    <td class="tg-yw4l">100.000</td>
    <td class="tg-yw4l">8.104</td>
    <td class="tg-yw4l">8.861</td>
    <td class="tg-yw4l">32.328</td>
    <td class="tg-yw4l"></td>
  </tr>
</table>
<div align="center"><b><h4>Tabela 1 - Resultados retornados pelo GRASP</h4></b></div>

| Ranking |
|:-------:|
|  deaths |
|    hh   |
|  denies |
| assists |
|   gpm   |
|   xpm   |
|    lh   |
|  kills  |
|    hd   |
<div align="center"><b><h4>Tabela 2 - Ranking de avaliação dos atributos</h4></b></div>

### Coeficiente de correlação tau de Kendall

- Usada para medir a correlação de postos entre duas quantidades medidas

- Considere $(x_{1},y_{1}), (x_{2},y_{2}), ... ,(x_{n},y_{n})$ um conjunto de observações das variáveis aleatórias conjuntas $X $ e $Y$ respectivamente, tal que todos os valores de $(x_{i})$ e $(y_{i})$ sejam únicos. Qualquer par de observações $(x_{i},y_{i})$ e $(x_{j},y_{j})$, em que $i \neq j$, é concordante se as classificações de ambos os elementos concordarem uma com a outra, isto é, se $x_{i}>x_{j}$ e $y_{i}>y_{j}$ ou se $x_{i}<x_{j}$ e $y_{i}<y_{j}$. Elas são discordantes se $x_{i}>x_{j}$ e $y_{i}<y_{j}$ ou se $x_{i}<x_{j}$ e $y_{i}>y_{j}$. Se $x_{i}=x_{j}$ ou $y_{i}=y_{j}$, o par não é nem concordante, nem discordante.

- O coeficiente $\tau$ de Kendall é definido como:

$$\tau = \frac{(qnte\ de\ pares\ concordantes) - (qnte\ de\ pares\ discordantes)} {n(n - 1)\ /\ 2}$$

- O denominador é o número total de combinações de pares, então, o coeficiente deve estar no intervalo $-1\leq \tau \leq 1$

- Se a concordância entre as duas classificações for perfeita (isto é, se as duas classificações forem iguais), o coeficiente tem valor 1


- Se a discordância entre as duas classificações for perfeita (isto é, se uma classificação for o reverso da outra), o coeficiente tem valor -1.

- Se $X$ e $Y$ forem independentes, espera-se que o coeficiente seja próximo de zero.

| Conjunto A                   | Conjunto B           | Kendall Tau       |
|------------------------------|----------------------|-------------------|
| assists,deaths,denies,gpm,hh | assists,deaths,kills | 0.56 |
| assists,deaths,denies,gpm,hh | deaths,gpm,hh        | 0.67 |
| assists,deaths,denies,gpm,hh | deaths,hh,xpm        | 0.63 |
| assists,deaths,kills         | deaths,gpm,hh        | 0.35 |
| assists,deaths,kills         | deaths,hh,xpm        | 0.35 |
| deaths,gpm,hh                | deaths,hh,xpm        | 0.87 |

<div align="center"><b><h4>Tabela 3 - Kendall Tau dos conjuntos escolhidos pelo GRASP</h4></b></div>

## Definição das métricas

$$f_{kda} = \frac {assists + kills} {1 + deaths}$$

$$f_{adg} = \frac {assists + denies + gpm + hh} {1 + deaths}$$

$$f_{g} = \frac {gpm + hh} {1 + deaths}$$

$$f_{x} = \frac {xpm + hh} {1 + deaths}$$

## Próximos passos

- **Passo 1:** Avaliação da métrica
- **Passo 2:** Redigir artigo

| Passos / Mês | Maio | Junho | Julho |
|:------------:|:----:|:-----:|:-----:|
|       1      |   X  |       |       |
|       2      |      |   X   |   X   |
  
<div align="center"><b><h4>Tabela 4 - Cronograma</h4></b></div>

## Referências

- [Blog do Kunigami - GRASP]. Acesso em 13/05/2018
  
  
- [Clever Algorithms - GRASP]. Acesso em 13/05/2018


- [Wikipedia - Kendall rank correlation coefficient]. Acesso em 13/05/2018
  

- Site do projeto: https://gaabrielfranco.github.io/

[Blog do Kunigami - GRASP]: <https://kuniga.wordpress.com/2010/09/03/grasp/>
[Clever Algorithms - GRASP]:<http://www.cleveralgorithms.com/nature-inspired/stochastic/grasp.html>
[Wikipedia - Kendall rank correlation coefficient]:<https://en.wikipedia.org/wiki/Kendall_rank_correlation_coefficient>
