In [23]:
import openml
import pandas as pd

### CONTEXTO DEL PROYECTO

League of Legends (también conocido como LoL) es un videojuego multijugador en línea de estrategia en tiempo real y de género MOBA (Multiplayer Online Battle Arena), en el cual dos equipos de cinco jugadores compiten para destruir la base del equipo contrario en un mapa simétrico. Cada jugador controla a un personaje, llamado campeón, que tiene habilidades únicas y distintas para luchar contra los enemigos y para ayudar a su equipo a ganar la partida. Los jugadores ganan experiencia y oro al derrotar a los enemigos y a los monstruos del mapa, lo que les permite mejorar sus habilidades y comprar objetos para fortalecer a sus campeones. 

League of Legends es uno de los videojuegos más populares y competitivos del mundo, con millones de jugadores en todo el mundo, por lo que hemos creído interesante estudiar datos de los **15 primeros minutos** de 48651 partidas del rango Diamante (uno de los rangos usados para clasificar a los jugadores según su nivel) para intentar predecir el desenlace de estas partidas y analizar que factores tienen más importancia a la hora de ganar una partida.

Los datos han sido extraídos de OPENML (https://www.openml.org/search?type=data&status=active&id=43635), pero han sido distribuídos originalmente por Riot Games (empresa creadora de League of Legends).

### LECTURA DEL DATASET

In [24]:
# Load the data
dataset = openml.datasets.get_dataset(43635)

In [25]:
# Get the data (X) and the target (y) as a pandas dataframe. The categorical_indicator is a list of booleans indicating which features are categorical. The attribute names are the names of the features.
X, y, categorical_indicator, attribute_names = dataset.get_data(dataset_format='dataframe', target=dataset.default_target_attribute)

### LIMPIADO DEL DATASET

Antes de empezar a trabajar con el dataset, vamos a eliminar dos variables que no tienen repercusión alguna en el desenlace de una partida:

- *Unnamed:_0* : esta variable actua como numeración del dataset por lo que es irrelevante.

- *matchId* : esta variable actua como identificador de cada partida, algo que no tiene influencia sobre la propia partida.

In [26]:
del X['Unnamed:_0']
del X['matchId']

In [27]:
X.head(10)

Unnamed: 0,blue_win,blueGold,blueMinionsKilled,blueJungleMinionsKilled,blueAvgLevel,redGold,redMinionsKilled,redJungleMinionsKilled,redAvgLevel,blueChampKills,blueHeraldKills,blueDragonKills,blueTowersDestroyed,redChampKills,redHeraldKills,redDragonKills,redTowersDestroyed
0,0,24575.0,349.0,89,8.6,25856.0,346.0,80,9.2,6,1,0,1,12,2,0,1
1,0,27210.0,290.0,36,9.0,28765.0,294.0,92,9.4,20,0,0,0,19,2,0,0
2,1,32048.0,346.0,92,9.4,25305.0,293.0,84,9.4,17,3,0,0,11,0,0,4
3,0,20261.0,223.0,60,8.2,30429.0,356.0,107,9.4,7,0,0,3,16,3,0,0
4,1,30217.0,376.0,110,9.8,23889.0,334.0,60,8.8,16,3,0,0,8,0,0,2
5,1,25470.0,362.0,82,9.2,22856.0,319.0,86,8.8,9,1,0,0,7,1,0,0
6,1,25391.0,350.0,96,9.2,23236.0,345.0,80,8.6,8,2,0,0,5,1,0,1
7,0,28946.0,367.0,65,9.2,26528.0,311.0,63,8.8,15,2,0,1,14,1,0,1
8,1,26928.0,379.0,80,9.6,23065.0,362.0,95,9.2,11,1,0,0,5,2,0,1
9,1,26079.0,302.0,106,9.0,27275.0,347.0,91,9.4,9,1,0,1,10,2,0,1


### EXPLICACIÓN DE LAS VARIABLES

Para los usuarios que no hayan jugado jamás al videojuego daremos una breve explicación de cada variable: 

- *blue_win* : esta variable indica si el equipo azul se ha alzado vencedor de la partida, es la variable que se quiere predecir (1 para victoria azul, 0 para victoria roja).

- *blue_gold* : indica el oro recolectado a lo largo de los 15 primeros minutos de la partida por parte del equipo azul.

- *blueMinionsKilled* : indica el número de súbditos eliminados por parte del equipo azul durante los 15 primeros minutos de partida.

- *blueJungleMinionsKilled* : indica el número de monstruos de la jungla eliminados por parte del equipo azul durante los 15 primeros minutos de partida.

- *blueAvgLevel* : indica la media de nivel del equipo azul al final de los 15 minutos de partida. Cada equipo consta de 5 jugadores y se obtiene la media de estos.

- *blueChampKills* : indica la cantidad de eliminaciones del equipo azul conseguidas en los 15 primeros minutos, es decir, la cantidad de *kills* del equipo azul. Una *kill* consiste en eliminar a un jugador del equipo enemigo (este jugador reaparece tras un periodo de tiempo, por lo que no hay uj¡n límite de eliminaciones).

- *blueHeraldKills* : "REVISAR"

- *blueDragonKills* : variable categórica que indica el número de dragones eliminados por el equipo azul en los 15 primeros minutos (en este tiempo se puede matar como mucho 1 dragón).

También están estas mismas variables para el equipo rojo.
