##### <img src="mioti.png" style="height: 100px">
<center style="color:#888">Módulo Data Science in IoT<br/>Asignatura Data preprocessing</center>

# Challenge S5: Liga de Fútbol Profesional

## Objetivos

El objetivo de este challenge es simular mediante el método de montecarlo el resultado de la próxima liga 2019-2020.

Para ello, utilizando las distribuciones de probabilidad, y todos los conceptos previos que hemos aprendido realizaremos una simulación lo más realista posible.

## Configuración del entorno

In [3]:
%matplotlib inline

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import math

## Carga de datos

Para este challenge dispones de varias fuentes de datos que puedes utilizar:

* `equipos_liga_2019-20.txt` Fichero TXT con los equipos que disputarán la temporada 2010 - 2020 en la primera división de Liga de Fútbol profesional en España.
* `clasificacion_historica.csv` Fichero con resultados acumulados de todos los equipos que han jugado alguna vez en primera division.
* Cualquier otra fuente de datos que quieras añadir o información tuya si sabes mucho de fútbol 😄.

El primer paso será la carga de datos a partir del fichero `TXT`. Como sólo contiene el nombre de los equipos meteremos los valores en una lista.

In [4]:
with open('equipos_liga_2019-20.txt', encoding='utf-8') as f:
    equipos = f.readlines()
    equipos = [x.strip() for x in equipos] 

equipos

['D. Alavés',
 'Athletic Club',
 'Atlético de Madrid',
 'FC Barcelona',
 'Real Betis',
 'RC Celta',
 'SD Eibar',
 'RCD Espanyol',
 'Getafe CF',
 'Granada CF',
 'CD Leganés',
 'Levante UD',
 'RCD Mallorca',
 'C.A. Osasuna',
 'Real Madrid',
 'Real Sociedad',
 'R. Valladolid CF',
 'Sevilla FC',
 'Valencia CF',
 'Villarreal CF']

## Simulador de partidos

El primer paso para realizar un análisis de montecarlo es definir la función que nos permita simular cada caso individual, en nuestro casos son los partidos. Puedes implementar esta función como quieras.

Tip: puedes usar `clasificacion_historica.csv` que contiene datos históricos de los distintos equipos, usar una fuente que busques por internet, o puedes hacer una función con tu "conocimiento futbolístico".

In [7]:
clashist=pd.read_csv("clasificacion_historica.csv",sep='\t')

Podemos ver los datos de clasificación histórica de los equipos que jugarán la liga la próxima temporada

In [8]:
clashist[clashist.Equipo.isin(equipos)]

Unnamed: 0,Pos,Equipo,Ptos,PJ,PG,PE,PP,GFavor,GContra,DifGoles
0,1º,Real Madrid,4529,2838,1690,567,581,6104,3230,2874
1,2º,FC Barcelona,4442,2838,1635,578,625,6089,3179,2910
2,3º,Atlético de Madrid,3597,2690,1286,618,786,4647,3360,1287
3,4º,Valencia CF,3520,2740,1224,639,877,4514,3542,972
4,5º,Athletic Club,3464,2838,1232,660,946,4713,3794,919
5,6º,Sevilla FC,2936,2484,1024,546,914,3791,3478,313
6,7º,RCD Espanyol,2894,2702,974,632,1096,3693,3976,-283
7,8º,Real Sociedad,2672,2378,891,595,892,3339,3335,4
9,10º,Real Betis,1995,1804,638,454,712,2266,2604,-338
10,11º,RC Celta,1879,1774,609,410,755,2390,2747,-357


Lo primero es simular un partido entre 2 equipos

In [2]:
def simular_partido(equipo_local, equipo_visitante):
    '''Simula un partido, devuelve una entero: 0 gana el equipo local, 1 empate, 2 gana el equipo visitante'''
    resultado = 1
    # AQUI TU CODIGO
    return resultado       

In [None]:
simular_partido('Real Madrid', 'Valencia CF')

## Simulador de temporadas

Una vez que tenemos una función que nos simula un partido, vamos a hacer una función que nos simule una temporada completa `simular_temporada`:

In [None]:
def simular_temporada():
    '''Simula una temporada completa, y devuelve un diccionario con el resultado en puntos obtenido por cada equipo'''
    
    # Creo una clasificación vacía (diccionario con puntos)
    clasificacion = {}
    for e in equipos:
        clasificacion[e] = 0 

    for equipo_local in equipos:
        for equipo_visitante in equipos:
            if equipo_local == equipo_visitante:
                pass
            resultado = simular_partido(equipo_local, equipo_visitante)
            
            if resultado == 0: 
                # Gana el equipo local
                clasificacion[equipo_local] += 3
            elif resultado == 1: 
                # Empate
                clasificacion[equipo_local] += 1
                clasificacion[equipo_visitante] += 1
            elif resultado == 2:
                # Gana el equipo visitante
                clasificacion[equipo_visitante] += 3
                
    return clasificacion

## Agregador de resultados
Por último necesitamos una función (`simular_lfp`) que nos genere los distintos casos de prueba a evaluar (temporadas) y por cada una de ella nos agrege los resultados

In [None]:
def simular_lfp(num_iteraciones):
    '''
    Realiza la simulación de montecarlo
    Devuelve un dataframe que tiene por columnas los distintos equipos y por cada fila la posición
    de cada equipo en la simulación.
    '''
    # Creo una clasificación global vacía
    clasificacion_global = pd.DataFrame(columns=equipos)

    num_intentos = 0
    for intento in range(0, num_iteraciones):
        if intento % 5 == 0:
            print("Simulando temporada " + str(intento) + "...")

        # Obtenemos los resultados de puntos de la temporada
        temporada_i = simular_temporada()     
        #print("Resultados: " + str(temporada_i))

        # Convertimos los puntos en clasificacion
        clasificacion = {}
        posicion = 1
        for equipo in sorted(temporada_i, key=temporada_i.get, reverse=True):
            clasificacion[equipo] = posicion
            posicion += 1

        #print("Clasificación: " + str(clasificacion))

        # Obtengo el equipo ganador
        clasificacion_global.loc[intento] = clasificacion

        num_intentos += 1

    #print(clasificacion_global)
    print("Fin de la simulación.")
    return clasificacion_global

## Ejecución del análisis

In [None]:
clasificacion_global = simular_lfp(110)

In [None]:
clasificacion_global.head()

## Análisis de resultados

Ahora, con los resultados obtenidos, vamos a plantearnos algunas preguntas:

### ¿Cuál es la posición media de cada equipo en la simulación?

### ¿Ha ganado R. Valladolid CF alguna vez la liga?

### ¿Cual es la distribución de los resultados del Madrid, Barcelona y del SD Eibar?

## Reflexiones

* ¿Qué información se te ocurre que puede ser interesante incorporar en esta simulación?
* ¿Puede el método de montecarlo ayudarnos a ganar una quiniela?