# Fundamentos de la Programación (Grado en Ingeniería de la Salud)
## Ejercicio "La Liga" (9 de diciembre de 2020)

Antes de empezar, ejecutaremos la siguiente celda con las importaciones necesarias para poder realizar el ejercicio:

In [1]:
import csv
from datetime import datetime
from matplotlib import pyplot as plt
from collections import namedtuple

## 1. Carga de datos (0.5 puntos)

Tomaremos la información de un fichero de entrada llamado <code>la_liga.csv</code> en el que se encuentran registrados datos de partidos de fútbol de la liga española desde 2014 hasta 2020. El fichero se encuentra en la carpeta <code>./data/</code>. Cada línea del fichero de entrada contiene las siguientes informaciones:

- **Date:** fecha en la que se jugó el partido. 
- **Season:** temporada a la que pertenece el partido.
- **Home_Team:** equipo local.
- **Away_Team:** equipo visitante.
- **Home_Goals:** goles del equipo local.
- **Away_Goals:** goles del equipo visitante.

He aquí un fragmento con las primeras líneas del fichero de entrada: 

<img src="./img/datos.png" alt="Drawing" style="width:12cm;"/>

Como se puede observar, los registros no están ordenados por fecha. Necesitaremos ordenarlos por ese campo para las consultas que realizaremos.

La primera función que implementaremos será <code>lee_partidos</code>. Será la encargada de leer los datos del fichero de entrada, y devolver una lista de tuplas con dichos datos **ordenada por fecha**.

In [None]:
Partido = namedtuple('Partido', 'fecha temporada local visitante goles_local goles_visitante')

def lee_partidos(fichero):
    ''' Lee el fichero de entrada y devuelve una lista de registros ordenados por fecha.

    ENTRADA:
       - fichero: nombre del fichero de entrada
    SALIDA:
       - lista de partidos -> [Partido(datetime, str, str, str, int, int)]
       
    Se llevarán a cabo las conversiones necesarias. Las fechas deben convertirse a objetos 'datetime' 
    con la siguiente instrucción:
                datetime.strptime(fecha, '%Y-%m-%d')
                
    La lista de partidos resultantes debe estar ordenada por fechas.
    '''
    registros = []
    with open(fichero, 'r', encoding='utf-8') as f:
        lector = csv.reader(f)
        next(lector)
        registros = [Partido(datetime.strptime(fecha, '%Y-%m-%d'), temporada, local, visitante, int(goles_local), int(goles_visitante))
                    for fecha, temporada, local, visitante, goles_local, goles_visitante in lector]
    return sorted(registros)

In [None]:
# TEST de 'lee_partidos', la salida esperada es:
#   2281 
#[Partido(fecha=datetime.datetime(2014, 8, 23, 0, 0), temporada='2014/2015', local='Almería', visitante='Espanyol', goles_local=1, goles_visitante=1), 
# Partido(fecha=datetime.datetime(2014, 8, 23, 0, 0), temporada='2014/2015', local='Granada', visitante='Deportivo La Coruña', goles_local=2, goles_visitante=1), 
# Partido(fecha=datetime.datetime(2014, 8, 23, 0, 0), temporada='2014/2015', local='Málaga', visitante='Athletic Club', goles_local=1, goles_visitante=0), 
# Partido(fecha=datetime.datetime(2014, 8, 23, 0, 0), temporada='2014/2015', local='Sevilla', visitante='Valencia', goles_local=1, goles_visitante=1),
# Partido(fecha=datetime.datetime(2014, 8, 24, 0, 0), temporada='2014/2015', local='Barcelona', visitante='Elche', goles_local=3, goles_visitante=0)]
PARTIDOS = lee_partidos('./data/la_liga.csv')
print(len(PARTIDOS))
print(PARTIDOS[:5])

## 2. Consulta y filtrado (7.5 puntos)

Una vez que hemos cargado los datos en una estructura en memoria ya podemos empezar a procesarlos. En esta sección implementaremos algunas funciones de consulta y filtrado que nos permitirán trabajar con ellos.

La primera función se llama <code>calcula_equipos</code> y obtiene la lista de equipos, ordenada alfabéticamente, que han jugado algún partido como local o como visitantes.

In [None]:
def calcula_equipos(partidos):
    ''' Equipos que han jugado al menos un partido como local o como visitante.
    
    ENTRADA:
       - partidos: lista de partidos -> [Partido(datetime, str, str, str, int, int)]
    SALIDA:
       - Lista de equipos ordenanda alfabéticamente -> [str]
    '''
    pass

In [None]:
# TEST de 'calcula_equipos', la salida esperada es:
#   105
#   ['Almería', 'Athletic Club', 'Atlético Madrid', 'Barcelona', 'Celta de Vigo']
print(len(calcula_equipos(PARTIDOS)))
print(calcula_equipos(PARTIDOS)[:5])

La siguiente función es <code>calcula_puntos_partido</code>. La función toma un único partido y devuelve un diccionario con los puntos que ha obtenido cada uno de los dos equipos en ese partido (0, 1 ó 3).

In [None]:
def calcula_puntos_partido(partido):
    ''' Puntos que ha obtenido cada equipo tras el resultado del partido.
    
    ENTRADA:
       - partido: tupla con los datos del partido ->  Partido(datetime, str, str, str, int, int)
    SALIDA:
       - Diccionario con los puntos obtenidos por cada equipo -> {str:int}
       
    Los puntos otorgados por cada resultado son:
        - Victoria: 3 puntos
        - Empate: 1 punto
        - Derrota: 0 puntos
    '''
    pass

In [None]:
# TEST de 'calcula_puntos_partido', la salida esperada es:
#  Almería-Espanyol: 1-1
#  {'Almería': 1, 'Espanyol': 1} 
#
#  Granada-Deportivo La Coruña: 2-1
#  {'Granada': 3, 'Deportivo La Coruña': 0} 
#
#  Málaga-Athletic Club: 1-0
#  {'Málaga': 3, 'Athletic Club': 0} 
#
#  Sevilla-Valencia: 1-1
#  {'Sevilla': 1, 'Valencia': 1} 

for i in range(4):
    p= PARTIDOS[i]
    puntos = calcula_puntos_partido(p)
    print('{}-{}: {}-{}'.format(p.local, p.visitante, p.goles_local, p.goles_visitante))
    print(puntos, '\n')

La siguiente función que implementarremos es <code>calcula_puntos_equipo</code>, que calcula el total de puntos que ha obtenido un equipo en una lista de partidos.

In [None]:
def calcula_puntos_equipo(partidos, equipo):
    ''' Puntos acumulados por un equipo en una lista de partidos
    
    ENTRADA:
       - partidos: lista de partidos -> [Partido(datetime, str, str, str, int, int)]
       - equipo: nombre del equipo del que se quieren calcular los puntos -> str
    SALIDA:
       - suma de los puntos obtenidos ->  int
    '''
    pass

In [None]:
# TEST de 'calcula_puntos_equipo', la salida esperada es:
#   Real Betis: 235
#   Sevilla: 387
#   Barcelona: 537
#   Real Madrid: 506
for equipo in ['Real Betis', 'Sevilla', 'Barcelona', 'Real Madrid']:
    puntos = calcula_puntos_equipo(PARTIDOS, equipo)
    print('{}: {}'.format(equipo, puntos))

La siguiente función es <code>calcula_secuencia_puntos_equipo</code>, que obtiene la secuencia de puntos obtenidos por un equipo entre dos fechas, ambas incluidas.

In [None]:
def calcula_secuencia_puntos_equipo(partidos, equipo, fecha_inicio, fecha_fin):
    ''' Secuencia de puntos obtenidos por un equipo entre dos fechas, ambas incluidas.
    
    ENTRADA:
       - partidos: lista de partidos -> [Partido(datetime, str, str, str, int, int)]
       - equipo: nombre del equipo del que se quiere calcular la secuencia de puntos -> str
       - fecha_inicio: fecha incial del rango de fechas de los partidos a considerar
       - fecha_fin: fecha final del rango de fechas de los partidos a considerar
    SALIDA:
       - secuencia de puntos obtenidos ->  [int]
       
    NOTA:
       - Puede ayudar filtrar primero los partidos para quedarnos solo con los del equipo.
    '''
    pass

In [None]:
# TEST de 'calcula_secuencia_puntos_equipo', la salida esperada es:
#   Real Betis: [0, 1, 0, 3, 0, 0, 1, 3, 0, 0, 0]
#   Sevilla: [3, 1, 1, 1, 1, 3, 3, 3, 3, 1, 3]
#   Barcelona: [3, 3, 1, 3, 1, 1, 3, 3, 3, 0, 3]
#   Real Madrid: [3, 3, 3, 3, 3, 3, 3, 3, 3, 3, 1]
for equipo in ['Real Betis', 'Sevilla', 'Barcelona', 'Real Madrid']:
    inicio = datetime.strptime('2020-06-01', '%Y-%m-%d')
    fin = datetime.strptime('2020-08-01', '%Y-%m-%d')
    puntos = calcula_secuencia_puntos_equipo(PARTIDOS, equipo, inicio, fin)
    print('{}: {}'.format(equipo, puntos))

La siguiente función es <code>goles_por_temporada</code>, y calcula un diccionario con el número de goles totales marcados en cada temporada.

In [None]:
def calcula_goles_por_temporada(partidos):
    ''' Cálculo del número de goles por temporada
    
    ENTRADA:
       - partidos: lista de partidos -> [Partido(datetime, str, str, str, int, int)]
    SALIDA:
       - diccionario con el número de goles por temporada ->  {str:int}
    '''
    pass

In [None]:
# TEST de 'calcula_goles_por_temporada', la salida esperada es:
#  {'2019/2020': 942,
#   '2018/2019': 983,
#   '2016/2017': 1118,
#   '2017/2018': 1024,
#   '2015/2016': 1043,
#   '2014/2015': 1009}
calcula_goles_por_temporada(PARTIDOS)

## 3. Visualización (2 puntos)

La función de visualización que implementaremos será <code>muestra_goles_por_equipo</code>. Toma como entrada una lista de partidos, y muestra un diagrama de barras con el número de goles marcados por los equipos más goleadores.

In [None]:
def muestra_goles_por_equipo(partidos, top=10):
    ''' Genera un diagrama de barras con el número de goles marcados por los equipos más goleadores.
    
    ENTRADA:
        - partidos: lista de partidos -> [Partido(datetime, str, str, str, int, int)]
        - top: número máximo de equipos a mostrar (por defecto, 10) -> int
    SALIDA EN PANTALLA:
        - Diagrama de barras con los equipos en el eje 'y', y los goles en el eje 'x'
           
    Se usarán las siguientes instrucciones matplotlib para generar la gráfica:
        plt.barh(equipos, goles)
        plt.show()
            
    Donde las dos variables usadas significan lo siguiente:
        - equipos: lista (de longitud 'top') de los equipos más goleadores, ordenada de mayor a menor número de goles
        - goles: lista (alineada con la anterior) con el número de goles de cada equipo
        
    NOTA:
       - Puede ayudar calcular previamente el diccionario 'goles_por_equipo', con el número de goles marcados por cada equipo.
    '''
    pass

In [None]:
# TEST de 'muestra_goles_por_equipo'
muestra_goles_por_equipo(PARTIDOS)

La salida de la celda de test anterior debería ser la siguiente:


<img src="./img/goles_por_equipo.png" alt="Drawing" style="width:10cm;"/> 