# Ranking ELO Pre-temporada

Descarga los puntajes ELO de los equipos de un país al final del mes en que terminó la temporada anterior.

EJ: Si la temporada 2018/2019 de una liga termina el 2019-06-27, descarga los puntajes al 2019-06-30. 

## Pruebas

In [1]:
import numpy as np
import pandas as pd
import os

In [2]:
def ObtenerFechasTorneosAnteriores(df, fin_mes = True):
    Torneos = df['Torneo'].drop_duplicates().tolist()
    last_dates = []
    for i in range(len(Torneos[1:])):
        torneo = Torneos[i]
        last_dates.append(df[df['Torneo'] == torneo]['Date'].max())
    df_torneos = pd.DataFrame(data = {'Fecha' : last_dates, 'Torneo': Torneos[1:]})
    if fin_mes:
        df_torneos['Fin anterior'] = pd.to_datetime(df_torneos['Fecha'])
        df_torneos['Fecha'] = df_torneos['Fin anterior'] + pd.offsets.MonthEnd(0)
        df_torneos['Fecha'] = df_torneos['Fecha'].astype(str)
        df_torneos = df_torneos[['Fecha','Torneo']]
    return df_torneos.values.tolist()

In [3]:
def ObtenerRankingELO(fecha, torneo, country = 'ENG'):
    df_elo = pd.read_csv('http://api.clubelo.com/%s' % fecha, usecols = ['Club','Country','Elo'])
    df_elo = df_elo[df_elo['Country'] == country].reset_index(drop=True)
    df_elo['Date'] = fecha
    return df_elo[['Date','Club', 'Elo']]

In [46]:
def ObtenerRankingELOLigaTemporadas(df, country = 'ENG'):
    prereplaces_country = {'ENG' : {'Man ': 'Manchester ',
                                    'QPR': 'Queens Park Rangers',
                                    'Middlesboro': 'Middlesbrough',
                                    'Wolves': 'Wolverhampton Wanderers',
                                    'Sheffield Weds': 'Sheffield Wednesday'},
                           'GER': {'Nuernberg' : 'Nürnberg',
                                   'Gladbach' : 'Mönchengladbach',
                                   'Muenchen 60' : 'TSV 1860 München' ,
                                   'Lautern' : 'Kaiserslautern',
                                   'Koeln' : 'Köln',
                                   'St Pauli' : 'St. Pauli',
                                   'Fuerth' : 'Fürth',
                                   'Duesseldorf' : 'Düsseldorf'},
                           'ESP' : {'Barcelona' : 'FC Barcelona',
                                    'Espanyol' : 'Espanyol Barcelona',
                                    'Atletico' : 'Atlético',
                                    'Alaves' : 'Alavés',
                                    'Cadiz' : 'Cádiz',
                                    'Tarragona' : 'Gimnàstic',
                                    'Malaga' : 'Málaga',
                                    'Almeria' : 'UD Almería',
                                    'Gijon' : 'Sporting Gijón',
                                    'Hercules' : 'Hércules CF',
                                    'Cordoba' : 'Córdoba CF',
                                    'Leganes' : 'CD Leganés'},
                           'FRA' : {'Paris SG' : 'Paris Saint-Germain',
                                    'Saint-Etienne' : 'AS Saint-Étienne',
                                    'Evian TG' : 'Évian Thonon Gaillard',
                                    'Ajaccio' : 'AC Ajaccio',
                                    'Gazelec' : 'GFC Ajaccio'},
                           'ITA' : {'Roma' : 'AS Roma',
                                    'Lazio' : 'Lazio Roma',
                                    'Verona' : 'Hellas Verona',
                                    'Chievo' : 'Chievo Verona',
                                    'Spal' : 'SPAL 2013 Ferrara'}}
    dfs_elo = []
    fechas_torneos = ObtenerFechasTorneosAnteriores(df, fin_mes = True)
    torneos = []
    for i in range(len(fechas_torneos)):
        fecha, torneo = fechas_torneos[i][0], fechas_torneos[i][1]
        torneos.append(torneo)
        print('Obteniendo puntaje para %s' % torneo, end = '\t\r')
        df_elo = ObtenerRankingELO(fecha, torneo, country = country)
        df_elo['Torneo'] = torneo
        dfs_elo.append(df_elo)
    df_elo = pd.concat(dfs_elo, ignore_index = True)
    df_elo = df_elo[['Torneo','Club','Elo']]
    try:
        prereplaces = prereplaces_country[country]
        df_elo = df_elo.replace(prereplaces, regex = True)
    except:
        pass
    equipos_elo = df_elo['Club'].drop_duplicates().tolist()
    equipos_cal = df[df['Torneo'].isin(torneos)]['Local'].drop_duplicates().tolist()
    dictreplaces = {}
    for eq in equipos_elo:
        eq_cal = [i for i in equipos_cal if eq in i]
        if eq_cal:
            dictreplaces[eq] = eq_cal[0]
    df_elo = df_elo.replace(dictreplaces, regex = True)
    equipos_elo = df_elo['Club'].drop_duplicates().tolist()
    eq_int = [e for e in equipos_elo if e in equipos_cal]
    if len(eq_int) != len(equipos_cal):
        print([e for e in equipos_cal if e not in eq_int])
    return df_elo

In [47]:
def LeerAgregarELO(datadir, str_liga = 'Inglaterra'):
    dictcountries = {'Inglaterra' : 'ENG',
                     'Alemania' : 'GER',
                     'Francia' : 'FRA',
                     'Italia' : 'ITA',
                     'Espana' : 'ESP'}
    country = dictcountries[str_liga]
    df = pd.read_excel(os.path.join(datadir, '%s.xlsx' % str_liga))
    df_elo = ObtenerRankingELOLigaTemporadas(df, country = country)
    return df_elo

In [50]:
%%time
datadir = os.path.join(os.path.pardir,'datos','ligas')
df_elo = LeerAgregarELO(datadir, str_liga = 'Italia')

CPU times: user 1.39 s, sys: 7.97 ms, total: 1.4 s
Wall time: 50.7 s


In [51]:
outputdir = os.path.join(os.path.pardir,'datos','elo')
df_elo.to_excel(os.path.join(outputdir, 'Italia.xlsx'), index = False)

In [43]:
df = pd.read_excel(os.path.join(datadir,'Italia.xlsx'))

In [44]:
df['Local'].drop_duplicates().tolist()

['Inter',
 'Bologna FC',
 'Calcio Como',
 'Modena FC',
 'AC Perugia',
 'Juventus',
 'Brescia Calcio',
 'Lazio Roma',
 'Udinese Calcio',
 'AC Milan',
 'Empoli FC',
 'Parma AC',
 'Chievo Verona',
 'Piacenza Calcio',
 'Atalanta',
 'Torino FC',
 'Reggina Calcio',
 'AS Roma',
 'Ancona Calcio',
 'Sampdoria',
 'AC Siena',
 'US Lecce',
 'Cagliari Calcio',
 'US Palermo',
 'Parma FC',
 'ACF Fiorentina',
 'FC Messina',
 'AS Livorno',
 'Ascoli Calcio',
 'Treviso FBC',
 'Calcio Catania',
 'SSC Napoli',
 'Genoa CFC',
 'AS Bari',
 'AC Cesena',
 'Novara Calcio',
 'Pescara Calcio',
 'Hellas Verona',
 'Sassuolo Calcio',
 'Frosinone Calcio',
 'Carpi FC',
 'FC Crotone',
 'Benevento Calcio',
 'SPAL 2013 Ferrara']

In [45]:
df_elo['Club'].drop_duplicates().tolist()

['Juventus',
 'Inter',
 'AC Milan',
 'Lazio Lazio Roma',
 'Lazio Roma',
 'Parma AC',
 'Chievo Chievo Verona',
 'Udinese Calcio',
 'Brescia Calcio',
 'Atalanta',
 'AC Perugia',
 'Bologna FC',
 'Reggina Calcio',
 'Piacenza',
 'Empoli FC',
 'Sampdoria',
 'Modena FC',
 'AC Siena',
 'US Lecce',
 'Torino FC',
 'Como',
 'Chievo Verona',
 'Ternana',
 'Ancona Calcio',
 'Cagliari Calcio',
 'Vicenza',
 'AS Bari',
 'US Palermo',
 'SSC Napoli',
 'Triestina',
 'AS Livorno',
 'FC Messina',
 'Venezia',
 'Ascoli Calcio',
 'Genoa CFC',
 'Cosenza',
 'Calcio Catania',
 'Salernitana',
 'ACF Fiorentina',
 'Treviso FBC',
 'Albinoleffe',
 'Avellino',
 'Pescara Calcio',
 'FC Crotone',
 'Arezzo',
 'AC Cesena',
 'Catanzaro',
 'Mantova',
 'Rimini',
 'Cremonese',
 'Frosinone Calcio',
 'Spezia',
 'Pisa',
 'Grosseto',
 'Ravenna',
 'Sassuolo Calcio',
 'Cittadella',
 'Padova',
 'Gallipoli',
 'Varese',
 'Novara Calcio',
 'Portogruaro',
 'Juve Stabia',
 'Nocerina',
 'Gubbio',
 'Virtus Lanciano',
 'Pro Vercelli',
 'Latin

In [12]:
df_elo

Unnamed: 0,Torneo,Club,Elo
0,Primera División 2003/2004,Real Madrid,1923.014404
1,Primera División 2003/2004,Espanyol Barcelona Barcelona,1864.803345
2,Primera División 2003/2004,Deportivo La Coruña,1860.925903
3,Primera División 2003/2004,Real Sociedad,1854.205566
4,Primera División 2003/2004,Valencia CF,1839.127686
5,Primera División 2003/2004,Celta Vigo,1814.622803
6,Primera División 2003/2004,Athletic Bilbao,1780.111572
7,Primera División 2003/2004,Real Betis,1771.916992
8,Primera División 2003/2004,Sevilla FC,1760.543335
9,Primera División 2003/2004,RCD Mallorca,1756.082642
