# PROCESAMIENTO DEL DATA SET: [FIFA_2021](https://www.kaggle.com/datasets/aayushmishra1512/fifa-2021-complete-player-data?resource=download)


* Para realizar los cambios necesarios se utilizará la librería [Pandas](https://pandas.pydata.org/)

* DataSet original:

In [1]:
import pandas as pd
from os import path

try:
    ruta_completa = path.join(path.realpath('..'), "csv_originales" ,"FIFA-21 Complete.csv")
    data_set_fifa = pd.read_csv(ruta_completa, encoding='utf-8', delimiter=';')
except FileNotFoundError:
    print("Archivo csv 'FIFA-21 complete.csv' no encontrado")

In [2]:
data_set_fifa

Unnamed: 0,player_id,name,nationality,position,overall,age,hits,potential,team
0,158023,Lionel Messi,Argentina,ST|CF|RW,94,33,299,94,FC Barcelona
1,20801,Cristiano Ronaldo,Portugal,ST|LW,93,35,276,93,Juventus
2,190871,Neymar Jr,Brazil,CAM|LW,92,28,186,92,Paris Saint-Germain
3,203376,Virgil van Dijk,Netherlands,CB,91,29,127,92,Liverpool
4,200389,Jan Oblak,Slovenia,GK,91,27,47,93,Atlético Madrid
...,...,...,...,...,...,...,...,...,...
17976,256093,Jaime Ortíz,Ecuador,ST,56,21,0,64,Sociedad Deportiva Aucas
17977,256088,Michael Carcelén,Ecuador,CM,56,23,0,64,Club Deportivo El Nacional
17978,256074,Davide Luzi,Venezuela,ST,56,18,1,68,Zamora Fútbol Club
17979,256073,Sergio Sulbarán,Venezuela,RW,56,22,0,62,Zamora Fútbol Club


* Primero necesitamos eliminar las columnas: <font color='red'>"player_id", "overall", "hits"</font>
* Luego, debemos reacomodar las columnas, para lograr el siguiente orden: <font color='aqua'>"team", "nationality", "position", "age", "potential", "name"</font>

In [3]:
columnas_sin_uso = ['player_id', 'overall', 'hits']
data_set_fifa = data_set_fifa.drop(columnas_sin_uso, axis='columns')

* ELIMINO LAS COLUMNAS SIN USO:

In [4]:
data_set_fifa

Unnamed: 0,name,nationality,position,age,potential,team
0,Lionel Messi,Argentina,ST|CF|RW,33,94,FC Barcelona
1,Cristiano Ronaldo,Portugal,ST|LW,35,93,Juventus
2,Neymar Jr,Brazil,CAM|LW,28,92,Paris Saint-Germain
3,Virgil van Dijk,Netherlands,CB,29,92,Liverpool
4,Jan Oblak,Slovenia,GK,27,93,Atlético Madrid
...,...,...,...,...,...,...
17976,Jaime Ortíz,Ecuador,ST,21,64,Sociedad Deportiva Aucas
17977,Michael Carcelén,Ecuador,CM,23,64,Club Deportivo El Nacional
17978,Davide Luzi,Venezuela,ST,18,68,Zamora Fútbol Club
17979,Sergio Sulbarán,Venezuela,RW,22,62,Zamora Fútbol Club


In [5]:
nuevo_orden_columnas = ['team', 'nationality', 'position', 'age', 'potential', 'name']
data_set_fifa = data_set_fifa.reindex(columns=nuevo_orden_columnas)

* REACOMODO LAS COLUMNAS:

In [6]:
data_set_fifa

Unnamed: 0,team,nationality,position,age,potential,name
0,FC Barcelona,Argentina,ST|CF|RW,33,94,Lionel Messi
1,Juventus,Portugal,ST|LW,35,93,Cristiano Ronaldo
2,Paris Saint-Germain,Brazil,CAM|LW,28,92,Neymar Jr
3,Liverpool,Netherlands,CB,29,92,Virgil van Dijk
4,Atlético Madrid,Slovenia,GK,27,93,Jan Oblak
...,...,...,...,...,...,...
17976,Sociedad Deportiva Aucas,Ecuador,ST,21,64,Jaime Ortíz
17977,Club Deportivo El Nacional,Ecuador,CM,23,64,Michael Carcelén
17978,Zamora Fútbol Club,Venezuela,ST,18,68,Davide Luzi
17979,Zamora Fútbol Club,Venezuela,RW,22,62,Sergio Sulbarán


* El siguiente paso es traducir al español las <font color='Fuchsia'>posiciones de cada jugador</font>, de su abreviatura en ingles, a su <font color='Aqua'>traducción sin abreviar en español</font>. Para ello se utilizará un archivo json con las traducciones contempladas: 

In [7]:
import json

try:
    ruta_completa = path.join(path.realpath('..'), "csv_originales" ,"fifa_pos_ENG_ESP.json")
    with open(ruta_completa, 'r', encoding="utf-8") as trad:
        traduccion = json.load(trad)
except FileNotFoundError:
    print ("Archivo fifa_pos_ENG_ESP.json,  no encontrado")
else:
    valores = (data_set_fifa['position'].str.split('|'))
    nuevas_pos = []
    for pos in valores:
        pos = '|'.join(list((map(lambda pos: traduccion[pos], pos))))
        nuevas_pos.append(pos) # me guardo las posiciones traducidas

    data_set_fifa['position'] = nuevas_pos

* TRADUCCION DE LAS POSICIONES:

In [8]:
data_set_fifa['position']

0        Delantero Centro|Media punta|Extremo izquierdo
1                    Delantero Centro|Extremo izquierdo
2               Medio centro ofensivo|Extremo izquierdo
3                                       Defensa central
4                                               Portero
                              ...                      
17976                                  Delantero Centro
17977                                      Medio centro
17978                                  Delantero Centro
17979                                 Extremo izquierdo
17980                                      Medio centro
Name: position, Length: 17981, dtype: object

* Por último, necesitamos reemplazar los valores de la columna <font color='Fuchsia'>'potential'</font> por su <font color='Aqua'>equivalente en string</font>, dado su valor numérico:

In [9]:
def conversion_del_potencial(potencial):
    """
    :param potencial: el valor de la columna 'Potential'
    :return: el equivalente a potencial en string
    """
    if(potencial < 60):
        potencial = "Regular"
    elif(potencial > 60 and potencial <= 79):
        potencial = "Bueno"
    elif(potencial > 79 and potencial <= 89):
        potencial = "Muy bueno"
    else:
        potencial = "Sobresaliente"
    return potencial

data_set_fifa['potential'] = list(map(lambda potencial: conversion_del_potencial(potencial), data_set_fifa['potential']))

* CONVERSION DEL POTENCIAL DE ENTERO A STRING:

In [10]:
data_set_fifa['potential']

0        Sobresaliente
1        Sobresaliente
2        Sobresaliente
3        Sobresaliente
4        Sobresaliente
             ...      
17976            Bueno
17977            Bueno
17978            Bueno
17979            Bueno
17980            Bueno
Name: potential, Length: 17981, dtype: object

* Finalmente, obtenemos, <font color='Aqua'>el nuevo data set de fifa_2021</font>, con las modificaciones requeridas para ser utilizado por  <font color='Fuchsia'>FiguRace</font>: 

* DATASET FINAL:

In [49]:
data_set_fifa

DATASET FINAL: 


Unnamed: 0,team,nationality,position,age,potential,name
0,FC Barcelona,Argentina,Delantero Centro|Media punta|Extremo izquierdo,33,Sobresaliente,Lionel Messi
1,Juventus,Portugal,Delantero Centro|Extremo izquierdo,35,Sobresaliente,Cristiano Ronaldo
2,Paris Saint-Germain,Brazil,Medio centro ofensivo|Extremo izquierdo,28,Sobresaliente,Neymar Jr
3,Liverpool,Netherlands,Defensa central,29,Sobresaliente,Virgil van Dijk
4,Atlético Madrid,Slovenia,Portero,27,Sobresaliente,Jan Oblak
...,...,...,...,...,...,...
17976,Sociedad Deportiva Aucas,Ecuador,Delantero Centro,21,Bueno,Jaime Ortíz
17977,Club Deportivo El Nacional,Ecuador,Medio centro,23,Bueno,Michael Carcelén
17978,Zamora Fútbol Club,Venezuela,Delantero Centro,18,Bueno,Davide Luzi
17979,Zamora Fútbol Club,Venezuela,Extremo izquierdo,22,Bueno,Sergio Sulbarán


In [7]:

ruta_completa = path.join(path.realpath('..'), "dataset_fifa.csv")
data_set_fifa.to_csv(ruta_completa, index=False)