# PROCESAMIENTO DEL DATA SET: [FIFA_2021](https://www.kaggle.com/datasets/aayushmishra1512/fifa-2021-complete-player-data?resource=download)


* Para realizar los cambios necesarios se utilizará la librería [Pandas](https://pandas.pydata.org/)

* DataSet original:

In [8]:
import pandas as pd
from os import path

try:
    ruta_completa = path.join(path.realpath('..'), "csv_originales" ,"FIFA-21 Complete.csv")
    data_set_fifa = pd.read_csv(ruta_completa, encoding='utf-8', delimiter=';')
except FileNotFoundError:
    print("Archivo csv 'FIFA-21 complete.csv' no encontrado")
else:
    print(data_set_fifa)

       player_id               name  nationality  position  overall  age  \
0         158023       Lionel Messi    Argentina  ST|CF|RW       94   33   
1          20801  Cristiano Ronaldo     Portugal     ST|LW       93   35   
2         190871          Neymar Jr       Brazil    CAM|LW       92   28   
3         203376    Virgil van Dijk  Netherlands        CB       91   29   
4         200389          Jan Oblak     Slovenia        GK       91   27   
...          ...                ...          ...       ...      ...  ...   
17976     256093        Jaime Ortíz      Ecuador        ST       56   21   
17977     256088   Michael Carcelén      Ecuador        CM       56   23   
17978     256074        Davide Luzi    Venezuela        ST       56   18   
17979     256073    Sergio Sulbarán    Venezuela        RW       56   22   
17980     256072          Luis Peña    Venezuela        CM       56   18   

       hits  potential                         team  
0       299         94           

* Primero necesitamos eliminar las columnas: <font color='red'>"player_id", "overall", "hits"</font>
* Luego, debemos reacomodar las columnas, para lograr el siguiente orden: <font color='aqua'>"team", "nationality", "position", "age", "potential", "name"</font>

In [9]:
print('ELIMINO LAS COLUMNAS SIN USO: ', end='\n')
columnas_sin_uso = ['player_id', 'overall', 'hits']
data_set_fifa = data_set_fifa.drop(columnas_sin_uso, axis='columns')
print(data_set_fifa)

ELIMINO LAS COLUMNAS SIN USO: 
                    name  nationality  position  age  potential  \
0           Lionel Messi    Argentina  ST|CF|RW   33         94   
1      Cristiano Ronaldo     Portugal     ST|LW   35         93   
2              Neymar Jr       Brazil    CAM|LW   28         92   
3        Virgil van Dijk  Netherlands        CB   29         92   
4              Jan Oblak     Slovenia        GK   27         93   
...                  ...          ...       ...  ...        ...   
17976        Jaime Ortíz      Ecuador        ST   21         64   
17977   Michael Carcelén      Ecuador        CM   23         64   
17978        Davide Luzi    Venezuela        ST   18         68   
17979    Sergio Sulbarán    Venezuela        RW   22         62   
17980          Luis Peña    Venezuela        CM   18         69   

                              team  
0                    FC Barcelona   
1                        Juventus   
2             Paris Saint-Germain   
3               

In [10]:
print('REACOMODO LAS COLUMNAS: ', end='\n')
nuevo_orden_columnas = ['team', 'nationality', 'position', 'age', 'potential', 'name']
data_set_fifa = data_set_fifa.reindex(columns=nuevo_orden_columnas)
print(data_set_fifa)

REACOMODO LAS COLUMNAS: 
                              team  nationality  position  age  potential  \
0                    FC Barcelona     Argentina  ST|CF|RW   33         94   
1                        Juventus      Portugal     ST|LW   35         93   
2             Paris Saint-Germain        Brazil    CAM|LW   28         92   
3                       Liverpool   Netherlands        CB   29         92   
4                 Atlético Madrid      Slovenia        GK   27         93   
...                            ...          ...       ...  ...        ...   
17976    Sociedad Deportiva Aucas       Ecuador        ST   21         64   
17977  Club Deportivo El Nacional       Ecuador        CM   23         64   
17978          Zamora Fútbol Club     Venezuela        ST   18         68   
17979          Zamora Fútbol Club     Venezuela        RW   22         62   
17980          Zamora Fútbol Club     Venezuela        CM   18         69   

                    name  
0           Lionel Mess

* El siguiente paso es traducir al español las <font color='Fuchsia'>posiciones de cada jugador</font>, de su abreviatura en ingles, a su <font color='Aqua'>traducción sin abreviar en español</font>. Para ello se utilizará un archivo json con las traducciones contempladas: 

In [11]:
import json

try:
    ruta_completa = path.join(path.realpath('..'), "csv_originales" ,"fifa_pos_ENG_ESP.json")
    with open(ruta_completa, 'r', encoding="utf-8") as trad:
        traduccion = json.load(trad)
except FileNotFoundError:
    print ("Archivo fifa_pos_ENG_ESP.json,  no encontrado")
else:
    print('TRADUCCION DE LAS POSICIONES: ', end='\n')
    valores = (data_set_fifa['position'].str.split('|'))
    nuevas_pos = []
    for pos in valores:
        pos = '|'.join(list((map(lambda pos: traduccion[pos], pos))))
        nuevas_pos.append(pos) # me guardo las posiciones traducidas

    data_set_fifa['position'] = nuevas_pos
    print(data_set_fifa['position'])

TRADUCCION DE LAS POSICIONES: 
0        Delantero Centro|Media punta|Extremo izquierdo
1                    Delantero Centro|Extremo izquierdo
2               Medio centro ofensivo|Extremo izquierdo
3                                       Defensa central
4                                               Portero
                              ...                      
17976                                  Delantero Centro
17977                                      Medio centro
17978                                  Delantero Centro
17979                                 Extremo izquierdo
17980                                      Medio centro
Name: position, Length: 17981, dtype: object


* Por último, necesitamos reemplazar los valores de la columna <font color='Fuchsia'>'potential'</font> por su <font color='Aqua'>equivalente en string</font>, dado su valor numérico:

In [12]:
def conversion_del_potencial(potencial):
    """
    :param potencial: el valor de la columna 'Potential'
    :return: el equivalente a potencial en string
    """
    if(potencial < 60):
        potencial = "Regular"
    elif(potencial > 60 and potencial <= 79):
        potencial = "Bueno"
    elif(potencial > 79 and potencial <= 89):
        potencial = "Muy bueno"
    else:
        potencial = "Sobresaliente"
    return potencial

print('CONVERSION DEL POTENCIAL DE ENTERO A STRING: ', end='\n')
data_set_fifa['potential'] = list(map(lambda potencial: conversion_del_potencial(potencial), data_set_fifa['potential']))
print(data_set_fifa['potential'])

CONVERSION DEL POTENCIAL DE ENTERO A STRING: 
0        Sobresaliente
1        Sobresaliente
2        Sobresaliente
3        Sobresaliente
4        Sobresaliente
             ...      
17976            Bueno
17977            Bueno
17978            Bueno
17979            Bueno
17980            Bueno
Name: potential, Length: 17981, dtype: object


* Finalmente, obtenemos, <font color='Aqua'>el nuevo data set de fifa_2021</font>, con las modificaciones requeridas para ser utilizado por  <font color='Fuchsia'>FiguRace</font>: 

In [13]:
print('DATASET FINAL: ', end='\n')
print(data_set_fifa)

ruta_completa = path.join(path.realpath('..'), "dataset_fifa.csv")
data_set_fifa.to_csv(ruta_completa, index=False)

DATASET FINAL: 
                              team  nationality  \
0                    FC Barcelona     Argentina   
1                        Juventus      Portugal   
2             Paris Saint-Germain        Brazil   
3                       Liverpool   Netherlands   
4                 Atlético Madrid      Slovenia   
...                            ...          ...   
17976    Sociedad Deportiva Aucas       Ecuador   
17977  Club Deportivo El Nacional       Ecuador   
17978          Zamora Fútbol Club     Venezuela   
17979          Zamora Fútbol Club     Venezuela   
17980          Zamora Fútbol Club     Venezuela   

                                             position  age      potential  \
0      Delantero Centro|Media punta|Extremo izquierdo   33  Sobresaliente   
1                  Delantero Centro|Extremo izquierdo   35  Sobresaliente   
2             Medio centro ofensivo|Extremo izquierdo   28  Sobresaliente   
3                                     Defensa central   29  Sob