In [None]:

import pandas as pd

# 1) Leer archivo
df = pd.read_csv('fifa_eda.csv')

# 2) Muestra de 20 líneas
print("Muestra de 20 líneas:")
print(df.sample(20, random_state=42))

# 3)Refinamientos mínimos para estadísticas
# Convertimos columnas típicas numéricas si vinieran como texto
for col in ['Value', 'Wage', 'Release Clause']:
    if col in df.columns:
        df[col] = pd.to_numeric(df[col].astype(str).str.replace(r'[^0-9.]', '', regex=True), errors='coerce')

# 4) Media, mínimo y máximo (total y por país) usando 'Overall'
print("\nEstadísticas totales (Overall):")
print(df['Overall'].agg(['mean', 'min', 'max']))

print("\nEstadísticas por país (Overall):")
print(df.groupby('Nationality')['Overall'].agg(['mean', 'min', 'max']).head(10))

# 5) Crear 2 jugadores ficticios (clonando la primera fila y modificando campos clave)
row_base = df.iloc[0].copy()

jug1 = row_base.copy()
jug1['Name'] = 'Ficticio A'
jug1['Nationality'] = 'Mexico'
jug1['Overall'] = 90
jug1['Potential'] = 92
jug1['Joined'] = '2019'

jug2 = row_base.copy()
jug2['Name'] = 'Ficticio B'
jug2['Nationality'] = 'Argentina'
jug2['Overall'] = 88
jug2['Potential'] = 91
jug2['Joined'] = '2020'

df = pd.concat([df, pd.DataFrame([jug1, jug2])], ignore_index=True)

print("\nÚltimas filas con los jugadores ficticios:")
print(df.tail())

# 6) Recalcular estadísticas y mostrarlas
print("\nEstadísticas totales (Overall) después de añadir ficticios:")
print(df['Overall'].agg(['mean', 'min', 'max']))

print("\nEstadísticas por país (Overall) después de añadir ficticios:")
print(df.groupby('Nationality')['Overall'].agg(['mean', 'min', 'max']).loc[['Mexico','Argentina']])

# 7) Lambda: añadir zona horaria y capital por país (map simple)
tz_map = {
    'Mexico': 'America/Mexico_City', 'Argentina': 'America/Argentina/Buenos_Aires',
    'Spain': 'Europe/Madrid', 'Brazil': 'America/Sao_Paulo', 'England': 'Europe/London',
    'France': 'Europe/Paris', 'Germany': 'Europe/Berlin', 'Portugal': 'Europe/Lisbon',
    'Belgium': 'Europe/Brussels', 'Netherlands': 'Europe/Amsterdam'
}
cap_map = {
    'Mexico': 'Ciudad de México', 'Argentina': 'Buenos Aires',
    'Spain': 'Madrid', 'Brazil': 'Brasilia', 'England': 'London',
    'France': 'Paris', 'Germany': 'Berlin', 'Portugal': 'Lisbon',
    'Belgium': 'Brussels', 'Netherlands': 'Amsterdam'
}

df['Timezone'] = df['Nationality'].map(lambda x: tz_map.get(x, 'N/A'))
df['Capital']  = df['Nationality'].map(lambda x: cap_map.get(x, 'N/A'))

print("\nVista rápida con Timezone y Capital:")
print(df[['Name', 'Nationality', 'Timezone', 'Capital']].tail(5))

# 8) Lambda: columna “Candidato” o “Next Year” según Potential (>85)
df['Ballon_dOr'] = df['Potential'].map(lambda p: 'Candidato' if p > 85 else 'Next Year')
print("\nVista rápida con Ballon_dOr:")
print(df[['Name', 'Potential', 'Ballon_dOr']].tail(5))