In [3]:
import pandas as pd
import numpy as np

# Cargar la hoja de cálculo de Excel con indicadores económicos
df_economicos = pd.read_excel('world_bank_data.xlsx')

# Cargar el archivo CSV "country-codes.csv"
df_country_codes = pd.read_csv('datos.csv')

# Columnas relevantes seleccionadas manualmente
columnas_relevantes = ['Country Code', 'Time', 'GDP (current US$)', 'GDP growth (annual %)', 'Gross capital formation (% of GDP)', 'Inflation, GDP deflator (annual %)', 'Exports of goods and services (% of GDP)', 'Imports of goods and services (% of GDP)', 'Total natural resources rents (% of GDP)']

# Verificar y seleccionar solo las columnas relevantes que existen en el DataFrame
columnas_existentes = [col for col in df_economicos.columns if any(relevant_col in col for relevant_col in columnas_relevantes)]
df1 = df_economicos[columnas_existentes]

# Reemplazar el símbolo ".." con NaN para que dropna() pueda eliminar los valores faltantes
df1 = df1.replace('..', np.NaN)

# Realizar un merge entre los dataframes df1 y df_country_codes utilizando la columna 'ISO3166-1-Alpha-3'
df1 = pd.merge(df1, df_country_codes[['Country Name','ISO 3166-1 Alpha-3']], left_on='Country Code', right_on='ISO 3166-1 Alpha-3', how='left')

# Convertir la columna 'Time' a tipo fecha
df1['Time'] = pd.to_datetime(df1['Time'], format='%Y')

# Filtrar los datos hasta el año 2016
df1 = df1[df1['Time'] <= pd.to_datetime('2016')]

# Cargar el archivo CSV creado en el paso anterior "tabla_olympics.csv"
df_olympics = pd.read_csv('tabla_olympics.csv')

# Obtener la lista de países presentes en el archivo de juegos olímpicos
paises_olimpicos = df_olympics['Country Name'].unique()

# Filtrar el DataFrame de indicadores económicos solo para los países presentes en los juegos olímpicos
df1 = df1[df1['Country Name'].isin(paises_olimpicos)]

df1 = df1.rename(columns={'Time': 'Year'})

# Guardar el DataFrame resultante en un archivo CSV
df1.to_csv('indicadores_economicos.csv', index=False)
