In [1]:
import pandas as pd
import glob

# Especificar el directorio de los archivos CSV
directorio = './datasets/'

# Obtener todos los archivos CSV en el directorio
archivos_csv = glob.glob(directorio + '*.csv')

# Lista para almacenar los nombres de los DataFrames creados
dataframes_creados = []

# Iterar sobre cada archivo CSV
for archivo in archivos_csv:
    # Obtener el nombre del archivo sin la extensión y sin el path
    nombre_base = archivo.split('/')[-1].split('.')[0]
    
    # Leer el archivo CSV y crear un DataFrame
    # Usamos globals() para crear una variable global con el nombre del archivo
    globals()[nombre_base] = pd.read_csv(archivo)
    
    # Añadir el nombre del DataFrame a la lista de creados
    dataframes_creados.append(nombre_base)

# Imprimir los nombres de los DataFrames creados
print("DataFrames creados:")
for nombre in dataframes_creados:
    print(f"- {nombre}")



DataFrames creados:
- banco_macro_historical_data
- bbva_historical_data
- cemex_historical_data
- citi_historical_data
- cocacola_femsa_historical_data
- cresud_sociedad_anonima_historical_data
- despegar_historical_data
- globant_historical_data
- goldman_sachs_historical_data
- grupo_bimbo_historical_data
- gurpo_financiero_galicia_historical_data
- jpmorgan_historical_data
- mercado_libre_historical_data
- pampa_energía_historical_data
- santander_historical_data
- tenaris_historical_data
- transportadora_de_gas_historical_data
- ypf_historical_data


**Significado de cada columna**

* Date: fecha de la información bursátil. Incluye hora y zona horaria.
* Open: precio de apertura de la acción en ese día específico.
* High: precio más alto alcanzado por la acción durante ese día.
* Low: precio más bajo al que se cotizó la acción en ese día.
* Close: precio de cierre de la acción al final del día.
* Volume: El número total de acciones negociadas durante ese día.
* Dividends: Cualquier dividendo pagado en ese día. Un valor de 0.0 indica que no se pagaron dividendos.
* Stock Splits: Indica si hubo una división de acciones ese día. Un valor de 0.0 significa que no hubo división.

In [2]:
# Lista de nombres de DataFrames 
nombres_dataframes = [
    'banco_macro_historical_data', 'bbva_historical_data', 'cemex_historical_data',
    'citi_historical_data', 'cocacola_femsa_historical_data',
    'cresud_sociedad_anonima_historical_data', 'despegar_historical_data',
    'globant_historical_data', 'goldman_sachs_historical_data',
    'grupo_bimbo_historical_data', 'gurpo_financiero_galicia_historical_data',
    'jpmorgan_historical_data', 'mercado_libre_historical_data',
    'pampa_energía_historical_data', 'santander_historical_data',
    'tenaris_historical_data', 'transportadora_de_gas_historical_data',
    'ypf_historical_data'
]

# Aplicar .info() a cada DataFrame
for nombre in nombres_dataframes:
    print(f"\n{'-'*40}")
    print(f"Información para {nombre}:")
    print(f"{'-'*40}")
    globals()[nombre].info()


----------------------------------------
Información para banco_macro_historical_data:
----------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 418 entries, 0 to 417
Data columns (total 8 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   Date          418 non-null    object 
 1   Open          418 non-null    float64
 2   High          418 non-null    float64
 3   Low           418 non-null    float64
 4   Close         418 non-null    float64
 5   Volume        418 non-null    int64  
 6   Dividends     418 non-null    float64
 7   Stock Splits  418 non-null    float64
dtypes: float64(6), int64(1), object(1)
memory usage: 26.3+ KB

----------------------------------------
Información para bbva_historical_data:
----------------------------------------
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 418 entries, 0 to 417
Data columns (total 8 columns):
 #   Column        Non-Null Count  Dtype  
---  

In [3]:
# Lista de nombres de DataFrames 
nombres_dataframes = [
    'banco_macro_historical_data', 'bbva_historical_data', 'cemex_historical_data',
    'citi_historical_data', 'cocacola_femsa_historical_data',
    'cresud_sociedad_anonima_historical_data', 'despegar_historical_data',
    'globant_historical_data', 'goldman_sachs_historical_data',
    'grupo_bimbo_historical_data', 'gurpo_financiero_galicia_historical_data',
    'jpmorgan_historical_data', 'mercado_libre_historical_data',
    'pampa_energía_historical_data', 'santander_historical_data',
    'tenaris_historical_data', 'transportadora_de_gas_historical_data',
    'ypf_historical_data'
]

# Aplicar describe() a cada DataFrame
for nombre in nombres_dataframes:
    print(f"\n{'-'*60}")
    print(f"Estadísticas descriptivas para {nombre}:")
    print(f"{'-'*60}")
    print(globals()[nombre].describe())
    print("\n")


------------------------------------------------------------
Estadísticas descriptivas para banco_macro_historical_data:
------------------------------------------------------------
             Open        High         Low       Close        Volume  \
count  418.000000  418.000000  418.000000  418.000000  4.180000e+02   
mean    29.065136   29.897710   28.296538   29.102591  3.247395e+05   
std     15.042741   15.463192   14.645680   15.051450  2.121726e+05   
min     12.958883   13.463564   12.747243   12.869346  4.740000e+04   
25%     17.013934   17.511182   16.597466   17.016676  1.836750e+05   
50%     21.783754   22.325552   21.196064   21.683553  2.749500e+05   
75%     44.523243   46.339592   43.576279   44.838139  4.080500e+05   
max     61.062018   62.285080   59.099635   61.062016  1.692700e+06   

        Dividends  Stock Splits  
count  418.000000         418.0  
mean     0.019438           0.0  
std      0.159206           0.0  
min      0.000000           0.0  
25%    

In [4]:
# Lista de nombres de los DataFrames
nombres_dataframes = [
    'banco_macro_historical_data', 'bbva_historical_data', 'cemex_historical_data',
    'citi_historical_data', 'cocacola_femsa_historical_data',
    'cresud_sociedad_anonima_historical_data', 'despegar_historical_data',
    'globant_historical_data', 'goldman_sachs_historical_data',
    'grupo_bimbo_historical_data', 'gurpo_financiero_galicia_historical_data',
    'jpmorgan_historical_data', 'mercado_libre_historical_data',
    'pampa_energía_historical_data', 'santander_historical_data',
    'tenaris_historical_data', 'transportadora_de_gas_historical_data',
    'ypf_historical_data'
]

# Función para calcular el rendimiento
def calcular_rendimiento(df):
    # Convertir 'Date' a datetime 
    df['Date'] = pd.to_datetime(df['Date'], utc=True)
    
    # Extraer el año de la fecha
    df['Year'] = df['Date'].dt.year
    
    # Filtrar datos de 2024
    df_2024 = df[df['Year'] == 2024]
    
    if df_2024.empty:
        return None
    
    precio_inicial = df_2024.iloc[0]['Close']
    precio_final = df_2024.iloc[-1]['Close']
    rendimiento = (precio_final - precio_inicial) / precio_inicial * 100
    return rendimiento

# Calcular rendimientos
rendimientos = {}
for nombre in nombres_dataframes:
    try:
        df = globals()[nombre]
        rendimiento = calcular_rendimiento(df)
        if rendimiento is not None:
            rendimientos[nombre] = rendimiento
    except Exception as e:
        print(f"Error al procesar {nombre}: {e}")

# Ordenar rendimientos de mayor a menor
rendimientos_ordenados = sorted(rendimientos.items(), key=lambda x: x[1], reverse=True)

# Mostrar resultados
print("Rendimientos de las empresas en 2024:")
for empresa, rendimiento in rendimientos_ordenados:
    print(f"{empresa}: {rendimiento:.2f}%")

# Identificar la empresa con mejor desempeño
if rendimientos_ordenados:
    mejor_empresa = rendimientos_ordenados[0]
    print(f"\nLa empresa con mejor desempeño en 2024 fue {mejor_empresa[0]} con un rendimiento de {mejor_empresa[1]:.2f}%")
else:
    print("\nNo se pudo determinar la empresa con mejor desempeño debido a errores en los datos.")

Rendimientos de las empresas en 2024:
gurpo_financiero_galicia_historical_data: 148.92%
banco_macro_historical_data: 134.78%
ypf_historical_data: 43.46%
despegar_historical_data: 35.65%
mercado_libre_historical_data: 34.82%
jpmorgan_historical_data: 32.94%
transportadora_de_gas_historical_data: 27.80%
santander_historical_data: 21.88%
citi_historical_data: 21.42%
bbva_historical_data: 20.09%
pampa_energía_historical_data: 12.86%
goldman_sachs_historical_data: 2.66%
cocacola_femsa_historical_data: -7.46%
cresud_sociedad_anonima_historical_data: -8.75%
tenaris_historical_data: -11.99%
globant_historical_data: -12.20%
grupo_bimbo_historical_data: -17.65%
cemex_historical_data: -19.18%

La empresa con mejor desempeño en 2024 fue gurpo_financiero_galicia_historical_data con un rendimiento de 148.92%


In [5]:
# Reutilizamos la función calcular_rendimiento y la lista nombres_dataframes que hicimos màs arriba

# Función para calcular el rendimiento en 2023
def calcular_rendimiento_2023(df):
    # Convertir 'Date' a datetime 
    if not pd.api.types.is_datetime64_any_dtype(df['Date']):
        df['Date'] = pd.to_datetime(df['Date'], utc=True)
    
    # Extraer el año de la fecha
    df['Year'] = df['Date'].dt.year
    
    # Filtrar datos de 2023
    df_2023 = df[df['Year'] == 2023]
    
    if df_2023.empty:
        return None
    
    precio_inicial = df_2023.iloc[0]['Close']
    precio_final = df_2023.iloc[-1]['Close']
    rendimiento = (precio_final - precio_inicial) / precio_inicial * 100
    return rendimiento

# Calcular rendimientos para 2023
rendimientos_2023 = {}
for nombre in nombres_dataframes:
    try:
        df = globals()[nombre]
        rendimiento = calcular_rendimiento_2023(df)
        if rendimiento is not None:
            rendimientos_2023[nombre] = rendimiento
    except Exception as e:
        print(f"Error al procesar {nombre} para 2023: {e}")

# Ordenar rendimientos de mayor a menor
rendimientos_ordenados_2023 = sorted(rendimientos_2023.items(), key=lambda x: x[1], reverse=True)

# Mostrar resultados
print("Rendimientos de las empresas en 2023:")
for empresa, rendimiento in rendimientos_ordenados_2023:
    print(f"{empresa}: {rendimiento:.2f}%")

# Identificar la empresa con mejor desempeño en 2023
if rendimientos_ordenados_2023:
    mejor_empresa_2023 = rendimientos_ordenados_2023[0]
    print(f"\nLa empresa con mejor desempeño en 2023 fue {mejor_empresa_2023[0]} con un rendimiento de {mejor_empresa_2023[1]:.2f}%")
else:
    print("\nNo se pudo determinar la empresa con mejor desempeño en 2023 debido a errores en los datos.")

Rendimientos de las empresas en 2023:
banco_macro_historical_data: 99.01%
ypf_historical_data: 97.36%
gurpo_financiero_galicia_historical_data: 95.95%
mercado_libre_historical_data: 90.23%
despegar_historical_data: 88.82%
cemex_historical_data: 88.11%
cresud_sociedad_anonima_historical_data: 66.85%
pampa_energía_historical_data: 59.07%
bbva_historical_data: 58.27%
cocacola_femsa_historical_data: 50.80%
santander_historical_data: 43.75%
globant_historical_data: 40.86%
transportadora_de_gas_historical_data: 30.54%
jpmorgan_historical_data: 29.64%
goldman_sachs_historical_data: 18.80%
citi_historical_data: 17.55%
tenaris_historical_data: 7.59%
grupo_bimbo_historical_data: 2.26%

La empresa con mejor desempeño en 2023 fue banco_macro_historical_data con un rendimiento de 99.01%
