In [None]:
import pandas as pd
import requests


def descargar_y_procesar_ranking(url, prueba, ano):
    """
    Descarga una página web, extrae la tabla del ranking de atletismo,
    añade las columnas de 'prueba' y 'ano', y la guarda en un CSV.

    Args:
        url (str): La URL de la página del ranking.
    """
    try:
        # Usar pandas para leer las tablas directamente desde la URL
        # read_html devuelve una lista de DataFrames, asumimos que la tabla de ranking es la primera
        tablas = pd.read_html(url, header=0, encoding='ISO-8859-1')
        df_ranking = tablas[0]

        # Agregar las nuevas columnas al DataFrame
        df_ranking['Ano'] = ano

        # Limpiar los nombres de las columnas para evitar espacios no deseados
        df_ranking.columns = df_ranking.columns.str.strip()

        # Generar el nombre del archivo CSV
        nombre_archivo = f'ranking_{prueba}_{ano}.csv'
        
        # Guardar el DataFrame en un archivo CSV
        df_ranking.to_csv(nombre_archivo, index=False, sep=';', encoding='utf-8')

        print(f"Archivo '{nombre_archivo}' creado exitosamente.")

    except Exception as e:
        print(f"Ocurrió un error: {e}")

def procesar_csv_ranking(ruta_archivo, ano_str):
    """
    Procesa un archivo CSV con una estructura de cabecera no estándar,
    lo formatea correctamente y añade las columnas de prueba y año.

    Args:
        ruta_archivo (str): Ruta del archivo CSV local.
        prueba_str (str): El nombre de la prueba, por ejemplo "200M MASCULINO". 
        ano_str (str): El año del ranking, por ejemplo "2025".
    """
    try:
        # Leer el archivo CSV sin cabecera inicialmente
        df = pd.read_csv(ruta_archivo, sep=';', header=None, encoding='utf-8')

        # La primera fila contiene la información de la prueba
        prueba_inferred = df.iloc[0, 0].split(';')[0].strip()
        prueba_str = prueba_inferred.replace('.', '').lower()
        

        # La tercera fila (índice 2) contiene los nombres de las columnas
        column_names = df.iloc[2].str.strip()
        
        # Eliminar las filas de cabecera y mantener solo los datos
        df_datos = df.iloc[3:].copy()
        
        # Asignar los nombres de columna correctos
        df_datos.columns = column_names
        
        # Renombrar la columna '#' a 'Posicion'
        df_datos = df_datos.rename(columns={'#': 'Posicion'})
        df_datos = df_datos.rename(columns={'Vv': 'Viento'})
        df_datos = df_datos.rename(columns={'Data': 'Fecha'})
        df_datos = df_datos.rename(columns={'Pto.': 'Puesto_competicion'})

        df_datos['Posicion'] = df_datos['Posicion'].astype(str).str.replace('.', '', regex=False)

        df_datos['Viento'] = df_datos['Viento'].astype(str).str.replace(r'(\d)(\d)', r'\1.\2', regex=True)
        
        # Eliminar columnas con nombres nulos o vacíos
        df_datos = df_datos.loc[:, df_datos.columns.notna()]
        
        # Añadir las nuevas columnas de prueba y año
        df_datos['Prueba'] = prueba_str
        df_datos['Ano'] = ano_str
        

        # 6. Seleccionar las columnas finales deseadas
        columnas_deseadas = ['Prueba', 'Ano', 'Posicion', 'Marca', 'Viento', 'Puesto_competicion', 'Atleta', 'Equipo', 'Fecha', 'Lugar']
        df_final = df_datos[columnas_deseadas]

        # 7. Limpiar filas vacías y guardar el DataFrame
        df_final = df_final.dropna(how='all')
        nombre_salida = f'ranking_final_{prueba_inferred.replace(" ", "_")}_{ano_str}.csv'
        df_final.to_csv(nombre_salida, index=False, sep=';', encoding='utf-8')

        print(f"Archivo '{nombre_salida}' creado y formateado correctamente con las columnas deseadas.")

    except Exception as e:
        print(f"Ocurrió un error: {e}")




probas = ['100', '200', '400', '800', '800', '1500']

for proba in probas:
    for ano in range(2008, 2026, 1):
        ruta_tmp = f'./ranking_{proba}_{ano}.csv'
        url = f'https://ranking.atletismo.gal/ranking_lista.asp?opcion=4&prueba={proba}&tp=AL&sx=H&club=0&cat=0&nreg=500&comp=0&temporada={ano}'
        
        descargar_y_procesar_ranking(url, proba, ano)

        procesar_csv_ranking(ruta_tmp, ano)



In [None]:
import google.generativeai as genai

API_KEY = "" # Reemplaza con tu clave
genai.configure(api_key=API_KEY)

for m in genai.list_models():
    if 'generateContent' in m.supported_generation_methods:
        print(m.name)

  from .autonotebook import tqdm as notebook_tqdm


models/gemini-1.5-pro-latest
models/gemini-1.5-pro-002
models/gemini-1.5-pro
models/gemini-1.5-flash-latest
models/gemini-1.5-flash
models/gemini-1.5-flash-002
models/gemini-1.5-flash-8b
models/gemini-1.5-flash-8b-001
models/gemini-1.5-flash-8b-latest
models/gemini-2.5-pro-preview-03-25
models/gemini-2.5-flash-preview-05-20
models/gemini-2.5-flash
models/gemini-2.5-flash-lite-preview-06-17
models/gemini-2.5-pro-preview-05-06
models/gemini-2.5-pro-preview-06-05
models/gemini-2.5-pro
models/gemini-2.0-flash-exp
models/gemini-2.0-flash
models/gemini-2.0-flash-001
models/gemini-2.0-flash-lite-001
models/gemini-2.0-flash-lite
models/gemini-2.0-flash-lite-preview-02-05
models/gemini-2.0-flash-lite-preview
models/gemini-2.0-pro-exp
models/gemini-2.0-pro-exp-02-05
models/gemini-exp-1206
models/gemini-2.0-flash-thinking-exp-01-21
models/gemini-2.0-flash-thinking-exp
models/gemini-2.0-flash-thinking-exp-1219
models/gemini-2.5-flash-preview-tts
models/gemini-2.5-pro-preview-tts
models/learnlm-2.0

In [24]:
import pandas as pd
import glob

def consolidar_rankings():
    """
    Busca todos los archivos CSV con un prefijo específico, los consolida
    en un único DataFrame y lo guarda en un nuevo CSV.
    """
    try:
        # 1. Definir el patrón de búsqueda para los archivos CSV
        # El asterisco (*) actúa como un comodín
        patron_archivos = "ranking_final_*.csv"
        
        # 2. Encontrar todos los archivos que coinciden con el patrón
        lista_archivos = glob.glob(patron_archivos)
        
        if not lista_archivos:
            print("No se encontraron archivos para consolidar. Asegúrate de que los archivos 'ranking_final_*.csv' estén en la misma carpeta.")
            return

        # 3. Crear una lista para almacenar los DataFrames
        dataframes = []
        
        # 4. Leer cada archivo y añadirlo a la lista de DataFrames
        for archivo in lista_archivos:
            df_temp = pd.read_csv(archivo, sep=';', encoding='utf-8')
            dataframes.append(df_temp)
        
        # 5. Concatenar todos los DataFrames de la lista en uno solo
        df_consolidado = pd.concat(dataframes, ignore_index=True)
        
        # 6. Guardar el DataFrame consolidado en un nuevo archivo CSV
        nombre_salida = "ranking_consolidado.csv"
        df_consolidado.to_csv(nombre_salida, index=False, sep=';', encoding='utf-8')
        
        print(f"¡Consolidación completa! Archivo '{nombre_salida}' creado con {len(df_consolidado)} registros de {len(lista_archivos)} archivos.")

    except Exception as e:
        print(f"Ocurrió un error al consolidar los archivos: {e}")

# Ejecutar la función
consolidar_rankings()

¡Consolidación completa! Archivo 'ranking_consolidado.csv' creado con 14116 registros de 85 archivos.
