In [22]:
%pip install google-colab-selenium



In [23]:
import google_colab_selenium as gs
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import TimeoutException, NoSuchElementException
import pandas as pd
import time
import os
from google.colab import drive

## **PARTE 1 (SEPTUD Y TEST DE ACCESO A LA PAGINA WEB)**

In [27]:
# CONFIGURACI√ìN INICIAL
def configurar_driver():
    """
    Configura el driver de Chrome con las opciones necesarias para Colab
    """
    print("üîß Configurando el navegador Chrome...")

    chrome_options = Options()
    # Opciones esenciales para Colab
    chrome_options.add_argument("--headless")  # Sin interfaz gr√°fica
    chrome_options.add_argument("--no-sandbox")  # Requerido en Colab
    chrome_options.add_argument("--disable-dev-shm-usage")  # Evita problemas de memoria
    chrome_options.add_argument("--disable-gpu")  # Desactiva GPU para mayor estabilidad
    chrome_options.add_argument("--window-size=1920,1080")  # Tama√±o de ventana est√°ndar

    # Configuraci√≥n para descargas autom√°ticas
    prefs = {
        "download.default_directory": "/content/drive/MyDrive/IDEAM_Datos",
        "download.prompt_for_download": False,
        "download.directory_upgrade": True,
        "safebrowsing.enabled": True
    }
    chrome_options.add_experimental_option("prefs", prefs)

    # Crear el driver
    driver = gs.Chrome(options=chrome_options)
    driver.set_page_load_timeout(30)  # Timeout de 30 segundos para cargar p√°ginas

    print("‚úÖ Navegador configurado correctamente")
    return driver

In [49]:
def montar_google_drive():
    """
    Monta Google Drive y crea la carpeta para los datos del IDEAM
    """
    print("üìÇ Montando Google Drive...")
    drive.mount('/content/drive')

    # Crear carpeta para los datos del IDEAM
    carpeta_datos = '/content/IDEAM_Datos'
    os.makedirs(carpeta_datos, exist_ok=True)
    print(f"‚úÖ Carpeta creada: {carpeta_datos}")

    return carpeta_datos

In [45]:
# FUNCI√ìN PARA MANEJAR LA VENTANA DE T√âRMINOS Y CONDICIONES
def aceptar_terminos_condiciones(driver):
    """
    Maneja la ventana emergente de t√©rminos y condiciones del IDEAM
    Esta es la parte cr√≠tica que estaba fallando
    """
    print("üìã Manejando t√©rminos y condiciones...")

    try:
        # Esperar a que aparezca la ventana modal
        print("‚è≥ Esperando ventana de t√©rminos...")
        modal = WebDriverWait(driver, 15).until(
            EC.presence_of_element_located((By.CLASS_NAME, "dijitDialog"))
        )
        print("‚úÖ Ventana de t√©rminos detectada")

        # Estrategia m√∫ltiple para encontrar y hacer click en el checkbox
        checkbox_encontrado = False

        # Estrategia 1: Por clase CSS espec√≠fica
        try:
            print("üîç Intentando localizar checkbox - Estrategia 1...")
            checkbox = WebDriverWait(driver, 10).until(
                EC.element_to_be_clickable((By.CSS_SELECTOR, 'div.checkbox.jimu-float-leading'))
            )
            checkbox.click()
            print("‚úÖ Checkbox marcado (Estrategia 1)")
            checkbox_encontrado = True
        except:
            print("‚ùå Estrategia 1 fall√≥")

        # Estrategia 2: Por input type checkbox
        if not checkbox_encontrado:
            try:
                print("üîç Intentando localizar checkbox - Estrategia 2...")
                checkbox = driver.find_element(By.CSS_SELECTOR, 'input[type="checkbox"]')
                driver.execute_script("arguments[0].click();", checkbox)
                print("‚úÖ Checkbox marcado (Estrategia 2)")
                checkbox_encontrado = True
            except:
                print("‚ùå Estrategia 2 fall√≥")

        # Estrategia 3: Buscar por texto o etiqueta
        if not checkbox_encontrado:
            try:
                print("üîç Intentando localizar checkbox - Estrategia 3...")
                # Buscar elemento que contenga texto relacionado con aceptaci√≥n
                checkbox = driver.find_element(By.XPATH, "//div[contains(@class, 'checkbox')]")
                driver.execute_script("arguments[0].click();", checkbox)
                print("‚úÖ Checkbox marcado (Estrategia 3)")
                checkbox_encontrado = True
            except:
                print("‚ùå Estrategia 3 fall√≥")

        if not checkbox_encontrado:
            raise Exception("No se pudo encontrar el checkbox de t√©rminos y condiciones")

        # Pausa breve para asegurar que el checkbox se registre
        time.sleep(2)

        # Ahora buscar y hacer click en el bot√≥n "Aceptar"
        print("üîç Buscando bot√≥n Aceptar...")

        # Estrategias m√∫ltiples para el bot√≥n Aceptar
        boton_encontrado = False

        # Estrategia 1: Por nombre
        try:
            boton = WebDriverWait(driver, 15).until(
                EC.element_to_be_clickable((By.CSS_SELECTOR, 'div[title="Aceptar"]'))
            )
            boton.click()
            print("‚úÖ Bot√≥n Aceptar clickeado (por t√≠tulo)")
            boton_encontrado = True
        except:
            print("‚ùå Bot√≥n por nombre no encontrado")

        # Estrategia 2: Por texto del bot√≥n
        if not boton_encontrado:
            try:
                boton = driver.find_element(By.XPATH, '//div[data-dojo-attach-event="onclick:onOkClick"]')
                boton.click()
                print("‚úÖ Bot√≥n Aceptar clickeado (por texto)")
                boton_encontrado = True
            except:
                print("‚ùå Bot√≥n por texto no encontrado")

        # Estrategia 3: Por clase de bot√≥n dijit
        if not boton_encontrado:
            try:
                boton = driver.find_element(By.CSS_SELECTOR, 'div[class="jimu-btn jimu-float-trailing enable-btn"]')
                if 'aceptar' in boton.text.lower():
                    boton.click()
                    print("‚úÖ Bot√≥n Aceptar clickeado (por clase dijit)")
                    boton_encontrado = True
            except:
                print("‚ùå Bot√≥n por clase dijit no encontrado")

        if not boton_encontrado:
            raise Exception("No se pudo encontrar el bot√≥n Aceptar")

        # Esperar a que la ventana se cierre
        print("‚è≥ Esperando que se cierre la ventana...")
        WebDriverWait(driver, 15).until(
            EC.invisibility_of_element((By.CLASS_NAME, "dijitDialog"))
        )

        print("‚úÖ T√©rminos y condiciones aceptados correctamente")
        return True

    except TimeoutException:
        print("‚ö†Ô∏è Timeout: La ventana de t√©rminos no apareci√≥ o no se pudo cerrar")
        return False
    except Exception as e:
        print(f"‚ùå Error al manejar t√©rminos y condiciones: {str(e)}")
        return False


In [46]:
# FUNCI√ìN PRINCIPAL DE NAVEGACI√ìN
def navegar_a_ideam(driver):
    """
    Navega al sitio del IDEAM y maneja la p√°gina inicial
    """
    print("üåê Navegando al sitio del IDEAM...")

    try:
        # Ir a la p√°gina principal
        url = "http://dhime.ideam.gov.co/atencionciudadano/"
        driver.get(url)
        print(f"‚úÖ P√°gina cargada: {url}")

        # Esperar un momento para que la p√°gina se cargue completamente
        time.sleep(3)

        # Manejar t√©rminos y condiciones
        if aceptar_terminos_condiciones(driver):
            print("‚úÖ Acceso concedido al sistema DHIME")
            return True
        else:
            print("‚ùå No se pudo acceder al sistema DHIME")
            return False

    except Exception as e:
        print(f"‚ùå Error al navegar: {str(e)}")
        return False


In [47]:
# FUNCI√ìN DE PRUEBA ESPEC√çFICA PARA TU PROBLEMA
def test_acceso_ideam():
    """
    Funci√≥n de prueba espec√≠fica para verificar el acceso inicial al IDEAM
    """
    print("üß™ INICIANDO PRUEBA DE ACCESO AL IDEAM")
    print("=" * 50)

    driver = configurar_driver()

    try:
        if navegar_a_ideam(driver):
            print("üéâ ¬°√âXITO! Se pudo acceder correctamente al sistema DHIME")

            # Tomar screenshot para verificar
            driver.save_screenshot("screenshot_ideam_acceso.png")
            print("üì∏ Screenshot guardado como evidencia")

            # Esperar un poco para inspeccionar la p√°gina
            time.sleep(5)

            return True
        else:
            print("üí• FALLO: No se pudo acceder al sistema")
            driver.save_screenshot("screenshot_ideam_error.png")
            return False

    finally:
        driver.quit()

In [32]:
# EJEMPLO DE USO
if __name__ == "__main__":
    # Primero ejecutar la prueba de acceso
    print("EJECUTANDO PRUEBA DE ACCESO...")
    test_acceso_ideam()

EJECUTANDO PRUEBA DE ACCESO...
üß™ INICIANDO PRUEBA DE ACCESO AL IDEAM
üîß Configurando el navegador Chrome...


<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

‚úÖ Navegador configurado correctamente
üåê Navegando al sitio del IDEAM...
‚úÖ P√°gina cargada: http://dhime.ideam.gov.co/atencionciudadano/
üìã Manejando t√©rminos y condiciones...
‚è≥ Esperando ventana de t√©rminos...
‚úÖ Ventana de t√©rminos detectada
üîç Intentando localizar checkbox - Estrategia 1...
‚úÖ Checkbox marcado (Estrategia 1)
üîç Buscando bot√≥n Aceptar...
‚ùå Bot√≥n por nombre no encontrado
‚ùå Bot√≥n por texto no encontrado
‚úÖ Bot√≥n Aceptar clickeado (por clase dijit)
‚è≥ Esperando que se cierre la ventana...
‚úÖ T√©rminos y condiciones aceptados correctamente
‚úÖ Acceso concedido al sistema DHIME
üéâ ¬°√âXITO! Se pudo acceder correctamente al sistema DHIME
üì∏ Screenshot guardado como evidencia
