In [62]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import pandas as pd

In [63]:
# Configuración del controlador de Selenium
driver = webdriver.Chrome()

# URL de la página principal del catálogo BESS
url = 'http://basebe.obspm.fr/basebe/'

In [None]:
try:
    # Abrir la página principal
    driver.get(url)
    print("Página principal abierta.")
    driver.save_screenshot('main_page.png')
    print("Captura de pantalla guardada como 'main_page.png'.")

    # Cambiar el contexto al frame que contiene el menú
    driver.switch_to.frame(driver.find_element(By.NAME, "vide"))
    print("Cambio de contexto al frame 'vide'.")
    driver.save_screenshot('frame_vide.png')
    print("Captura de pantalla guardada como 'frame_vide.png'.")

    # Navegar a la sección "Be stars"
    be_stars_link = WebDriverWait(driver, 20).until(
        EC.element_to_be_clickable((By.LINK_TEXT, "Be stars"))
    )
    be_stars_link.click()
    print("Navegación hacia 'Be stars' completada.")
    driver.save_screenshot('be_stars_page.png')
    print("Captura de pantalla guardada como 'be_stars_page.png'.")

    # Cambiar el contexto al frame principal después de la navegación
    driver.switch_to.default_content()
    driver.switch_to.frame(driver.find_element(By.NAME, "main"))
    print("Cambio de contexto al frame 'main'.")
    driver.save_screenshot('frame_main.png')
    print("Captura de pantalla guardada como 'frame_main.png'.")

    # Esperar a que la página de "Be stars" cargue y seleccionar "All Be stars" en el campo "Stellar type"
    stellar_type_select = WebDriverWait(driver, 20).until(
        EC.presence_of_element_located((By.NAME, "req_category"))
    )
    stellar_type_select.send_keys("All Be stars")
    print("'All Be stars' seleccionado en 'Stellar type'.")
    driver.save_screenshot('stellar_type_selected.png')
    print("Captura de pantalla guardada como 'stellar_type_selected.png'.")

    # Encontrar y hacer clic en el botón de submit
    submit_button = driver.find_element(By.NAME, "req_submit")
    submit_button.click()
    print("Formulario enviado.")

    # Cambiar el contexto al frame que contiene los resultados de la búsqueda
    driver.switch_to.default_content()
    driver.switch_to.frame(driver.find_element(By.NAME, "main"))
    print("Cambio de contexto al frame 'main' después de la búsqueda.")
    driver.save_screenshot('results_frame.png')
    print("Captura de pantalla guardada como 'results_frame.png'.")

    # Esperar a que la tabla de resultados esté presente en la página
    table = WebDriverWait(driver, 20).until(
        EC.presence_of_element_located((By.TAG_NAME, "table"))
    )
    print("Tabla de resultados encontrada.")
    driver.save_screenshot('results_page.png')
    print("Captura de pantalla guardada como 'results_page.png'.")

    # Extraer los datos de la tabla
    rows = table.find_elements(By.TAG_NAME, "tr")
    data = []
    headers = [header.text for header in rows[0].find_elements(By.TAG_NAME, "th")]

    for row in rows[1:]:
        cells = row.find_elements(By.TAG_NAME, "td")
        data.append([cell.text for cell in cells])

    # Convertir los datos a un DataFrame de pandas
    df = pd.DataFrame(data, columns=headers)

    # Guardar el DataFrame en un archivo CSV
    df.to_csv('bess_catalog.csv', index=False)
    print("Datos guardados en 'bess_catalog.csv'.")

except Exception as e:
    print(f"Ocurrió un error: {e}")
    driver.save_screenshot('error_screenshot.png')
    print("Captura de pantalla guardada como 'error_screenshot.png'.")

finally:
    driver.quit()

Página principal abierta.
Captura de pantalla guardada como 'main_page.png'.
Cambio de contexto al frame 'vide'.
Captura de pantalla guardada como 'frame_vide.png'.


In [61]:
# Verificar que la solicitud fue exitosa
if search_response.status_code == 200:
    print("Consulta de búsqueda exitosa.")
    # Parsear el contenido HTML de la respuesta de búsqueda
    search_soup = BeautifulSoup(search_response.content, 'html.parser')

    # Imprimir el contenido HTML de la respuesta para depuración
    print(search_soup.prettify())

    # Encontrar la tabla de resultados
    table = search_soup.find('table')
    if table:
        print("Tabla encontrada.")
        # Extraer los datos de la tabla
        rows = table.find_all('tr')
        data = []
        headers = [header.text for header in rows[0].find_all('th')]

        for row in rows[1:]:
            cells = row.find_all('td')
            data.append([cell.text for cell in cells])

        # Convertir los datos a un DataFrame de pandas
        df = pd.DataFrame(data, columns=headers)

        # Guardar el DataFrame en un archivo CSV
        df.to_csv('bess_catalog.csv', index=False)
        print("Datos guardados en 'bess_catalog.csv'.")
    else:
        print("No se encontró la tabla de resultados.")
else:
    print("Error en la consulta de búsqueda.")

Consulta de búsqueda exitosa.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
"http://www.w3.org/TR/html4/frameset.dtd">
<html>
 <head>
  <link href="Images/bess.ico" rel="SHORTCUT ICON" type="image/x-icon"/>
  <title>
   BeSS Database
  </title>
 </head>
 <frameset rows="170, *">
  <frameset cols="170,*, 170">
   <frame frameborder="0" marginheight="2" marginwidth="2" name="logobess" scrolling="no" src="/basebe/LogoBeSS.html"/>
   <frame frameborder="0" name="bandeau" scrolling="no" src="/basebe/Bandeau.php?flag_lang=en"/>
   <frame frameborder="0" marginheight="2" marginwidth="2" name="logoobs" scrolling="no" src="/basebe/LogoObs.html"/>
  </frameset>
  <frameset cols=" *">
   <frame frameborder="0" name="vide" scrolling="no" src="/basebe/MenuIntro.php?flag_lang=en"/>
  </frameset>
  <noframes>
   <h1>
    Votre Navigateur ne gere pas les cadres
   </h1>
  </noframes>
 </frameset>
</html>

No se encontró la tabla de resultados.
