In [141]:
import os
import time
from dotenv import load_dotenv
from selenium import webdriver
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.ui import Select
from selenium.common.exceptions import NoSuchElementException, TimeoutException
from urllib.parse import unquote
import openpyxl
from openpyxl.styles import Font, Color, Alignment, PatternFill

In [142]:
# Cargar las variables de entorno desde el archivo .env
load_dotenv('credenciales_uasd.env')

USUARIO = os.getenv('USUARIO')
CLAVE = os.getenv('CLAVE')

if not USUARIO or not CLAVE:
    raise ValueError("Las variables de entorno USUARIO o CLAVE no están definidas. Por favor, verifica tu archivo 'credenciales_uasd.env'.")

In [143]:
import openpyxl.workbook


class Web_Scrapping:
    def __init__(self):
        
        self.url = 'https://uasd.edu.do/servicios/autoservicio/'
        self.count_test = 1
    
    def __enter__(self):
        self.driver = webdriver.Chrome()
        return self

    def __exit__(self, exc_type, exc_val, exc_tb):
        if self.driver:
            self.driver.quit()
    
    def navegar(self):
        try:
            self.driver.get(self.url)
            
            time.sleep(3)
            
            ver_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[7]/div/div[1]/div/div[3]/a'))
            )
            # Eliminar el atributo target si existe
            self.driver.execute_script("arguments[0].removeAttribute('target');", ver_button)
            
            ver_button.click()
             
            print(f'Test {self.count_test} Pasado')  # Usar self.count_test
            self.count_test += 1 
            
        except(NoSuchElementException, TimeoutException) as e:
            print(f'Hubo un error al navegar en la web: {e}')
    
    def iniciar_sesion(self):
        try:
            username_field = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.ID, 'username'))
            )
            username_field.send_keys(USUARIO)
            
            password_field = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.ID, 'password'))
            )
            password_field.send_keys(CLAVE)
            
            time.sleep(3)
            
            submit_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '//*[@id="loginForm"]/div[3]/div/button'))
            )
            submit_button.click()
            
            print(f'Test {self.count_test} Pasado')  # Usar self.count_test
            self.count_test += 1 
            
            time.sleep(2)
        except Exception as e:
            print(f'Ha ocurrido un error al intentar iniciar sesion {e}')
            
    def main(self): #Todos los procesos antes de ingresar a la pagina principal:
        time.sleep(2)
        try:
            alumno_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[19]/div[3]/div[2]/div[1]/span[2]/span/span[3]/button/div/div/span'))
            )
            alumno_button.click()
            
            inscripcion_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[19]/div[3]/div[2]/div[2]/div/div[1]'))
            )
            inscripcion_button.click()
            
            buscar_clases_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[19]/div[3]/div[2]/div[2]/div/div[4]/ul/li[3]/a'))
            )
            buscar_clases_button.click()
            
        except (NoSuchElementException, TimeoutException) as e:
            print(f'Ha ocurrido un error en el proceso de ingresar a la pagina {buscar_clases_button.text}: {e}')
            
        try:            
            periodo_select = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[3]/div[4]/div[2]/div[1]/div[3]/form/table/tbody/tr/td/select'))
            )
            periodo_select.click()
            
            def seleccionar_periodo(number_option: int):
                try:
                    number_option_int = int(number_option)
                    selector_xpath = f'//td/select/option[{number_option_int}]'
                    
                    periodo_selected_query = WebDriverWait(self.driver, 20).until(
                    EC.element_to_be_clickable((By.XPATH, selector_xpath))
                )
                    periodo_selected_query.click()
                    
                except (NoSuchElementException, TimeoutException) as e:
                    print(f"Error: No se pudo seleccionar el período número {number_option}. Verifique el XPath o el tiempo de espera.")
                    print(f"Detalles del error: {e}")
                    return
            
            seleccionar_periodo(2)
            
            if seleccionar_periodo:
                enviar_submit = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[3]/div[4]/div[2]/div[1]/div[3]/form/button[1]/div/div/div'))
            )
                enviar_submit.click()
                
        except (NoSuchElementException, TimeoutException) as e:
            print(f'Ha ocurrido un error en el proceso de ingresar a la pagina {enviar_submit.text}: {e}')
        
        try:  
            buscar_curso_button_avanzado = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[3]/div[4]/div[2]/div[1]/div[3]/form/button[2]/div/div/div'))
            )
            buscar_curso_button_avanzado.click()
            
            # Seleccionar las materias para buscar clases
            select_element = WebDriverWait(self.driver, 20).until(
                EC.presence_of_element_located((By.XPATH, '//td/select[@id="subj_id"]'))
            )
            
            select = Select(select_element)
            
            # Seleccionar todas las opciones
            for option in select.options:
                select.select_by_value(option.get_attribute('value'))
        
            print("Todas las opciones han sido seleccionadas exitosamente.")
            
            buscar_curso_button = WebDriverWait(self.driver, 20).until(
                EC.element_to_be_clickable((By.XPATH, '/html/body/div[3]/div[4]/div[2]/div[1]/div[3]/form/span/button[1]/div/div/div'))
            )
            buscar_curso_button.click()
            
        except (NoSuchElementException, TimeoutException) as e:
            print("Error: No se pudieron seleccionar las opciones. Verifique el XPath o el tiempo de espera.")
            print(f"Detalles del error: {e}")
            
    def extraer_info(self):
        self.materias = []
        self.nrc = []
        self.creditos = []
        self.dias = []
        self.horas = []
        self.capacidades = []
        self.ubicaciones = []
        
        time.sleep(2)
        
        filas = self.driver.find_elements(By.XPATH, "//tr[position() > 2]")
        
        # Encuentra todos los elementos de texto en las celdas relevantes
        materia_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][8]")
        nrc_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][2]/a[1]")
        credito_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][7]")
        dias_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][9]")
        horas_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][10]")
        capacidad_actual_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][13]")
        ubicacion_elements = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][15]")
        element_identify = self.driver.find_elements(By.XPATH, "//tr[position() > 2]/td[@class='dddefault'][1]")
        
        # Extrae el texto de cada elemento y almacena en la lista
        self.materias = [element.text for element in materia_elements if element.text.strip()]
        self.nrc = [element.text for element in nrc_elements if element.text.strip()]
        self.creditos = [element.text for element in credito_elements if element.text.strip()]
        self.dias = [element.text for element in dias_elements if element.text.strip()]
        self.horas = [element.text for element in horas_elements if element.text.strip()]
        self.capacidades = [element.text for element in capacidad_actual_elements if element.text.strip()]
        self.ubicaciones = [element.text for element in ubicacion_elements if element.text.strip()]
        
        if 'PA' in self.ubicaciones:
            indice = self.ubicaciones.index('PA')
            self.ubicaciones[indice] = 'Por Anunciar'
        
        for i in range(3, enumerate(filas)):
            
            
    def guardar_info(self, filename):
        
        # Crear un nuevo libro de trabajo y una hoja
        workbook = openpyxl.Workbook()
        sheet = workbook.active
        sheet.title = 'Buscador Materia'
        
        header = ['Materias', 'NRC', 'Créditos', 'Días', 'Hora', 'Capacidad Actual', 'Ubicación']
        sheet.append(header)
        
        try:
            for materia, NRC, credito, dia, hora, capacidad, ubicacion in zip(self.materias, self.nrc, self.creditos, self.dias, self.horas, self.capacidades, self.ubicaciones):
                sheet.append([materia, NRC, credito, dia, hora, capacidad, ubicacion])
        except:
            print(f'Hubo un error al intentar guardar el archivo: {filename}')
            
        # Guardar el archivo
        workbook.save(filename)
        print("Archivo guardado como 'materias.xlsx'")
                
        

            
                
                

        
            
    

In [144]:
class Materia:
    def __init__(self):
     self_materia_info = []
     
    def armar_horario(self):
        self.materia = str(input('Inserta el nombre de la materia o codigo que deseas seleccionar: '))
        
        
        
        
        

In [145]:
try:
    with Web_Scrapping() as web_scrapper:
        web_scrapper.navegar()
        web_scrapper.iniciar_sesion()
        web_scrapper.main()
        web_scrapper.extraer_info()
        web_scrapper.guardar_info('materias.xlsx')
        
except Exception as e:
    print(f'Ha ocurrido un error, verificar el problema: {e}')

Test 1 Pasado
Test 2 Pasado
Todas las opciones han sido seleccionadas exitosamente.
Archivo guardado como 'materias.xlsx'
