# Trabajo Practico Automatización Web

---


| **Universidad** | Universidad Nacional del Oeste                                                       |
| --              | --                                                                                   |
| **Carrera**     | Tec. Univ. en Tecnologías Web                                                        |
| **Materia**     | Taller de Lenguajes                                                                  |
| **Profesores**  | Mg. Ing. Pablo Pandolfo / Anta. Alex Andrada                                         |
| **Alumnos**     | Grupo 2: Álvarez Santiago, Calegari Luis, Clavero Triana, Contreras Ricardo, Vessoni Agustin                                          |
| **Fecha**       | Noviembre 2025                                                                       |


## ¿Qué es la Automatización Web?

La Automatización Web es una disciplina que utiliza software (bots o scripts) para realizar acciones, tareas y procesos predefinidos en un navegador web o aplicacion, simulando el comportamiento de un usuario humano. Su objetivo principal es reducir el esfuerzo manual, aumentar la velocidad de ejecución y mejorar la precisión en tareas repetitivas.  

## Aplicaciones Clave de la Automatización Web
1. **Pruebas de Software (QA)**: Simulación del recorrido del usuario para garantizar la funcionalidad y compatibilidad de las aplicaciones web (pruebas de regreción). 
2. **RPA (Rpbotic Process Automation)**: Automatización de flujos de trabajo de negocio, como llenado de formularios o la transferencia de datos entre sistemas.
3. **Web Scraping**: Extraccion de datos especificos de sitios web para análisis o inteligencia competitiva.
4. **Monitoreo y Alertas**: Verificación periódica del estado de servicios y sitios web para detectar fallos o cambios de rendimiento.
5. **Generación de Datos**: Creación masiva y automatizada de cuentas o datos de prueba para inicializar entornos de desarrollo.

## ¿Cómo funciona la Automatización Web?
El proceso de automatización sigue una serie de pasos técnicos que permiten al software interactuar con la página web de forma programática:
1. **Seleccion de Herramientas**: Se elige un lenguaje de programación (como Python o JavaScript) y un framework de automatización (como Selenium o Playwright).
2. **Acceso al Recurso Web**: El script utiliza el framework para lanzar y controlar un navegador (Chrome, Firefox, etc.), que puede ejecutarse en modo visible o en modo headless (sin interfaz gráfica).
3. **Localización de Elementos**: El paso clave es identificar los elementos de la página (botones, campos de texto, enlaces) mediante sus atributos únicos, como `ID`, `class` o `XPath`.
4. **Simulación de Acciones**:Una vez que el elemento es localizado, el script simula acciones del usuario:
    * __Clics__: Simular la pulsación en botones o enlaces.
    * __Entrada da Datos__: Enviar cadenas de texto a campos de formulario.
    * __Navegación__: Instruir al navegador para ir a una nueva URL.
5. **Validación y Reporte**: En el contexto de QA o RPA, el script verifica el resultado de la acción (por ejemplo, si la URL cambió o si apareció un mensaje de éxito) y reporta si el proceso fue exitoso.

El código actúa como un control remoto del navegador, enviando comandos al WebDriver que a su vez ejecuta las acciones deseadas en el DOM (Modelo de Objetos del Documento) de la página.


## Herramientas y sus diferencias
La elección de la herramienta depende del objetivo: pruebas funcionales (QA), flujos de trabajo empresariales (RPA) o automatización rápida. Las principales opciones son:

1. **Selenium**
    - Enfoque: Principalmente Pruebas de QA y automatización cross-browser.
    - Mecanismo: Utiliza el protocolo WebDriver para comunicarse con el navegador.
    - Pros: Gran comunidad, soporta múltiples lenguajes (Python, Java, C#, etc.).
    - Contras: Puede ser más lento y requiere gestionar drivers externos.

2. **Playwright**
    - Enfoque: Alta eficiencia en QA y desarrollo.
    - Mecanismo: Comunicación directa y rápida, con soporte nativo para Chromium, Firefox y WebKit desde una sola API.
    - Pros: Rápido, maneja interacciones complejas (iframes, downloads) y ofrece auto-wait.

3. **Cypress**
    - Enfoque: Pruebas End-to-End (E2E) y desarrollo front-end.
    - Mecanismo: Se ejecuta dentro del navegador (a diferencia de Selenium/Playwright que se ejecutan fuera), lo que permite un control más nativo del DOM.
    - Pros: Excelente experiencia de desarrollador, depuración simple y rápida, ideal para pruebas.
    - Contras: Solo soporta JavaScript/TypeScript y está limitado a navegadores basados en Chromium/Firefox (no sopbra soporte para Safari/WebKit completo).

4. **Puppeteer**
    - Enfoque: Automatización sin interfaz gráfica (headless) y pruebas centradas en Google Chrome/Chromium.
    - Mecanismo: Una librería de Node.js que usa el protocolo DevTools para controlar el navegador.
    - Pros: Muy rápido y eficiente para tareas que solo necesitan Chrome/Chromium (como generación de PDFs o pruebas de rendimiento).
    - Contras: Históricamente limitado a Chromium (aunque ha ampliado el soporte), requiere JavaScript.

5. **Plataformas RPA** 
    - Enfoque: Automatización de procesos de negocio complejos (web, escritorio y sistemas internos).
    - Mecanismo: Utiliza un entorno visual de bajo código (Low-Code) para construir flujos (ej. Microsoft Power Automate).

|Caracteristica   |    Selenium                   |Playwright|Cypress|Puppeteer|RPA (Ej. Power Automate)
|       :---:     |       :---:                   |:---:     | :---:     | :---:     | :---:     | 
|**Uso Principal**| QA / Cross-Browser            |QA / Alto Rendimiento| Pruebas E2E (Front-end)|Automatización Headless|Flujos de Negocio|
|**Lenguaje Base**| Múltiples (Python, Java, etc.)|Múltiples (Python, JS)|JavaScript/TypeScript|JavaScript/TypeScript|Low-Code / Visual|
|**Mecanismo**    | WebDriver Protocol            |Direct Protocol|Dentro del Navegador|DevTools Protocol|Integrado / Visual|
|**Costo**        | Código Abierto                |Código Abierto|Código Abierto|Código Abierto|Licencias de Pago|
                                                                    

## Scripts Ejecutables: Demostración Funcional
Utilizaremos **Python** como lenguaje base por su sintaxis legible y su amplio ecosistema de librerías. La herramienta central para la automatización será **Selenium WebDriver**.

### Preparación del entorno
Esta celda instalará las librerías necesarias para ejecutar los ejemplos.

In [None]:
# Instalar Selenium y el gestor de drivers de Chrome (para simplificar la configuración)
print("Instalando librerías necesarias...")
%pip install selenium webdriver-manager
print("Instalación completada.")

# Importar las clases y módulos clave para la automatización
from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time 

print("Librerías importadas correctamente. Listos para automatizar.")

### Simulación de Prueba de Software (QA)
Este ejemplo demuestra una simulación de prueba de funcionalidad para validar que un enlace funciona correctamente y navega a la URL esperada.

**Tarea**: Navegar a [uno.edu.ar](https://uno.edu.ar/), localizar el enlace de "Ingreso a la UNO", hacer clic y verificar la nueva URL.

In [None]:
# --- Configuración e Inicio ---
URL_INICIAL = "https://uno.edu.ar/"
driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))
driver.get(URL_INICIAL) 

print(f"1. Navegador iniciado y navegando a: {URL_INICIAL}")
time.sleep(2) # Pausa visual

# --- Proceso de Interacción (Simulación QA) ---
try:
    # 2. Localizar el enlace con el texto exacto (By.LINK_TEXT)
    enlace_info = driver.find_element(By.LINK_TEXT, "Ingreso a la UNO")

    print("2. Encontrado el enlace para 'Ingreso a la UNO'")

    # 3. Hacer clic en el enlace
    enlace_info.click()
    print("3. Clic realizado. Esperando la carga de la nueva página...")
    
    time.sleep(3) 

    # 4. Verificación (Prueba de Aserción Simple): Verificar que la URL cambió
    url_final = driver.current_url
    print(f"4. URL final tras el clic (Verificación): {url_final}")
    
    if url_final != URL_INICIAL:
        print("Resultado QA: La navegación fue exitosa.")
    else:
        print("Resultado QA: La navegación falló o la URL no cambió.")

except Exception as e:
    print(f"Error durante la prueba de software: {e}")

finally:
    # --- Finalización ---
    driver.quit()
    print("5. Navegador cerrado. Demostración de Prueba de Software completada.")

### Simulación llenado de Formulario (RPA)
Este ejemplo simula una tarea de Automatización Robótica de Procesos (RPA): ingresar datos en un campo de búsqueda y enviar la solicitud, un proceso fundamental en la automatización de flujos de trabajo.

**Tarea**: Abrir el sitio [uno.edu.ar](https://uno.edu.ar/), ingresar un texto en el campo de búsqueda y simular la pulsación de la tecla "Enter".

In [None]:
# --- Configuración e Inicio ---
URL_FORMULARIO = "https://uno.edu.ar/"
TERMINO_BUSQUEDA = "Inscripciones"

driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))
driver.get(URL_FORMULARIO) 
print(f"1. Abriendo sitio UNO: {URL_FORMULARIO}")

# --- Proceso de Interacción (RPA) ---
try:
    # 2. Localizar el campo de búsqueda (usando By.NAME='searchword')
    campo_busqueda = driver.find_element(By.NAME, "searchword")
    
    # 3. Ingresar el texto
    campo_busqueda.send_keys(TERMINO_BUSQUEDA)
    print(f"2. Ingresando texto: '{TERMINO_BUSQUEDA}'")
    
    # 4. Enviar el formulario/búsqueda
    campo_busqueda.send_keys(Keys.ENTER)
    
    print("3. Búsqueda enviada. Esperando resultados...")
    
    # 5. Pausa para mostrar la acción
    time.sleep(5) 

except Exception as e:
    print(f"Error en la interacción del formulario: {e}")

finally:
    # --- Finalización ---
    driver.quit()
    print("4. Navegador cerrado. Demostración de Llenado de Formulario (RPA) completada.")

## Consideraciones Legales y Éticas de la Automatización Web

La automatización de procesos web debe llevarse a cabo respetando las leyes y los términos de servicio para evitar problemas legales o el bloqueo de los bots. Las consideraciones clave incluyen:

1. Respeto a los Términos de Servicio (ToS)
    - **Política Anti-Scraping**: La mayoría de los sitios web prohíben explícitamente el scraping masivo o automatizado de datos en sus Términos de Servicio. Aunque tu informe no lo ejecuta, la automatización en general debe evitar violar estas cláusulas.

    - **Velocidad y Carga del Servidor**: Ejecutar scripts demasiado rápido puede sobrecargar el servidor del sitio web. Éticamente, se debe limitar la velocidad de las peticiones para no causar una Denegación de Servicio (DoS) involuntaria.

2. Privacidad y Regulación de Datos (GDPR, CCPA)
    - **Datos Personales**: Al automatizar flujos de trabajo (RPA) que involucran formularios, se debe garantizar que la recopilación y el manejo de cualquier Dato Personal Identificable (DPI) cumpla con regulaciones como el GDPR (Europa) o CCPA (California), incluso si la automatización es interna.

    - **Consentimiento**: Si la automatización implica la creación de cuentas o la participación en servicios, debe haber un proceso claro de consentimiento.

3. Normas Técnicas para Bots
    - **Archivo robots.txt**: Este archivo (disponible en la raíz de la mayoría de los dominios, ej: uno.edu.ar/robots.txt) indica a los bots cuáles secciones del sitio web no deben ser accedidas o rastreadas. Todo bot ético debe leer y respetar estas directivas antes de iniciar la automatización.

    - **Identificación (User-Agent)**: Los bots deben usar un User-Agent que los identifique claramente (por ejemplo, "MiAutomatizacion-Python") en lugar de pretender ser un navegador humano, lo que facilita que los administradores web los contacten o los gestionen.

4. Ética y Transparencia
    - **Competencia Justa**: No se debe utilizar la automatización para obtener ventajas desleales (ej. acaparar productos en una venta limitada) o para realizar ataques de suplantación de identidad.

    - **Impacto Social**: Se debe considerar el impacto laboral y social de la automatización. El objetivo ético debe ser aumentar la productividad y liberar a los empleados de tareas tediosas, no simplemente eliminar puestos de trabajo.