# Selenium

## 1. Introducción a Selenium
Selenium es un **framework de código abierto** para la **automatización de pruebas** de aplicaciones web. Permite a los desarrolladores y testers simular la interacción del usuario con una aplicación web, facilitando la verificación de su comportamiento.

Originalmente creado por **Jason Huggins** en **2004**, Selenium ha evolucionado a través de diferentes versiones, siendo **Selenium WebDriver** la más utilizada actualmente.

## 2. Arquitectura de Selenium
### Selenium WebDriver
Es el componente central que permite la interacción con los navegadores. A través de un **API común**, permite escribir pruebas en varios lenguajes de programación, incluyendo **Java, Python, C#, Ruby**, entre otros.

### Controladores de navegador
Son programas que actúan como intermediarios entre el **WebDriver** y el navegador. Ejemplos incluyen **ChromeDriver** para Google Chrome y **GeckoDriver** para Mozilla Firefox.

## 3. Funcionalidades clave
- **Automatización de pruebas**: Permite ejecutar pruebas automáticas de aplicaciones web, reduciendo el tiempo y esfuerzo en pruebas manuales.
- **Soporte de múltiples lenguajes**: Selenium soporta varios lenguajes de programación, lo que permite a los equipos usar el lenguaje con el que se sientan más cómodos.
- **Ejecución en diferentes navegadores**: Las pruebas pueden ser ejecutadas en múltiples navegadores (**Chrome, Firefox, Safari**, etc.), garantizando que la aplicación web funcione correctamente en todos ellos.

## 5. Casos de uso
- **Automatización de pruebas**: Ideal para pruebas de **regresión**, pruebas de **carga** y pruebas de **aceptación**.
- **Web Scraping**: Puede ser utilizado para extraer datos de sitios web, aunque se debe tener cuidado con los términos de servicio del sitio.


# obligatorio descargado cromedriver

Pagina enlaces

https://googlechromelabs.github.io/chrome-for-testing/


Descarga directa 

https://storage.googleapis.com/chrome-for-testing-public/131.0.6778.24/win64/chromedriver-win64.zip 

# Ejercicio práctico

In [30]:
#pip install selenium
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
import pandas as pd

# XPATH

XPath (XML Path Language) es un lenguaje utilizado para navegar y seleccionar nodos en un documento XML. Es especialmente útil en el contexto de la automatización de pruebas de aplicaciones web, como Selenium, porque permite localizar elementos dentro del DOM (Document Object Model) de una página web de manera precisa.

En Selenium, XPath se utiliza para identificar y seleccionar elementos web que se pueden interactuar (como botones, campos de texto, etc.). Esto permite a los testers automatizar la interacción con estos elementos y verificar su comportamiento en las pruebas.

//tagname[@AttributeName="Value"]

//tagname[TAG_NAME]

//tagname[class_name]

<article class ="main-article">
    <h1> Titanic(1997) </h1>
    <p class ="plot" > 84 years later... </p>
    <p class ="plot2" > In the end ... </p>
    <div class ="full-script">
    "13 meters. You should see it. "
    "Okay, take her up and over the bow rail. "
    </div>
</article>


https://scrapinghub.github.io/xpath-playground/


En selenium podemos encontrar elementos por ID, nombre, XPath, enlace, texto, nombre de etiqueta, nombre de clase y selectro CSS.
* driver.find_element(By.id,'id')
* driver.find_element(By.class_name,'label') ####('main-article','plot','full-script')
* driver.find_elements(By.TAG_NAME,'tag') ####('h1','p','div')
* driver.find_element(By.XPATH,'//tagname[@AttributeName="Value"]') #list=[a,b,c,d]
* driver.find_element(By.XPATH,'//tagname[@AttributeName="Value"]')

In [50]:
web='https://www.adamchoi.co.uk/overs/detailed'
path="E:\TESIS\webscraping\chromedriver-win64\chromedriver-win64\chromedriver.exe" #ubicación del ejecutable Chromedriver 
service=Service(executable_path=path)
driver = webdriver.Chrome(service=service) #options=webdriver.ChromeOptions().add_argument("--headless")
driver.get(web)

boton=driver.find_element(By.XPATH,'//label[@analytics-event="All matches"]')
boton.click()

filas=driver.find_elements(By.TAG_NAME,'tr')

fecha=[]
local=[]
marcador=[]
visita=[]

for partidos in filas:
    if 'Next match' in partidos.text:
        continue
    fecha.append(partidos.find_element(By.XPATH,'./td[1]').text)
    local.append(partidos.find_element(By.XPATH,'./td[2]').text)
    
    marcador.append(partidos.find_element(By.XPATH,'./td[3]').text)
    visita.append(partidos.find_element(By.XPATH,'./td[4]').text)
   
driver.quit()



#click










  path="E:\TESIS\webscraping\chromedriver-win64\chromedriver-win64\chromedriver.exe" #ubicación del ejecutable Chromedriver


In [53]:
df=pd.DataFrame({'fecha':fecha,'local':local,'marcador':marcador,'visita':visita})

In [54]:
df

Unnamed: 0,fecha,local,marcador,visita
0,16-08-2024,Arsenal,2 - 0,Wolves
1,23-08-2024,Aston Villa,0 - 2,Arsenal
2,30-08-2024,Arsenal,1 - 1,Brighton
3,14-09-2024,Tottenham,0 - 1,Arsenal
4,21-09-2024,Man City,2 - 2,Arsenal
...,...,...,...,...
195,27-09-2024,Wolves,1 - 2,Liverpool
196,04-10-2024,Brentford,5 - 3,Wolves
197,19-10-2024,Wolves,1 - 2,Man City
198,25-10-2024,Brighton,2 - 2,Wolves
