Selenium es una librería de software de código abierto que se utiliza para automatizar pruebas en aplicaciones web. Permite a los desarrolladores escribir scripts en varios lenguajes de programación, como Java, Python, C#, Ruby, y JavaScript, para simular la interacción de un usuario con un navegador web.

La principal aplicación de Selenium es la automatización de pruebas funcionales para aplicaciones web, lo que significa que puedes escribir scripts para realizar acciones como hacer clic en botones, rellenar formularios, navegar por páginas web y verificar resultados. Esto es útil para garantizar que las aplicaciones web se comporten según lo esperado y para identificar posibles problemas o errores.

Selenium se compone de varias herramientas, siendo Selenium WebDriver la parte más destacada. WebDriver proporciona una interfaz de programación para interactuar con los navegadores web de manera programática. También hay otros componentes en el conjunto de herramientas de Selenium, como Selenium Grid, que permite ejecutar pruebas en paralelo en múltiples máquinas.

Además de las pruebas automatizadas, Selenium también se utiliza en la automatización de tareas repetitivas en navegadores web y en la realización de pruebas de carga y rendimiento. Su versatilidad y compatibilidad con diversos navegadores hacen que sea una herramienta popular en el ámbito del desarrollo web y la calidad del software. 

In [7]:
"""Accediendo a datos básicos"""

from selenium import webdriver

driver = webdriver.Chrome()
url_page = "https://www.techwithtim.net"
driver.get(url_page)

print(f'Título: {driver.title}')
print(f'url actual: {driver.current_url}')
print("html de la página:")
print(driver.page_source)

# Cerrar el navegador
driver.quit()

Título: Tech with Tim | Your ultimate resource for learning to code
url actual: https://www.techwithtim.net/
html de la página:
<html lang="en"><head><meta charset="utf-8"><title>Tech with Tim | Your ultimate resource for learning to code</title><meta name="description" content="Python and Java programming tutorials by Tim Ruscica. Featuring web development, machine learning and data science."><meta name="keywords" content="python, java, programming, tutorials, web development, machine learning, data science, tech with tim"><meta name="og:title" property="og:title" content="Tech with Tim | Your ultimate resource for learning to code"><meta name="og:description" property="og:description" content="Python and Java programming tutorials by Tim Ruscica. Featuring web development, machine learning and data science."><meta name="viewport" content="width=device-width, initial-scale=1"><link rel="icon" href="/favicon.ico"><meta name="next-head-count" content="8"><link rel="preload" href="/_next

### find_elements

Ésta función se utiliza para encontrar múltiples elementos en una página web que coincidan con un criterio específico. Esta función retorna una lista de objetos WebElement que representan los elementos encontrados. Función y sus parámetros:

```python
find_elements(by, value)
```

**by:** Este parámetro especifica el criterio de búsqueda que se utilizará para localizar los elementos. Puede tomar los siguientes valores, entre otros:

- **"id":** Busca elementos por su atributo id.
- **"name":** Busca elementos por su atributo name.
- **"class name":** Busca elementos por sus clases CSS.
- **"tag name":** Busca elementos por su nombre de etiqueta HTML.
- **"xpath":** Utiliza expresiones XPath para localizar elementos.
- **"css selector":** Utiliza selectores CSS para localizar elementos.
- **"link text":** Busca elementos mediante el texto completo de un enlace.
- **"partial link text":** Busca elementos mediante una parte del texto de un enlace.

**value:** Este parámetro es el valor asociado al criterio de búsqueda. Por ejemplo, si by es "id", entonces value sería el valor del atributo id que estás buscando.

In [9]:
from selenium import webdriver
driver = webdriver.Chrome()

url_page = "https://www.techwithtim.net"
driver.get(url_page)

# Encontrar todo el texto dentro de los div en la página
divs_text = driver.find_elements("tag name", "div")

# Iterar sobre los elementos div e imprimir su texto
for texto in divs_text:
    print(texto.text)

# Cerrar el navegador
driver.quit()

Tech with Tim
your ultimate resource for learning to code
Tutorials
Clear, concise, and easy to follow with step by step instructions to guide you through each lesson.
Code Jams
Put your skills to the test with our coding challenges for a chance to win real cash prizes!
Courses
For those who want to dive deeper in the world of programming and become true Software Engineers!
Browse through a variety of topics
Python
Java
Game Development
Machine Learning
Web Development
Discord.py
Beginner
Intermediate
Advanced
Meet Tim Ruscica
Programming Youtuber with over 1 million subscribers
I'm Tim Ruscica, a software developer and content creator behind the Tech With Tim YouTube channel.
I love sharing my knowledge and helping people achieve their goals. Whether you're just starting out or looking to improve your skills, I've got you covered with easy-to-follow tutorials and tips.
Join our community and start your journey today!
YouTube
Access the latest video tutorials, coding challenges, and li

Para acceder a lementos específicos podemos ir al navegador e inspeccionar la página, una vez que identifiquemos el elemento podemos copiar el XPATH y obtener la ruta 

In [19]:
from selenium import webdriver
from selenium.webdriver.common.by import By

driver = webdriver.Chrome()

url_page = "https://www.techwithtim.net"
driver.get(url_page)

# Encontrar todo el texto dentro de los div en la página
divs_text = driver.find_elements(By.XPATH, '//*[@id="__next"]/main/div/div/div[4]/div')

# Iterar sobre los elementos div e imprimir su texto
for texto in divs_text:
    print(texto.text)

# Cerrar el navegador
driver.quit()

Programming Youtuber with over 1 million subscribers
I'm Tim Ruscica, a software developer and content creator behind the Tech With Tim YouTube channel.
I love sharing my knowledge and helping people achieve their goals. Whether you're just starting out or looking to improve your skills, I've got you covered with easy-to-follow tutorials and tips.


Si queremos descargar una imagen

In [22]:
from selenium import webdriver
from selenium.webdriver.common.by import By
import requests

driver = webdriver.Chrome()

url_page = "https://www.techwithtim.net"
driver.get(url_page)

# Encontrar el elemento de la imagen por su XPath
imagen_element = driver.find_element(By.XPATH, '//*[@id="__next"]/main/div/div/div[4]/div/img')

# Obtener la URL de la imagen
url_imagen = imagen_element.get_attribute('src')

# Descargar la imagen utilizando requests
response = requests.get(url_imagen)

# Guardar la imagen en un archivo local
with open('imagen.jpg', 'wb') as f:
    f.write(response.content)

# Cerrar el navegador
driver.quit()


Si queremos descargar todas las imágenes

In [26]:
from selenium import webdriver
from selenium.webdriver.common.by import By
import os

driver = webdriver.Chrome()
url_page = "https://www.skatefactory.com.mx/collections/patinetas-completas"
driver.get(url_page)

# Encuentra todos los elementos de imágenes en la página
elementos_imagenes = driver.find_elements(By.TAG_NAME, 'img')

# Directorio donde se guardarán las imágenes descargadas
directorio_destino = "imagenes_descargadas"

# Crea el directorio si no existe
if not os.path.exists(directorio_destino):
    os.makedirs(directorio_destino)

# Itera sobre los elementos de imágenes y las descarga
for i, elemento_imagen in enumerate(elementos_imagenes):
    url_imagen = elemento_imagen.get_attribute('src')
    
    if url_imagen:
        # Descarga la imagen utilizando requests
        response = requests.get(url_imagen)

        # Guarda la imagen en un archivo local
        nombre_archivo = f"imagen_{i + 1}.jpg"
        ruta_archivo = os.path.join(directorio_destino, nombre_archivo)
        
        with open(ruta_archivo, 'wb') as f:
            f.write(response.content)

# Cierra el navegador
driver.quit()

De igual manera si son audios

In [30]:
from selenium import webdriver
import requests
import os
import time

driver = webdriver.Chrome()
url_page = "https://www.soundhelix.com/audio-examples"
driver.get(url_page)

# Espera 2 seg para asegurar que la página cargue
time.sleep(2)

# Encuentra el enlace al archivo de audio
enlace_audio = driver.find_element("tag name", "audio").find_element("tag name", "source").get_attribute("src")

# Descarga el audio 
response = requests.get(enlace_audio)

# Guarda el archivo 
directorio_destino = "audios_descargados"
if not os.path.exists(directorio_destino):
    os.makedirs(directorio_destino)

nombre_archivo = "audio_prueba.mp3"
ruta_archivo = os.path.join(directorio_destino, nombre_archivo)

with open(ruta_archivo, 'wb') as f:
    f.write(response.content)

driver.quit()

# Puedes reproducir el audio con la biblioteca playsound
#from playsound import playsound
#playsound(ruta_archivo)

Realizando busquedas en Google

In [34]:
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time

driver = webdriver.Chrome()

# Lista de consultas de búsqueda
consultas = ["Ejemplo de búsqueda 1", "Ejemplo de búsqueda 2", "Ejemplo de búsqueda 3"]

# Navegar a la página de Google
driver.get("https://www.google.com")

# Iterar sobre las consultas de búsqueda
for consulta in consultas:
    # Encontrar el campo de búsqueda por su nombre (puede variar en diferentes momentos)
    campo_busqueda = driver.find_element("name", "q")

    # Borrar el contenido actual del campo de búsqueda
    campo_busqueda.clear()

    # Escribir la nueva consulta de búsqueda
    campo_busqueda.send_keys(consulta)

    # Presionar Enter para realizar la búsqueda
    campo_busqueda.send_keys(Keys.RETURN)

    # Esperar 5 segundos
    time.sleep(5)

# regresa a la página anterior
driver.execute_script("window.history.go(-1)")

time.sleep(5)
    
# Cerrar el navegador
driver.quit()