# Automatización web (webdrivers) con Selenium

Pre-requisitos:

* instalar **selenium** (pip)
* descargar el webdriver **chromedriver**: http://chromedriver.chromium.org/downloads (importante marcarlo como ejecutable)
* tener **Google Chrome o Chromium** instalado en el sistema

Inicialización:

* Importar selenium.webdriver
* Inicializar el navegador
* Abrir una página (p.ej. https://www.google.es)

In [31]:
from selenium import webdriver
browser = webdriver.Chrome(
    executable_path="/home/david/Webdrivers/chromedriver" #Ruta al binario del webdriver descargado
)
browser.get("https://www.google.es")

Vamos a realizar una búsqueda desde nuestro webdriver. Al igual que en el scraping, necesitamos localizar los elementos sobre los que interactuar.

Empecemos por el recuadro de búsqueda. Es un input con la id **#lst-ib**.

In [32]:
cuadro = browser.find_element_by_id("lst-ib")
print(cuadro)

#Si un elemento no existe salta una excepción
print("A continuación saltará una excepción porque no se encuentra un elemento en la página:")
prueba = browser.find_element_by_id("holaquetal")

<selenium.webdriver.remote.webelement.WebElement (session="a2f5bb9757def3d9e19f9440fd524276", element="0.28612309395175894-1")>
A continuación saltará una excepción porque no se encuentra un elemento en la página:


NoSuchElementException: Message: no such element: Unable to locate element: {"method":"id","selector":"holaquetal"}
  (Session info: chrome=66.0.3359.181)
  (Driver info: chromedriver=2.35.528139 (47ead77cb35ad2a9a83248b292151462a66cd881),platform=Linux 4.13.0-45-generic x86_64)


Ahora vamos a escribir lo que queremos buscar y pulsar Enter.

In [33]:
#Escribimos el término de búsqueda en el cuadro de texto
cuadro.send_keys("tutoriales de python")

Para pulsar teclas como Enter hay que importar las Keys desde Selenium

In [34]:
from selenium.webdriver.common.keys import Keys

#Pulsamos Enter
cuadro.send_keys(Keys.ENTER)

Selenium permite hacer scraping de la página (aunque si lo quisiéramos podríamos usar otras librerías como BeautifulSoup4 o requests-html). Vamos a buscar todos los resultados y listar sus nombres y URLs, teniendo en cuenta que:

* Los resultados de búsqueda aparecen en un div con id **#ires**
* Cada resultado aparece dentro de un div con clase **.rc**
* Cada enlace aparece dentro de un <h3> de clase **.r**
* El enlace contiene tanto la URL como el texto (lo que queremos obtener)


In [39]:
resultados = browser.find_element_by_id("ires")
enlaces_h3 = resultados.find_elements_by_class_name("r")
print("He encontrado {} enlaces".format(len(enlaces_h3)))
#Ahora mismo tenemos los <h3> dentro de los cuales se encuentran los enlaces

#Ahora vamos a sacar de los propios enlaces <a> la URL (href) y el texto
enlaces = [e.find_element_by_tag_name("a") for e in enlaces_h3]
for e in enlaces:
    url = e.get_attribute("href")
    texto = e.text
    print("{} -> {}".format(texto, url))

He encontrado 6 enlaces
Tutorial de Python (y Django!) en Español -> http://docs.python.org.ar/tutorial/
Tutorial Python: Un tutorial de Python diferente -> https://www.tutorialpython.com/
Tutorial python desde cero --> 2.7 - Mi diario Python -> http://www.pythondiario.com/p/tutorial-python-desde-cero.html
Tutorial de Python - Mundo geek -> http://mundogeek.net/tutorial-python/
SpanishLanguage - Python Wiki -> https://wiki.python.org/moin/SpanishLanguage
Ocho canales de YouTube para aprender Python desde cero hasta ... -> https://www.genbeta.com/herramientas/ocho-canales-de-youtube-para-aprender-python-desde-0-hasta-nivel-experto


Por último, vamos a pulsar sobre uno de los enlaces localizados

In [40]:
enlace = enlaces[0]
enlace.click()