# Tutorial sulla libreria Selenium in Python

### Prima installiamo la libreria con pip

In [None]:
!pip install -U selenium

### Procediamo con l'importazione delle librerie necessarie

In [29]:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
import time

### Configuriamo ora il WebDriver con Chrome

In [30]:
def setup_driver():
    """
    Configura e restituisce un'istanza del WebDriver di Chrome.
    """
    #chrome_options = Options()
    #chrome_options.add_argument("--headless")  # Esecuzione in background
    #driver = webdriver.Chrome(options=chrome_options)
    driver = webdriver.Chrome()
    return driver

#### In questa cella abbiamo creato una funzione nella quale:
- Avviamo il webdriver con chrome per poter interagire con le pagine web;
- Volendo possiamo impostare varie opzioni tra cui la possibilità di eseguire il tutto in modalità headless.

### Ora partiamo con i primi comandi per la navigazione di base

In [31]:
def basic_navigation(driver):
    """
    Dimostra la navigazione di base con Selenium.
    """
    driver.get("https://www.python.org")
    print(f"Titolo della pagina: {driver.title}")
    time.sleep(5)
    search_bar = driver.find_element(By.NAME, "q")
    search_bar.clear()
    search_bar.send_keys("selenium" + Keys.RETURN)
    
    WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.CLASS_NAME, "list-recent-events"))
    )
    time.sleep(5)
    driver.quit()
    print("Ricerca completata")

#### In questa cella abbiamo creato una funzione in cui:
- driver.get() naviga a un URL specifico.
- find_element() trova elementi nella pagina usando vari metodi (NAME, ID, CLASS_NAME, ecc.).
- send_keys() simula l'input da tastiera.
- WebDriverWait implementa un'attesa esplicita per assicurarsi che certi elementi siano caricati.

### Iniziamo ora a testare le prime 2 funzioni:

In [18]:
driver = setup_driver()

basic_navigation(driver)

Titolo della pagina: Welcome to Python.org
Ricerca completata


### Creiamo ora una funzione per interagire con gli elementi della pagina

In [38]:
def interact_with_elements(driver):
    """
    Dimostra l'interazione con vari elementi della pagina.
    """
    driver.get("https://www.python.org")
    time.sleep(5)
    # Clic su un link
    about_link = driver.find_element(By.ID, "about")
    about_link.click()
    time.sleep(5)

    # Selezionare da un dropdown
    driver.get("https://www.w3schools.com/tags/tryit.asp?filename=tryhtml_select")
    time.sleep(5)
    button_privacy = driver.find_element(By.ID, "accept-choices")
    button_privacy.click()
    time.sleep(5)
    driver.switch_to.frame("iframeResult")
    from selenium.webdriver.support.ui import Select
    dropdown = Select(driver.find_element(By.ID, "cars"))
    dropdown.select_by_visible_text("Audi")
    time.sleep(5)
    button_dropdown = driver.find_element(By.XPATH, "/html/body/form/input")
    button_dropdown.click()
    time.sleep(5)
    
    # Gestione di alert
    driver.get("https://www.w3schools.com/js/tryit.asp?filename=tryjs_alert")
    driver.switch_to.frame("iframeResult")
    time.sleep(5)
    driver.find_element(By.TAG_NAME, "button").click()
    alert = driver.switch_to.alert
    print(f"Testo dell'alert: {alert.text}")
    time.sleep(5)
    alert.accept()
    time.sleep(5)
    driver.quit()

#### In questa cella abbiamo creato una funzione nella quale: 
- click() simula il clic del mouse su un elemento.
- switch_to.frame() permette di interagire con elementi all'interno di un iframe.
- Select è utilizzato per interagire con menu a discesa.
- switch_to.alert gestisce finestre di alert JavaScript.

### Vediamo ora il risultato di questa nuova funzione:

In [39]:
driver = setup_driver()
interact_with_elements(driver)

Testo dell'alert: I am an alert box!


### Vediamo ora  come si fa Scraping di dati

In [44]:
def scrape_data(driver):
    """
    Dimostra come estrarre dati da una pagina web.
    """
    driver.get("https://www.python.org/events/python-events/")
    event_times = driver.find_elements(By.CLASS_NAME, "event-location")
    event_titles = driver.find_elements(By.CLASS_NAME, "event-title")
    
    for time, title in zip(event_times, event_titles):
        print(f"{time.text}: {title.text}")
    driver.quit()

#### In questa cella abbiamo creato una funzione nella quale: 
- find_elements() restituisce una lista di tutti gli elementi che corrispondono al criterio.
- Usiamo zip() per iterare su due liste contemporaneamente.

### Vediamo il risultato:

In [45]:
driver = setup_driver()
scrape_data(driver)

Moscow, Russia: PyCon Russia 2024
Columbus, USA: PyOhio 2024
Natal, Brazil: Python Nordeste 2024
Buea, Cameroon: Python Communities - South West Region
Mogadishu, Somalia: PyCon Somalia 2024
Wellington, Aoetaroa, New Zealand: Kiwi PyCon XIII
Douala, Cameroon: Python Communities - University of Douala
Eindhoven, Netherlands: PyData Eindhoven 2024


### Vediamo ora come si gestiscono le finestre e schede:

In [48]:
def handle_windows_and_tabs(driver):
    """
    Dimostra come gestire multiple finestre e schede.
    """
    driver.get("https://www.python.org")
    original_window = driver.current_window_handle
    time.sleep(5)

    # Apre una nuova scheda
    driver.execute_script("window.open('');")
    driver.switch_to.window(driver.window_handles[1])
    driver.get("https://docs.python.org/3/")
    print(f"Nuova pagina: {driver.title}")
    time.sleep(5)
    # Torna alla scheda originale
    driver.switch_to.window(original_window)
    print(f"Tornato alla pagina: {driver.title}")
    time.sleep(5)
    driver.quit()

#### In questa cella abbiamo creato una funzione nella quale: 

- execute_script() esegue JavaScript nel browser.
- switch_to.window() permette di cambiare la scheda o finestra attiva.

### Testiamo ora il risultato:

In [49]:
driver = setup_driver()
handle_windows_and_tabs(driver)

Nuova pagina: 3.12.4 Documentation
Tornato alla pagina: Welcome to Python.org


### Vediamo ora come si gestiscono i cookie:

In [66]:
def manage_cookies(driver):
    """
    Dimostra come gestire i cookie.
    """
    driver.get("https://www.python.org")

    # Aggiunge un nuovo cookie
    driver.add_cookie({"name": "esempio_cookie", "value": "123456"})
    
    # Ottiene tutti i cookie
    cookies = driver.get_cookies()
    for cookie in cookies: 
        print("Cookie:", cookie)
    
    
    # Cancella un cookie specifico
    driver.delete_cookie("esempio_cookie")
    time.sleep(5)
    driver.quit()

#### In questa cella abbiamo creato una funzione nella quale: 
- add_cookie() aggiunge un nuovo cookie.
- get_cookies() restituisce tutti i cookie attuali.
- delete_cookie() rimuove un cookie specifico.

### Vediamo il risultato:

In [67]:
driver = setup_driver()
manage_cookies(driver)

Cookie: {'domain': '.python.org', 'expiry': 1721298321, 'httpOnly': False, 'name': '__utmb', 'path': '/', 'sameSite': 'Lax', 'secure': False, 'value': '32101439.1.10.1721296521'}
Cookie: {'domain': '.python.org', 'expiry': 1721297121, 'httpOnly': False, 'name': '__utmt', 'path': '/', 'sameSite': 'Lax', 'secure': False, 'value': '1'}
Cookie: {'domain': '.python.org', 'expiry': 1737064521, 'httpOnly': False, 'name': '__utmz', 'path': '/', 'sameSite': 'Lax', 'secure': False, 'value': '32101439.1721296521.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none)'}
Cookie: {'domain': '.python.org', 'httpOnly': False, 'name': '__utmc', 'path': '/', 'sameSite': 'Lax', 'secure': False, 'value': '32101439'}
Cookie: {'domain': '.python.org', 'expiry': 1755856521, 'httpOnly': False, 'name': '__utma', 'path': '/', 'sameSite': 'Lax', 'secure': False, 'value': '32101439.542030225.1721296521.1721296521.1721296521.1'}
Cookie: {'domain': 'www.python.org', 'httpOnly': False, 'name': 'esempio_cookie', 'path': '/

### Vediamo ora come fare uno Screenshot:

In [72]:
def take_screenshot(driver):
    """
    Dimostra come catturare screenshot.
    """
    driver.get("https://www.python.org")
    
    #rimpiccioliamo la pagina così da avere lo screen di tutta la pagina
    driver.execute_script("document.body.style.zoom='30%'")
    time.sleep(5)
    driver.save_screenshot("python_org.png")
    print("Screenshot salvato come 'python_org.png'")

    driver.quit()

#### Avviamo la funzione e vediamo lo screenshot:

In [73]:
driver = setup_driver()
take_screenshot(driver)

Screenshot salvato come 'python_org.png'


## Esercizi

In [None]:
# Esercizio 1: Ricerca su Wikipedia
def wikipedia_search():
    """
    Visita Wikipedia, cerca "Python (programming language)", 
    e stampa il primo paragrafo della pagina risultante.
    """
    # Il tuo codice qui
    pass

# Esercizio 2: Login su un sito di pratica
def practice_login():
    """
    Visita https://practicetestautomation.com/practice-test-login/
    Effettua il login con username "student" e password "Password123"
    Verifica che il login sia avvenuto con successo
    """
    # Il tuo codice qui
    pass

# Esercizio 3: Scraping di una tabella
def table_scraping():
    """
    Visita https://www.w3schools.com/html/html_tables.asp
    Estrai i dati dalla prima tabella sulla pagina e stampali in formato leggibile
    """
    # Il tuo codice qui
    pass

# Esercizio 4: Gestione di un form dinamico
def dynamic_form():
    """
    Visita https://demoqa.com/dynamic-properties
    Attendi che il bottone "Visible After 5 Seconds" appaia
    Cliccalo e verifica che l'azione sia stata eseguita con successo
    """
    # Il tuo codice qui
    pass


# Esercizio 5: Web Scraping Avanzato
def advanced_scraping():
    """
    Visita https://news.ycombinator.com/
    Estrai i titoli, i link e i punteggi dei primi 3 articoli
    Salva questi dati in un file CSV
    """
    # Il tuo codice qui
    pass