# Selenium

Biblioteka do automatyzacji działań w przeglądarkach internetowych. Głównie służąca do scrapowania informacji ze stron internetowych oraz do automatyzacji testów (black-box tests).

### Import bibliotek

In [2]:
import selenium as se
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

## Prosty przykład działania

Utworzenie instancji WebDriver dla przeglądarki Firefox i uruchomienie strony Google

In [6]:
driver = webdriver.Firefox()
driver.get("https://www.google.com")

Wyszukanie elementu po poniższym ID oraz kliknięcie w ten element (guzik "Odrzuć")

In [7]:
odrzuc = driver.find_element(By.ID, "W0wltc")
odrzuc.click()

Znalezienie pola wyszukiwania po id (sposób z selektorem CSS), przesłanie słowa Python do pola i przesłanie formularza (w tym przypadku przesłanie frazy do wyszukania) 

In [8]:
poleWyszukiwania = driver.find_element(By.CSS_SELECTOR, "#APjFqb")
poleWyszukiwania.send_keys("Python")
poleWyszukiwania.submit()

Zamknięcie przeglądarki

In [9]:
driver.quit()

## WebDriver

Klasa do zarządzania sesją przeglądarki. Używając instancji tej klasy możemy:
- otworzyć daną stronę
- zczytać dane ze strony (scrapowanie)
- wejść w interakcję ze stroną
- zamknąć/przełączyć okna przeglądarki

Aktualnie wspierane przeglądarki do automatyzacji z użyciem Selenium to Chrome, Edge, Firefox, Internet Exploder i Safari. Każda przeglądarka posiada swoją instancję WebDrivera, np. `Edge()` dla przeglądarki Microsoft Edge.

In [None]:
driver = webdriver.Edge() # przeglądarka Edge

### WebDriver Options

Klasa do ustawienia opcji dla danego WebDrivera. Każda przeglądarka posiada swoją własną klasę opcji - wszystkie posiadają część wspólnych ustawień jak i również te specyficzne dla danej przeglądarki. 

Instację opcji Edge'a i Chrome'a tworzy się przy pomocy funkcji `get_default_edge_options()` lub `get_default_chrome_options()`, dla reszty przeglądarek korzysta się z konstruktora odpowiednich klas (dla Firefoxa, `FirefoxOptions()`).

Aby zmodyfikować opcje, należy zmienić wartości w słowniku `capabilities` lub zmienić wartość pola (dla niektórych pól).

In [None]:
options = webdriver.FirefoxOptions()
driver = webdriver.Firefox(options = options)
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}}


Opcje domyślnie (widoczny powyżej) składają się z poniższych ustawień:
- `browserName` - nazwa wyszukiwarki
- `acceptInsecureCerts` - jeśli jest `False`, zwraca błąd przy nawigacji strony z przedawnionym lub niewłaściwym certyfikatem TLS
- `moz:debuggerAddress` - specjalny parametr Firefoxa - wskazuje czy uruchomić server do debugowania przy starcie WebDrivera
- `pageLoadStrategy` - strategia ładowania strony:
    - `normal` - czeka na załadowanie się całej strony
    - `eager` - aktywuje się gdy jest dostęp do pełnej strony od strony html, ale inne elementy nieinteraktywne np. obrazy mogą być w trakcie ładowania
    - `none` - nie czeka, webDriver kontynuuje działanie od razu
    
    Bazuje na stanie parametru DOM `document.readyState`.
- `browserVersion` - wersja przeglądarki, opcjonalnie
- opcja na specyficzne ustawienia, tutaj `moz:firefoxOptions`:
    - `binary` - określa ścieżkę do przeglądarki
    - `prefs` - preferncje profilu, tutaj ustawienie odnośnie wyboru aktywnego protokołu


#### Timeouts

Można dodatkowo ustawić różne interwały czasu, w których skrypt ma wykonać określoną czynność. Są 3 rodzaje:
- `script` - interwał czasu na wykonanie skryptu w danym kontekście, domyślnie ustawiony na 30 sekund
- `pageLoad` - interwał czasu na załadowanie strony, domyślnie 5 minut
- `implicit` - interwał czasu na znalezienie wskazanego elementu na stronie, domyślnie opcja ustawiona na 0 (minimalny czas)

In [None]:
options.timeouts = {'script': 10000,'pageLoad': 50000,'implicit': 100}
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}}


#### unhandledPromptBehivour

Parametr określający akcję do wykonania przy natrafieniu pop-upu lub okienek potwierdzenia. Dostępne są poniższe stany:
- `dismiss` - automatyczne odrzucenie
- `accept` - automatyczne zatwierdzenie
- `dismiss and notify` - automatyczne odrzucenie i powiadomienie webDrivera
- `accept and notify` - automatyczne zatwierdzenie i powiadomienie webDrivera
- `ignore` - zignorowanie

In [None]:
options.unhandled_prompt_behavior = 'accept'
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept'}


#### setWindowRect

Wskazuje, czy przeglądarka wspiera wszystkie komendy do zmiany lokalizacji i rozmiaru

In [None]:
options.set_window_rect = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True}


#### strictFileInteractibility

Parametr wskazujący, czy na wszelkie pola do przesłania plików (`<input type="file">`) mają być dodatkowo sprawdzane pod kątem widoczności i dostępności. Przy ustawieniu wartości na `False`, webDriver będzie mógł przesłać plik pomimo schowania/zablokowania dostępu do przesłania dla zwykłego użytkownika.

In [None]:
options.strict_file_interactability = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True}


#### Proxy

Ustawienie serwera proxy. Przyjmuje takie argumenty jak np. adresy serwerów różnego rodzaju, autodetekcję czy jej typ. Dostępne typy:
- `DIRECT` - bezpośrednie połączenie
- `MANUAL` - manualne ustawienie proxy (np. dla serwera http)
- `PAC` - autokonfiguracja z URL
- `AUTODETECT` - autodetekcja
- `SYSTEM` - użycie ustawień systemowych

In [None]:
from selenium.webdriver.common.proxy import Proxy,ProxyType
options.proxy = Proxy({'proxyType':ProxyType.MANUAL,'httpProxy': '127.0.0.1:6942'})
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True, 'proxy': {'proxyType': 'manual', 'httpProxy': '127.0.0.1:6942'}}


In [None]:
#reset opcji
options = webdriver.FirefoxOptions()

### WebDriver Service

Klasa z ustawieniami technicznymi dla WebDrivera, takie jak lokalizacja, port do użycia i które argumenty zostają przekazane do wiersza poleceń.

Podobnie jak opcje, przekazuje się je do konstruktora WebDrivera poprzez argument, tutaj keyword `service`.

In [None]:
service = webdriver.FirefoxService()
driver = webdriver.Firefox(service = service)

#### Ścieżka do Drivera

W wersji Selenium 4.6 i wyżej, nie jest potrzebne wskazywanie lokalizacji Drivera. Jednak w razie braku możliwości update'u lub z innego powodu, można ją ustawić w instancji przez argument `executable_path`.

In [None]:
path = './path/to/driver'
service = webdriver.FirefoxService(executable_path = path) # oczywiście nie zadziała ;P

#### Docelowe miejsce logowania

Aby wskazać plik, do którego chcemy wysyłać informacje logowane od WebDrivera, można to wskazać używając argumentu `log_path`. Jeśli chcemy, aby logi pojawiały się w wierszu konsoli, możemy to wskazać poprzez `subprocess.STDOUT` (z pakietu `subprocess`)

In [None]:
import subprocess
service = webdriver.FirefoxService(log_output = subprocess.STDOUT)

#### `service_args`

Aby wskazać jakie rodzaje logów mają być zapisywane we wskazanym miejscu i czy mają być one skracane, możemy przekazać listę argumentów wskazujących poziomy logów (np. debug, trace, info) po parametrze `--log`. Dodatkowo, przekazując parametr `--log-not-truncate`, żeby przesłać pełne dane ze strumienia logów.

In [None]:
service = webdriver.FirefoxService(service_args = ['--log-no-truncate', '--log', 'debug', 'info'])

### Elementy specyficzne dla Firefox'a

#### Profile

Firefox pozwala na utworzenie profili zawierających informacje odnośnie haseł, ustawień i tym podobnych. Należy skorzystać tutaj z instancji klasy `FirefoxProfile` i z metody `set_preference` do dodania danych ustawień/preferencji. 

In [None]:
options = webdriver.FirefoxOptions()
firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference("javascript.enabled", False)
options.profile = firefox_profile

W serwisie można jako argument w `service_args` przekazać ścieżkę do eksportowanego profilu.

In [None]:
temp_dir = './path/to/profile'
service = webdriver.FirefoxService(service_args = ['--profile-root', temp_dir]) # oczywiście nie zadziała tutaj

#### Dodatki

Do przeglądarki Firefox na czas testów można zainstalować dodatki, poprzez pliki o rozszerzeniu `xpi`. Metody `install_addon` i `uninstall_addon` pozwalają na instalację i deinstalację danego dodatku, w przypadku instalacji potrzebna jest ścieżka do pliku, do deinstalacji musimy odnaleźć id dodatku. 

Ponadto, możemy zaznaczyć jak wtyczka nie jest zatwierdzona lub jak chcemy zainstalować wtyczkę tylko tymczasowo. Wtedy musimy nastawić parametr `temporary` na `True`.|

In [None]:
id = driver.install_addon("path/to/addon")
driver.uninstall_addon(id)

#### Zrzuty ekranu

Można wykonać zrzut ekranu i zapisać do wskazanego miejsca poprzez metodę `save_full_page_screenshot`.

In [None]:
driver.save_full_page_screenshot("screenshot.png")

### Ustawienia specyficzne dla Chrome

- argument passing for options
- log file features
- Chrome Cast
- komentarz że powyższe rzeczy również dostępne w Edge (plus w edge jest Internet Explorer Compatibility Mode)

## Elementy strony - narzędzia do scrapowania i nie tylko

- Znajdowanie elementów
    - Strategie lokalizujące
        - Tradycyjne lokatory (By.x)
        - Inne lokatory
        - Lokatory względne (nad, pod elementem)
    - Znajdowanie jednego elementu
    - Znajdowanie wielu elementów
    - Nestowane elementy
    - Aktywny element
- Podstawowe interakcje z elementami
    - Click
    - SendKeys
        - Dodatkowa informacja o sposobie wysyłania plików
    - Clear
    - Submit
    - Select
- Informacje o elementach
    - czy wyświetlone, włączone, zaznaczone
    - pozycja/rozmiar elementu
    - wartość określonego parametru css
    - zawartość tekstowa
    - wartość określonego atrybutu HTMLowego

### Przerwy - instrukcje czekania

- implicit wait (określony czas)
- explicit wait (warunkowy)
    - dodatkowe argumenty do WebDriverWait

## Interakcje z przeglądarką

- tytuł i URL
- nawigacja stron
    - przez wskazanie adresu
    - back
    - forward
    - refresh
- Javascriptowe pop-upy
    - alerty
    - confirm
    - prompt
- Ciasteczka
    - dodanie
    - wyciągnięcie konkretnego
    - wyciągnięcie wszystkich
    - usunięcie konkretnego
    - usunięcie wszystkich
    - atrybut same-site
- Drukowanie strony
    - instancja PrintOptions
    - orientacja
    - zakres stron
    - rozmiar
    - marginesy
    - skala
    - tło
    - zmniejszenie do dopasowania
    - drukowanie
- Okna/karta (dla selenium to jest to samo)
    - aktualne okno
    - zmiana okna
    - zamknięcie okna
    - otwarcie nowego okna
    - zarządzanie oknem i jego właściwościami
        - get wielkość okna
        - set wielkość okna
        - get pozycję okna
        - set pozycję okna
        - maksymalizuj/minimalizuj okno
        - fullscreen
        - zrzut ekranu lub danego elementu
        - wykonanie skryptu JSowego
- Wirtualne uwierzytelnianie
    - dodanie nowego uwierzytelnienia
    - usnięcie uwierzytelnienia
    - tworzenie stateful/stateless poświadczenia
    - dodanie poświadczenia
    - otrzymanie danego poświadczenia
    - usunięcie jednego/wszystkich poświadczeń
    - ustawienie symulacji sukcesu/porażki przy autoryzacji


## Actions API - mimika zachowania użytkownika
Jest to niskopoziomowy interfejs, pozwalający symulować działania urządzeń wejściowych w przeglądarce.

Możliwości:
- Sterowanie zachowaniem (mysz, klawiatura, ...) i tworzenie pojedyńczych **akcji** (np. przesunięcie, wpisanie tekstu, ...).
- Łączenie akcji w **łańcuchy** i ich wspólne wykonanie przez `.perform()`.

Od Selenium 4.2 dodano wsparcie dla akcji przewijania *(wheel actions*).

#### Klawiatura

In [None]:
# otwarcie przeglądarki
driver = webdriver.Firefox()
driver.get("https://the-internet.herokuapp.com/key_presses")

In [40]:
# pobranie elementu
poleSzukaj = driver.find_element(By.ID, "target")

# użycie send_keys() do wpisania tekstu
poleSzukaj.send_keys("Pajtoon")

In [106]:
# wysłanie BACKSPACE trzykrotnie
poleSzukaj.send_keys(Keys.BACKSPACE * 3)

#### `key_down()` oraz `key_up()`

wpisanie liter w pole tekstowe

In [107]:
# użycie ActionChains
actions = webdriver.ActionChains(driver)

# r + SHIFT + m + [SHIFT off]+ s
actions.send_keys("r").key_down(Keys.SHIFT).send_keys("m").key_up(Keys.SHIFT).send_keys("s").perform()

otwarcie linku w nowej karcie

In [5]:
from selenium.webdriver.common.keys import Keys

In [109]:
# pobranie elementu z linkiem
link = driver.find_element(By.CSS_SELECTOR, "img[alt='Fork me on GitHub']")

# otwarcie linku w nowej karcie
actions.key_down(Keys.CONTROL).click(link).key_up(Keys.CONTROL).perform()

In [111]:
actions.click(poleSzukaj)  # żeby aktywować pole

actions.key_down(Keys.CONTROL).send_keys('a').key_up(Keys.CONTROL)  # zaznacz wszystko
actions.key_down(Keys.CONTROL).send_keys('c').key_up(Keys.CONTROL)  # kopiuj
actions.key_down(Keys.CONTROL).send_keys('v').send_keys('v').key_up(Keys.CONTROL)  # wklej 2x

actions.perform()

#### Mysz
- click_and_release
- click_and_hold
- context_click (right click)
- back_click
- forward_click
- double_click
- move_to_element (bez i z offsetem)
- move_to_location
- move_by_offset (od kursora)
- drag_and_drop
- drag_and_drop_by_offset

#### Scroll
- to element
- by amount
- to element by amount
- from offset by amount
- from element with offset by amount

#### Proxy

Ustawienie serwera proxy. Przyjmuje takie argumenty jak np. adresy serwerów różnego rodzaju, autodetekcję czy jej typ. Dostępne typy:
- `DIRECT` - bezpośrednie połączenie
- `MANUAL` - manualne ustawienie proxy (np. dla serwera http)
- `PAC` - autokonfiguracja z URL
- `AUTODETECT` - autodetekcja
- `SYSTEM` - użycie ustawień systemowych

## Praktyki dobrego testowania

- Strategie
    - LoadableComponent (klasa testów)
    - Bot Pattern (klasa z metodami rozszerzającymi działanie czystego API Selenium dla danego przypadku)
- Typy testów
    - testy funkcjonalne
    - testy akceptacji
    - testy integracji
    - testy systemowe
    - testy performance'owe
        - testy z odpowiednim obciążeniem
        - stress testy
    - testy regresyjne
- Wspierane
    - użycie obiektów stron
    - DSL
    - przygotowanie stanu aplikacji do testowania bez użycia Selenium
    - mockowanie zewnętrznych zależności
    - rozszerzenie raportów przez inne narzędzia
    - izolacja testów od siebie
    - wskazówki odnośnie selektorów
    - niezależność testów
    - fluent API
    - każdy test od czystego bazowego stanu
- Odradzane
    - nie testować CAPTCHy \\\XFFFFDD
    - postęp pobierania plików nie jest widoczny
    - nie należy testować kodów HTTP, nie jest to ważne
    - logowanie się poprzez FB,Google etc z WebDriverem niewskazane
    - raczej nie do testowania performance'u
    - nie do link spideringu - przełażeniu po linkach (wolna biblioteka)
    - 2FA bez automatyzacji