# Selenium

Biblioteka do automatyzacji działań w przeglądarkach internetowych. Głównie służąca do scrapowania informacji ze stron internetowych oraz do automatyzacji testów (black-box tests).

### Import bibliotek

In [5]:
import selenium as se
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

## Prosty przykład działania

Utworzenie instancji WebDriver dla przeglądarki Firefox i uruchomienie strony Google

In [21]:
driver = webdriver.Firefox()
driver.get("https://www.google.com")

Wyszukanie elementu po poniższym ID oraz kliknięcie w ten element (guzik "Odrzuć")

In [22]:
odrzuc = driver.find_element(By.ID, "W0wltc")
odrzuc.click()

Znalezienie pola wyszukiwania po id (sposób z selektorem CSS), przesłanie słowa Python do pola i przesłanie formularza (w tym przypadku przesłanie frazy do wyszukania) 

In [23]:
poleWyszukiwania = driver.find_element(By.CSS_SELECTOR, "#APjFqb")
poleWyszukiwania.send_keys("Python")
poleWyszukiwania.submit()

Zamknięcie przeglądarki

In [24]:
driver.quit()

## WebDriver

Klasa do zarządzania sesją przeglądarki. Używając instancji tej klasy możemy:
- otworzyć daną stronę
- zczytać dane ze strony (scrapowanie)
- wejść w interakcję ze stroną
- zamknąć/przełączyć okna przeglądarki

Aktualnie wspierane przeglądarki do automatyzacji z użyciem Selenium to Chrome, Edge, Firefox, Internet Exploder i Safari. Każda przeglądarka posiada swoją instancję WebDrivera, np. `Edge()` dla przeglądarki Microsoft Edge.

In [25]:
driver = webdriver.Edge() # przeglądarka Edge

### WebDriver Options

Klasa do ustawienia opcji dla danego WebDrivera. Każda przeglądarka posiada swoją własną klasę opcji - wszystkie posiadają część wspólnych ustawień jak i również te specyficzne dla danej przeglądarki. 

Instację opcji Edge'a i Chrome'a tworzy się przy pomocy funkcji `get_default_edge_options()` lub `get_default_chrome_options()`, dla reszty przeglądarek korzysta się z konstruktora odpowiednich klas (dla Firefoxa, `FirefoxOptions()`).

Aby zmodyfikować opcje, należy zmienić wartości w słowniku `capabilities` lub zmienić wartość pola (dla niektórych pól).

In [26]:
options = webdriver.FirefoxOptions()
driver = webdriver.Firefox(options = options)
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}}


Opcje domyślnie (widoczny powyżej) składają się z poniższych ustawień:
- `browserName` - nazwa wyszukiwarki
- `acceptInsecureCerts` - jeśli jest `False`, zwraca błąd przy nawigacji strony z przedawnionym lub niewłaściwym certyfikatem TLS
- `moz:debuggerAddress` - specjalny parametr Firefoxa - wskazuje czy uruchomić server do debugowania przy starcie WebDrivera
- `pageLoadStrategy` - strategia ładowania strony:
    - `normal` - czeka na załadowanie się całej strony
    - `eager` - aktywuje się gdy jest dostęp do pełnej strony od strony html, ale inne elementy nieinteraktywne np. obrazy mogą być w trakcie ładowania
    - `none` - nie czeka, webDriver kontynuuje działanie od razu
    
    Bazuje na stanie parametru DOM `document.readyState`.
- `browserVersion` - wersja przeglądarki, opcjonalnie
- opcja na specyficzne ustawienia, tutaj `moz:firefoxOptions`:
    - `binary` - określa ścieżkę do przeglądarki
    - `prefs` - preferncje profilu, tutaj ustawienie odnośnie wyboru aktywnego protokołu


#### Timeouts

Można dodatkowo ustawić różne interwały czasu, w których skrypt ma wykonać określoną czynność. Są 3 rodzaje:
- `script` - interwał czasu na wykonanie skryptu w danym kontekście, domyślnie ustawiony na 30 sekund
- `pageLoad` - interwał czasu na załadowanie strony, domyślnie 5 minut
- `implicit` - interwał czasu na znalezienie wskazanego elementu na stronie, domyślnie opcja ustawiona na 0 (minimalny czas)

In [27]:
options.timeouts = {'script': 10000,'pageLoad': 50000,'implicit': 100}
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}}


#### unhandledPromptBehivour

Parametr określający akcję do wykonania przy natrafieniu pop-upu lub okienek potwierdzenia. Dostępne są poniższe stany:
- `dismiss` - automatyczne odrzucenie
- `accept` - automatyczne zatwierdzenie
- `dismiss and notify` - automatyczne odrzucenie i powiadomienie webDrivera
- `accept and notify` - automatyczne zatwierdzenie i powiadomienie webDrivera
- `ignore` - zignorowanie

In [28]:
options.unhandled_prompt_behavior = 'accept'
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept'}


#### setWindowRect

Wskazuje, czy przeglądarka wspiera wszystkie komendy do zmiany lokalizacji i rozmiaru

In [29]:
options.set_window_rect = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True}


#### strictFileInteractibility

Parametr wskazujący, czy na wszelkie pola do przesłania plików (`<input type="file">`) mają być dodatkowo sprawdzane pod kątem widoczności i dostępności. Przy ustawieniu wartości na `False`, webDriver będzie mógł przesłać plik pomimo schowania/zablokowania dostępu do przesłania dla zwykłego użytkownika.

In [30]:
options.strict_file_interactability = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True}


#### Proxy

Ustawienie serwera proxy. Przyjmuje takie argumenty jak np. adresy serwerów różnego rodzaju, autodetekcję czy jej typ. Dostępne typy:
- `DIRECT` - bezpośrednie połączenie
- `MANUAL` - manualne ustawienie proxy (np. dla serwera http)
- `PAC` - autokonfiguracja z URL
- `AUTODETECT` - autodetekcja
- `SYSTEM` - użycie ustawień systemowych

In [31]:
from selenium.webdriver.common.proxy import Proxy,ProxyType
options.proxy = Proxy({'proxyType':ProxyType.MANUAL,'httpProxy': '127.0.0.1:6942'})
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Users\\dawid\\AppData\\Local\\Mozilla Firefox\\firefox.exe'}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True, 'proxy': {'proxyType': 'manual', 'httpProxy': '127.0.0.1:6942'}}


In [32]:
#reset opcji
options = webdriver.FirefoxOptions()

### WebDriver Service

Klasa z ustawieniami technicznymi dla WebDrivera, takie jak lokalizacja, port do użycia i które argumenty zostają przekazane do wiersza poleceń.

Podobnie jak opcje, przekazuje się je do konstruktora WebDrivera poprzez argument, tutaj keyword `service`.

In [33]:
service = webdriver.FirefoxService()
driver = webdriver.Firefox(service = service)

#### Ścieżka do Drivera

W wersji Selenium 4.6 i wyżej, nie jest potrzebne wskazywanie lokalizacji Drivera. Jednak w razie braku możliwości update'u lub z innego powodu, można ją ustawić w instancji przez argument `executable_path`.

In [None]:
path = './path/to/driver'
service = webdriver.FirefoxService(executable_path = path) # oczywiście nie zadziała ;P

#### Docelowe miejsce logowania

Aby wskazać plik, do którego chcemy wysyłać informacje logowane od WebDrivera, można to wskazać używając argumentu `log_path`. Jeśli chcemy, aby logi pojawiały się w wierszu konsoli, możemy to wskazać poprzez `subprocess.STDOUT` (z pakietu `subprocess`)

In [None]:
import subprocess
service = webdriver.FirefoxService(log_output = subprocess.STDOUT)

#### `service_args`

Aby wskazać jakie rodzaje logów mają być zapisywane we wskazanym miejscu i czy mają być one skracane, możemy przekazać listę argumentów wskazujących poziomy logów (np. debug, trace, info) po parametrze `--log`. Dodatkowo, przekazując parametr `--log-not-truncate`, żeby przesłać pełne dane ze strumienia logów.

In [None]:
service = webdriver.FirefoxService(service_args = ['--log-no-truncate', '--log', 'debug', 'info'])

### Elementy specyficzne dla Firefox'a

#### Profile

Firefox pozwala na utworzenie profili zawierających informacje odnośnie haseł, ustawień i tym podobnych. Należy skorzystać tutaj z instancji klasy `FirefoxProfile` i z metody `set_preference` do dodania danych ustawień/preferencji. 

In [None]:
options = webdriver.FirefoxOptions()
firefox_profile = webdriver.FirefoxProfile()
firefox_profile.set_preference("javascript.enabled", False)
options.profile = firefox_profile

W serwisie można jako argument w `service_args` przekazać ścieżkę do eksportowanego profilu.

In [None]:
temp_dir = './path/to/profile'
service = webdriver.FirefoxService(service_args = ['--profile-root', temp_dir]) # oczywiście nie zadziała tutaj

#### Dodatki

Do przeglądarki Firefox na czas testów można zainstalować dodatki, poprzez pliki o rozszerzeniu `xpi`. Metody `install_addon` i `uninstall_addon` pozwalają na instalację i deinstalację danego dodatku, w przypadku instalacji potrzebna jest ścieżka do pliku, do deinstalacji musimy odnaleźć id dodatku. 

Ponadto, możemy zaznaczyć jak wtyczka nie jest zatwierdzona lub jak chcemy zainstalować wtyczkę tylko tymczasowo. Wtedy musimy nastawić parametr `temporary` na `True`.|

In [None]:
id = driver.install_addon("path/to/addon")
driver.uninstall_addon(id)

#### Zrzuty ekranu

Można wykonać zrzut ekranu i zapisać do wskazanego miejsca poprzez metodę `save_full_page_screenshot`.

In [None]:
driver.save_full_page_screenshot("screenshot.png")

### Ustawienia specyficzne dla Chrome

#### Argumenty

Do Chrome'a, można przekazać argumenty poprzez funkcję `add_argument`. Argumentami są flagi określające mody, w których przeglądarka będzie uruchomiona lub według których będzie odpowiednio skonfigurowana, np. `--headless` włącza okrojoną wersję strony bez UI, `--start-maximized` uruchamia okno zmaksymalizowane. 


In [34]:
from selenium.webdriver import ChromeOptions
options = ChromeOptions()
options.add_argument("--start-maximized")


#### Przekazywanie logów do plików

Poza wskazaniem ścieżki do logów jak w Firefox, można dodać 2 dodatkowe flagi do `service_args` - `--append_log` do dodania logów na koniec pliku wskazanego, oraz `--readable-timestamp` do sformatowania wszelkich dat. Należy pamiętać o podaniu rodzajów logów logowanych, aby to zadziałało.

In [None]:
log_path=subprocess.STDOUT
service = webdriver.ChromeService(service_args=['--log','trace','--append-log', '--readable-timestamp'], log_output=log_path)

#### Chrome Casting

Chrome pozwala na dublowanie stron/zakładek poprzez Chrome Casting. Aby to wykonać, trzeba uzyskać sinki Chrome Casta i wskazać driverowi rozpoczęcie dublowania zakładek na sink o danej nazwie.

In [35]:
driver = webdriver.Chrome()
try:
    sinks = driver.get_sinks()
    if sinks:
        sink_name = sinks[0]['name']
        driver.start_tab_mirroring(sink_name)
        driver.stop_casting(sink_name)
    else:
        print("No available Cast sinks to test with.")
finally:
    driver.quit()

No available Cast sinks to test with.


#### Symulacje stanów sieci

Można zasymulować działanie sieci w określonych warunkach, przesyłając słownik z takimi informacjami jak np. prędkość przesyłu danych, opóźnienie etc.

In [None]:
network_conditions = {
    "offline": False,
    "latency": 20,  # w ms
    "download_throughput": 2000 * 1024 / 8,  # 2000 kilobitów na sekundę (1024 to kilobajt, 8 bitów to 1 bajt, czyli de facto 128 kB na sekundę)
    "upload_throughput": 2000 * 1024 / 8,
}
driver.set_network_conditions(**network_conditions)

### Edge
Edge bazuje na Chromium, czyli w dużej mierze posiada te możliwości co Chrome. Dodatkowo, można uruchomić Edge'a w stylu Internet Explorer (w przypadku potrzeby aktualizacji testów, które były robione ne IE). Wystarczy utworzyć obiekty Webdrivera i opcji do Internet Explorera i wskazać wykonawczy plik Edge'a jako plik przeglądarki.

In [None]:
ie_options = webdriver.IeOptions()
ie_options.attach_to_edge_chrome = True
ie_options.edge_executable_path = "C:/Program Files (x86)/Microsoft/Edge/Application/msedge.exe"

driver = webdriver.Ie(options=ie_options)

driver.get("http://www.bing.com")
elem = driver.find_element(By.ID, 'sb_form_q')
elem.send_keys('WebDriver' + Keys.RETURN)

driver.quit()

## Elementy strony - narzędzia do scrapowania i nie tylko

### Znajdowanie elementów

Aby znaleźć określony element na stronie, należy zastosować metodę `find_element` z odpowiednią strategią lokalizacji, dostępną w klasie By. 

Dostępne strategie:
- CLASS_NAME - po danej klasie (pojedynczej, nie przyjmuje wielu klas)
- TAG_NAME - po nazwie tagu 
- ID - po id elementu
- NAME - po atrybucie `name` elementu
- LINK_TEXT - po widocznym tekście w danym elemencie (ewentualnie PARTIAL_LINK_TEXT do szukania po części tekstu)
- CSS_SELECTOR - po pełnym selektorze CSS - klasie, id, nazwie tagu
- XPATH - po ścieżce XMLowej



In [1]:
import selenium.webdriver as webdriver
from selenium.webdriver.common.by import By
driver = webdriver.Firefox()
driver.get("https://www.selenium.dev/selenium/web/locators_tests/locators.html")


In [2]:
e=driver.find_element(By.ID, "fname")
print(e.get_attribute("value"))
element = driver.find_element(By.XPATH, "//input[@value='f']")
print(e.tag_name)

Jane
input


Jeśli nie mamy klasy/id danego elementu, ale posiadamy wiedzę o względnej lokalizacji w stosunku do innego elementu możemy zastosować lokatory względne. Dostępne mamy:

- `above` - nad danym elementem
- `below` - pod danym elementem
- `to_left_of` - na lewo od danego elementu
- `to_right_of` - na prawo od danego elementu
- `near` - w odległości max 50 pixeli od danego elementu

Wykorzystujemy te funkcje wraz z `locate_with` z informacją o nazwie tagu. W funkcji lokatora, przekazujemy strategie lokalizacji dla elementu względem którego szukamy.

In [None]:
password_locator = webdriver.support.relative_locator.locate_with(By.TAG_NAME, "input").below({By.ID: "email"})

Lokatory względne można łączyć ze sobą jeśli musimy dodatkowo uszczegółowić parametry do lokalizacji.

In [None]:
submit_locator = webdriver.support.relative_locator.locate_with(By.TAG_NAME, "button").below({By.ID: "email"}).to_right_of({By.ID: "cancel"})

Po odnalezieniu danego elementu, można kontynuowanie przeszukiwanie, traktując element jako podzbiór, w którym będziemy szukać kolejnego określonego strategiami elementu. 

In [None]:
fruits = driver.find_element(By.ID, "fruits")
fruit = fruits.find_element(By.CLASS_NAME,"tomatoes")

### Znajdowanie wielu elementów

Zamiast szukania pojedynczego elementu, Selenium jest w stanie zwrócić pełną listę elementów spełniających podane wymagania selektora. Po zwróconej liście można normalnie iterować w celu interakcji/zebrania informacji.

In [None]:
plants = driver.find_elements(By.TAG_NAME, "li")
for p in plants:
    print(p.text)

### Aktywny element

Do wybrania aktualnie aktywnego elementu (wybranego przez użytkownika), możemy wykorzystać pole `active_element` w metodzie `switch_to`.

In [None]:
active_element=driver.switch_to.active_element
print(active_element.text)

### Informacje o danym elemencie

O każdym elemencie możemy otrzymać informacje, np. czy element jest uruchomiony, jaki on jest i wartość określonej właściwości.

Elementy posiadają metody `isDisplayed()`, `isEnabled()` i `isSelected()` zwracające boola określającego czy kolejno element jest wyświetlony, włączony czy zazanczony.

In [None]:
element=driver.find_element(by=By.TAG_NAME, value="header")
print(element.isDisplayed())
print(element.isEnabled())
print(element.isSelected())

Korzystając z pól `tag_name`, `text` i `rect`, możemy kolejno otrzymać informację o nazwie tagu danego elementu, zawartości tesktowej tego elementu oraz jego rozmiaru na stronie (współrzędne górnego lewego rogu elementu, wysokość i szerokość elementu).

In [None]:
print(element.tag_name)
print(element.text)
print(element.rect)

Do przechwycenia określonych właściwości tagu - HTMLowych lub CSSowych - wykorzystujemy kolejno funkcje `get_attribute()` i `value_of_css_property()`.

In [None]:
print(element.get_attribute("name"))
print(element.value_of_css_property("background-color"))

### Przerwy - instrukcje czekania

Selenium posiada możliwość oprogramowania przerw w wykonywaniu aktywności na stronie. 

Są 2 główne rodzaje: niejawne i jawne. 

Niejawne przerwy powodują czekanie na zwrócenie błędu - jeśli element nie został od razu znaleziony, niejawna przerwa spowoduje wystąpienie błędu z pewnym opóźnieniem. Jeśli, podczas przerwy, pierwotnie szukany element zostanie znaleziony, kod będzie kontynuowany normalnie.

Jawne przerwy sprawdzają określony warunek. Jeśli warunek nie zostanie spełniony w określonym czasie, wg parametry `timeout`, zwrócony zostanie błąd timeoutu. Takie przerwy są robione poprzez stworzenie instacji klasy `WebDriverWait(driver, timeout)` i nastawienie warunku poprzez metodę `until()`

In [None]:
from selenium.webdriver.support.wait import WebDriverWait


driver.implicitly_wait(2) #przerwa niejawna

wait=WebDriverWait(driver,timeout=4) #przerwa jawna
wait.until(lambda _ : element.isDisplayed()) # warunek

Zastosowanie `WebDriverWait` z odpowiednią strategią lokalizacji może być dobrą alternatywą do wyszuwiania elementów poprzez `find_element()`. Można dodatkowo wskazać rodzaj dostępności i czas oczekiwania na dostępność danego elementu. 

In [None]:
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC

W poniższym przykładzie najpierw oczekujemy, aż pierwszy element będzie istnieć w DOM (nawet jeśli go nie widać), potem pobieramy go.

Następnie oczekujemy aż drugi element będzie widoczny (czyli ma wysokość/szerokość i nie jest display: none).

In [None]:

e = WebDriverWait(driver, 10).until(EC.visibility_of_element_located((By.ID, "fname")))
print(e.get_attribute("value"))
element = WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, "//input[@value='f']")))
print(e.tag_name)

Jane
input


Najważniejsze warunki, których możemy użyć z WebDriverWait:

- `presence_of_element_located` – element istnieje w DOM, ale może być niewidoczny
- `visibility_of_element_located` – element istnieje i jest widoczny
- `element_to_be_clickable` – element jest widoczny i aktywny (klikalny)
- `presence_of_all_elements_located` – wszystkie wskazane elementy istnieją w DOM
- `visibility_of_all_elements_located` – wszystkie wskazane elementy są widoczne
- `invisibility_of_element_located` – element jest niewidoczny lub nie istnieje
- `text_to_be_present_in_element` – określony tekst znajduje się wewnątrz elementu
- `text_to_be_present_in_element_value` – tekst znajduje się w atrybucie `value` (np. input)
- `staleness_of` – element przestał istnieć w DOM (np. po odświeżeniu strony)

## Interakcje z przeglądarką

Selenium pozwala na wchodzenie w interakcję z przeglądarką. Daje dostęp do akcji wykonywalnych przez człowiek (nawigacja po stronach, odklikanie pop-upów, zmiana rozmiaru okna) jak i takich jak zarządzanie ciasteczkami, wirtualne uwierzytelnianie oraz robienie zrzutów okien.

W łatwy sposób można otrzymać tytuł i aktualny URL strony otwartej w sesji WebDrivera, poprzez pola `title` i `current_url`.

In [None]:
print(driver.title)
print(driver.current_url)

Możliwa jest automatyzacja przechodzenia po stronach w przód, w tył i odświeżania przy użyciu metod `back()`, `forward()` i `refresh()`

In [None]:
driver.get("https://www.selenium.dev/selenium/web/index.html")

In [None]:
driver.back()

In [None]:
driver.forward()

In [None]:
driver.refresh()

Selenium umożliwia na wejście w interakcję z wszelkimi pop-upami Javascriptowymi. Najlepszym podejściem jest zastosowanie przerwy jawnej `WebDriverWait` do przechwycenia alertu, korzystając z pola `switch_to.alert`. Alerty można akceptować, odrzucić i, jeśli jest pole tekstowe, wpisać coś do niego.

In [None]:
wait = WebDriverWait(driver, timeout=2)
alert = wait.until(lambda d : d.switch_to.alert)
alert.send_keys("Selenium")
text = alert.text
alert.accept()
#alert.dismiss() #do odrzucania alertów

Zarządzanie ciasteczkami w Selenium polega na dodawaniu i usuwaniu ciasteczek poprzez metody `add_cookie()` i `delete_cookie()` (dodawanie przyjmuje słownik jako parametr, usuwanie przechodzi po nazwie). Ciasteczko o określonej nazwie można uzyskać przez metodę `get_cookie()`. Możliwe jest rownież otrzymanie pełnej listy ciasteczek oraz usunięcie ich.

In [None]:
driver.add_cookie({"name": "key", "value": "value"})

print(driver.get_cookie("key"))
print(driver.get_cookies())

driver.delete_cookie("key")
print(driver.get_cookies())
driver.delete_all_cookies()
print(driver.get_cookies())

Ważnym parametrem w ciasteczkach jest `sameSite` - pozwala na określenie czy ciasteczka mają być przesyłane razem z żądaniami GET wysyłanych przez strony osób trzecich. Opcja `"Strict"` blokuje przesyłanie ciasteczek, a opcja `"Lax"` je wysyła. Zostało dodane aby mitygować ataki CSRF (Cross-Site Request Forgery).

#### Okna

Okna można rozróżnić poprzez określone uchwyty/id. Przykładowo, można zapisać uchwyt aktualnie otworzonego okna, jeśli będziemy chcieli je otworzyć po przejściu na inne witryny. 

In [2]:
handle=driver.current_window_handle
assert len(driver.window_handles)==1

driver.switch_to.new_window('window')
driver.close()
driver.switch_to.window(handle)


NameError: name 'driver' is not defined

Możliwe jest otrzymywanie i nastawianie rozmiarów i pozycji okien poprzez pola `get/set_window_size()` i `get/set_window_position()`.

In [None]:
size = driver.get_window_size()
width = size.get("width")
height = size.get("height")

driver.set_window_size(1360,800)

position = driver.get_window_position()
x1 = position.get('x')
y1 = position.get('y')

driver.set_window_position(0,0)

driver.set_window_rect(x=0,y=0,width=800,height=600) # alternatywny sposób łączący pozycję i rozmiar

Można również automatyzować maksymalizację, minimalizację i rozszerzenie okna na pełny ekran.

In [None]:
driver.maximize_window()

In [None]:
driver.minimize_window()

In [None]:
driver.fullscreen_window()

Selenium pozwala skonfigurować format zrzutu strony i potem odniesienie do utworzonego pliku zrzutu.

In [None]:
from selenium.webdriver.common.print_page_options import PrintOptions

print_options=PrintOptions()

print_options.orientation="landscape"

print_options.page_height=28
print_options.page_width=20

print_options.margin_top = 10
print_options.margin_bottom = 10
print_options.margin_left = 10
print_options.margin_right = 10

print_options.background=True

page=driver.print_page(print_options)
print(page)

Virtual Authentication

- Wirtualne uwierzytelnianie
    - dodanie nowego uwierzytelnienia
    - usnięcie uwierzytelnienia
    - tworzenie stateful/stateless poświadczenia
    - dodanie poświadczenia
    - otrzymanie danego poświadczenia
    - usunięcie jednego/wszystkich poświadczeń
    - ustawienie symulacji sukcesu/porażki przy autoryzacji


## Actions API - mimika zachowania użytkownika
Jest to niskopoziomowy interfejs, pozwalający symulować działania urządzeń wejściowych w przeglądarce.

Możliwości:
- Sterowanie zachowaniem (mysz, klawiatura, ...) i tworzenie pojedyńczych **akcji** (np. przesunięcie, wpisanie tekstu, ...).
- Łączenie akcji w **łańcuchy** i ich wspólne wykonanie przez `.perform()`.

Od Selenium 4.2 dodano wsparcie dla akcji przewijania *(wheel actions*).

#### Klawiatura
`key_down(key, element=None)` – symuluje wciśnięcie klawisza (np. *Keys.CONTROL*)

`key_up(key, element=None)` – symuluje puszczenie klawisza

`send_keys(*keys_to_send)` – wysyła określone znaki (np. tekst lub *Keys.ENTER*)

In [None]:
# otwarcie przeglądarki
driver = webdriver.Firefox()

In [None]:
# otwarcie strony
driver.get("https://www.ikea.com/pl/pl/p/havbaeck-orrsjoen-szaf-umyw-z-drzwmi-gleb-umyw-bater-bezowy-s39514065/")

In [None]:
# import Keys
from selenium.webdriver.common.keys import Keys

Wpisanie znaków w pole tekstowe:

In [None]:
# pobranie elementu
poleSzukaj = driver.find_element(By.ID, "ikea-search-input")

# użycie send_keys() do wpisania tekstu
poleSzukaj.send_keys("GLAMBERGET")

In [None]:
# import ActionChains
from selenium.webdriver.common.action_chains import ActionChains

# użycie send_keys() z odnośnikiem do elementu
ActionChains(driver).send_keys_to_element(poleSzukaj, "GLAMBERGET").perform()

In [None]:
# wysłanie BACKSPACE trzykrotnie
poleSzukaj.send_keys(Keys.BACKSPACE * 3)

Kombinacja wpisywania znaków *z Shift'em*:

In [None]:
# r + SHIFT + m + [SHIFT off]+ s
ActionChains(driver).send_keys("r").key_down(Keys.SHIFT).send_keys("m").key_up(Keys.SHIFT).send_keys("s").perform()

Otwarcie linku w nowej karcie przy pomocy klawisza *Ctrl*:

In [None]:
# przypisanie ActionChains do zmiennej
actions = ActionChains(driver)

# pobranie elementu z linkiem
link = driver.find_element(By.CLASS_NAME, "hnf-header__logo")

# otwarcie linku w nowej karcie
actions.key_down(Keys.CONTROL).click(link).key_up(Keys.CONTROL).perform()

Kopiuj-wkej:

In [None]:
actions.click(poleSzukaj)  # żeby aktywować pole

actions.key_down(Keys.CONTROL).send_keys('a').key_up(Keys.CONTROL)  # zaznacz wszystko
actions.key_down(Keys.CONTROL).send_keys('c').key_up(Keys.CONTROL)  # kopiuj
actions.send_keys(Keys.ARROW_RIGHT).perform() # strzałka w prawo
actions.key_down(Keys.CONTROL).send_keys('v').key_up(Keys.CONTROL)  # wklej

actions.perform()

#### Mysz
- `click(on_element=None)` – kliknięcie lewym przyciskiem myszy na wskazanym elemencie lub w aktualnej pozycji kursora.

- `click_and_hold(on_element=None)` – naciśnięcie i przytrzymanie lewego przycisku myszy.

- `context_click(on_element=None)` – kliknięcie prawym przyciskiem myszy (otwarcie menu kontekstowego).

- `double_click(on_element=None)` – podwójne kliknięcie lewym przyciskiem myszy.

- `move_to_element(to_element)` – przesunięcie kursora myszy nad wskazany element.

- `move_by_offset(xoffset, yoffset)` – przesunięcie kursora o określony *offset* względem aktualnej pozycji.

- `drag_and_drop(source, target)` – przeciągnięcie elementu źródłowego i upuszczenie go na element docelowy.

- `drag_and_drop_by_offset(source, xoffset, yoffset)` – przeciągnięcie elementu o określony *offset*.

- `release(on_element=None)` – zwolnienie przycisku myszy, np. po przeciąganiu.

In [None]:
# start przeglądarki i inicjalizacja ActionChains
driver = webdriver.Firefox()
actions = webdriver.ActionChains(driver)

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://the-internet.herokuapp.com/key_presses")
elem = driver.find_element(By.ID, "target")

In [None]:
# zwykłe kliknięcie
actions.click(elem).perform()

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://unixpapa.com/js/testmouse.html")
elem = driver.find_element(By.CLASS_NAME, "page")

In [None]:
# click + hold + release
actions.click_and_hold(elem).pause(2).release().perform()

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://the-internet.herokuapp.com/context_menu")
elem = driver.find_element(By.ID, "hot-spot")

In [None]:
# context_click (prawy przycisk myszy)
actions.context_click(elem).perform()

In [None]:
# wszystkie kliki myszki
from selenium.webdriver.common.actions.mouse_button import MouseButton
from selenium.webdriver.common.action_chains import ActionBuilder

action = ActionBuilder(driver)

action.pointer_action.click(None, MouseButton.LEFT)
action.pointer_action.click(None, MouseButton.MIDDLE)
action.pointer_action.click(None, MouseButton.RIGHT)
action.pointer_action.click(None, MouseButton.BACK)
action.pointer_action.click(None, MouseButton.FORWARD)
action.perform()

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://cps-check.com/double-click-test")
elem = driver.find_element(By.ID, "clicker")

In [None]:
# double_click
actions.double_click(elem).perform()

In [None]:
# załadowanie strony + zapisanie odnośnika do elementów
driver.get("https://the-internet.herokuapp.com/hovers")
elem = driver.find_elements(By.CLASS_NAME, "figure")

In [None]:
# move_to_element
actions.move_to_element(elem[2]).perform()

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://openlayers.org/en/latest/examples/mouse-position.html")
elem = driver.find_element(By.ID, "map")

In [None]:
# move_to_element z offsetem
actions.move_to_element_with_offset(elem, 10, 0).perform()

In [None]:
# użycie move_by_offset od aktualnej pozycji
actions.move_by_offset(100, 0).perform()

In [None]:
# załadowanie strony + zapisanie odnośnika elementu
driver.get("https://jqueryui.com/droppable/")

In [None]:
# przełączenie do iframe
iframe = driver.find_element(By.CSS_SELECTOR, "iframe.demo-frame")
driver.switch_to.frame(iframe)

In [None]:
# drag_and_drop
source = driver.find_element(By.ID, "draggable")
target = driver.find_element(By.ID, "droppable")
actions.drag_and_drop(source, target).perform()

In [None]:
# drag_and_drop_by_offset
actions.click_and_hold(source).move_by_offset(133, 7).release().perform()

#### Scroll

`scroll_to_element(element)` – przewija stronę tak, aby wskazany element był widoczny.

`scroll_by_amount(xoffset, yoffset)` – przewija stronę o określoną liczbę pikseli w poziomie i pionie.

`scroll_from_element(element, xoffset, yoffset)` – przewija od miejsca, gdzie znajduje się dany element o wskazany *offset*.

`scroll_from_element_with_offset(element, x, y, xoffset, yoffset)` – przewija z pozycji określonej przez *offset* (x, y) względem danego elementu.

`scroll_from_origin(origin, xoffset, yoffset)` – przewija od wskazanego punktu (np. elementu) o zadany *offset*.

In [None]:
# start przeglądarki i inicjalizacja ActionChains
driver = webdriver.Chrome()
actions = webdriver.ActionChains(driver)

In [None]:
# załadowanie strony
driver.get("https://jqueryui.com/droppable/")

In [None]:
# scroll do elementu
el = driver.find_element(By.TAG_NAME, "footer")
actions.scroll_to_element(el).perform()

In [None]:
# scroll by amount (z aktualnej pozycji kursora / widoku) (ujemna wartość - w górę)
actions.scroll_by_amount(0, -900).perform()

In [None]:
# import
from selenium.webdriver.common.actions.wheel_input import ScrollOrigin

In [None]:
# scroll to element by amount (element + offset)
scroll_origin = ScrollOrigin.from_element(el)
actions.scroll_from_origin(scroll_origin, 0, -450).perform()

In [None]:
# załadowanie strony
driver.get("https://en.wikipedia.org/wiki/Lorem_ipsum")

In [None]:
# sprawdzenie wysokości strony (scroll'a)
height = driver.execute_script("return document.body.scrollHeight")
print(height)

4015


In [None]:
# od "Viewport" 
scroll_origin = ScrollOrigin.from_viewport(0, 300)
actions.scroll_from_origin(scroll_origin, 0, 2000).perform()

In [None]:
# wybór elementu 
el = driver.find_element(By.ID, "Source_text")

In [None]:
# od elementu (+ offset)
scroll_origin = ScrollOrigin.from_element(el, x_offset=0, y_offset=-100)
actions.scroll_from_origin(scroll_origin, 0, 300).perform()

Po co?

- Umożliwia interakcje z elementami poza widocznym obszarem strony – np. przycisk „Dalej”, który trzeba przewinąć, aby kliknąć.

- Testowanie dynamicznych interfejsów – gdzie nowe treści ładują się po przewinięciu (np. infinite scroll).

- Symulowanie realistycznych zachowań użytkownika – np. scrollowanie do sekcji strony, zanim nastąpi akcja.

- Precyzyjne kontrolowanie pozycji strony lub elementu – np. sprawdzania widoczności banerów, sticky-headerów czy animacji.

## Praktyki dobrego testowania

### 1. Strategie

- **LoadableComponent**  
Wzorzec, w którym każda strona reprezentowana jest jako klasa z metodą sprawdzającą, czy strona została poprawnie załadowana (`is_loaded()`). Umożliwia to wykonywanie testów dopiero wtedy, gdy strona jest gotowa, co zwiększa stabilność testów.

In [None]:
class ProductPage:
    def __init__(self, driver):
        self.driver = driver
        self.url = "adres strony"

    def load(self):
        self.driver.get(self.url)

    def is_loaded(self):
        return self.driver.find_element(By.ID, "article").is_displayed()

- **Bot Pattern**  
Podejście polegające na tworzeniu klas (botów), które grupują typowe akcje użytkownika, takie jak logowanie, rejestracja czy zakupy. Dzięki temu testy są czytelniejsze, krótsze i łatwiejsze w utrzymaniu. Zamiast bezpośrednio używać Selenium, wywołuje się metody wysokiego poziomu (np. `bot.login()`).

In [None]:
class LoginBot:
    def __init__(self, driver):
        self.driver = driver

    def login(self, username, password):
        self.driver.get("adres strony logowania")
        self.driver.find_element(By.ID, "username").send_keys(username)
        self.driver.find_element(By.ID, "password").send_keys(password)
        self.driver.find_element(By.ID, "submit").click()

### 2. Typy testów

- **Testy funkcjonalne**  
  Testy te sprawdzają, czy konkretne funkcje aplikacji działają zgodnie z oczekiwaniami użytkownika. Celem jest upewnienie się, że poszczególne elementy systemu (np. formularze, przyciski) działają poprawnie w kontekście użycia.  
  **Przykład**: Testowanie procesu dodawania produktu do koszyka w sklepie internetowym.

- **Testy akceptacyjne**  
  Weryfikują, czy aplikacja spełnia wymagania klienta lub użytkownika końcowego. Często są to testy na poziomie biznesowym, gdzie sprawdza się, czy aplikacja działa zgodnie z oczekiwaniami zdefiniowanymi w specyfikacji.  
  **Przykład**: Testowanie pełnego procesu zakupowego w sklepie internetowym, od dodania produktu do koszyka, przez dane adresowe, aż po płatność.

- **Testy integracyjne**  
  Testują, jak różne komponenty systemu współdziałają ze sobą. Celem jest sprawdzenie, czy np. frontend poprawnie komunikuje się z backendem lub API. Testy te pomagają wykryć problemy na poziomie integracji systemu.  
  **Przykład**: Testowanie integracji między frontendem sklepu internetowego a systemem płatności, sprawdzając, czy poprawnie przechodzi się przez proces płatności.

- **Testy systemowe**  
  Sprawdzają cały system w warunkach zbliżonych do rzeczywistego środowiska produkcyjnego. Testują działanie aplikacji jako całości, w tym współpracę różnych modułów, baz danych, interfejsów itp.  
  **Przykład**: Testowanie pełnego procesu zamówienia, w tym zarówno frontend, jak i backend, aż po zapisywanie danych w bazie.

- **Testy wydajnościowe**:
  - *Testy obciążeniowe* – badają, jak system zachowuje się przy normalnym, przewidywanym obciążeniu, np. przy określonej liczbie użytkowników jednocześnie korzystających z aplikacji.  
    **Przykład**: Testowanie wydajności systemu sklepu internetowego, gdy wielu użytkowników dokonuje zakupu jednocześnie.
    
  - *Stress testy* – mają na celu sprawdzenie, jak system reaguje na ekstremalne warunki, takie jak nadmierne obciążenie lub brak zasobów. Testy te pomagają znaleźć limity wydajnościowe systemu.  
    **Przykład**: Testowanie systemu pod dużym obciążeniem, gdzie kilkuset użytkowników próbuje dokonać zakupu jednocześnie.

- **Testy regresyjne**  
  Mają na celu wykrycie błędów w istniejącej funkcjonalności aplikacji po wprowadzeniu zmian w kodzie. Testy te pomagają upewnić się, że nowe funkcje lub poprawki nie wprowadziły nowych problemów w już działających częściach systemu.  
  **Przykład**: Sprawdzanie, czy zmiany w procesie płatności nie spowodowały problemów w innych częściach procesu zakupu.


### 3. Wspierane praktyki

- **Page Object Model** – rozdzielenie logiki testów od reprezentacji elementów UI. Dzięki temu, zmiany w interfejsie użytkownika nie wpływają bezpośrednio na testy, a testy stają się łatwiejsze do utrzymania.
  
- **DSL (Domain-Specific Language)** – stosowanie własnych metod (np. `user_logs_in()`) zamiast bezpośrednich komend Selenium. Użycie własnych, dobrze nazwanych metod pozwala na lepszą czytelność i ponowne użycie kodu w testach.

- **Przygotowanie stanu aplikacji bez Selenium** – np. przez REST API lub manipulację bazą danych. Pozwala to na szybkie przygotowanie aplikacji do testów bez potrzeby korzystania z interfejsu użytkownika.

- **Mockowanie zewnętrznych zależności** – odseparowanie testowanej aplikacji od np. usług zewnętrznych. Pozwala na kontrolowanie środowiska testowego i symulowanie różnych scenariuszy bez potrzeby interakcji z rzeczywistymi zewnętrznymi systemami.

- **Rozszerzanie raportów** – wykorzystanie narzędzi jak Allure, Pytest HTML czy TestNG. Dobre raportowanie ułatwia analizowanie wyników testów i daje lepszy wgląd w jakość aplikacji.

- **Izolacja testów** – każdy test powinien działać niezależnie od innych. Testy nie mogą na siebie wzajemnie wpływać, aby zmiana w jednym teście nie powodowała błędów w innych.

- **Dobre selektory** – stabilne, odporne na zmiany (np. `data-testid`, `aria-label`). Użycie odpornych na zmiany selektorów poprawia stabilność testów, ponieważ nie są one zależne od drobnych zmian w wyglądzie aplikacji.

- **Niezależność testów** – test nie może bazować na stanie poprzednich testów. Każdy test powinien być autonomiczny, aby wyniki testów były wiarygodne, niezależnie od kolejności ich uruchamiania.

- **Fluent API** – testy jako łańcuchy metod (np. `login().navigate().verify()`). Takie podejście poprawia czytelność testów i sprawia, że są one bardziej intuicyjne, łatwiejsze do napisania i utrzymania.

- **Czysty stan początkowy** – każdy test powinien zaczynać od tej samej konfiguracji środowiska. Dzięki temu wyniki testów będą zawsze porównywalne, a błędy łatwiejsze do wykrycia, ponieważ nie będą wynikały z różnic w środowisku.


### 4. Odradzane praktyki

- **Testowanie CAPTCHA** – CAPTCHA są zaprojektowane, by uniemożliwić automatyzację procesów. Ponieważ wymaga ona interakcji użytkownika, automatyczne testowanie takich mechanizmów za pomocą Selenium jest trudne lub niemożliwe, co czyni te testy nieefektywnymi i problematycznymi w automatyzacji.

- **Pobieranie plików** – Selenium nie jest w stanie monitorować postępu pobierania plików. Działa na poziomie interfejsu użytkownika, a nie systemu operacyjnego, co uniemożliwia precyzyjne śledzenie procesu pobierania. Testowanie postępu pobierania plików należy przeprowadzać przy użyciu innych narzędzi.

- **Testowanie kodów HTTP** – Selenium jest narzędziem do testowania interfejsu użytkownika, a nie komunikacji sieciowej. Testy kodów HTTP, jak np. statusy odpowiedzi 200 czy 404, należy przeprowadzać na poziomie backendu, używając odpowiednich narzędzi do testowania API, takich jak Postman czy JMeter.

- **Logowanie przez zewnętrzne systemy (FB, Google)** – Proces logowania za pomocą zewnętrznych systemów, takich jak Facebook czy Google, jest trudny do automatyzacji i może stać się niestabilny. Takie logowanie jest podatne na zmiany w API tych zewnętrznych systemów, co może prowadzić do problemów z utrzymaniem testów.

- **Testy wydajnościowe** – Selenium nie jest narzędziem do testowania wydajnościowego, ponieważ działa na poziomie UI. Do testów obciążeniowych lepiej użyć dedykowanych narzędzi, takich jak JMeter czy Locust, które są zoptymalizowane do symulacji dużego obciążenia systemu.

- **Link spidering** – "Link spidering", czyli automatyczne przechodzenie przez wszystkie linki na stronie, jest zbyt czasochłonne i nieoptymalne w Selenium. Dla takich zadań lepiej sprawdzą się narzędzia typu Scrapy, które zostały zaprojektowane do szybkiego przeszukiwania i indeksowania stron internetowych.

- **2FA (uwierzytelnianie dwuskładnikowe)** – Automatyzacja procesów z dwuskładnikowym uwierzytelnianiem (2FA) jest trudna i może wymagać wyłączenia tego mechanizmu lub jego mockowania w środowisku testowym. Ponieważ 2FA wymaga interakcji z użytkownikiem (np. wprowadzenie kodu z SMS), automatyzacja jest niewygodna i podatna na błędy.
