# Selenium

Biblioteka do automatyzacji działań w przeglądarkach internetowych. Głównie służąca do scrapowania informacji ze stron internetowych oraz do automatyzacji testów (black-box tests).

### Import bibliotek

In [3]:
import selenium as se
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
import time

## Prosty przykład działania

Utworzenie instancji WebDriver dla przeglądarki Firefox i uruchomienie strony Google

In [6]:
driver = webdriver.Firefox()
driver.get("https://www.google.com")

Wyszukanie elementu po poniższym ID oraz kliknięcie w ten element (guzik "Odrzuć")

In [7]:
odrzuc = driver.find_element(By.ID, "W0wltc")
odrzuc.click()

Znalezienie pola wyszukiwania po id (sposób z selektorem CSS), przesłanie słowa Python do pola i przesłanie formularza (w tym przypadku przesłanie frazy do wyszukania) 

In [8]:
poleWyszukiwania = driver.find_element(By.CSS_SELECTOR, "#APjFqb")
poleWyszukiwania.send_keys("Python")
poleWyszukiwania.submit()

Zamknięcie przeglądarki

In [9]:
driver.quit()

## WebDriver

Klasa do zarządzania sesją przeglądarki. Używając instancji tej klasy możemy:
- otworzyć daną stronę
- zczytać dane ze strony (scrapowanie)
- wejście w interakcję ze stroną
- zakmnięcie okna przeglądarki

Aktualnie wspierane przeglądarki do automatyzacji z użyciem Selenium to Chrome, Edge, Firefox, Internet Exploder i Safari. Każda przeglądarka posiada swoją instancję WebDrivera, np. `Edge()` dla przeglądarki Microsoft Edge.

In [None]:
driver=webdriver.Firefox() # przeglądarka Firefox

### WebDriver Options

Klasa do ustawienia opcji dla danego WebDrivera. Każda przeglądarka posiada swoją własną klasę opcji - wszystkie posiadają część wspólnych ustawień jak i również te specyficzne dla danej przeglądarki. 

Instację opcji Edge'a i Chrome'a tworzy się przy pomocy funkcji `get_default_edge_options()` lub `get_default_chrome_options()`, dla reszty przeglądarek korzysta się z konstruktora odpowiednich klas (dla Firefoxa, `FirefoxOptions()`).

Aby zmodyfikować opcje, należy zmienić wartości w słowniku `capabilities` lub zmienić wartość pola (dla niektórych pól).

In [None]:
options=webdriver.FirefoxOptions()
driver=webdriver.Firefox(options=options)
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}}


Opcje domyślnie (widoczny powyżej) składają się z poniższych ustawień:
- `browserName` - nazwa wyszukiwarki
- `acceptInsecureCerts` - jeśli jest `False`, zwraca błąd przy nawigacji strony z przedawnionym lub niewłaściwym certyfikatem TLS
- `moz:debuggerAddress` - specjalny parametr Firefoxa - wskazuje czy uruchomić server do debugowania przy starcie WebDrivera
- `pageLoadStrategy` - strategia ładowania strony:
    - `normal` - czeka na załadowanie się całej strony
    - `eager` - aktywuje się gdy jest dostęp do pełnej strony od strony html, ale inne elementy nieinteraktywne np. obrazy mogą być w trakcie ładowania
    - `none` - nie czeka, webDriver kontynuuje działanie od razu
    
    Bazuje na stanie parametru DOM `document.readyState`.
- `browserVersion` - wersja przeglądarki, opcjonalnie
- opcja na specyficzne ustawienia, tutaj `moz:firefoxOptions`:
    - `binary` - określa ścieżkę do przeglądarki
    - `prefs` - preferncje profilu, tutaj ustawienie odnośnie wyboru aktywnego protokołu


#### Timeouts

Można dodatkowo ustawić różne interwały czasu, w których skrypt ma wykonać określoną czynność. Są 3 rodzaje:
- `script` - interwał czasu na wykonanie skryptu w danym kontekście, domyślnie ustawiony na 30 sekund
- `pageLoad` - interwał czasu na załadowanie strony, domyślnie 5 minut
- `implicit` - interwał czasu na znalezienie wskazanego elementu na stronie, domyślnie opcja ustawiona na 0 (minimalny czas)

In [None]:
options.timeouts={'script':10000,'pageLoad':50000,'implicit':100}
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}}


#### unhandledPromptBehivour

Parametr określający akcję do wykonania przy natrafieniu pop-upu lub okienek potwierdzenia. Dostępne są poniższe stany:
- `dismiss` - automatyczne odrzucenie
- `accept` - automatyczne zatwierdzenie
- `dismiss and notify` - automatyczne odrzucenie i powiadomienie webDrivera
- `accept and notify` - automatyczne zatwierdzenie i powiadomienie webDrivera
- `ignore` - zignorowanie

In [None]:
options.unhandled_prompt_behavior = 'accept'
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept'}


#### setWindowRect

Wskazuje, czy przeglądarka wspiera wszystkie komendy do zmiany lokalizacji i rozmiaru

In [None]:
options.set_window_rect = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True}


#### strictFileInteractibility

Parametr wskazujący, czy na wszelkie pola do przesłania plików (`<input type="file">`) mają być dodatkowo sprawdzane pod kątem widoczności i dostępności. Przy ustawieniu wartości na `False`, webDriver będzie mógł przesłać plik pomimo schowania/zablokowania dostępu do przesłania dla zwykłego użytkownika.

In [None]:
options.strict_file_interactability = True
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True}


#### Proxy

Ustawienie serwera proxy. Przyjmuje takie argumenty jak np. adresy serwerów różnego rodzaju, autodetekcję czy jej typ. Dostępne typy:
- `DIRECT` - bezpośrednie połączenie
- `MANUAL` - manualne ustawienie proxy (np. dla serwera http)
- `PAC` - autokonfiguracja z URL
- `AUTODETECT` - autodetekcja
- `SYSTEM` - użycie ustawień systemowych

In [None]:
from selenium.webdriver.common.proxy import Proxy,ProxyType
options.proxy=Proxy({'proxyType':ProxyType.MANUAL,'httpProxy': '127.0.0.1:6942'})
print(options.capabilities)

{'browserName': 'firefox', 'acceptInsecureCerts': True, 'moz:debuggerAddress': True, 'pageLoadStrategy': <PageLoadStrategy.normal: 'normal'>, 'browserVersion': None, 'moz:firefoxOptions': {'binary': 'C:\\Program Files\\Mozilla Firefox\\firefox.exe', 'prefs': {'remote.active-protocols': 3}}, 'timeouts': {'script': 10000, 'pageLoad': 50000, 'implicit': 100}, 'unhandledPromptBehavior': 'accept', 'setWindowRect': True, 'strictFileInteractability': True, 'proxy': {'proxyType': 'manual', 'httpProxy': '127.0.0.1:6942'}}


In [None]:
#reset opcji
options=webdriver.FirefoxOptions()

### WebDriver Service

Klasa z ustawieniami technicznymi dla WebDrivera, takie jak lokalizacja, port do użycia i które argumenty zostają przekazane do wiersza poleceń.

Podobnie jak opcje, przekazuje się je do konstruktora WebDrivera poprzez argument, tutaj keyword `service`.

In [None]:
service=webdriver.FirefoxService()
driver=webdriver.Firefox(service=service)

#### Lokalizacja Drivera

W wersji Selenium 4.6 i wyżej, nie jest potrzebne wskazywanie lokalizacji Drivera, w razie braku możliwości updatu lub z innego powodu, można ustawić ją w instancji serwisu przez argument `executable_path`.

In [None]:
path='./some/path'
service=webdriver.FirefoxService(executable_path=path) #oczywiście nie zadziała ;P

#### Docelowe miejsce logowania

Aby wskazać plik, do którego chcemy wysyłać informacje logowane od WebDrivera, można to wskazać używając argumentu `log_path`. Jeśli chcemy, aby logi pojawiały się w wierszu konsoli, możemy to wskazać poprzez `subprocess.STDOUT` (z pakietu `subprocess`)

In [4]:
import subprocess
service=webdriver.FirefoxService(log_output=subprocess.STDOUT)

#### `service_args`

Aby 

### WebDriver Profile (Firefox exclusive)

## Elementy strony - narzędzia do scrapowania i nie tylko

### Przerwy - instrukcje czekania

## Interakcje z przeglądarką

## Actions API - mimika zachowania użytkownika

## Praktyki dobrego testowania

## Grid - do testowania na wielu maszynach