# Session 4: Selenium - Automatizace prohlizece

Selenium umoznuje ovladat webovy prohlizec pomoci Pythonu. Je uzitecny pro stranky, ktere pouzivaji JavaScript.

### Podporovane prohlizece

| Prohlizec | Prikaz |
|-----------|--------|
| Chrome | `webdriver.Chrome()` |
| Firefox | `webdriver.Firefox()` |
| Edge | `webdriver.Edge()` |
| Opera | Pouziva ChromeDriver (viz nize) |

### Jak to funguje?

Od Selenium 4.6+ se driver stahne automaticky - nemusite rucne instalovat drivre! jenom knihovnu!

---

## 1. Instalace knihoven

Nejprve nainstalujeme potrebne knihovny. Spustte nasledujici bunku:

In [None]:
%pip install selenium

---

## 2. Uvod do Selenia

**Selenium** umoznuje ovladat webovy prohlizec pomoci Pythonu.

Pouzivame ho kdyz:
- Stranka pouziva JavaScript pro nacitani obsahu
- Potrebujeme klikat na tlacitka nebo vyplnovat formulare
- Obsah se meni dynamicky

### Podporovane prohlizece

| Prohlizec | Prikaz |
|-----------|--------|
| Chrome | `webdriver.Chrome()` |
| Firefox | `webdriver.Firefox()` |
| Edge | `webdriver.Edge()` |

Od Selenium 4.6+ se driver stahne automaticky!

In [None]:
from selenium import webdriver
from selenium.webdriver.common.by import By

### Spusteni prohlížeče - závisí od používaného prohlížeče

! zmeňte si na `Code` příslušné buňky podle typu používaného prohlížeče a spusťte je. Je to nastaveno, že máte Chrome. Kdo ma jiný, přestavte si to.

#### Chrome

In [None]:
browser = webdriver.Chrome()

#### Firefox

#### Edge

#### Opera

### Další práce v spusteném prohlížeči

In [None]:
# Otevreni stranky
browser.get('https://books.toscrape.com/')

In [None]:
# Nalezeni elementu pomoci CSS selektoru
title = browser.find_element(by=By.CSS_SELECTOR, value='h1')

print(f"Nazev stranky: {title.text}")

In [None]:
# Nalezeni vsech knih
books = browser.find_elements(by=By.CSS_SELECTOR, value='article.product_pod')

print(f"Pocet knih: {len(books)}")

In [None]:
# Vypsani prvnich 5 knih
for book in books[:5]:
    name = book.find_element(by=By.CSS_SELECTOR, value='h3 a').get_attribute('title')
    price = book.find_element(by=By.CSS_SELECTOR, value='p.price_color').text
    print(f"{name}: {price}")

In [None]:
# Zavreni prohlizece - DULEZITE!
browser.quit()

### Pokud automaticke stahovani driveru nefunguje
Tohle je postup z LMS:

Nainstalujte knihovnu `webdriver-manager`:

```python
%pip install webdriver-manager

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

service = Service(ChromeDriverManager().install())
browser = webdriver.Chrome(service=service)
```

---

## 3. BeautifulSoup vs Selenium

| Vlastnost | BeautifulSoup | Selenium |
|-----------|--------------|----------|
| Rychlost | Rychlejsi | Pomalejsi |
| JavaScript | Nepodporuje | Podporuje |
| Interakce | Ne (jen cteni) | Ano (klikani, psani) |
| Pouziti | Staticke stranky | Dynamicke stranky |
| Pamet | Mensi spotreba | Vetsi spotreba |

---

## Uzitecne zdroje

- **CSS selektor hra:** https://flukeout.github.io/ - interaktivni procviceni CSS selektoru
- **Books to Scrape:** https://books.toscrape.com/ - cvicna stranka pro web scraping
- **Selenium dokumentace:** https://www.selenium.dev/documentation/

---

## Prehled pouzitych metod

| Metoda | Popis |
|--------|-------|
| `webdriver.Chrome()` | Spusti prohlizec |
| `browser.get(url)` | Otevre stranku |
| `browser.find_element(by, value)` | Najde element |
| `browser.find_elements(by, value)` | Najde vsechny |
| `element.text` | Textovy obsah |
| `element.get_attribute('attr')` | Hodnota atributu |
| `browser.quit()` | Zavre prohlizec |