Skip to content
Merged
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
4 changes: 2 additions & 2 deletions ziskavani-dat/webscraping/html.md
Original file line number Diff line number Diff line change
Expand Up @@ -6,7 +6,7 @@ Web scraping je technika pomocí které můžeme strojově číst obsah webovýc

### HTML značky (tagy)

V následující ukázce vidíte HTML kód celé webové stránky tak, jak by si ji stáhl prohlížeč odněkud ze server.
V následující ukázce vidíte HTML kód celé webové stránky tak, jak by si ji stáhl prohlížeč odněkud ze serveru.

```html
<html>
Expand Down Expand Up @@ -46,7 +46,7 @@ Stránka se poté v prohlížeči zobrazí nějak takto. Zatím nevypadá příl

::fig[Ukázka HTML]{src=assets/ukazka-html.png size=80}

Vytvořte si na svém počítači složku `ukazka-html` a otevřete ji ve Visual Studiu. Vytvořte v této složce soubor `ukazka.html` a zkopírujte do něj výše uvedený kód a uložte. Poté tento soubor najděte v průzkumníku a dvojklikem by se vám měl otevřít ve vašem oblíbeném prohlížeči. Můžete tak zkontrolovat, že prohlížeč vaši stránku skutečně zobrazí tak, jak je uvedeno na obrázku výše.
Vytvořte si ve Visual Studiu soubor `ukazka.html`, zkopírujte do něj výše uvedený kód a soubor uložte. Poté tento soubor najděte v průzkumníku a dvojklikem by se vám měl otevřít ve vašem oblíbeném prohlížeči. Můžete tak zkontrolovat, že prohlížeč vaši stránku skutečně zobrazí tak, jak je uvedeno na obrázku výše.

V naší první webové stránce jsme viděli takzvané :term{cs="HTML značky" en="HTML tags"}. Značky se píší do špičatých závorek a většina značek má otevírací a zavírací část. Například značka `em` pro zvýraznění textu vypadá takto

Expand Down
4 changes: 2 additions & 2 deletions ziskavani-dat/webscraping/webscraping.md
Original file line number Diff line number Diff line change
Expand Up @@ -18,12 +18,12 @@ Ve Visual Studiu ve složce s naší ukázkovou stránkou si vytvořte program `

```py
from requests_html import HTML
with open('sample.html', encoding='utf-8') as soubor:
with open('ukazka.html', encoding='utf-8') as soubor:
obsah = soubor.read()
html = HTML(html=obsah)
```

Proměnná html, nyní obsahuje naši HTML stránku ve formátu, který můžeme použít k vyhledávání.
Proměnná `html` nyní obsahuje naši HTML stránku ve formátu, který můžeme použít k vyhledávání.

HTML značky můžeme vyhledávat podle jména. Takto například najdeme všechny odstavce a vypíšeme jejich text každý na nový řádek.

Expand Down