From 9aae309a75db3f77b9f09133dd42e5dfaf4b2fd1 Mon Sep 17 00:00:00 2001 From: Ludmila Tydlitatova Date: Wed, 19 Oct 2022 22:17:13 +0200 Subject: [PATCH 1/3] Typo --- ziskavani-dat/webscraping/html.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ziskavani-dat/webscraping/html.md b/ziskavani-dat/webscraping/html.md index 6d857cf..3068268 100644 --- a/ziskavani-dat/webscraping/html.md +++ b/ziskavani-dat/webscraping/html.md @@ -6,7 +6,7 @@ Web scraping je technika pomocí které můžeme strojově číst obsah webovýc ### HTML značky (tagy) -V následující ukázce vidíte HTML kód celé webové stránky tak, jak by si ji stáhl prohlížeč odněkud ze server. +V následující ukázce vidíte HTML kód celé webové stránky tak, jak by si ji stáhl prohlížeč odněkud ze serveru. ```html From 4b81e1b00f112aaa182ff3b59acdd28ebcd77fab Mon Sep 17 00:00:00 2001 From: Ludmila Tydlitatova Date: Wed, 19 Oct 2022 22:17:49 +0200 Subject: [PATCH 2/3] Spravne pojmenovani ukazoveho souboru; markdown --- ziskavani-dat/webscraping/webscraping.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/ziskavani-dat/webscraping/webscraping.md b/ziskavani-dat/webscraping/webscraping.md index a135276..0d46aef 100644 --- a/ziskavani-dat/webscraping/webscraping.md +++ b/ziskavani-dat/webscraping/webscraping.md @@ -18,12 +18,12 @@ Ve Visual Studiu ve složce s naší ukázkovou stránkou si vytvořte program ` ```py from requests_html import HTML -with open('sample.html', encoding='utf-8') as soubor: +with open('ukazka.html', encoding='utf-8') as soubor: obsah = soubor.read() html = HTML(html=obsah) ``` -Proměnná html, nyní obsahuje naši HTML stránku ve formátu, který můžeme použít k vyhledávání. +Proměnná `html` nyní obsahuje naši HTML stránku ve formátu, který můžeme použít k vyhledávání. HTML značky můžeme vyhledávat podle jména. Takto například najdeme všechny odstavce a vypíšeme jejich text každý na nový řádek. From 31e0c85da8808a91da307d736dd9fef4e27e5f5e Mon Sep 17 00:00:00 2001 From: Ludmila Tydlitatova Date: Thu, 20 Oct 2022 16:27:04 +0200 Subject: [PATCH 3/3] =?UTF-8?q?Zjednodu=C5=A1en=C3=AD=20instrukc=C3=AD?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- ziskavani-dat/webscraping/html.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/ziskavani-dat/webscraping/html.md b/ziskavani-dat/webscraping/html.md index 3068268..5e98f16 100644 --- a/ziskavani-dat/webscraping/html.md +++ b/ziskavani-dat/webscraping/html.md @@ -46,7 +46,7 @@ Stránka se poté v prohlížeči zobrazí nějak takto. Zatím nevypadá příl ::fig[Ukázka HTML]{src=assets/ukazka-html.png size=80} -Vytvořte si na svém počítači složku `ukazka-html` a otevřete ji ve Visual Studiu. Vytvořte v této složce soubor `ukazka.html` a zkopírujte do něj výše uvedený kód a uložte. Poté tento soubor najděte v průzkumníku a dvojklikem by se vám měl otevřít ve vašem oblíbeném prohlížeči. Můžete tak zkontrolovat, že prohlížeč vaši stránku skutečně zobrazí tak, jak je uvedeno na obrázku výše. +Vytvořte si ve Visual Studiu soubor `ukazka.html`, zkopírujte do něj výše uvedený kód a soubor uložte. Poté tento soubor najděte v průzkumníku a dvojklikem by se vám měl otevřít ve vašem oblíbeném prohlížeči. Můžete tak zkontrolovat, že prohlížeč vaši stránku skutečně zobrazí tak, jak je uvedeno na obrázku výše. V naší první webové stránce jsme viděli takzvané :term{cs="HTML značky" en="HTML tags"}. Značky se píší do špičatých závorek a většina značek má otevírací a zavírací část. Například značka `em` pro zvýraznění textu vypadá takto