# Web Crawler

V tomto notebooku si vyzkoušíte, jak naprogramovat jednoduchý web crawler, tj. program, který sám prochází webové stránky a do vhodného formátu ukládá jejich obsah. K vytvoření takového programu použijete standardní funkce Pythonu, soubor modulů urllib pro otvírání webových stránek a knihovnu BeautifulSoup, díky které jednoduše získáte text z HTML kódu. 

## 1 S čím budete pracovat

### 1.1 HTML

HTML (HyperText Markup Language, česky hypertextový značkovací jazyk), je základním stavebním kamenem webových stránek. Tento jazyk definuje základní strukturu webu. Vedle HTML se při tvorbě stránek používají ještě CSS (Cascading Style Sheets, česky kaskádové styly) pro vzhled webu a programovací jazyk JavaScript např. pro ovládání interaktivních prvků.

Pro tento úkol je důležité seznámit se se strukturou HTML, abyste byli schopní ze stránek stáhnout holý text. Ten je v HTML uzavřen ve značkách, např. `<p>Ahoj!</p>` značí jeden odstavec obsahující text _Ahoj!_.

HTML kód jednotlivých stránek si můžete prohlédnout přímo v prohlížeči. Po kliknutí pravým tlačítkem myši do prostoru stránky se zobrazí menu, ze kterého vyberte Zobrazit zdrojový kód stránky. Otevře se nové okno, ve kterém uvidíte zdrojový kód stránky. Pro stahování dat bude důležité, abyste věděli, v jakých HTML značkách je uzavřen text, který chcete stáhnout. To zjistíte právě ve zdrojovém kódu.

Více o HTML a značkách například [zde](https://www.w3schools.com/html/html_intro.asp) nebo [zde](https://developer.mozilla.org/en-US/docs/Web/HTML).

### 1.2 urllib

urllib je soubor modulů umožňující pracovat s webovými adresami (URL). Z tohoto souboru je pro tento notebook nejdůležitější modul request, který otevře požadované URL.

### 1.3 BeautifulSoup

BeautifulSoup je knihovna pro stahování dat z HTML a XML souborů. V tomto úkolu ji použijete hlavně pro získání holého textu z HTML značek.

Více informací v [dokumentaci](https://beautiful-soup-4.readthedocs.io/en/latest/).

## 2 Instalace

### 2.1 urllib

urllib e součástí tzv. The Python Standard Library (standarní knihovny Pythonu), není tedy nutné nic instalovat.

Více informací na [The Python Standard Library](https://docs.python.org/3/library/).

### 2.2 BeautifulSoup

Instalaci BeautifulSoup provedete přímo v tomto notebooku pomocí následující buňky. 

Následující buňku pouze spusťte.

In [None]:
!pip3 install bs4

## 3 Import knihoven a modulů 

Než bude možné začít s psaním programu, je nutné importovat všechny knihovny a moduly, které budete potřebovat. Patří mezi ně:

- urllib
- BeautifulSoup

Spusťte následující buňku, knihovny se importují.

**Poznámka:** Po každém otevření notebooku je nutné všechen kód (tj. i importování) spustit znovu.

In [2]:
from urllib.request import urlopen #importuj modul urlopen
from bs4 import BeautifulSoup #importuj knihovnu BeautifulSoup

## 4 Otevření URL

Abyste mohli stáhnout textová data z internetových stránek, musíte je nejdřív v Pythonu otevřít. K tomu slouží modul `urlopen`.

In [128]:
f = urlopen('https://cs.wikipedia.org/wiki/Web_crawler') #otevři url

In [129]:
print(f) #vypiš proměnnou f

<http.client.HTTPResponse object at 0x7f89353c8430>


Jak si můžete všimnout výše, při vypsání proměnné se nevypíše její obsah. Pokud budete chtít obsah stránky vypsat, musíte nejprve použít metodu `read`, která přečte celý soubor.

In [130]:
f = f.read() #přečti proměnnou f

In [131]:
print(f) #vypiš proměnnou f

b'<!DOCTYPE html>\n<html class="client-nojs" lang="cs" dir="ltr">\n<head>\n<meta charset="UTF-8"/>\n<title>Web crawler \xe2\x80\x93 Wikipedie</title>\n<script>document.documentElement.className="client-js";RLCONF={"wgBreakFrames":false,"wgSeparatorTransformTable":[",\\t.","\xc2\xa0\\t,"],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"\xc4\x8cSN basic dt","wgMonthNames":["","leden","\xc3\xbanor","b\xc5\x99ezen","duben","kv\xc4\x9bten","\xc4\x8derven","\xc4\x8dervenec","srpen","z\xc3\xa1\xc5\x99\xc3\xad","\xc5\x99\xc3\xadjen","listopad","prosinec"],"wgRequestId":"5118d6bc-63a5-4070-bf09-b0e28b8939d8","wgCSPNonce":false,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":false,"wgNamespaceNumber":0,"wgPageName":"Web_crawler","wgTitle":"Web crawler","wgCurRevisionId":18168319,"wgRevisionId":18168319,"wgArticleId":1256095,"wgIsArticle":true,"wgIsRedirect":false,"wgAction":"view","wgUserName":null,"wgUserGroups":["*"],"wgCategories":["Monitoring:\xc4\x8cl\xc3\xa1nky p\xc5\x99elo\x

Vypsaný text je sice nepřehledný, můžete si ale všimnout, že nepodporuje písmena s diakritikou. Např. slovo _vyhledávače_ je v textu reprezentováno jako _vyhled\xc3\xa1va\xc4\x8de_. To souvisí s kódováním, tj. reprezentací znaků na počítači. Aby se vám text zobrazil i s písmeny s diakritikou, použijte metodu decode s parametrem UTF-8.

Více o kódování [zde](https://cs.wikipedia.org/wiki/K%C3%B3dov%C3%A1n%C3%AD_znak%C5%AF) a o standardu UTF-8 [zde](https://cs.wikipedia.org/wiki/UTF-8).

In [132]:
f_decoded = f.decode('UTF-8') #změň kódování na UTF-8

In [133]:
print(f_decoded) #vypiš proměnnou f_decoded

<!DOCTYPE html>
<html class="client-nojs" lang="cs" dir="ltr">
<head>
<meta charset="UTF-8"/>
<title>Web crawler – Wikipedie</title>
<script>document.documentElement.className="client-js";RLCONF={"wgBreakFrames":false,"wgSeparatorTransformTable":[",\t."," \t,"],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"ČSN basic dt","wgMonthNames":["","leden","únor","březen","duben","květen","červen","červenec","srpen","září","říjen","listopad","prosinec"],"wgRequestId":"5118d6bc-63a5-4070-bf09-b0e28b8939d8","wgCSPNonce":false,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":false,"wgNamespaceNumber":0,"wgPageName":"Web_crawler","wgTitle":"Web crawler","wgCurRevisionId":18168319,"wgRevisionId":18168319,"wgArticleId":1256095,"wgIsArticle":true,"wgIsRedirect":false,"wgAction":"view","wgUserName":null,"wgUserGroups":["*"],"wgCategories":["Monitoring:Články přeložené z enwiki","Pahýly","Monitoring:Články s identifikátorem TDKIV","Monitoring:Články s identifikátorem GND","Webový software"

## 5 BeautifulSoup

Pro získání holého textu bez HTML značek použijte knihovnu BeautifulSoup. Nejprve zavolejte BeautifulSoup konstruktor, který požaduje dva parametry:

1. HTML dokument (v tomto případě uložený v proměnné `f` z předchozí kapitoly),
2. typ parseru, v tomto případě `html.parser`, jelikož pracujete s dokumentem psaným v HTML.

Do proměnné `soup` uložte výsledek.

In [134]:
soup = BeautifulSoup(f, 'html.parser') #ulož BeautifulSoup objekt do proměnné soup

Po vypsání proměnné `soup` si na první pohled nevšimnete větších změn od výpisů v minulé sekci. Díky použití konstruktoru můžete použít metody z knihovny BeautifulSoup pro práci s HTML dokumenty, jelikož se nejedná o obyčejný textový řetězec ale objekt BeautifulSoup.

In [135]:
print(soup) #vypiš proměnnou soup

<!DOCTYPE html>

<html class="client-nojs" dir="ltr" lang="cs">
<head>
<meta charset="utf-8"/>
<title>Web crawler – Wikipedie</title>
<script>document.documentElement.className="client-js";RLCONF={"wgBreakFrames":false,"wgSeparatorTransformTable":[",\t."," \t,"],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"ČSN basic dt","wgMonthNames":["","leden","únor","březen","duben","květen","červen","červenec","srpen","září","říjen","listopad","prosinec"],"wgRequestId":"5118d6bc-63a5-4070-bf09-b0e28b8939d8","wgCSPNonce":false,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":false,"wgNamespaceNumber":0,"wgPageName":"Web_crawler","wgTitle":"Web crawler","wgCurRevisionId":18168319,"wgRevisionId":18168319,"wgArticleId":1256095,"wgIsArticle":true,"wgIsRedirect":false,"wgAction":"view","wgUserName":null,"wgUserGroups":["*"],"wgCategories":["Monitoring:Články přeložené z enwiki","Pahýly","Monitoring:Články s identifikátorem TDKIV","Monitoring:Články s identifikátorem GND","Webový software

In [136]:
type(soup) #vypiš datový typ proměnné soup

bs4.BeautifulSoup

### 5.1 prettify

První užitečnou metodou je `prettify`, která text formátuje do přehledného řetězce. Díky tomu si HTML kód můžete přehledně prohlédnout a nemusíte využívat zdrojový kód stránky.

In [137]:
print(soup.prettify()) #formátuj dokument pomocí metody prettify

<!DOCTYPE html>
<html class="client-nojs" dir="ltr" lang="cs">
 <head>
  <meta charset="utf-8"/>
  <title>
   Web crawler – Wikipedie
  </title>
  <script>
   document.documentElement.className="client-js";RLCONF={"wgBreakFrames":false,"wgSeparatorTransformTable":[",\t."," \t,"],"wgDigitTransformTable":["",""],"wgDefaultDateFormat":"ČSN basic dt","wgMonthNames":["","leden","únor","březen","duben","květen","červen","červenec","srpen","září","říjen","listopad","prosinec"],"wgRequestId":"5118d6bc-63a5-4070-bf09-b0e28b8939d8","wgCSPNonce":false,"wgCanonicalNamespace":"","wgCanonicalSpecialPageName":false,"wgNamespaceNumber":0,"wgPageName":"Web_crawler","wgTitle":"Web crawler","wgCurRevisionId":18168319,"wgRevisionId":18168319,"wgArticleId":1256095,"wgIsArticle":true,"wgIsRedirect":false,"wgAction":"view","wgUserName":null,"wgUserGroups":["*"],"wgCategories":["Monitoring:Články přeložené z enwiki","Pahýly","Monitoring:Články s identifikátorem TDKIV","Monitoring:Články s identifikátorem GND"

### 5.2 get_text

Metoda `get_text` vám umožní získat holý text bez HTML značek. Můžete ji použít na celý text nebo jen na text v určitých značkách.

In [138]:
txt = soup.get_text() #získej text z proměnné soup

In [139]:
print(txt) #vypiš text





Web crawler – Wikipedie
































Web crawler

Z Wikipedie, otevřené encyklopedie



Skočit na navigaci
Skočit na vyhledávání
Web crawler (někdy také spider) je v informatice specializovaný internetový bot, který prochází World Wide Web za účelem vytvoření obrovské databáze (web index). Navštěvuje automaticky veškeré dostupné webové stránky a tím umožní zaznamenat, která slova kde viděl. Webový vyhledávač pak na dotaz uživatele (jedno nebo více slov) může z web indexu odpovědět, na kterých stránkách jsou hledaná slova k nalezení.

Obsah

1 Přehled
2 Vyhledávací politiky

2.1 Výběrová politika
2.2 Politika opětovných návštěv
2.3 Politika zdvořilosti
2.4 Politika paralelního zpracování


3 Příklady
4 Reference


Přehled[editovat | editovat zdroj]
Web crawler začíná se seznamem URL adres k návštěvě, které prohledává a přes HTTP protokol si o nich ukládá důležitá data jako je jejich obsah (text), metadata (datum stažení stránky, hash či změny od poslední návštěvy 

In [140]:
heading = soup.h1.get_text() #získej text z nadpisu první úrovně v proměnné soup

In [141]:
print(heading) #vypiš proměnnou heading

Web crawler


### 5.3 find

Pro vyhledání značky slouží metoda `find`. Tato metoda (na rozdíl od metody `find_all`) najde a vrátí pouze první výskyt značky. Do parametru metody se uvádí HTML značka, kterou chcete nalézt.

In [155]:
b = soup.find('b') #vyhledej první instanci značky tučného textu

In [156]:
b #vypiš proměnnou b

<b>Web crawler</b>

### 5.4 find_all

Pro vyhledání všech instancí jedné značky slouží metoda `find_all`. Do parametru této metody opět uveďte HTML značku, kterou chcete nalézt.

In [158]:
b2 = soup.find_all('b') #vyhledej všechny instance značky tučného textu

In [159]:
b2 #vypiš proměnnou b2

[<b>Web crawler</b>, <b>spider</b>, <b>Aktuálnost</b>, <b>Stáří stránky</b>]

Všimněte si, že výstupem `find_all` je seznam. Všechny odstavce jsou ponechány s HTML značkami. Pro přehledné vypsání obsahu proměnné tedy nestačí proměnnou pouze vypsat, musíte přes její prvky iterovat a vypsat je postupně pomocí metody `get_text`.

In [160]:
for t in b2: #pro každý element v seznamu b2
    print(t.get_text()) #vypiš element

Web crawler
spider
Aktuálnost
Stáří stránky


### 5.5 Hledání tříd a identifikátorů

Pokud vám nebude stačit vyhledání pouze samostatné značky, ale budete potřebovat nalézt značku s konkrétní třídou nebo indentifikátorem, použijte ve funkci `find` nebo `find_all` ještě druhý parametr, do kterého zadáte název třídy nebo identifikátoru. Parametr musí být datový typ slovník, kde klíč je označení třída/identifikátor a hodnota je název třídy/identifikátoru.

Pro vyhledání všech instancí značky `<span class="toctext">` slouží následující kód. 

In [163]:
tt = soup.find_all('span', {'class': 'toctext'}) #vyhledej všechny instance značky 

In [164]:
tt #vypiš proměnnou tt

[<span class="toctext">Přehled</span>,
 <span class="toctext">Vyhledávací politiky</span>,
 <span class="toctext">Výběrová politika</span>,
 <span class="toctext">Politika opětovných návštěv</span>,
 <span class="toctext">Politika zdvořilosti</span>,
 <span class="toctext">Politika paralelního zpracování</span>,
 <span class="toctext">Příklady</span>,
 <span class="toctext">Reference</span>]

Další informace ke knihovně BeautifulSoup naleznete [v dokumentaci](https://www.crummy.com/software/BeautifulSoup/bs4/doc/#beautiful-soup-documentation).

## 7 Web crawler

V této sekci budete mít za úkol naprogramovat vlastní web crawler. V několika krocích vytvoříte program, který z hlavní stránky webu [Root.cz](https://www.root.cz/) stáhne nadpisy článků, jejich perexy a dobu čtení.

Nejprve si prohlédněte strukturu webu.

Než začnete psát první funkce, do proměnné `url` uložte url webu Root.cz

Následující buňku pouze spusťte.

In [95]:
url = 'https://www.root.cz/' #do proměnné url ulož stránku Root.cz

**Úkol 1:** Napište funkci `read_url`, která otevře stránku uloženou v proměnné `url`, přečte ji, změní kódování na UTF-8 a poté vrátí na výstup.

In [97]:
def read_url(url):
    u = urlopen(url)
    u = u.read()
    u = u.decode('UTF-8')
    return u

**Úkol 2:** Zavolejte funkci `read_url` a její výstup uložte do proměnné `doc`. Proměnnou `doc` pak vypište.

In [98]:
doc = read_url(url)

In [99]:
doc



Aby bylo možné s HTML dokumentem dále pracovat a vyhledávat v něm, je nutné použít BeautifulSoup konstruktor. Následující buňka zavolá BeautifulSoup konstruktor a do proměnné `soup` uloží BeautifulSoup objekt.

Následující buňku pouze spusťte.

In [100]:
soup = BeautifulSoup(doc, 'html.parser')

**Úkol 3:** Zjistěte, jakého typu je proměnná `soup`.

In [104]:
type(soup)

bs4.BeautifulSoup

**Úkol 4:** Pro přehlednější orientaci v HTML dokumentu použijte metodu `prettify`.

**Poznámka:** V tomto případě _musíte_ použít standardní výpis v proměnných v Pythonu, tj. funkci `print`, aby se výpis proměnné zobrazil správně.

In [106]:
print(soup.prettify())

<!DOCTYPE html>
<!--
Zdá se, že se zajímáš o náš zdrojový kód...
Hledáme posilu do našeho týmu!
@erik.dvorak@iinfo.cz
-->
<html class="js-inactive design-html" id="css" lang="cs">
 <head>
  <meta charset="utf-8"/>
  <title>
   Root.cz - informace nejen ze světa Linuxu
  </title>
  <meta content="width=device-width, initial-scale=1, minimum-scale=1" name="viewport"/>
  <script type="text/javascript">
   var dataLayer = dataLayer || [];
dataLayer.push({"stranka":{"typ":"Index","nazev":"","url":"https:\/\/www.root.cz\/","404":false}});
dataLayer.push({"prihlasen":false,"userHash":null});
dataLayer.push({"vcerejsiOtvirak":{"titulek":"CutiePi: tablet s\u00a0\u010dist\u00fdm Linuxem postaven\u00fd na Raspberry Pi","perex":"Chcete m\u00edt tablet s\u00a0\u010dist\u00fdm Linuxem? CutiePi je tablet poch\u00e1zej\u00edc\u00ed z\u00a0Japonska a z\u00a0Taiwanu, kter\u00fd si m\u016f\u017eete postavit i\u00a0vlastn\u00edmi silami. Budete k\u00a0tomu pot\u0159ebovat 3D tisk\u00e1rnu a vybaven\u00ed 

**Úkol 5:** 

1. Ve zdrojovém kódu stránky najděte, v jakých značkách jsou uloženy boxy obsahující články.

OBRÁZEK

Takto si budete jistí, že výsledek bude obsahovat pouze články z této sekce.

2. Najděte všechny instance těchto boxů pomocí značek a do proměnné `content` uložte výsledek. 
3. Proměnnou pak vypište.

<details> 
    <summary>Klikněte na tento text pro zobrazení <b>nápovědy:</b></summary>
    <p>Lze použít celkem 2 různé značky, se kterými výsledný kód bude fungovat.</p>
    <p>Obě značky mají v názvu box.</p>
</details>

In [107]:
#najdi všechny instance značky div s třídou design-box__content
content = soup.find_all("div", {"class": "design-box__content"})

In [108]:
content #vypiš proměnnou content

[<div class="design-box__content">
 <ul class="design-list--articles--tiles--rows--medium design-list--articles--tiles--rows design-list--articles--tiles design-list--articles design-list list-reset">
 <li class="design-list__item">
 <div class="design-article--with-image design-article design-tile">
 <a class="design-article__heading design-article__link--major design-article__link--default design-article__link" href="/clanky/common-lisp-zralok-mezi-programovacimi-jazyky-2-cast/">
 <h3 class="element-heading-reset">
 Common Lisp: žralok mezi programovacími jazyky (2.část)
 </h3>
 </a>
 <a aria-hidden="true" class="element-print-hidden design-article__image-outer design-marker design-article__link--mimic design-article__link" href="/clanky/common-lisp-zralok-mezi-programovacimi-jazyky-2-cast/">
 <img alt=" " class="image-lazyloadxt design-article__image" data-src="https://i.iinfo.cz/images/302/zralok-shark-thumb.jpg" src="https://i.iinfo.cz/sh/placeholder/1x1.gif"/>
 <noscript>
 <img a

**Úkol 6:** 

1. Ve zdrojovém kódu stránky najděte, v jakých značkách jsou uloženy jednotlivé články.
2. Dále nalezněte značky pro nadpis článku, perex a dobu čtení.

Názvy značek si napište do následující buňky, budete je potřebovat v dalším úkolu.

_značka pro články:_

_značka pro nadpisy:_

_značka pro perexy:_

_značka pro doby čtení:_

**Úkol 7:** Napište funkci `get_articles`, která:

1. postupně projde elementy v proměnné `content` a nalezne v ní všechny značky pro články,
2. články jednotlivě projde,
3. v každém článku vyhledá nadpis, perex a odhadovanou dobu čtení článku,
4. nadpis, perex a dobu čtení převede na holý text,
5. tyto tři holé texty spojí do jednoho řetězce,
6. řetězec připojí do seznamu `all_articles`,
7. na výstup vrátí seznam `all_articles`, který obsahuje jednotlivé texty.

**Poznámka:** Všimněte si, že ne všechny články mají uvedenou dobu čtení. Může se tedy stát, že vám v určité chvíli program spadne s chybovou hláškou. Pro vyřešení tohoto problému určitě budete potřebovat podmínku, která řekne, co se má stát, pokud doba čtení (ne)chybí.

In [124]:
def get_articles(content):
    
    all_articles = []
    
    for c in content:
        item = c.find_all('div', 
                          {'class': 'design-article--with-image design-article design-tile'})
       
        for i in item:
            article = ''
            
            head = i.find('h3', {'class': 'element-heading-reset'}).get_text()
            perex = i.find('div', {'class': 'design-article__perex-content'}).get_text()
            
            if i.find('div', {'class': 'design-impressum__item'}):
                time = i.find('div', {'class': 'design-impressum__item'}).get_text()
            else:
                time = '\nDoba čtení: nespecifikováno\n'
            
            article = head + perex + time
            all_articles.append(article)
            
    return all_articles
        

Zavolejte funkci `get_articles` a její výstup uložte do proměnné `articles`.

In [125]:
articles = get_articles(content)

Iterujte přes seznam `articles` a jednotlivé články vypište.

In [126]:
for a in articles:
    print(a)


Common Lisp: žralok mezi programovacími jazyky (2.část)

Ve druhé části miniseriálu o Common Lispu se seznámíme se základními stavebními prvky tohoto jazyka. Mezi tyto prvky patří především atomy, uspořádané páry, z nich odvozené seznamy, anonymní funkce i pojmenované funkce.

Doba čtení: 55 minut


CutiePi: tablet s čistým Linuxem postavený na Raspberry Pi

Chcete mít tablet s čistým Linuxem? CutiePi je tablet pocházející z Japonska a z Taiwanu, který si můžete postavit i vlastními silami. Budete k tomu potřebovat 3D tiskárnu a vybavení na výrobu plošných spojů.

Doba čtení: 4 minuty


Softwarová sklizeň (27. 4. 2022): terminál s vylepšeným hlášením chyb

Dnes vyzkoušíme terminál s vylepšeným hlášením chyb, řekneme si o linuxovém klientu pro Microsoft To-Do, podíváme se na jednoduchý hudební přehrávač a extrahujeme si kurzory a ikony ze souborů pro MS Windows.

Doba čtení: 1 minuta


Jak do Ubuntu vrátit klasický Firefox z balíčku .deb a odstranit Snap

Počínaje Ubuntu 21.10 se Canon

jednoduchý web crawler - asi zahodit

In [26]:
def crawler():
    url = 'https://cs.wikipedia.org/wiki/Speci%C3%A1ln%C3%AD:N%C3%A1hodn%C3%A1_str%C3%A1nka'
    txts = []
    
    for i in range(20):
        print('Příprava textu #'+str(i+1))
        txt_final = ''
        
        u = urlopen(url)
        u = u.read()
        u = u.decode('UTF-8')
        
        soup = BeautifulSoup(u, 'html.parser')
        txt = soup.body.get_text()
        
        txt_final += soup.h1.get_text() + '\n'
            
        par = soup.find_all('p')
        for p in par:
            txt_final += p.get_text()
        
        txts.append(txt_final)

    return txts

In [27]:
c = crawler()

Příprava textu #1
Příprava textu #2
Příprava textu #3
Příprava textu #4
Příprava textu #5
Příprava textu #6
Příprava textu #7
Příprava textu #8
Příprava textu #9
Příprava textu #10
Příprava textu #11
Příprava textu #12
Příprava textu #13
Příprava textu #14
Příprava textu #15
Příprava textu #16
Příprava textu #17
Příprava textu #18
Příprava textu #19
Příprava textu #20


In [28]:
print(c)

['V neděli v desetV neděli v deset/V neděli večer (v americkém/mexickém originále: La Misma Luna/Under the Same Moon) je americko-mexický film z roku 2007.\nRosario Reyesová (mexická matka) nelegálně pracuje v Los Angeles, zatímco její devítiletý syn Carlitos Reyeso žije u babičky. Když babička zemře, vydá se Carlitos na cestu za matkou. Spolu s ním je jeho rozvedený otec Enrique.\n', 'NathanNathan je mužské rodné jméno. Jméno má hebrejský původ (נתן\u200e a znamená v hebrejštině „dárce“ nebo „dal, daroval“).\n', 'Esaias van de VeldeEsaias van de Velde [esajas fan de felde] (pokřtěn 17. května 1587, Amsterdam - pohřben 18. listopadu 1630, Haag) byl holandský krajinář 17. století.\nNarodil se v Amsterdamu, kam jeho otec Hans van de Velde jako protestant uprchl v roce 1585 z Vlámska. Malířství studoval u svého otce a u Gillise van Coninxloo, krajináře z Antverp a žáka Pietera Brueghela staršího. Mezi lety 1610-1618 pracoval v Haarlemu a stal se zde, spolu s malířem Herculem Segersem roku