# Práce se soubory

Python umožňuje číst a zapisovat soubory různých typů. Začneme s textovými soubory, protože jsou nejjednodušší.

## 1. Otevírání souborů

Python poskytuje funkci `open()`, která slouží k otevírání souborů.

In [None]:
# Otevření souboru v režimu pouze pro čtení
muj_textovy_soubor = open('poem.txt')

# Po práci se souborem by měl být uzavřen
muj_textovy_soubor.close()

## 2. Práce se soubory pomocí `with`

Python poskytuje syntaxi, která se postará o uzavření souboru automaticky.

In [None]:
with open('poem.txt') as muj_textovy_soubor:
    # blok kódu, který se provede když je soubor otevřený
    # ...
    # poslední řádek s odsazením - soubor je stále otevřený
    pass

# blok kódu bez odsazení
# v této fázi je soubor již uzavřený
# a neměl by být dále zpracováván

## 3. Čtení souborů

Funkce `open()` volaná **pouze s jedním** argumentem (cestou k souboru) otevře soubor v textovém režimu, pouze **pro čtení**.

Data načtená ze souboru budou mít typ `str` a budou fungovat pouze metody pro čtení.

### 3.1. Metoda `read()` - celý obsah jako string

In [None]:
# file.read() vrátí celý obsah souboru jako string
with open('poem.txt') as muj_textovy_soubor:
    obsah = muj_textovy_soubor.read()

In [None]:
# zobraz obsah

### 3.2. Metoda `readlines()` - všechny řádky jako seznam

In [None]:
# file.readlines() vrátí celý obsah souboru jako seznam řetězců (každý řádek je samostatný řetězec)
with open('poem.txt') as muj_textovy_soubor:
    radky = muj_textovy_soubor.readlines()

In [None]:
# zobraz radky

In [None]:
# rozdíl? typ, zobrazeni..

### 3.3. Metoda `readline()` - po jednom řádku

In [None]:
# file.readline() - postupné volání této metody vrátí postupné řádky
# soubor si "pamatuje", který řádek byl naposledy přečten
with open('poem.txt') as muj_textovy_soubor:
    prvni_radek = muj_textovy_soubor.readline()
    druhy_radek = muj_textovy_soubor.readline()

In [None]:
print('První řádek:', prvni_radek)

In [None]:
print('Druhý řádek:', druhy_radek)

### 3.4. Iterace přes soubor - **FOR**

In [None]:
# Python umožňuje iterovat přes soubor - jako by to byl seznam řetězců (jednotlivé řádky)
with open('poem.txt') as muj_textovy_soubor:
    for jeden_radek in muj_textovy_soubor:
        print('Řádek ze souboru:', jeden_radek)

## 4. Zápis do souborů

Funkce `open()` má druhý argument, který určuje, jak otevřít soubor. Výchozí je `'r'`, což znamená pouze pro čtení.

Pro zápis do souboru zadejte `'w'`. Soubor otevřený v tomto režimu bude vytvořen (pokud neexistoval) nebo přepíše obsah současného souboru s tímto názvem.

In [None]:
# file.write(string) - zapíše data (typu string)
with open('novy_soubor.txt', 'w') as muj_textovy_soubor:
    muj_textovy_soubor.write('row1\n')
    muj_textovy_soubor.write('row2\n')

In [None]:
# file.writelines(list) - zapíše řetězce ze seznamu
with open('novy_soubor.txt', 'w') as muj_textovy_soubor:
    muj_textovy_soubor.writelines(['row3\n', 'row4\n', 'row5\n'])

In [None]:
# české # encoding='utf-8'
with open('novy_soubor.txt', 'w') as muj_textovy_soubor: 
    muj_textovy_soubor.write('Řádek\n')
    muj_textovy_soubor.write('row2\n')

### Úloha: Opravte chybu

Následující kód má chybu. Najděte ji a opravte.

In [None]:
# Tento kód má chybu - co je špatně?
with open('test.txt') as soubor:
    soubor.write('Nějaký text')

## 5. Relativní cesty

Relativní cesta k souboru je taková, která definuje, kde se soubor nachází relativně k aktuálně otevřené složce.

Konzole (terminál) je vždy otevřená v nějaké složce; obvykle po otevření je to domovská složka.

In [None]:
# Pokud se pokusíte otevřít soubor: open('muj_soubor.txt')
# Python bude hledat soubor s tímto názvem v aktuální složce

# Pokud Python pracuje v kontextu jiné složky,
# stejný řádek ( open('muj_soubor.txt') ) otevře úplně jiný soubor!

## 6. Absolutní cesty

Absolutní cesta je taková, která jednoznačně vysvětluje, kde se konkrétní soubor nachází na disku - nezáleží na tom, ze které složky byl program spuštěn.

Příklad absolutní cesty v macOS/Linux: `/home/jconnor/Documents/muj_soubor.txt`

Příklad absolutní cesty ve Windows: `C:\Documents and Settings\John Connor\Documents\muj_soubor.txt`

Rozhodujícím prvkem je zde znak `/` nebo `C:\`.

**Doporučení:** Při psaní skriptů používejte relativní cesty (takový kód se lépe přenáší mezi uživateli a dokonce i systémy); jen si buďte vědomi důsledků spouštění skriptů z různých umístění na disku.

## 7. Cesty ve Windows

Systémy Windows používají znak `\` k oddělování názvů souborů a složek.

To může způsobit problémy: čtení souboru `data\chart.jpg` uspěje, zatímco `data\toto.jpg` ne.

Je to proto, že některé posloupnosti znaků (`\a`, `\b`, `\n`, `\r`, `\t`) mají speciální význam - v uvedeném příkladu: `\t` byl nahrazen znakem tabulátoru, čímž ztratil svůj zamýšlený význam oddělit název složky od názvu souboru.

In [None]:
print('data\toto.jpg')

### 7.1. Řešení 1: Použijte `/`

In [None]:
# Použijte znak / a nechte Python ho při potřebě automaticky nahradit za \
with open('data/toto.jpg') as soubor:
    pass

### 7.2. Řešení 2: Raw string

In [None]:
# Zadejte cesty pomocí syntaxe raw string: r'relativni\cesta\k\souboru.txt'
with open(r'data\toto.jpg') as soubor:
    pass

### 7.3. Řešení 3: Zdvojení zpětného lomítka

In [None]:
# Předcházejte znak \ druhým znakem \: 'relativni\\cesta\\k\\souboru.txt'
with open('data\\toto.jpg') as soubor:
    pass

## 8. Přesouvání a mazání souborů

Funkce pro operace se soubory najdete v modulu `os`.

In [None]:
import os

# os.replace(existujici_cesta_k_souboru, nova_cesta_k_souboru) - přesune soubor
# os.remove(existujici_cesta_k_souboru) - smaže soubor

### 8.1. Přesun souboru mezi složkami

In [None]:
# Funkce os.replace může také přesunout soubor mezi složkami,
# pokud argumenty jsou cesty, které zahrnují složky
import os
os.replace('aktualni_mesic.txt', r'archiv\leden_2021.txt')

## 9. Vyhľadávání souborů ve složkách

Nejjednodušší způsob, jak hledat soubory ve složce, je funkce `glob` z modulu `glob`.

Stačí jí předat vzorec pro název (nebo cestu) souborů, které chcete najít; znak `*` znamená, že na tomto místě v názvu může být cokoli.

In [None]:
import glob

# Najde všechny soubory s příponou .txt
glob.glob('*.txt')  # ['muj_soubor.txt', 'muj_dalsi_soubor.txt', 'test.txt']

# Najde všechny soubory začínající na 'muj_'
glob.glob('muj_*.txt')  # ['muj_soubor.txt', 'muj_dalsi_soubor.txt']

### 9.1. Rekurzivní vyhledávání

In [None]:
# Funkce může také přijmout další parametr recursive=True,
# takže začne hledat i uvnitř složek.
# Znaky ** pak označují, kde v cestě mohou být složky s neznámými názvy
import glob

# Hledá soubory .jpg ve všech podsložkách
glob.glob(r'**\*.jpg', recursive=True)  # ['cerven/prace/spanelsko.jpg', 'srpen/prace/italie.jpg']

# Hledá soubory .jpg pouze ve složce cerven a jejích podsložkách
glob.glob(r'cerven\**\*.jpg', recursive=True)  # ['cerven/prace/spanelsko.jpg']

## Cvičení 1

Otevřete soubor `poem.txt` a zobrazte jeho obsah s prefixem `"řádek <ČÍSLO_ŘÁDKU>: "` před každým řádkem.

**Nápověda:** Použijte cyklus `for` pro čtení souboru řádek po řádku. Kromě toho vytvořte proměnnou pro uložení čísla řádku. Číslo řádku můžete vložit do řetězce pomocí metody `.format(...)` nebo syntaxe f-string.

In [None]:
# Napište řešení zde

## Cvičení 2

Otevřete soubor `stromecek.txt` v režimu zápisu a zapište do něj vánoční stromek vysoký 12 řádků. Použijte cyklus `for` pro generování stromku.

Očekávaný obsah souboru:
```
*
**
***
****
*****
******
*******
********
*********
**********
***********
************
```

In [None]:
# Napište řešení zde

## Cvičení 3

Napište skript, který přesune soubory `jeden.txt` a `dva.txt` do složky `archiv/`. Názvy souborů by měly zůstat stejné, změní se pouze místo, kde jsou uloženy.

In [None]:
# Napište řešení zde

## Cvičení 4

Najděte všechny soubory s příponou **.txt** ve složce `data/`. Pomocí cyklu otevřete každý z nich a zobrazte jeho obsah na obrazovce.

Úloha bude správně provedena, když uvidíte na obrazovce tři anglická palindroma a nula českých (protože ta jsou v souborech **.py**, ne **.txt**) ani ukrajinských (ta jsou v souborech **.html**).

In [None]:
# Napište řešení zde

## Otázky k zamyšlení

1. Jaký je rozdíl mezi metodami `read()`, `readlines()` a `readline()`?
2. Proč je důležité používat `with` při práci se soubory?
3. Jaký je rozdíl mezi relativní a absolutní cestou?
4. Proč je potřeba používat `'w'` režim při zápisu do souboru?