# Práce se soubory

Python umožňuje číst a zapisovat soubory různých typů. Začneme s textovými soubory, protože jsou nejjednodušší.

## 1. Otevírání souborů

Python poskytuje funkci `open()`, která slouží k otevírání souborů.

In [1]:
import os

In [2]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2'

In [50]:
os.chdir('data')

In [5]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2\\data'

In [None]:
# Otevření souboru v režimu pouze pro čtení
muj_textovy_soubor = open('poem.txt')

In [11]:
# Po práci se souborem by měl být uzavřen
muj_textovy_soubor.close()

## 2. Práce se soubory pomocí `with`

Python poskytuje syntaxi, která se postará o uzavření souboru automaticky.

In [None]:
with open('poem.txt') as muj_textovy_soubor:
    # blok kódu, který se provede když je soubor otevřený
    # ...
    # poslední řádek s odsazením - soubor je stále otevřený
    pass

# blok kódu bez odsazení
# v této fázi je soubor již uzavřený
# a neměl by být dále zpracováván

In [14]:
with open('poem.txt') as muj_textovy_subor:
    pass
    #   tu je otvorene, nacitavam
# tu uz je zatvorene txt

## 3. Čtení souborů

Funkce `open()` volaná **pouze s jedním** argumentem (cestou k souboru) otevře soubor v textovém režimu, pouze **pro čtení**.

Data načtená ze souboru budou mít typ `str` a budou fungovat pouze metody pro čtení.

### 3.1. Metoda `read()` - celý obsah jako string

In [15]:
# file.read() vrátí celý obsah souboru jako string
with open('poem.txt') as muj_textovy_soubor:
    text_ze_souboru = muj_textovy_soubor.read()

In [16]:
# zobraz obsah
text_ze_souboru

'Faster than fairies, faster than witches,\nBridges and houses, hedges and ditches;\nAnd charging along like troops in a battle,\nAll through the meadows the horses and cattle:\nAll of the sights of the hill and the plain\nFly as thick as driving rain;\nAnd ever again in the wink of an eye,\nPainted stations whistle by.\nHere is a child who clambers and scrambles,\nAll by himself and gathering brambles;\nHere is a tramp who stands and gazes;\nAnd there is the green for stringing the daisies!\nHere is a cart run away in the road\nLumping along with man and load;\nAnd here is a mill and there is a river,\nEach a glimpse and gone forever!\n\nRobert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)\nhttps://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE\n'

In [17]:
type(text_ze_souboru)

str

In [18]:
print(text_ze_souboru)

Faster than fairies, faster than witches,
Bridges and houses, hedges and ditches;
And charging along like troops in a battle,
All through the meadows the horses and cattle:
All of the sights of the hill and the plain
Fly as thick as driving rain;
And ever again in the wink of an eye,
Painted stations whistle by.
Here is a child who clambers and scrambles,
All by himself and gathering brambles;
Here is a tramp who stands and gazes;
And there is the green for stringing the daisies!
Here is a cart run away in the road
Lumping along with man and load;
And here is a mill and there is a river,
Each a glimpse and gone forever!

Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE



### 3.2. Metoda `readlines()` - všechny řádky jako seznam

In [19]:
# file.readlines() vrátí celý obsah souboru jako seznam řetězců (každý řádek je samostatný řetězec)
with open('poem.txt') as muj_textovy_soubor:
    text_seznam = muj_textovy_soubor.readlines()

In [20]:
# zobraz radky
text_seznam

['Faster than fairies, faster than witches,\n',
 'Bridges and houses, hedges and ditches;\n',
 'And charging along like troops in a battle,\n',
 'All through the meadows the horses and cattle:\n',
 'All of the sights of the hill and the plain\n',
 'Fly as thick as driving rain;\n',
 'And ever again in the wink of an eye,\n',
 'Painted stations whistle by.\n',
 'Here is a child who clambers and scrambles,\n',
 'All by himself and gathering brambles;\n',
 'Here is a tramp who stands and gazes;\n',
 'And there is the green for stringing the daisies!\n',
 'Here is a cart run away in the road\n',
 'Lumping along with man and load;\n',
 'And here is a mill and there is a river,\n',
 'Each a glimpse and gone forever!\n',
 '\n',
 'Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)\n',
 'https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE\n']

In [21]:
type(text_seznam)

list

In [None]:
# rozdíl? typ, zobrazeni..

### 3.3. Metoda `readline()` - po jednom řádku

In [None]:
# file.readline() - postupné volání této metody vrátí postupné řádky
# soubor si "pamatuje", který řádek byl naposledy přečten

In [22]:
with open('poem.txt') as muj_textovy_soubor:
    radek1 = muj_textovy_soubor.readline()
    radek2 = muj_textovy_soubor.readline()
    radek3 = muj_textovy_soubor.readline()

In [23]:
print('První řádek:', radek1)
print('Druhý řádek:', radek2)

První řádek: Faster than fairies, faster than witches,

Druhý řádek: Bridges and houses, hedges and ditches;



In [24]:
radek1

'Faster than fairies, faster than witches,\n'

### 3.4. Iterace přes soubor - **FOR**

In [26]:
# Python umožňuje iterovat přes soubor - jako by to byl seznam řetězců (jednotlivé řádky)
with open('poem.txt') as muj_textovy_soubor:
    # dopln iteraci pres muj_textovy_soubor jako "seznam"
    for radek in  muj_textovy_soubor:
        print(radek, end = '')

Faster than fairies, faster than witches,
Bridges and houses, hedges and ditches;
And charging along like troops in a battle,
All through the meadows the horses and cattle:
All of the sights of the hill and the plain
Fly as thick as driving rain;
And ever again in the wink of an eye,
Painted stations whistle by.
Here is a child who clambers and scrambles,
All by himself and gathering brambles;
Here is a tramp who stands and gazes;
And there is the green for stringing the daisies!
Here is a cart run away in the road
Lumping along with man and load;
And here is a mill and there is a river,
Each a glimpse and gone forever!

Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE


## 4. Zápis do souborů

Funkce `open()` má druhý argument, který určuje, jak otevřít soubor. Výchozí je `'r'`, což znamená pouze pro čtení.

Pro zápis do souboru zadejte `'w'`. Soubor otevřený v tomto režimu bude vytvořen (pokud neexistoval) nebo **přepíše obsah současného souboru** s tímto názvem.

In [31]:
# file.write(string) - zapíše data (typu string)
with open('novy_soubor.txt', 'w') as muj_textovy_soubor:
    # dopln zapis
    muj_textovy_soubor.write('Radek 1\n')
    muj_textovy_soubor.write('Radek 2\n')

In [33]:
# file.write(string) - zapíše data (typu string)
with open('novy_soubor.txt', 'w', encoding='utf-8') as muj_textovy_soubor:
    # dopln zapis
    muj_textovy_soubor.write('Řádek 1\n')
    muj_textovy_soubor.write('Řádek 2\n')

In [37]:
# file.writelines(list) - zapíše řetězce ze seznamu
with open('novy_soubor.txt', 'w', encoding='utf-8') as muj_textovy_soubor:
    # dopln zapis
    muj_textovy_soubor.writelines(['1 něco\n', '33 neco\n'])

### Úloha: Opravte chybu

Následující kód má chybu. Najděte ji a opravte.

In [41]:
# české # encoding='utf-8'
with open('novy_soubor.txt', 'w', encoding='utf-8') as muj_textovy_soubor: 
    muj_textovy_soubor.write('Řádek\n')
    muj_textovy_soubor.write('row2\n')

### Úloha: Opravte chybu

Následující kód má chybu. Najděte ji a opravte.

In [45]:
# Tento kód má chybu - co je špatně?
with open('test.txt','w', encoding='utf-8') as soubor:
    soubor.write('Nějaký text')

### Úloha: Opravte chybu

Následující kód má chybu. Najděte ji a opravte.
Chceme vložit dva řádky, no vloží se jenom jeden.

In [47]:
# Tento kód má chybu - co je špatně?
with open('test.txt', 'w') as soubor:
    soubor.writelines(['Text na 1. radku\n', 'text na 2. radku\n'])

## 5. Relativní cesty

Relativní cesta k souboru je taková, která definuje, kde se soubor nachází relativně k aktuálně otevřené složce.

Konzole (terminál) je vždy otevřená v nějaké složce; obvykle po otevření je to domovská složka.

In [None]:
# Pokud se pokusíte otevřít soubor: open('muj_soubor.txt')
# Python bude hledat soubor s tímto názvem v aktuální složce

# Pokud Python pracuje v kontextu jiné složky,
# stejný řádek ( open('muj_soubor.txt') ) otevře úplně jiný soubor!

In [None]:
import os
print(os.getcwd())  # Vypíše aktuální složku

In [None]:
os.chdir('###') # zmení 

## 6. Absolutní cesty

Absolutní cesta je taková, která jednoznačně vysvětluje, kde se konkrétní soubor nachází na disku - nezáleží na tom, ze které složky byl program spuštěn.

Příklad absolutní cesty v macOS/Linux: `/home/jconnor/Documents/muj_soubor.txt`

Příklad absolutní cesty ve Windows: `C:\Documents and Settings\John Connor\Documents\muj_soubor.txt`

Rozhodujícím prvkem je zde znak `/` nebo `C:\`.

**Doporučení:** Při psaní skriptů používejte relativní cesty (takový kód se lépe přenáší mezi uživateli a dokonce i systémy); jen si buďte vědomi důsledků spouštění skriptů z různých umístění na disku.

## 7. Cesty ve Windows

Systémy Windows používají znak `\` k oddělování názvů souborů a složek.

To může způsobit problémy: čtení souboru `data\chart.jpg` uspěje, zatímco `data\toto.jpg` ne.

Je to proto, že některé posloupnosti znaků (`\a`, `\b`, `\n`, `\r`, `\t`) mají speciální význam - v uvedeném příkladu: `\t` byl nahrazen znakem tabulátoru, čímž ztratil svůj zamýšlený význam oddělit název složky od názvu souboru.

In [48]:
print('data\toto.jpg')

data	oto.jpg


In [51]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2\\data'

In [52]:
os.chdir('..')

In [53]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2'

### 7.1. Řešení 1: Použijte `/`

In [54]:
with open('data\toto.txt') as soubor:
    pass

OSError: [Errno 22] Invalid argument: 'data\toto.txt'

In [55]:
print('data\toto.txt')

data	oto.txt


In [56]:
# Použijte znak / a nechte Python ho při potřebě automaticky nahradit za \
with open('data/toto.txt') as soubor:
    pass

### 7.2. Řešení 2: Raw string

In [58]:
# Zadejte cesty pomocí syntaxe raw string: r'relativni\cesta\k\souboru.txt'
with open(r'data\toto.jpg') as soubor:
    pass

### 7.3. Řešení 3: Zdvojení zpětného lomítka

In [59]:
# Předcházejte znak \ druhým znakem \: 'relativni\\cesta\\k\\souboru.txt'
with open('data\\toto.jpg') as soubor:
    pass

## 8. Přesouvání a mazání souborů

Funkce pro operace se soubory najdete v modulu `os`.

In [None]:
#import os

# os.replace(existujici_cesta_k_souboru, nova_cesta_k_souboru) - přesune soubor
# os.remove(existujici_cesta_k_souboru) - smaže soubor

### 8.1. Přesun souboru mezi složkami

In [None]:
# Funkce os.replace může také přesunout soubor mezi složkami,
# pokud argumenty jsou cesty, které zahrnují složky
import os
os.replace('aktualni_mesic.txt', r'archiv\leden_2021.txt')

## 9. Vyhledávaní souborů ve složkách

Nejjednodušší způsob, jak hledat soubory ve složce, je funkce `glob` z modulu `glob`.

Stačí jí předat vzorec pro název (nebo cestu) souborů, které chcete najít; znak `*` znamená, že na tomto místě v názvu může být cokoli.

In [60]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2'

In [61]:
os.chdir('data')

In [62]:
import glob

In [63]:
# Najde všechny soubory s příponou .txt
glob.glob('*.txt')  # ['muj_soubor.txt', 'muj_dalsi_soubor.txt', 'test.txt']

['data.txt',
 'lemon.txt',
 'novy_soubor.txt',
 'one.txt',
 'owl.txt',
 'pets.txt',
 'poem.txt',
 'test.txt',
 'toto.txt',
 'two.txt']

In [65]:
# Najde všechny soubory začínající na 'muj_'
glob.glob('*o*.txt')  # ['muj_soubor.txt', 'muj_dalsi_soubor.txt']

['lemon.txt',
 'novy_soubor.txt',
 'one.txt',
 'owl.txt',
 'poem.txt',
 'toto.txt',
 'two.txt']

### 9.1. Rekurzivní vyhledávání

In [None]:
# Funkce může také přijmout další parametr recursive=True,
# takže začne hledat i uvnitř složek.
# Znaky ** pak označují, kde v cestě mohou být složky s neznámými názvy
import glob

# Hledá soubory .jpg ve všech podsložkách
glob.glob(r'**\*.jpg', recursive=True)  # ['cerven/prace/spanelsko.jpg', 'srpen/prace/italie.jpg']

In [None]:
# Hledá soubory .jpg pouze ve složce cerven a jejích podsložkách
glob.glob(r'cerven\**\*.jpg', recursive=True)  # ['cerven/prace/spanelsko.jpg']

## Cvičení 1

Otevřete soubor `poem.txt` a zobrazte jeho obsah s prefixem `"řádek <ČÍSLO_ŘÁDKU>: "` před každým řádkem.

**Nápověda:** Použijte cyklus `for` pro čtení souboru řádek po řádku nebo načítejte řadky jako seznam. Kromě toho vytvořte proměnnou pro uložení čísla řádku nebo použijte index seznamu. Číslo řádku můžete vložit do řetězce pomocí metody `.format(...)` nebo syntaxe f-string.

In [None]:
# Napište řešení zde


In [66]:
os.getcwd()

'C:\\Users\\educa\\Documents\\GitHub\\Python-CodersLab\\Day_2\\data'

In [68]:
with open('poem.txt') as soubor:
    radky = soubor.readlines()

In [None]:
for radek in radky:
    print(radek)

In [71]:
for radek in radky:
    print(radek, end = '')

Faster than fairies, faster than witches,
Bridges and houses, hedges and ditches;
And charging along like troops in a battle,
All through the meadows the horses and cattle:
All of the sights of the hill and the plain
Fly as thick as driving rain;
And ever again in the wink of an eye,
Painted stations whistle by.
Here is a child who clambers and scrambles,
All by himself and gathering brambles;
Here is a tramp who stands and gazes;
And there is the green for stringing the daisies!
Here is a cart run away in the road
Lumping along with man and load;
And here is a mill and there is a river,
Each a glimpse and gone forever!

Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE


In [None]:
index = 1

for radek in radky:
    print(f"{index}. {radek}", end = '')
    index += 1

In [76]:
for index, radek in enumerate(radky):
    print(f"{index}. {radek}", end = '')

0. Faster than fairies, faster than witches,
1. Bridges and houses, hedges and ditches;
2. And charging along like troops in a battle,
3. All through the meadows the horses and cattle:
4. All of the sights of the hill and the plain
5. Fly as thick as driving rain;
6. And ever again in the wink of an eye,
7. Painted stations whistle by.
8. Here is a child who clambers and scrambles,
9. All by himself and gathering brambles;
10. Here is a tramp who stands and gazes;
11. And there is the green for stringing the daisies!
12. Here is a cart run away in the road
13. Lumping along with man and load;
14. And here is a mill and there is a river,
15. Each a glimpse and gone forever!
16. 
17. Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
18. https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE


In [77]:
for index, radek in enumerate(radky, start = 1):
    print(f"{index}. {radek}", end = '')

1. Faster than fairies, faster than witches,
2. Bridges and houses, hedges and ditches;
3. And charging along like troops in a battle,
4. All through the meadows the horses and cattle:
5. All of the sights of the hill and the plain
6. Fly as thick as driving rain;
7. And ever again in the wink of an eye,
8. Painted stations whistle by.
9. Here is a child who clambers and scrambles,
10. All by himself and gathering brambles;
11. Here is a tramp who stands and gazes;
12. And there is the green for stringing the daisies!
13. Here is a cart run away in the road
14. Lumping along with man and load;
15. And here is a mill and there is a river,
16. Each a glimpse and gone forever!
17. 
18. Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
19. https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE


In [81]:
for radek in enumerate(radky, start = 1):
    print(f"{radek[0]}. {radek[1]}", end ="")

1. Faster than fairies, faster than witches,
2. Bridges and houses, hedges and ditches;
3. And charging along like troops in a battle,
4. All through the meadows the horses and cattle:
5. All of the sights of the hill and the plain
6. Fly as thick as driving rain;
7. And ever again in the wink of an eye,
8. Painted stations whistle by.
9. Here is a child who clambers and scrambles,
10. All by himself and gathering brambles;
11. Here is a tramp who stands and gazes;
12. And there is the green for stringing the daisies!
13. Here is a cart run away in the road
14. Lumping along with man and load;
15. And here is a mill and there is a river,
16. Each a glimpse and gone forever!
17. 
18. Robert Louis Stevenson - From A Childâ€™s Garden of Verses (1885)
19. https://www.gutenberg.org/files/19722/19722-h/19722-h.htm#FROM_A_RAILWAY_CARRIAGE


## Cvičení 2

Otevřete soubor `stromecek.txt` v režimu zápisu a zapište do něj vánoční stromek vysoký 12 řádků. Použijte cyklus `for` pro generování stromku.

Očekávaný obsah souboru:
```
*
**
***
****
*****
******
*******
********
*********
**********
***********
************
```

In [None]:
# Napište řešení zde

In [82]:
for i in range(12):
    print(i)

0
1
2
3
4
5
6
7
8
9
10
11


In [86]:
for i in range(1, 13):
    print(i)

1
2
3
4
5
6
7
8
9
10
11
12


In [87]:
for i in range(1, 13):
    print('*' * i)

*
**
***
****
*****
******
*******
********
*********
**********
***********
************


In [88]:
with open('stromecek.txt', 'w', encoding = 'utf-8') as soubor:
    for i in range(1, 13):
        soubor.write('*' * i)

In [89]:
with open('stromecek.txt', 'w', encoding = 'utf-8') as soubor:
    for i in range(1, 13):
        soubor.write('*' * i + '\n')

## Cvičení 3

Napište skript, který přesune soubory `one.txt` a `two.txt` do složky `archiv/`. Názvy souborů by měly zůstat stejné, změní se pouze místo, kde jsou uloženy.

In [None]:
# Napište řešení zde

## Cvičení 4

Najděte všechny soubory s příponou **.txt** ve složce `data/`. Pomocí cyklu otevřete každý z nich a zobrazte jeho obsah na obrazovce.

Úloha bude správně provedena, když uvidíte na obrazovce tři anglická palindroma a nula českých (protože ta jsou v souborech **.py**, ne **.txt**) ani ukrajinských (ta jsou v souborech **.html**).

In [None]:
# Napište řešení zde

## Otázky k zamyšlení

1. Jaký je rozdíl mezi metodami `read()`, `readlines()` a `readline()`?
2. Proč je důležité používat `with` při práci se soubory?
3. Jaký je rozdíl mezi relativní a absolutní cestou?
4. Proč je potřeba používat `'w'` režim při zápisu do souboru?