## Pokročilejší možnosti

#### jméno souboru - umístění na disku
* os.getcwd() zjistí pracovní adresář
* os.chdir(...) změní pracovní adresář
* os.path.join(...) pro sestavení cesty

In [None]:
import os
os.getcwd()

In [None]:
os.path.join(os.getcwd(), 'poadresar', 'soubor.txt')

#### Zápis do souboru, přečtení souboru
* **open()** otevře soubor a získá na něj odkaz (tzv. handle)
* používá se konstrukce **with**, která při svém opuštění zajistí uzavření souboru

In [None]:
with open(cesta_k_souboru, mod) as f:
    obsahsouboru = f.read()    # defaultně: konce řádků převede na '\n'
    # nebo: f.readlines()             # bude rozděleno na řádky (list), ale každý bude končit '\n'
    # nebo: f.write(nejakytext)       # '\n' jsou konce řádků

#### mod
mód otevření souboru
* **r** pro čtení
* **x** vytvořit pro zápis (error pokud existuje)
* **w** pro zápis (původní obsah se přepíše)
* **a** pro zápis na konec, za původní obsah
* **+** lze kombinovat čtení a zápis

#### Jak vhodně pracovat s jednotlivými řádky?

In [None]:
with open(cesta_ke_ctenemu_souboru) as f:
    obsahsouboru = f.read()
    radky = obsahsouboru.splitlines()   # dostanu jednotlivé řádky, bez ukončovacích znaků

with open(cesta_k_zapisovanemu_souboru, 'x') as f:
    f.writelines(radek + '\n' for radek in radky)   # přidá ukončovací znak ke každému řádku

#### práci s textovými soubory lze ovlivnit dalšími parametry: 
open(cesta_k_souboru, mod, encoding=None, newline=None)
* pokud je nepoužijeme,
  * překóduje se text defaultním kódováním operač.systému
  * konce řádků se převedou mezi '\n' v pythonu a používaným koncem řádků v operačním systému
* ... a to právě skoro vždy chceme
* pokud ale potřebujeme pracovat se soubory s "cizím" kódováním nebo konci řádků, můžeme parametry použít

*možná zrada: utf-8 soubor může mít identifikační znaky na začátku - zde nebudeme řešit*

Pokud nám nevyhovuje chování pro texty (pro str), můžeme přidat do módu: **b**
* newline ani encoding se neuplatní - text se čte/píše bez jakékoli změny
* na straně pythonu nebude text (typ: str), ale binární řetězec (typ: bytes; b'...') - **přesně stejně jako v souboru**


Pokud by to byl text a chtěl bych to dělat takto (což je nevhodné), bude bytes řetězec zakódovaný (přesně stejně jao v souboru, např. v utf-8) a abych dostal normální text (typ: str), musel bych ho odkódovat:
* text = byty.decode()   # default=utf-8; případně byty.decode('cp1250') - načtení souboru z českých Windows

a zpět:
* byty = text.encode()

**Ale**: Postupovat takto pro texty je nevhodné! **Přesně toto pro nás udělá open(), když b vynecháme.** S módem **b** zapisovat jen skutečně binární řetězce (obrázky,..)