<h6 align=right> 🐍 Python akademie - lekce 9 - 12.12.2024</h6>

---



<br>

# <h1 align=center><font size=24><b> 09_01: 🗒 Textové soubory</font></h1>

<br>


<br>

---

### **Zajímavé odkazy z této lekce:**

* [Oficiální dokumentace k **docstring** u funkci (python.org)](https://www.python.org/dev/peps/pep-0257/)
* [Oficiální dokumentace k **UTF-8** u funkci (wikipedia.org)](https://cs.wikipedia.org/wiki/UTF-8)


---

<br>

<br>

## **Pojem file io**

---

<br>

Doposud jsme pracovali pouze s objekty Pythonu vlastními nebo s knihovnami. Dneska si povíme něco o práci **s textovými soubory** přímo u vás na počítači.

<br>

Celkově pokud budete v rámci Pythonu pracovat se soubory (obecně), mluvíme o procesu `io`(někdy také `i/o`).

<br>

Toto označení vychází z anglického *input* a *output*. Tedy **vstup** a **výstup**.

<br>

V průběhu této lekce se naučíme textové soubory **číst**, **zapisovat** i **upravovat** tak, aby to za nás vždy provedl interpret Pythonu.

<br>

## **Textové soubory (~text files)**

---

Textovým souborem rozumějme jakýkoliv soubor, který má příponu `.txt`.

<br>

Jeden takový textový soubor máme k dispozici v aktuálním adresáři:

In [None]:
!dir

MyDrive


<br>

Práce s textovými soubory nám může být v principu jasná (v pracovním prostředí počítače).

<br>

Nyní se ale pojďme naučit pracovat s textovým editorem pomocí Pythonu (pomocí interpretu Pythonu).

<br>

## **Práce s textovými soubory (~File I/O)**

---

Chceme napsat šikovnější programy, které umí Pythonu vysvětlit, aby pracoval s různymi textovými soubory.<br>

Nejprve ale budeme muset Python přesvědčit, aby nám soubor **vytvořil**.

<br>

## **Vytvoření nového souboru (zápis)**

---

In [None]:
muj_string = "Python je cool!"

String `muj_string` máme aktuálně k dispozici pouze jako nějaký **objekt Pythonu** (v aktuálním prostředí jako `str`).

<br>

Jak jej ale uložit do skutečného textového souboru na našem disku?

<br>

Nejprve potřebujeme "zevnitř" Pythonu (~interpreta Pythonu), vytvořit soubor. Nejdříve ověříme [zabudované funkce](https://docs.python.org/3/library/functions.html).

In [None]:
help(open)

In [None]:
muj_soubor = open('novy_soubor.txt', mode='w')

In [None]:
PATH

NameError: ignored

<br>

Soubor si můžeme otevřít, ale zjistíme, že je v tento moment prázdný.

<br>

Funkce `open` pouze **vytvoří** (~iniciuje) nový objekt `muj_soubor`. Hodnotou tohoto souboru je zapsaní **skutečného souboru** (jehož jméno jsme uvedli v závorce s příslušným argumentem) na váš disk, do aktuálního otevřeného adresáře.

<br>

Příslušný text teprve musíme zapsat.

In [None]:
muj_soubor.write(muj_string)

<br>

Číslo `15`, které vidíme na výstupu je počet zapsaných znaků (*~bytes*). ([zdroj](https://docs.python.org/3/library/io.html#io.RawIOBase.write))

<br>

Pojďme si nyní společně **prohlédnout zapsaný soubor** na disku.

<br>

Protože jsme do souboru zapisovali, ale **neukončili jej**, nejsme schopni s ním ještě manipulovat.<br>
Pomocí metody `closed` ověříme, jestli je spojení ukončené. ([zdroj](https://docs.python.org/3/library/io.html#io.IOBase.closed))

In [None]:
muj_soubor.closed

<br>

Pokud zjistíme, že není ukončené, ukončíme jej pomocí metody `close`. ([zdroj](https://docs.python.org/3/library/io.html#io.IOBase.close))

In [None]:
muj_soubor.close()

<br>

Teprve po ukončení *streamu* objektu můžeme soubor `novy.txt` prozkoumat.

<br>

Nyní chceme doplnit **další řádek** v našem souboru:

In [None]:
muj_string2 = "Prave probirame lekci 9"

In [None]:
muj_soubor = open("novy_soubor.txt", mode="w")

In [None]:
muj_soubor.write(muj_string2)

24

In [None]:
muj_soubor.close()

<br>

**Zkontrolujeme** jak vypadá nově přidaný string.

<br>

Opatrně na `mode="w"`. Pokud opětovně načtete stejný soubor v tomto režimu, přesunute "zapisovač" (představ si jej jako blikající kurzor v editoru) opět na začátek souboru.

<br>

Interpret ale zapisuje od místa, kde se zapisovač nachází, takže dojde k **přepsání stávajícího obsahu**.

<br>

Pokud chceš automaticky zapisovat nehledě na umístění našeho *zapisovač*, otevři soubor s argumentem `mode="a"`, tedy v režimu **append**. ([zdroj](https://docs.python.org/3/library/functions.html#open))

In [None]:
muj_string = "Python je cool!"
muj_string2 = "Prave probirame lekci 9"

In [None]:
muj_soubor = open("novy_soubor.txt", mode="w")

In [None]:
muj_soubor.write(muj_string)

24

In [None]:
muj_soubor.close()

In [None]:
muj_soubor = open("novy_soubor.txt", mode="a")  # rezim 'append'

In [None]:
muj_soubor.write(muj_string2)

25

In [None]:
muj_soubor.close()

<br>

Přidáním `\n` na konec stringů dosáhneme toho, že následující string bude vypsaný **na novém řádku**.

In [None]:
!rm novy_soubor.txt  # pouze příkaz do linuxové přík. řádky

In [None]:
!del novy_soubor.txt  # ve Windows

In [None]:
muj_str_1 = "Ahoj, ja jsem Matous\n"
muj_str_2 = "Rad ctu, hraji na klavir\n"
muj_str_3 = "A co ty?:)"

In [None]:
muj_soubor = open("novy_soubor.txt", mode="w")

In [None]:
muj_soubor.write(muj_str_1)
muj_soubor.write(muj_str_2)
muj_soubor.write(muj_str_3)

10

In [None]:
muj_soubor.close()

In [None]:
muj_soubor2 = open('druhy_soubor.txt', mode='w')

In [None]:
muj_soubor2.close()

<br>

## **Čtení existujícího souboru**

---

Zatím jsme tu nahlíželi na obsah našich textových souborů pouze pomocí nějakého grafického prohlížeče. Tentokrát si pojďme zkusit čtení pomocí **Pythonu**.<br>

<br>

Opět použijeme zabud. funkci `open`.

In [None]:
muj_existujici_soubor = open("novy_soubor.txt")

In [None]:
print(muj_existujici_soubor)

<_io.TextIOWrapper name='novy.txt' mode='r' encoding='cp1252'>


In [None]:
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)


In [None]:
obsah_txt = muj_existujici_soubor.read()

In [None]:
print(obsah_txt)




Opět, pokud jedenkrát přečtete obsah celého souboru, *zapisovač* (*~kurzor*) přečte postupně celý text a zůstane na konci souboru.

<br>

Proto při dalším čtení získáme prázdný výstup, protože kurzor neprojde text znovu.

In [None]:
muj_existujici_soubor.seek(0)     # přesune kurzor na začátek souboru

0

In [None]:
muj_existujici_soubor.seek(0, 2)  # přesune kurzor na konec souboru

58

In [None]:
muj_existujici_soubor.seek(0)     # přesune kurzor na začátek souboru

0

In [None]:
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)


In [None]:
muj_existujici_soubor.seek(0)
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)


<br>

### **Reprezentace znaků**

---

In [None]:
ord("\n")  # vrací ze znaku číselné označení (Unicode standart)

10

In [None]:
chr(10)   # vrací z číselného označení znak

'\n'

<br>

## **Metody pro čtění obsahu `TextIOWrapper` objektu:**

1. `read` - přečte celý soubor jako jeden string
2. `readline` - přečte pouze první řádek jako string
3. `readlines` - přečte celý soubor jako list (co řádek, to údaj)

<br />

#### Ukázka různých variant 

In [None]:
muj_existujici_soubor.seek(0)
print(muj_existujici_soubor.readline())

Ahoj, ja jsem Matous



In [None]:
print(muj_existujici_soubor.readline())

Rad ctu, hraji na klavir



In [None]:
print(muj_existujici_soubor.readline())

A co ty?:)


In [None]:
print(muj_existujici_soubor.readline())




In [None]:
muj_existujici_soubor.seek(0)

0

In [None]:
print(muj_existujici_soubor.readlines())

['Ahoj, ja jsem Matous\n', 'Rad ctu, hraji na klavir\n', 'A co ty?:)']


In [None]:
muj_existujici_soubor.close()

<br>

## **Současně zapisovat a číst**

---

Vhodnou hodnotou argumentu `mode` můžeme specifikovat režim, kdy můžeme jak zapisovat, tak číst:

In [None]:
muj_existujici_soubor.closed

True

In [None]:
muj_existujici_soubor = open("novy_soubor.txt", mode="r+")

In [None]:
help(open)

In [None]:
print(muj_existujici_soubor)

<_io.TextIOWrapper name='novy.txt' mode='r+' encoding='cp1252'>


In [None]:
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)


In [None]:
muj_existujici_soubor.write("A jeste jeden radek!")

20

In [None]:
print(muj_existujici_soubor.tell())

78


In [None]:
muj_existujici_soubor.seek(0)
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)A jeste jeden radek!


In [None]:
muj_existujici_soubor.write("\nPosledni radek!")

16

In [None]:
muj_existujici_soubor.seek(0)
print(muj_existujici_soubor.read())

Ahoj, ja jsem Matous
Rad ctu, hraji na klavir
A co ty?:)A jeste jeden radek!
Posledni radek!


In [None]:
muj_existujici_soubor.close()

<br>

## **Kontextový manažer**

---

<br>
    
Pokud vám není příjemné myslet na neustálou proceduru otevřít soubor, provést s ním potřebnou práci a zavřít jej, je tu i jiná možnost.

<br>

### **Syntaxe s `with`**


Pokud nechcete hlídat zavírání jednotlivých souborů, můžeme použít syntaxi s `with` (tedy kontextový manažer).([zdroj](https://docs.python.org/3/reference/datamodel.html#with-statement-context-managers))

<br> 

Jeho použití, jak si ukážeme nesouvisí pouze s textovými soubory, ale pří práci s nimi je to skvělý pomocník.

<br>

Jeho použití spočívá v tom, že pomocí různých volatelných objektů v Pythonu (jako jsou funkce, př. `open`) spustí konkrétní proces. 

<br>

Ihned potom umí automaticky ukončit celý proces, pokud interpret nenajde žádné další odsazené ohlášení.

In [None]:
with open("novy_soubor.txt", mode="a") as muj_existujici_soubor:
    muj_existujici_soubor.write("\nPosledni radek z kont. manazera!")

In [None]:
muj_existujici_soubor.closed

True