# Python akademie

---

<br>

## Obsah lekce
---

1. [Úvod do IO](),
2. [Spojení se souborem pomocí Pythonu](),
3. [Textové soubory](),
4. [Zápis s kontextovým manažerem](),
5. [Formátování řetězců (~string formatting)](),
    - [Formátování řetězců](),
    - [Formátovací výraz](),
    - [Formátovací metoda](),
    - [Formátovaný string (f-string)]().

---

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse4.mm.bing.net%2Fth%3Fid%3DOIP.BPYuvKj05Xo_oF_oXiL1yAHaHa%26pid%3DApi&f=1" width="250" style="margin-left:auto; margin-right:auto">

## Úvod do IO

---

Nyní pracuješ pouze s objekty **Pythonu vlastními** nebo **s jeho knihovnami**.

Všechny tyto *objekty* jsi vytvoříš a zpracováváš **v rámci paměti RAM** (*random access memory*).

<br>

*Paměť RAM* je **velmi rychlá**, ale současně náročná a vyžaduje **neustálý zdroj** (není elektřina, ztratíš data).

Takový **disk počítače** je o dost **pomalejší** než paměť *RAM*, ale umožňuje ti uchovávat tebou získaná, zpracovaná data.

<br>

Proto je dobré osvojit si pravidla a postupy v Pythonu, jak vytvořit **persistentní data**.

<br>

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.h0qswb-mu-Ay17g7L_gwYwHaHa%26pid%3DApi&f=1&ipt=88ac91ad4993d84f5f1996a1644d85f41dead53dc1526c82b95099dfc7e5a6b1&ipo=images" width="200" style="margin-left:auto; margin-right:auto">

### Spojení se souborem pomocí Pythonu

---

Klasickou cestou, jak vytvořit obyčejný soubor je poskládat údaje (bajty) za hlavičkou, tedy **jménem souboru**.

<br>

Než ale začneš se souborem pracovat, potřebuješ si v Pythonu vytvořit *pomocný objekt*, který jej bude **zastupovat** (nebo se na něj odkazovat):

```python
muj_soubor = open(jmeno_souboru, pravidla)  # pomocný objekt

# ... libovolná ohlášení

muj_soubor.close()
```

1. `muj_soubor`, je **Pythonovský objekt** odkazující na **soubor**,
2. `open()`, *zabudovaná funkce*, která **vytváří spojení** (*stream*) mezi objektem a souborem,
3. `jmeno_souboru`, jméno souboru (*relativní* cesta/*absolutní* cesta),
4. `pravidla`, výběr argumentů upřesňujících, **jak soubor otevřít**,
5. `muj_soubor.close`, způsob, kterým **ukončíš spojení** mezi objektem a souborem.

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse2.mm.bing.net%2Fth%3Fid%3DOIP.JhMJc09m94e9V3oKtb_n3AHaHa%26pid%3DApi&f=1" width="200" style="margin-left:auto; margin-right:auto">

## Textové soubory

---

Nejlepším souborem na začátek bude prostý **textový soubor**.

Textovým souborem rozuměj jakýkoliv soubor, který má příponu `.txt`.

#### Demo: Ukázka textového souboru

<br>

### Úvod k souborům

---

Základními procesy pro práci se soubory obecně jsou:
1. **Čtení** souborů,
2. **Zápis** do souborů.

### Čtení souborů

---

Otevřít a přečíst *textový soubor* pomocí *editorů* jistě ovládáš.

Teď se podívej, jak můžeš naučit otevírání a čtení souborů také **interpreta Pythonu**:

In [None]:
#help(rozdel_text)

In [None]:
muj_txt_soubor = open(demo.txt)

<br>

Dávej pozor, jakým způsobem **jméno souboru** používáš. Python potřebuje pracovat s takovým datovým typem, který dobře zná.

In [None]:
!pwd

In [None]:
!ls -l ../data/

In [None]:
muj_txt_soubor = open("../data/demo.txt")

Další kolizí může být **umístění** souboru.

<br>

*Interpret* pracuje v aktuálním umístění. Takže buď soubor přesuneš, nebo na něj odkážeš pomocí:
1. **Relativní cesty** (tedy vzhledem k aktuálnímu umístění),
2. **absolutní cesty** (celá cesta od *roota* nebo *jména disku*).

<br>

#### Relativní cesta
```
"muj_textovy_soubor.txt"                # v aktuální složce
"../muj_textovy_soubor.txt"             # v rodičovské složce
"shared/onsite/muj_textovy_soubor.txt"  # v dceřinné složce 'shared', v dceřinné složce 'onsite'
```

#### Absolutní cesta, Windows
```
"C:\users\admin\docs\muj_textovy_soubor.txt"
```

#### Absolutní cesta, unix
```
"/home/user/project/shared/onsite/muj_textovy_soubor.txt"
```

In [None]:
muj_txt_soubor = open("../onsite/lesson07/muj_textovy_soubor.txt")

In [None]:
print(muj_txt_soubor)

In [None]:
print(type(muj_txt_soubor))

Metody **pro čtění obsahu** *TextIOWrapper* objektu:

1. `read` - přečte celý soubor jako jeden string,
2. `readline` - přečte pouze první řádek jako string,
3. `readlines` - přečte celý soubor jako list (co řádek, to údaj)

<br>

In [None]:
obsah_txt = muj_txt_soubor.readlines()

In [None]:
print(obsah_txt)

In [None]:
obsah_txt_2 = muj_txt_soubor.readlines()

In [None]:
print(obsah_txt_2)

<br>

Pokud čteš jednotlivé znaky, **pomyslný kurzor** je postupně prochází.

Jakmile s ním dojdeš nakonec, **musíš jej ručně vrátit na začátek**, pokud chceš obsah souboru znovu načíst:

In [None]:
muj_txt_soubor.seek(0)     # Nastaví kurzor na začátek .txt souboru

In [None]:
muj_txt_soubor.seek(0, 1)  # Nastaví kurzor na konec .txt souboru

In [None]:
obsah_txt_2 = muj_txt_soubor.read()

In [None]:
print(obsah_txt_2)

Jakmile tvoje práce s textovými souborem skončí, nezapomeň soubor zavřít.

<br>

Pokud si potřebuješ jen ověřit, jestli je spojení se souborem ukončené, použij metodu `closed`:

In [None]:
muj_txt_soubor.closed

In [None]:
muj_txt_soubor.close()

In [None]:
muj_txt_soubor.closed

<br>

### Zápis do souborů

---

Pokud všem žádný textový soubor nemáš, nebo jej chceš naopak **vytvořit**, musíš jej prvně **zapsat**:

In [None]:
muj_txt = "Toto je můj nový soubor^.^"

<br>

*String* `muj_txt` máš aktuálně k dispozici pouze jako nějaký objekt Pythonu.

Opět je potřeba nejprve spojit **objekt v Pythonu** se skutečným souborem na disku.

In [None]:
muj_soubor = open("../data/demo_zapis.txt", mode='w')  # jméno souboru jako "str"

<br>

Soubor si následně můžeš otevřít, ale zjistíš, že je **v tento moment prázdný**.

Funkce `open` pouze vytvoří (*~iniciuje*) nový objekt `muj_novy_soubor`.

Příslušný text teprve musíme zapsat, pomocí vhodné *funkce* `write`:

In [None]:
muj_soubor.write(muj_txt)

In [None]:
muj_soubor.close()

In [None]:
muj_soubor = open("../onsite/lesson07/muj_textovy_soubor.txt", mode="w")  # vybrat vhodný režim

In [None]:
muj_soubor.write(muj_txt)

Pokud si budeš chtít nyní prohlédnout **zapsaný soubor na disku**, zjistíš, že je stále prázdný.

Protože *stále není ukončený*, nedovedeš s ním nijak manipulovat.

Pokud zjistíš, že není ukončený, ukončíš jej pomocí metody `close`.

In [None]:
muj_soubor.closed

In [None]:
muj_soubor.close()

Teprve po ukončení *streamu* (nebo také zápisu) objektu, můžeš soubor `muj_novy_soubor.txt` prozkoumat.

<br>

### 🧠 CVIČENÍ 🧠, Vyzkoušej si práci s *textovým souborem*:

1. Funkce `zapis_zpravu_do_txt_souboru` přijímá dva parametry `zprava` a `jmeno_souboru`,
2. Funkce otevře nový soubor, zapíše zprávu a spojení se souborem ukončí,
3. Vyzkoušej funkci spustit pro dva různé textové soubory.

In [2]:
zapis_zpravu_do_txt_souboru("Ahojte, toto je testovací zpráva!", 'test_soubor.txt')

<details>
  <summary>▶️ Klikni zde pro zobrazení řešení</summary>
   
```python
def zapis_zpravu_do_txt_souboru(zprava: str, jmeno_souboru: str) -> None:
    muj_soubor = open(jmeno_souboru, mode='w')
    muj_soubor.write(zprava)
    muj_soubor.close()

zapis_zpravu_do_txt_souboru("Ahojte, toto je testovací zpráva!", 'test_soubor.txt')
```
</details>

<br>

### Opakovaný zápis do souboru

---

Máš situaci, kdy tebou vytvořený soubor existuje a ty jej chceš znovu otevřít a rozšířit:

In [None]:
dalsi_text = "\nRád čtu a hraji na klavír"

<br>

Opět potřebuješ inicializovat **pomocný objekt**, jako v předchozích scénářích:

In [None]:
muj_soubor = open("../data/demo_zapis.txt", mode="w")

In [None]:
muj_soubor.write(dalsi_text)

In [None]:
muj_soubor.close()

In [None]:
help(muj_soubor.writelines)

Když zkontroluješ, jak vypadá **nově přidaný text**, bude vypadat zmateně.

<br>

Pokud opětovně načteš **stejný soubor** v režimu `w`, přesuneš "zapisovač" (*představ si jej jako blikající kurzor v editoru*) opět **na začátek souboru**.

*Interpret* zapisuje od místa, kde se zapisovač nachází, takže dojde **k přepsání původního obsahu**.

<br>

Pokud chceš automaticky zapisovat **od konce souboru**, otevři soubor s argumentem `mode="a"`, tedy v režimu `append`.

In [None]:
prvni_radek = "Ahoj, ja jsem Matous (:"

In [None]:
dalsi_txt = "\nRad ctu, hraji na klavir"

In [None]:
muj_soubor = open("../data/demo_zapis.txt", mode="w")

In [None]:
muj_soubor.write(prvni_radek)

In [None]:
muj_soubor.close()

In [None]:
muj_soubor = open("../data/demo_zapis.txt", mode="")

In [None]:
muj_soubor.write(dalsi_txt)

In [None]:
muj_soubor.close()

<br>

Pokud budeš někdy pracovat se stejným souborem tak, že jej budeš současně:
1. **číst** soubor,
2. **zapisovat** do něj.
    
Vyzkoušej režim `r+`.

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.eUy0yqtKrsDHeiUI1dWKggHaHa%26pid%3DApi&f=1&ipt=69ae33045a754823160a963754bc498c4c560ed92d3f57186fdc778816155ef9&ipo=images" width="200" style="margin-left:auto; margin-right:auto">

### Zápis s kontextovým manažerem

Zápis můžeš doplnit/rozšířit tzv. *kontextovým manažerem*.

In [None]:
muj_soubor = open("../data/demo.txt", mode="r")  # open
print(muj_soubor.readlines())                    # processe
muj_soubor.close()                               # close

<br>

Opakování a hlídání 3 základních kroků se může zdát svazující.

V Pythonu existuje klíčový výraz `with`:

In [None]:
with open("../data/demo.txt", mode="r") as muj_soubor:  # open
    print(muj_soubor.readlines())                       # process + close
print()

In [None]:
json_soubor.closed

<br>

### 🧠 CVIČENÍ 2 🧠, práce s textovými souborem:
---

- Definuj funkci `precti_logy`, která splňuje:
    - parametr: `soubor` (string),
    - vrací: seznam záznamů z logovacího souboru,
    - popis: Tato funkce přečte obsah logovacích souboru. Kde každý řádek bude oddělený údaj sekvence.

- definuj funkci `vyber_pouze_typ`, která splňuje:
    - parametr: `obsah_souboru` (list),
    - vrací: tuple,
    - popis: Tato funkce ze zadaného seznamu logů rozdělí každý řádek a uloží pouze typ logovací zprávy (`INFO`, `WARN`, ...). Výsledný údaj vrať jako `tuple`.

In [None]:
INFO 2023-07-26 10:30:22 Aplikace úspěšně spuštěna
INFO 2023-07-26 10:31:12 Uživatel přihlášen
WARN 2023-07-26 10:35:05 Nedostatek místa na disku
INFO 2023-07-26 10:36:17 Data úspěšně uložena
ERROR 2023-07-26 10:40:44 Připojení k databázi selhalo
WARN 2023-07-26 10:45:30 Možná chyba v konfiguraci
ERROR 2023-07-26 10:50:01 Nelze odeslat e-mail
INFO 2023-07-26 10:55:12 Aplikace úspěšně ukončena

<details>
    <summary>▶️ Řešení</summary>
    
```python
def precti_logy(soubor: str) -> list:
    muj_soubor = open(soubor, mode='w')
    obsah_souboru = muj_soubor.readlines()
    return obsah_souboru
    

def vyber_pouze_typ(obsah_souboru: list) -> tuple:
    return tuple(
        [log.split()[0] for log in obsah_souboru if len(log) > 3]
    )
```
</details>

<br>

<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.eIepNW0QqoKS0nHKxdHb_gHaHa%26pid%3DApi&f=1&ipt=f8fbd56c24a7f9c26b35553a95d220e93ce3bdce6bce019cdf455c712cd8e1b5&ipo=images" width="200" style="margin-left:auto; margin-right:auto">

## Formátování řetězců (~string formatting)

---

Jde o způsob, jakým efektivně zapisovat klasický string ve spojením se jmény proměnných, doplňujícím upravováním a dalšími variantami.

<br>

### Formátování řetězců

---

Povíme si více o těchto třech způsobech:
1. **Formátovací výraz** (`%`-formatting)
2. **Formátovací metoda** (`str.format()`)
3. **Formátovaný string** (`f""`)

<br>

### Formátovací výraz

---

Je to prapůvodní způsob formátování stringu v Pythonu už od uplného začátku:

In [None]:
JMENO = "Lukas"
VEK = 27
"Ahoj, jmenuji se %s a je mi %d let" % (JMENO, VEK)

<br>

**Pozor!** dnes se již oficiálně nedoporučuje, jelikož často selhává, nesprávně zobrazuje tupl nebo slovníky. Vypisování není příliš praktické.

<br>

### Formátovací metoda

---

Od verze Pythonu 2.6 máme k dispozici další způsob pro formátování:

In [None]:
JMENO = "Eliska"
VEK = 26
"Ahoj, jmenuji se {} a je mi {} let".format(JMENO, VEK)

<br>

**Pozor!** použití je pořád poměrně upovídaní např. při zápisu více proměnných. Má rozhodně široké možnosti formátování, ale vždy prakticky použitelné.

<br>

### 🔝 Formátovaný string (f-string)

---

Od verze Pythonu 3.6 máme k dispozici ještě třetí metodu pro formátování stringů.

In [None]:
JMENO = "Lucie"
VEK = 28
f"Ahoj, jmenuji se {JMENO} a je mi {VEK} let"

<br>

Syntaxe je stručná přesto čitelná. Zvládá různé platné operace v Pythonu včetně volání funkcí. Opatrně při důsledném zapisování uvozovek.

In [None]:
f"|{JMENO:<10}|{VEK:^10}|"

<br>

Vhodná také pro zaokrouhlování desetinných čísel a převádění číselných hodnot na procenta:

In [None]:
value = 11.1234
print(f"value: {value:.2f}")

---


<img src="https://external-content.duckduckgo.com/iu/?u=https%3A%2F%2Ftse1.mm.bing.net%2Fth%3Fid%3DOIP.GMJvJ-GG0YS8H5JmHR3CbwHaHm%26pid%3DApi&f=1" width="200" style="margin-left:auto; margin-right:auto" />


## Domácí úkol

---

Napiš *skript*, který:

1. Načte soubor typu `JSON`,
2. rozdělí obsah **podle klíčů**,
3. zapíšeš rozdělená data do sloupečků **v CSV souboru**.

Vstupní **JSON** soubor:
    

```
    {
        "id": 1,
        "first_name": "Dorri",
        "last_name": "Di Bernardo",
        "email": "ddibernardo0@nba.com",
        "gender": "Female",
        "ip_address": "158.223.131.8"
    },
    {
        "id": 2,
        "first_name": "Nisse",
        "last_name": "Noye",
        "email": "nnoye1@theatlantic.com",
        "gender": "Female",
        "ip_address": "252.57.218.72"
    },
    ...
```

Výstupní **CSV**:
```
["id", "first_name", "last_name", "email", "gender", "ip_address"],
["1", "Dorri", "Di Bernardo", "ddibernardo0@nba.com", "Female", "158.223.131.8"],
["2", "Nisse", "Noye", "nnoye1@theatlantic.com", "Female", "252.57.218.72"],
...
```

---