### Soubory `csv`
---
- [Oficiální dokumentace na python.org](https://docs.python.org/3/library/csv.html)

<br>

#### Obecně k formátu

---

Je formát založený na hodnotách oddělených obecně **oddělovačem** (~*comma-separated values*). Dále je tento typ souboru psaný v určitém **dialektu** (*newline*, *separator*).

<br>

**Oddělovačem** je (defaultně) čárka. Ale lze použít středník, tabulátor, mezera, aj.

<br>

**Dialektem** rozumíme nějaký soubor pravidel, podle kterých `csv` soubory zapisujeme a čteme. Např.typ oddělovače, ukončení řádků, mezery za oddělovači, aj.

<br>

Základní stavební jednotkou jsou *buňky* (*columns*), které jsou naskládané do *řádků* (*rows*).

<br>

#### Možnosti modulu `csv`

---

In [None]:
import csv  # nahrajeme knihovnu

In [None]:
help(csv)   # nápověda knihovny

In [None]:
dir(csv)    # objekty knihovny

<br>

#### Vyzkoušíme si následující

---

| jméno objektu | účel metody |
| :-| :- |
| csv.reader(m) | funkce vrátí iterovatelný objekt (co cyklus, to řádek) |
| csv.writer(m) | funkce zapíše objekt do souboru (+ `writerows`)|
| csv.DictWriter(m) | třída pro zápis slovníku do souboru |
| csv.DictReader(m) | třída pro čtení souboru do slovníku |

<br>


*pozn* `m` je objekt (proměnná)

<br>

Základní dva procesy, které budeme provádět jsou:
1. __čtení__ souboru `csv`
2. __zápis__ do souboru `csv`

<br>

#### Vytvoříme soubor s příp. `.csv`

---

In [None]:
!dir data 

In [None]:
hlavicka = ["jmeno", "prijmeni", "vek"]
osoba_1 = ["Jana", "Novakova", "28"]
osoba_2 = ["Petr", "Svetr", "27"]


In [None]:
zapis_csv = open("data/prvni_tabulka.csv", mode="w", newline="")

In [None]:
print(zapis_csv)

In [None]:
zapis = csv.writer(zapis_csv, delimiter=",")

In [None]:
zapis.writerow(hlavicka)
zapis.writerow(osoba_1)
zapis.writerow(osoba_2)

In [None]:
zapis_csv.close()

<br>

#### Přečteme obsah souboru `.csv`

---

In [None]:
!dir data 

In [None]:
# Q: will this work?..
cteni = csv.reader("data/prvni_tabulka.csv", delimiter=",")

In [None]:
# oh, probably not what we wanted...
for radek in cteni:
    print(radek)

In [None]:
import csv
cteni_csv = open("data/prvni_tabulka.csv", encoding="utf-8")

In [None]:
cteni = csv.reader(cteni_csv, dialect="excel")

In [None]:
print(cteni)

In [None]:
for radek in cteni:
    print(radek)

In [None]:
cteni_csv.close()

In [None]:
# but can also work in (maybe) unexpected way
# => csvfile: Iterable[str]

radky = ["jmeno,prijmeni,vek","Jana,Novakova,28","Petr,Svetr,27"]
cteni = csv.reader(radky, dialect="excel")

for radek in cteni:
    print(radek)

In [None]:
cteni.dialect

In [None]:
cteni.dialect.delimiter

In [None]:
# Alternative read/write: DictReader / DictWriter
# works with dictionaries

In [None]:
with open("data/prvni_tabulka.csv", newline="") as f:
    cteni = csv.DictReader(f)
    for radek in cteni:
        print(radek)

In [None]:
slovniky = [
    {'jmeno': 'Jana', 'prijmeni': 'Novakova', 'vek': '28'},
    {'jmeno': 'Petr', 'prijmeni': 'Svetr', 'vek': '27'}
]
with open("data/druha_tabulka.csv", newline="", mode="w") as f:
    klice = ["jmeno", "prijmeni", "vek"]
    zapis = csv.DictWriter(f, fieldnames=klice)
    zapis.writeheader()
    for radek in slovniky:
        zapis.writerow(radek)

---