# Lekce 5 - Práce se soubory, formátování 
Práce se soubory v jazyce Python zahrnuje čtení dat ze souborů, zápis dat do 
souborů a různé způsoby manipulace se soubory. Dnes se naučíme:
 * Formátovat výstup funkce print
 * Otvírat/čist/psát/ukládat soubory různých typů


Tisk informací, ať už na obrazovku nebo do souboru patří mezi nejčastější úkony
Funkce `print` posílá výstup do souboru *sys.stdout*, který je přesměrován na terminálový výstup

Celou syntaxi a d dokumentaci k finkci print získáme pomocí příkazu `help`

In [7]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



In [8]:
print(1,2,3,4,5,sep=':')
print("First output", end="|")
print("Second output")

1:2:3:4:5
First output|Second output


### Formátování výstupu
Existují dvě syntaxe pro formátování výstupu
* originální 
* nová python3 syntaxe s použitím tzv. string formatting 

In [9]:
print("My integer is: %d, my float is %4.3f" % (42, 3.141592653589793))
print("My integer is: {}, my float is {:4.3f}".format(42, 3.141592653589793))

My integer is: 42, my float is 3.142
My integer is: 42, my float is 3.142


Specifikace formátu (část následující za dvojtečkou uvnitř složených závorek) má následující syntaxi:

```python
format_spec ::=  [[fill]align][sign][#][0][width][,][.precision][type]
fill        ::=  <any character>
align       ::=  "<" | ">" | "=" | "^"
sign        ::=  "+" | "-" | " "
width       ::=  integer
precision   ::=  integer
type        ::=  "b" | "c" | "d" | "e" | "E" | "f" | "F" | "g" | "G" | "n" | "o" | "s" | "x" | "X" | "%"
```

Pro plnou referenci můžete použít odkaz https://docs.python.org/3/library/string.html#format-string-syntax

## Práce se soubory
* Každý vstup nebo výstup je prováěn prostřednictvím souborů (file). Výstup na obrazovku a a vstup z klávesnice je prostřednictvím defaultních souborů *sys.stdout* a *sys.stdin*
* Soubory *sys.stdout* and *sys.stdin* jsou k dispozici defaultně, nemusí se otvírat ani zavírat
* Práce se souborem začíná jeho otevřením pomocí funkce **open()**: *file_handle = open(filename_string, mode_string)*
* Základní módy jsou "r" pro čtení (reading), "w" pro zápis (write) a "a" pro přidávání (append) k existujícímu obsahu souboru
* Po ukončení práce se souborem, je nutno jej zavřít pomocí funkce **close**

Funkce open vrací hodnotu typu soubor, která poskytuje následující metody:
 * read(n): přečte n znaků nebo pokud není n specifikováno, přečte celý obsah souboru jako řetězec.
 * readline(): pro čtení jednoho řádku po druhém nebo
 * readlines(): pro čtení všech řádků do seznamu.
 * write(): pro zápis obsahu do souboru
 * close(): pro zavření souboru


In [None]:
# Open the file
file = open('Data/message.txt', 'r')

# Read the whole file in one operation
content = file.read()
print(content)
file.close()

Earth has a diameter at the Equator of about 12,756 kilometers, making it the fifth largest planet in the solar system. 
Earth’s mass is about 5.97 ⨉ 1024 kilograms. 


In [12]:
file1 = open( "Data/message.txt", 'r' )
line = file1.readline()
while line:
    print(line)
    line = file1.readline()

file1.close()

Earth has a diameter at the Equator of about 12,756 kilometers, making it the fifth largest planet in the solar system. 

Earth’s mass is about 5.97 ⨉ 1024 kilograms. 


Dokonce můžete iterovat přez soubor

In [14]:
file1 = open( "Data/message.txt", 'r' )

for line in file1:
    print(line.rstrip())

file1.close()

Earth has a diameter at the Equator of about 12,756 kilometers, making it the fifth largest planet in the solar system.
Earth’s mass is about 5.97 ⨉ 1024 kilograms.


## Zápis do souboru
Chcete-li zapsat data do souboru, otevřete jej v režimu 
zápisu ("w", "a"), použijte metodu `write()` pro zápis dat a 
poté soubor zavřete pomocí metody `close()`. Případně 
můžete použít příkaz `with`, který soubor po dokončení 
automaticky uzavře.

V3imn2te si že funkce write vyžaduje explicitní ukončení každého řádku pomocí znaku `\n`

In [15]:
# Open, write, and close
file = open('myfile.txt', 'w')
file.write("My test output\n")
file.write("The magic number is: {}\n".format(42))
file.close()

In [None]:
with open('myfile.txt', 'r') as file:
    print (file.read())

My test output
The magic number is: 42




Alternativou k funkci write je funkce print s tím, že výstup je třeba do souboru přesměrovat, jinak jde výstup do defaultního souboru *sys.stdout*!
    * Funkce print také defaultně připojuje znak konce souboru
    * Nezapisování konce řádku můžete vynutit pridáním volitelného argumentu `end=''`

In [16]:
# Open, write, and close
file2 = open('myfile.txt', 'w')
print("My test output", file=file2)
print("The magic number is: {}\n".format(42), file=file2)
file2.close()

Existují specializované moduly pro čtení specializovaných formátů.
Například
* Modul `csv` poskytuje funkce pro čtení ze souborů CSV a zápis do nich
* Modul `json` pro čtení a zápis do strukturovaných json souborů
* Modul `pickle` pro serializaci a deserializaci komplexních typů