# Język Python
## Pliki

In [None]:
from pprint import pprint
with open('00_podstawy.ipynb') as notebook:
    lines = notebook.readlines()
    pprint(lines)

In [None]:
with open('00_podstawy.ipynb') as notebook:
    for line in notebook:
        pprint(line)
        break

Czy pliki __zawsze__ otwieramy w bloku `with`?

Sposoby czytania z pliku:
 - `read()` - wczytuje cały plik do jednego napisu
 - `read(n)` - wczytuje maksymalnie n bajtów do napisu
 - `readline()` - wczytuje do końca linii (lub końca pliku)
 - `readlines()` - wczytuje cały plik do listy napisów - każda linia to osobny napis
 - iteracja po obiekcie pliku - działa jak `readlines`, ale bez konieczności wczytania całości do pamięci - istotne w przypadku dużych plików

In [None]:
with open('output.txt', 'w') as outfile:
    outfile.write("Hello ")
    outfile.write("world!\nWhat a lovely day!\n")
    outfile.writelines(["This is test file.\n", "And also a text file.\n"])  # <- please note the newline characters

Tryby otwarcia pliku:
 - `"r"` - domyślny, otwarcie do odczytu
 - `"w"` - otwarcie do zapisu; jeżeli plik istniał, jego dotychczasowa zawartość zostaje usunięta
 - `"a"` - otwarcie do dopisywania; dotychczasowa zawartość zostaje zachowana, a nowa pojawia się na końcu
 - `"rb"`, `"wb"`, `"ab"` - analogicznie, ale dla plików binarnych
 
Sposoby zapisu do pliku:
 - `write()` - przyjmuje pojedynczy napis
 - `writelines()` - przyjmuje listę napisów
 
W obu przypadkach liczba napisów nie przekłada się na liczę linii - znaki końca linii (`"\n"`) musimy wstawiać samodzielnie

In [None]:
f = open("output.txt", "w")
help(f)
f.close()

## CSV

https://docs.python.org/3/library/csv.html

In [None]:
import csv

with open('Plant_1_Generation_Data.csv') as csv_file:
    reader = csv.reader(csv_file)
    for ind, row in enumerate(reader):
        print(row)
        if ind >= 3:
            break

In [None]:
import csv

with open('Plant_1_Generation_Data.csv') as csv_file:
    reader = csv.DictReader(csv_file)
    for ind, row in enumerate(reader):
        print(row)
        if ind >= 3:
            break

In [None]:
import pandas as pd

df = pd.read_csv('Plant_1_Generation_Data.csv')
df[:3]

## JSON

https://docs.python.org/3/library/json.html

In [None]:
import json

data = ["This", "is", "a", ["list", "of", "strings"]]
data

In [None]:
with open("/tmp/data.json", "w") as outfile:
    json.dump(data, outfile)

In [None]:
with open("/tmp/data.json", "r") as infile:
    data2 = json.load(infile)

data2    

In [None]:
for x, y in zip(Xs, Ys):
    outfile.write(f'{{ "translation": {{ "before": "{y}", "after": "{x}" }} }}\n')

What could possibly go wrong?

In [None]:
for x, y in zip(Xs, Ys):
    outfile.write(json.dumps({"translation": {"before": y, "after": x}}) + "\n")

![Who's JSON](img/Lecture/JSON.jpg)

## Dane binarne

https://docs.python.org/3/library/pickle.html

In [None]:
import pickle

data = ["This", "is", "a", ["list", "of", "strings"], {"Kind", "of"}]

In [None]:
with open("/tmp/list_of_strings.bin", "wb") as outfile:  # uwaga na tryb dostępu
    pickle.dump(data, outfile)

In [None]:
with open("/tmp/list_of_strings.bin", "rb") as infile:
    data2 = pickle.load(infile)
data2

In [None]:
import joblib

data = ["This", "is", "a", ["list", "of", "strings"], {"Kind", "of"}]

In [None]:
with open("/tmp/list_of_strings.bin", "wb") as outfile:  # uwaga na tryb dostępu
    joblib.dump(data, outfile)

In [None]:
with open("/tmp/list_of_strings.bin", "rb") as infile:
    data2 = joblib.load(infile)
data2

## Inne biblioteki:
 - xlrd, xlwt - obsługa plików xls
 - Beautiful Soup - obługa XMLa (jest też wbudowany moduł xml)
 - PIL/Pillow - pliki graficzne
 - pyyaml
 - ...