# Moduł 8 - Obsługa plików.

## 1. Obsługa plików.
Dokumentacja : https://docs.python.org/3.11/tutorial/inputoutput.html#reading-and-writing-files
Przejdźmy od razu do omówienia kilku przykładów.


#### Listing 1

In [None]:
# plik znajduje się w tej samej lokalizacji co uruchamiany skrypt
# lub jest to np. w PyCharm ustawiony folder roboczy, w którym ten plik się znajduje
uchwyt = open('plik.txt')
# podana pełna ścieżka do pliku
uchwyt = open(r'C:\plik.txt', 'r')


Pierwsze polecenie otwiera plik, który znajduje się w folderze, w którym jest uruchamiany plik. Domyślnie plik otwierany jest tylko do odczytu. Drugie polecenie przyjmuje ścieżkę bezwzględną i dodatkowo kolejny parametr przekazuje tryb odczytu pliku, który tutaj również jest tylko do odczytu. Litera r poprzedzająca ścieżkę powoduje potraktowanie tego ciągu tekstowego jako ciągu surowego (ang. raw), czyli nie będą brane pod uwagę ewentualne wystąpienia znaków specjalnych, które trzeba by poprzedzać znakiem „\” bez użycia litery r.
Podstawowy odczyt danych z pliku można wykonać tak:


#### Listing 2

In [None]:
uchwyt = open('plik.txt') 
uchwyt = open(r'C:\plik.txt', 'r') 
dane = uchwyt.read() 
print(dane) 
uchwyt.close()


I tutaj możemy zauważyć pierwszy problem, jeżeli w pliku tekstowym znajdowały się polskie ogonki. Możemy temu zaradzić dodając dodatkowy parametr określający jak powinny być kodowane odczytywane znaki. Pamiętajmy również o zamykaniu uchwytu do pliku po odczytaniu danych.

#### Listing 3

In [None]:
uchwyt = open(r'C:\plik.txt', 'r', , encoding='utf-8'))

Typy i nazwy kodowania można znaleźć pod adresem https://docs.python.org/3.11/library/codecs.html#standard-encodings. Tryby otwarcia pliku przedstawione są w tabelce poniżej.

Tryb - Opis
r	- Tylko do odczytu. Plik musi istnieć
w	- Tylko do zapisu. Jeżeli pliku nie ma to zostanie utworzony a jeżeli jest to jego zawartość zostanie zapisana nową
a	- Do dopisywania. Dane dopisuje się na koniec pliku. Jeśli plik nie istnieje to zostanie utworzony
r+	- Do odczytu i zapisu. Plik musi istnieć.
w+	- Do odczytu i zapisu. Jeśli plik nie istnieje zostanie utworzony
a+	- Do odczytu i zapisu. Jeżeli plik nie istnieje zostanie utworzony.

Możemy również odczytywać plik linia po linii z pomocą pętli:


#### Listing 4

In [None]:
uchwyt = open('plik.txt', 'r', encoding='utf-8') 

for linia in uchwyt: 
    print(linia) 
uchwyt.close()


W tym przypadku może pojawić się sytuacja, gdzie po każdej wyświetlonej linii na wyjściu będzie wypisywana nowa linia. To dlatego, że funkcja print dodaje na końcu znak \n, który oznacza nową linię, a jeżeli taki znak został również odczytany z pliku to mamy odpowiedź dlaczego tak się dzieje.
Aby to zmienić można ustalić wartość parametru 'end' funkcji print na inną niż domyślna wartość.
Możemy również określić jakiej wielkości fragmenty pliku wyrażone w bajtach. Tym razem z pomocą pętli while:


#### Listing 5

In [None]:
uchwyt = open('plik.txt', 'r', encoding='utf-8') 

while True: 
    dane = uchwyt.read(1024) 
    print(dane, end='') 
    if not dane: 
        uchwyt.close() 
        break


Teraz kolej na zapisywanie do pliku.

#### Listing 6

In [None]:
uchwyt = open('plik2.txt', 'w', encoding='utf-8') 
uchwyt.write('Zapisuję do pliku.') 
uchwyt.close()


Istnieje bardziej nowoczesna metoda dostępu do plików, której wykorzystanie zwalnia nas z obowiązku pamiętania o zamknięciu uchwytu do pliku. Ta metoda gwarantuje również zamknięcie uchwytu przy wystąpieniu wyjątku. To zalecane rozwiązanie przy obsłudze plików w Python 3.

#### Listing 7

In [None]:
with open('plik.txt', 'r', encoding='utf-8') as file_reader: 
    for linia in file_reader:
        print(linia, end='')


Na koniec jeszcze przykład z obsługą wyjątków:

#### Listing 8

In [None]:
try: 
    with open('plik.txt', 'r', encoding='utf-8') as file_reader: 
        for linia in file_reader: 
            print(linia, end='') 
except OSError as er: 
    print(f'Wystąpił wyjątek OSError: {er}')


Więcej informacji o wyjątkach, również związanych z obsługą plików znajdziemy pod adresem https://docs.python.org/3.11/library/exceptions.html#exception-hierarchy.

## 2. Moduł json oraz csv.

Obsługa nieustrukturyzowanych plików nie jest najwygodniejszym sposobem utrwalania danych. Jednym z najbardziej popularnych formatów przechowywania struktur danych jest format json (ang. JavaScript Object Notation), który pozwala na przechowywanie informacji o całych hierarchieach oiektów. Proces zapisywania nazywa się serializacją a odtwarzania struktury z pliku deserializacją.

#### Listing 9

In [None]:
import json
import random

# lista
lista = [[random.randint(1, 100) for n in range(10)] for k in range(10)]

with open('dane_lista.json', 'w') as plik:
    json.dump(lista, plik)

with open('dane_lista.json', 'r') as plik:
    x = json.load(plik)

print(x)
print(type(x))

# słownik
slownik = {f'student_{x}': x**2 for x in range(1,11)}

with open('dane_slownik.json', 'w') as plik:
    json.dump(slownik, plik)

with open('dane_slownik.json', 'r') as plik:
    x = json.load(plik)

print(x)
print(type(x))

# typy inne niż list i dict nie działają out of the box
# ale można poszukać metod, które pozwalają zapisać inne struktury w
# postaci list lub słowników

class Pracownik:
    pass

p = Pracownik()
p.imie = 'Adam'
p.nazwisko = 'Malinowski'

# print(json.dumps(p)) # nie

# tak !
print(json.dumps(p.__dict__))


Format csv jest również bardzo popularny i mimo, że można go bez większych problemów obsługiwać za pomocą wbudowanych metod operujących na plikach oraz dzięki metodom split() oraz join() klasy str w dość efektywnie tworzyć i odtwarzać takie pliki mamy do dyspozycji moduł csv.
Dokumentacja: https://docs.python.org/3.11/library/csv.html


#### Listing 10

In [None]:
import csv


lista = [[random.randint(1, 100) for n in range(10)] for k in range(10)]


# tworzymy plik csv korzystając z metody writerows, która przyjmuje iterowalny
# obiekt jako argument
with open('dane_lista.csv', 'w', newline='') as f:
    writer = csv.writer(f)
    writer.writerows(lista)

# otwieramy zapisany wcześniej plik linia po linii
with open('dane_lista.csv', newline='') as f:
    reader = csv.reader(f)
    for wiersz in reader:
        print(wiersz)

# parametry pliku csv można dostosować
with open('dane_lista.csv', newline='') as f:
    reader = csv.reader(f, delimiter=':', quoting=csv.QUOTE_NONE)
    for wiersz in reader:
        print(wiersz)

# przykład wykorzystania DictReader oraz DictWriter

# pierwszy wiersz w pliku traktowany jako lista kluczy słownika
# którym jest każdy zwracany wiersz
with open('dane.csv', newline='', encoding='utf-8') as csvfile:
    reader = csv.DictReader(csvfile, delimiter=';')
    for wiersz in reader:
        print(wiersz['Kraj'], wiersz['2006'])
    

# zapis
with open('dane_2.csv', 'w', newline='') as csvfile:
    kolumny = ['Kraj', '2020']
    writer = csv.DictWriter(csvfile, fieldnames=kolumny)

    writer.writeheader()
    writer.writerow({'Kraj': 'Polska', '2020': 37987654})
    writer.writerow({'Kraj': 'USA', '2020': 331002651})
