# Praca z plikami

### 01.12.2022, Python

Obsługa plików jest jedną z podstawowych umiejętności programisty. Odczyt danych zapisanych w plikach, wczytywanie plików konfiguracyjnych, zapisywanie poszczególnych danych do plików – wszystko to wykorzystane w naszych programach wpłynie na ich użyteczność.

### Zmienne plikowe

Do obsługi plików potrzebujemy zmiennej, która będzie pełniła rolę uchwytu do pliku. Wszelkie operacje związane z plikiem wykonuje się właśnie poprzez wykonywanie metod oferowanych przez zmienną plikową. Aby stworzyć zmienną plikową należy otworzyć plik.

# 1. Otwieranie, czytanie i zamykanie pliku

Funkcja  `open(file, mode)` pozwala otworzyć plik i zwraca go jako obiekt.      


## 1.1. Otwarcie pliku

### Metoda `open`
Do otwierania pliku służy metoda open. Zwraca ona uchwyt do pliku. Metoda za argument przyjmuje ścieżkę do pliku.
Jeżeli plik, który chcemy otworzyć znajduje się w tym samym katalogu co wykonywany plik Pythona wystarczy, że podamy jego nazwę (ścieżka relative).

Jeśli plik znajduje się w innym miejscu na naszym komputerze podajemy całą ścieżkę do pliku (ścieżka absolute):

`filepath = "dane.txt"  # ścieżka relative`

`filepath = "E:\home\dane.txt"  # ścieżka absolute`

UWAGA! Jeżeli pracujesz na systemie Windows to podając pełną ścieżkę do pliku stosuj podwójne ukośniki (\) tak jak na powyższym kodzie**. 

### Tryb `mode` otwarcia/odczytu pliku (tryb pracy z plikami)

Drugim często stosowanym argumentem metody jest tryb otwarcia pliku. Parametr mode określa, w jakim trybie otwieramy plik. Najczęściej stosowane tryby to:

- 'r' - (read) - otwiera plik do odczytu, zwraca błąd jeśli plik nie istnieje
- 'a' - (append) - otwiera plik do dopisania, tworzy plik jeśli nie istnieje (lub dodaje nową treść na końcu pliku, nie usuwa starej)
- 'w' - (write) - otwiera plik do zapisu, tworzy plik jeśli nie istnieje (lub zawartość pliku jest usuwana)

Domyślnie wszystkie pliki otwierane są w trybie tekstowym. Możemy otwierać je również w trybie binarnym dodając flagę ‘b‘. Na przykład “rb” otworzy nam plik do oczytu binarnie.

Użycie operatora ‘+’ pozwoli na otwarcie pliku zarówno do zapisu jak i odczytu (np “r+”).

In [1]:
# Otwieramy z poziomu Pythona plik: 

file = open('simple.txt', 'r') # od razu otwieramy plik `simple.txt` do zmiennej file

# `open(,)` - pierwszy atrybut/argument to nazwa pliku, drugi to atrybut czy chcemy odczytać czy zapisać (tryb otwarcia)
# `r` - read (odczyt)
# po uruchomieniu zmienna file jest w przestrzeni zmiennych jako obiekt, ma swój własny typ TextIOWrapper

### Czytanie pliku linijka po linijce

Zawartość otwartego pliku możemy wczytać od razu w całości, bądź czytać go linia po linii.

In [2]:
# Aby odczytać całą treść pliku korzystamy z metody `read`:

file.read() 

'Pierwsza linia\nDruga linia\nTrzecia linia\n'

In [3]:
# Za pomocą tej samej metody czytamy konkretną liczbę znaków podaną przez nas jako parametr metody:

file = open('simple.txt', "r")
file.read(6)

'Pierws'

UWAGA! Po odczytaniu zawartości pliku zostaje ona “wykasowana” ze zmiennej plikowej.

In [4]:
f = open('simple.txt', "r")
file.read(8)

'za linia'

In [5]:
# Po odczytaniu całego pliku następne wywołanie metody `read` zwróci pusty napis:

file = open('simple.txt', "r")
tekst = file.read()
file.read()

''

In [6]:
# Teraz zobaczmy, że początkowo plik został odczytany:

print(tekst[:14])

Pierwsza linia


In [7]:
# Możemy też po takim obiekcie iterować:

file = open('simple.txt', "r")
for line in file:
    print(line)

Pierwsza linia

Druga linia

Trzecia linia



In [8]:
# Aby odczytać pojedyczną linię z pliku używamy polecenia `readline`:

with open('simple.txt', 'r') as file:
    line = file.readline() # przypisanie do zmiennej `line` pierwszej linijki z pliku 
    print(line)
    
# Jak widać zczytana została cała pierwsza linia pliku (wraz ze znakiem końca linii).    

Pierwsza linia



In [9]:
# Ponowne użycie metody pozwoli nam na wczytanie następnej linii:

with open('simple.txt', 'r') as file:
    line = file.readline()  
    line = file.readline()
    print(line)

Druga linia



In [10]:
# Plik możemy czytać linia po linii za pomocą pętli:

file = open('simple.txt', "r")
for line in file:
    print(line)

Pierwsza linia

Druga linia

Trzecia linia



In [11]:
# By pozbyć się dodatkowych odstępów możemy użyć parametru `end` w funkcji print:

file = open('simple.txt', "r")
for line in file:
    print(line, end="")

Pierwsza linia
Druga linia
Trzecia linia


In [12]:
# Inną opcją jest wczytanie wszystkich linii pliku do listy. Służy do tego metoda `readlines`,
# Metoda `readlines()` wczyta nam jako elementy listy wszystkie linie pliku:

with open('simple.txt', 'r') as file:
    lines = file.readlines() 
    print(lines)

['Pierwsza linia\n', 'Druga linia\n', 'Trzecia linia\n']


### Czytanie pliku znak po znaku

Można czytać konkretną liczbę znaków z pliku. Korzystając z tego możemy czytać plik znak po znaku.

In [13]:
file = open('simple.txt', "r")
znak = file.read(1)
print(znak)


P


In [14]:
file = open('simple.txt', "r")
znak = file.read(6) # po 1, 2 etc., spacja to też znak (biały)
while znak:
    print(znak)
    znak = file.read(3)

Pierws
za 
lin
ia

Dru
ga 
lin
ia

Trz
eci
a l
ini
a



## 1.2. Zamknięcie pliku

Jeśli otworzyliśmy plik, to powinniśmy również go zamknąć. To dobra praktyka obsługi plików. Służy do tego metoda `close()`.

In [15]:
# Zamykamy plik:
file = open('simple.txt', "r")
file.close()    

### Dlaczego nie można zostawić otwartego pliku?

Otwarty w programie plik może spowodować problemy. Inne aplikacje próbujące go odczytać nie będą mogły tego zrobić. Jeżeli korzystamy z domyślnej dystrybucji CPython, to nawet jeśli nie zamkniemy pliku, to przy końcu programu zostanie on zamknięty automatycznie. Jednak nie każda dystrybucja zrobi to za nas. Dobrą praktyką jest zamykanie pliku samodzielnie!

In [16]:
# Po zamknięciu pliku nie możemy z niego czytać!

for line in file:
   print(line, end = '')

ValueError: I/O operation on closed file.

Przydatne linki:
- https://stackoverflow.com/questions/3167494/how-often-does-python-flush-to-a-file
- https://askubuntu.com/questions/701491/is-closing-a-file-after-having-opened-it-with-open-required-in-python

### Krótszy zapis sekwencji: otwarcie, czytanie, zamknięcie pliku

In [17]:
# Otwieramy pliku, iteracja odczytuje zawartość, zamykamy plik:
    
with open('simple.txt', 'r') as file:
    for line in file:
        print(line, end = '')

Pierwsza linia
Druga linia
Trzecia linia


### * Context Manager

- obiekt, który definiuje w jakim kontekście ma się wywołać owijany kod
- określa, co ma się wykonać przed i po wykonaniu bloku kodu owijanego
- zazwyczaj wywoływane ze pomocą `with`, ale da się też bezpośrednio wywołać poszczególne metody
- przykłady użycia: zamykanie otwartych plików, zwalnianie zasobów/locków, przywracanie jakiegoś globalnego stanu

Przydatne linki::
- https://docs.python.org/3/reference/datamodel.html#context-managers
- https://docs.python.org/3/library/stdtypes.html#typecontextmanager
- https://docs.python.org/3/reference/compound_stmts.html#with
- https://www.python.org/dev/peps/pep-0343/

## 1.3. Kodowanie

Problemy z kodowaniem plików zdarzają się przy obsłudze polskojęzycznych tekstów. Plik zapisany z nieprawidłowym kodowaniem może sprawić, że zamiast polskich znaków widać będzie niezrozumiałe symbole.

Aby naprawić ten problem często wystarczy otworzyć plik z kodowaniem w standardzie ‘UTF-8’.

In [18]:
f = open('simple1.txt', "r", encoding="utf-8")
f.read()

'kolor żółty'

In [19]:
f = open('simple1.txt', "r", encoding="ascii")
f.read()

UnicodeDecodeError: 'ascii' codec can't decode byte 0xc5 in position 6: ordinal not in range(128)

Przydatne linki:

- https://docs.python.org/3/tutorial/inputoutput.html#reading-and-writing-files
- https://docs.python.org/3/library/functions.html#open
- https://docs.python.org/3/glossary.html#term-file-object


# 2. Zapisywanie do pliku

Do zapisu do pliku służy metoda `write`. 
UWAGA! Wartość podana do zapisu musi być napisem(stringiem)!

## 2.1. Tryb `write`

In [20]:
# Do pliku zapisujemy podany tekst:

file2 = open('simple2.txt', "w")
file2.write("Dane1") # Metoda write zwraca nam liczbę zapisanych znaków

5

In [21]:
# Do pliku możemy również zapisać wiele linii jednocześnie,
# Wykorzystujemy do tego listę napisów i metodę `writelines`:
 
file3 = open('simple3.txt', "w")
lines = ['Pierwsza\n', 'Druga\n', 'Trzecia\n']
file3.writelines(lines)

In [22]:
# Możemy też zapisywać dane do pliku w postaci listy za pomocą pętli i metody `write`,
# Spróbujmy zapisać do pliku wszystkie liczby parzyste < 100:

even_number = list(range(100))[::2] # Chcemy co drugą wartość, więc wycinamy z krokiem 2    

with open('numbers.txt', 'w') as file:
    for number in even_number:
        file.write(str(number) + '\n')

In [23]:
# Drugi sposób:

techs = ['python','java', 'go', 'scala'] # Każdy element zapisujemy w osobnej linii

# Otwieramy plik (ew. tworzymy), następnie iterujemy listę i zapisujemy do pliku,
# za pomocą funkcji `print()`:
    
with open('techs.txt', 'w') as file:
    for tech in techs:
        print(tech, file = file)
    

## 2.2. Tryb `append`

In [24]:
# W trybie `w` dane w pliku zostają nadpisane, ale teraz chcemy dodać dane:
# Plik techs.txt już istnieje:

techs = ['cplusplus', 'c', 'csharp', 'r'] # każdy element zapisać w osobnej liniii

with open('techs.txt', 'a') as file:
    for tech in techs:
        print(tech, file = file)
        
# trybem append 'a' dodajemy dane do pliku    