# T5: Python - operacje na plikach.

## I. Pojęcie pliku

1. **Plik** jest logiczną jednostką przechowywania danych. Stanowi uporządkowany, zapisany na nośniku zbiór danych o skończonej długości i o sekwencyjnym dostępie.
2. W odniesieniu do **działań na plikach** możemy się spotkać ze sformułowaniem **CRUD** - akronim słów *creating, reading, updating, deletion*,  oznaczających: tworzenie, odczyt, modyfikację, usuwanie plików.
3. Obsługa plików wiąże się z przetwarzaniem danych strumieniowych i z operacjami wejścia — wyjścia. Wymaga rozwiązywania wielu kwestii, takich jak:
 - zarządzanie pamięcią i urządzeniami,
 - **obsługa błędów**,
 - buforowanie wejścia — wyjścia,
 - wydajność systemu operacyjnego.
 - w Pythonie **moduł io** zawiera szeroką gamę klas obsługujących dane strumieniowe.

## II. Otwieranie lub tworzenie pliku

1. **Otwieranie lub tworzenie pliku** - dostęp do pliku zapisanego w pamięci masowej komputera może być realizowany wyłącznie za pośrednictwem systemu operacyjnego, w tym celu trzeba podać:<br>
a) informację o nazwie lokalizacji tego pliku,<br>
b) tryb dostępu do pliku.<br>
2. Przekazanie informacji o *nazwie*, *położeniu* i *trybie dostępu do pliku* nazywamy **otwarciem pliku** - służy do tego funkcja **open()**. 
3. Aby otworzyć plik, a także wykonywać na nim inne operacje, musimy jeszcze
utworzyć **specjalny obiekt** - nazywany **zmienną plikową** lub **uchwytem** albo **obiektem pliku**. Zmienna plikowa udostępnia nam metody potrzebne do
wykonywania wszystkich działań na danym pliku.
4. Funkcja **open()** zwraca zmienną plikową, a jako argumenty przyjmuje nazwę pliku wraz ze scieżką dostępu, jeśli jest potrzebna, oraz tryb otwarcia pliku:<br>
 **f = open(filepath, "r")**
 - f jest zmienną plikową,
 - **filepath** - nazwa pliku ze ścieżką dostępu,
- jeśli plik jest w tym samym katalogu (folderze) co uruchamiany program:<br>
<b>filepath = "dane.txt"</b>
- jeśli plik jest gdzie indziej - podajemy ścieżkę względną, tzn. z miejsca, w którym znajduje się plik zawierający uruchomiony program:<br>
<b>filepath = "D:\pliki\dane.txt"</b>
- moduł ułatwiający tworzenie poprawnie działających ścieżek dostepu do plików to **os.path**
5. Otwieranie plików tekstowych z uwzględnieniem odpowiedniego kodowania np. dla obsługi poskich znaków diakrytycznych należy korzystać z UTF-8:
- <b>f=open(filepath,"r",encoding="utf-8")<br>
     f.read()</b>
- otwarcie pliku  z użyciem niewłaściwego kodowania zakończy się błędem.
6. Zalecaną metodą otwierania plików w Pythonie jest instrukcja **with... as...** - zapewnia ona zamknięcie pliku po ukończeniu pracy i obsługę ewentualnych błędów:<br>
<b>with open(filepath,"r") as f:<br>
f.read()</b>
7. W tabeli podano podstawowe informacje na temat operacji na plikach.

|Konstrukcja języka | Opis|Przykład|
|-------------------|-----|--------| 
|**open(„nazwa_pliku.txt”,„tryb”)**|otwieranie pliku w wybranym|**odczyt.open(„dane.txt”, „r”)**|
| | trybie dostępu |**zapis.open(„wyniki.txt”, „w”)**|
|**close()**| zamykanie pliku, po za- |**odczyt.close()**|
||mknięciu niemożliwe jest  |**zapis.close()**|
||wykonywanie na pliku ||
||operacji odczytywania ||
|| i zapisywania||
|**read(rozmiar)**| odczytywanie z pliku |**odczyt.read(2)**|
||podanej przez parametr|**odczyt.read(5)**|
||rozmiar liczby znaków ||
||w postaci napisu;||
||jeśli rozmiar nie jest|**odczyt.read()**|
||określony, odczytywane||
||są wszystkie znaki||
||z pliku od bieżącej po-||
||zycji do końca pliku||
|**readline(rozmiar)**|odczytywanie z bieżącego|**odczyt.readline(3)**|
||wiersza pliku podanej |**odczyt.readline(2)**|
||przez parametr rozmiar ||
||liczby znaków w postaci||
|| napisu;||
||jeśli rozmiar nie jest|**odczyt.readline( )**|
||określony, odczytywane||
||są wszystkie znaki||
||z bieżącego wiersza||
||od bieżącej pozycji do||
||końca wiersza||
|**readlines()**|odczytywanie wszystkich |**odczyt.readlines()**|
|| wierszy pliku jako listy||
|**write(dane)**|zapisywanie napisu|**zapis.write(napis)**|
||"dane" do pliku||
|**writelines(dane)**| zapisywanie listy dane |**zapis.writelines(lista)**|
||do pliku w formacie napisów||

8. Tryby dostępu do pliku tekstowego.

|Tryb|Opis|
|----|----|
|**"r"**|jeśli plik istnieje, odczytywane są dane z pliku tekstowego,w przeciwnym|
||wypadku pojawia się komunikat o błędzie|
|**"w"**|zapisywanie danych do pliku tekstowego; jeśli plik istnieje, zawarte w nim |
||dane zostają zastąpione nowymi, w przeciwnym wypadku zostaje utworzony nowy plik|
|**"a"**|dopisywanie danych na końcu pliku tekstowego; jeśli plik istnieje,nowe|
||dane są dopisywane, w przeciwnym wypadku zostaje utworzony nowy plik|
|**"r+"**|odczytywanie danych z pliku tekstowego i zapisywanie ich do niego;| 
||jeśli plik nie istnieje, pojawia się komunikat o błędzie|
|**"w+"**|zapisywanie danych do pliku tekstowego i odczytywanie ich z niego;| 
||jeśli plik istnieje, dane w nim zawarte zostają zastąpione nowymi,w przeciwnym |
||wypadku zostaje utworzony nowy plik|
|**"a+"**|dopisywanie danych do pliku tekstowego i odczytywanie ich z niego;jeśli| 
||plik istnieje, nowe dane są dopisywane na jego końcu, w przeciwnym wypadku| 
||zostaje utworzony nowy plik|

## III. Odczyt z pliku

In [None]:
%%writefile dane.txt
To jest linia pierwsza pliku
To jest linia druga pliku
To jest linia trzecia pliku
To jest linia czwarta pliku

In [None]:
# Aby odczytać go w całości, użyjemy metody read():
f = open("dane.txt", "r")
print(f.read()) 

In [None]:
# Jeśli chcemy odczytać tylko określoną liczbę znaków, przekazujemy do metody read()
# odpowiedni argument, na przykład:
f = open("dane.txt", "r")
print(f.read(10)) 

In [None]:
'''
Działanie zmiennej plikowej trochę przypomina wskaźnik przesuwający się wzdłuż pliku
w miarę jego odczytywania. Ma to swoje praktyczne znaczenie: jeśli po otwarciu pliku odczytaliśmy 
jego część za pomocą metody read() i ponownie ją wywołamy, odczyta ona dalszą część pliku 
z pominięciem znaków odczytanych podczas pierwszego wywołania. A zatem:
'''
f = open("dane.txt", "r")
print(f.read(18))
print(f.read(8))

In [None]:
# Plik można również odczytywać wiersz po wierszu, aby odczytać pierwszą linię pliku 
# używamy polecenia readline():
f= open("dane.txt", "r")
print(f.readline())

In [None]:
# Ponowne użycie metody readline() pozwoliłoby wczytać kolejny wiersz w pliku,
# my wykorzystamy tutaj pętlę for:
f=open("dane.txt","r")
for line in f:
    print(line)

In [None]:
# Aby pozbyć się zbędnych pustych wierszy, zastosujemy parametr end w funkcji print()
with open("dane.txt","r") as f:
  for line in f:
    print(line,end="")

In [None]:
# Niekiedy przydaje się możliwość odczytywania pliku znak po znaku:
f = open("dane.txt", "r")
znak = f.read(1)
while znak:
  print(znak)
  znak = f.read(1)

In [None]:
# Aby wczytać wszystkie wiersze pliku do listy, możemy zastosować metodę readlines():
f = open("dane.txt", "r") 
lines = f.readlines()
print(lines)

## IV. Zapis do pliku

In [22]:
'''
Kolejną operacją, jaką można wykonać na otwartym pliku, jest zapisanie do tego pliku
Przypomnijmy, że w zależności od wybranego trybu otwarcia pliku albo nadpiszemyj
istniejącą zawartość (w), albo dopiszemy nową treść do jego końca (a). Do zapisywania
w pliku służy metoda write():
'''
f = open("dane.txt", "w")
f.write("Ważne informacje")
f.write("Ważniejsze informacje")

In [None]:
# Należy pamiętać, że funkcja jako argument przyjmuje wyłącznie ciągi znaków (dane typu.
# string). Jeżeli dane dodawane do pliku miałyby się znaleźć w kolejnych wierszach, należy
# samodzielnie pododawać znaki końca linii: 

f = open("dane.txt", "w")
f.write( "Ważne informacje\n")
f.write( "Ważniejsze informacje\n")

In [None]:
'''
Wpisywanie dłuższych treści w ten sposób mogłoby się okazać uciążliwe. Można więc po-
służyć się metodą writelines( ), której jako argument podamy listę ciągów znaków. Znaki
końca linii, jeśli są potrzebne, trzeba dodać samodzielnie:
'''
f= open("dane.txt", "w")
lines = ['seria danych 1\n', 'seria danych 2\n','seria danych 3\n']
f.writelines(lines)

# Spróbujmy teraz odczytać nasz plik dane.txt:
f = open( "dane.txt", "r")
print(f.read())

In [None]:
# Znaki końca linii można dodać również w następujący sposób:
lines = ['seria danych 1', 'seria danych 2', 'seria danych 3']
lines = [line + "\n" for line in lines]
lines

In [None]:
'''
W powyższych przykładach otwarliśmy plik w trybie w. Jak pamiętamy, w tym trybie ist-
niejąca zawartość pliku jest nadpisywana i zostaje utracona. Żeby nowa treść została dopisana
do końca pliku, należy użyć trybu a:
'''
f=open("dane.txt", "w")
lines = ['seria danych 1\n', 'seria danych 2\n']
f.writelines(lines)
f=open("dane.txt", "r")
print(f.read())
f=open("dane.txt", "a")
f.write("seria danych 3\n")
# Sprawdźmy, jak teraz wygląda plik dane.txt:
f= open("dane.txt", "r")
print(f.read())

## V. Zamykanie pliku

In [None]:
# Zamykanie otwartego pliku przy pomocy metody close(). 
f = open("dane.txt","w")
f.write("Zapisujemy do pliku\n")
f.close()
f.write("Zapisujemy do pliku\n")

In [44]:
# Obecnie zaleca się, aby przy otwieraniu plików korzystać z instrukcji with... as... 
with open("dane.txt", "w") as f:
  f.write("Zapisujemy do pliku\n")

# Następnie spróbujemy jeszcze raz wywołać metodę write():
  f.write("test")

In [49]:
# Instrukcja with.. as.. umożliwia nam otwieranie pliku zarówno do zapisu, jak i do odczytu 
with open('dane.txt', 'r') as reader, open('write_to.txt','w') as writer:
  text = reader.read()
  writer.write(text)

## VI. Sprawdzanie pliku

In [None]:
'''
Dowiedzieliśmy się już, że próba zapisywania do zamkniętego pliku się nie powiedzie. Po-
dobnie nie uda się odczytywać zamkniętego pliku ani zapisywać do pliku nieprzeznacz-
nego do zapisania. Dobrym sposobem na ustrzeżenie się przed takimi problemami jest
sprawdzanie w odpowiedniej chwili stanu interesującego nas pliku.
Aby się dowiedzieć, czy plik został zamknięty, sprawdzamy atrybut closed metody close():
'''
f = open("dane.txt", "r")
print(f.closed)

In [None]:
# Wywołujemy metodę closed() i jeszcze raz sprawdzamy atrybut closed:
f.close()
print(f.closed)

In [None]:
# Aby sprawdzić, czy nasz plik jest otwarty do odczytu,
# wykorzystujemy readable() i writable():
f = open("dane.txt", "r")
print(f.readable(), f.writable())

In [None]:
# Sprawdźmy jeszcze dwie inne opcje:
f= open("dane.txt", "w")
print(f.readable(), f.writable())

f= open("dane.txt", "r+")
print(f.readable(), f.writable())

## VII. Obsługa wyjątków

1. Istnieje wiele potencjalnych przyczyn problemów, które mogą wystąpić podczas wykonywania kodu Pythona - oczywiście niekoniecznie musi to dotyczyć konkretnie operacji na plikach.Może się zdarzyć, że jakiś zasób, do którego odwołujemy się w kodzie, jest niedostępny czy też wystąpiły kłopoty z pamięcią komputera. Niektórych problemów nie da się dokładnie przewidzieć na etapie pisania programu. Dlatego dobrą praktyką, podczas tworzenia bardziej złożonych programów, jest zapewnienie **obsługi wyjątków**.
2. **Wyjątkiem** nazywamy obiekt, który reprezentuje **błąd**. Jest inicjalizowany w sytuacji nieprzewidzianej przez programistę i przerywa normalny przebieg programu. Jeżeli wyjątek nie zostanie przechwycony i obsłużony przez programistę, Python automatycznie kończy pracę programu.
3. W języku Python istnieje obszerna lista wyjątków, które można przechwycić i obsłużyć.Można też, w razie potrzeby,napisać własny wyjątek — klasę, która będzie dziedziczyła po klasie **Exception**.


In [None]:
# Aby obsłużyć wyjątek, należy skorzystać z klauzuli try... except... . 
try:
  f = open("dane.txt", "w")
  f.write("Bardzo istotne dane")
except IOError:
  print("Wystąpił błąd w zapisie do pliku")
else:
  print("Udało się zapisać dane")
  f.close()

In [None]:
# Jeżeli po zakończeniu danego bloku kodu konieczne jest wykonanie jakiegoś działania bez
# względu na to, czy wyjątek wystąpił, czy nie, możemy użyć instrukcji finally. Na przykład:
try: 
  f = open("dane.txt", "w")
  f.write("Bardzo istotne dane")
except IOError:
  print("Wystąpił błąd w zapisie do pliku")
else:
  print("Udało się zapisać dane")
finally:
  f.close()

In [None]:
%%writefile dane.txt
absolutny
adapter
adnotacja
adres
adwokat
afera
afisz
agencja
agrafka
akcent
aksamit
bagno
bajka
bal
balon
balkon
banan
bar
baranek
bariera
basen
bat
bateria
baza
bazylia
beczka
bestia
bez
cel
celny
cena
centralny
ceramika
cesarz
chirurg
chmiel
chusteczka
ciekawy
codzienny
cyrk
czajnik
daleki
daleko
daremny
definitywny
delikatesy
deszczowy
dobroduszny
dobry
ekspres
elektrownia
emigracja
fabryka
farmaceutyczny
flota
folia
formalny
gabinet
galeria
garnitur
gatunek
gest
gondola
grafika
hipnoza
hamulec
identyczny
informatyka
jadalnia
jarmark

In [None]:
ls -l

In [3]:
dane = open("dane.txt", "r")
wyniki = open("wyniki.txt", "w")
for k in dane:
    if len(k.rstrip()) % 2 == 0:
        wyniki.write(k)
dane.close()
wyniki.close()

In [None]:
ls -l

In [None]:
%%writefile dane2.txt
303
149
146
373
129
295
13
95
192
244
480
406
487
303
28
121
52
241
87
26
300
26
32
146
117
15
173
343
379
255
420
74
235
126
350
283
59
41
151
17
368
335
209
22
6
245
129
489
380
355
384
411
262
437
379
483
473
443
292
363
338
282
143
144
15
473
181
453
404
196
212
273
8
24
301
10
41
325
32
5
46
406
469
177
206
37
42
434
52
409
261
483
56
190
252
36
15
404
71
81

In [6]:
dane = open("dane2.txt", "r")
wyniki = open("wyniki2.txt", "w")
for k in dane:
    w = int(k) ** 2
    if w % 3 == 0:
        wyniki.write( str(w) +'\n')
dane.close()
wyniki.close()

## ĆWICZENIA
1. Napisz program wykonujący następujące operacje:<br>
a) wpisanie do pliku tekstowego **dane11.txt** w kolejnych wierszach nazw miesięcy;<br>
b) wypisanie tylko tych miesięcy zapisanych w pliku, których nazwa zaczyna się na literę „m”;<br>
c) przepisanie do nowego pliku **wyniki11.txt** wszystkich miesięcy, których nazwa liczy więcej niż 8 znaków;<br>
d) wypisanie miesięcy przepisanych do nowego pliku **wyniki12.txt**.<br>

In [None]:
%%writefile dane11.txt
styczeń
luty
marzec
kwiecień
maj
czerwiec
lipiec
sierpień
wrzesień
październik
listopad
grudzień

2. W pliku **dane22.txt** w oddzielnych wierszach znajdują się pary liczb całkowitych z przedziału [5, 500], oddzielone odstępem. Program powinien odczytać dane z pliku wejściowego **dane22.txt**, a następnie przepisać do pliku **wyniki22.txt** tylko te iloczyny par liczb zapisanych w kolejnych
wierszach, które mieszczą się w przedziale [250, 3000].

In [None]:
%%writefile dane22.txt
326 303
119 149
473 146
296 373
446 129
353 295
116 13
432 95
206 192
361 244
36 480
69 406
359 487
461 303
458 28
39 121
19 52
416 241
209 87
31 26
25 300
48 26
482 32
57 146
56 117
322 15
349 173
79 343
263 379
26 255
103 420
444 74
132 235
467 126
455 350
421 283
183 59
149 41
408 151
484 17
96 368
121 335
90 209
372 22
191 6
223 245
177 129
326 489
473 380
153 355
180 384
239 411
266 262
461 437
144 379
216 483
270 473
7 443
82 292
77 363
214 338
21 282
384 143
14 144
185 15
393 473
145 181
417 453
241 404
123 196
272 212
26 273
21 8
52 24
42 301
305 10
230 41
6 325
7 32
43 5
17 46
172 406
324 469
82 177
11 206
35 37
66 42
205 434
460 52
71 409
8 261
21 483
358 56
35 190
221 252
454 36
7 15
410 404
71 71
47 81