# Python (podstawy) - pliki i moduły
_Mikołaj Leszczuk_
![](https://inventyourshit.com/wp-content/uploads/2020/11/4lmoe3.jpg)
![](https://i.creativecommons.org/l/by/4.0/88x31.png)

## Konspekt

* Operacje na plikach
  * Otwieranie i czytanie
  * Zapis do pliku
  * Zamykanie pliku
  * Instrukcja `with`
* Moduły
  * Import modułu
  * Wyszukiwanie modułów
  * Używanie modułu jako skryptu

## Operacje na plikach

### Otwieranie i czytanie

```python
f = open('write_file_name', 'w')
f = open('append_file_name', 'a')
f = open('read_file_name', 'r')

f.read()

f.readline()

f.readlines()
```

### Zapis do pliku

```python
f.write('Witaj\n’) 
value = 42 
f.write(value) 

>>>Traceback (most recent call last): 
>>> File "<stdin>", line 1, in <module> 
>>>TypeError: must be str, not int 

s = str(value) 
f.write(s)
```

### Zamykanie pliku

```python
f.close()
```

### Poruszamy się po plikach – seek

* Metoda pliku Pythona
```python
f.seek(offset[, whence])
```
ustawia aktualną pozycję pliku na przesunięcie
* Argument `whence` jest opcjonalny:
  * `0` – oznacza bezwzględne pozycjonowanie pliku (taką przyjmuje wartość domyślną)
  * `1` – oznacza szukanie względem bieżącej pozycji
  * `2` – oznacza szukanie względem końca pliku
```python
f.seek(0) # na początek
f.seek(0, 2) # na koniec
```

### Przykład

`text.txt`:
```
Co to jest język Python?
Python jest szeroko stosowanym dynamicznym językiem programowania wysokiego poziomu, ogólnego przeznaczenia. Jego filozofia projektowania kładzie nacisk na czytelność kodu, a jego składnia pozwala programistom na wyrażanie koncepcji w mniejszej liczbie wierszy kodu niż jest to możliwe w językach takich jak C++ lub Java.
Python obsługuje wiele paradygmatów programowania, w tym programowanie obiektowe, imperatywne i funkcjonalne oraz style proceduralne. Posiada dynamiczny system typów i automatyczne zarządzanie pamięcią oraz dużą i wszechstronną bibliotekę standardową.
Najlepszym sposobem nauki języka Python są ćwiczenia i pytania z ćwiczeniami.
```

In [None]:
# Otwórz plik
f = open("text.txt", "r")
print("Nazwa pliku:", f.name)

line = f.readline()
print("Czytaj linię: >" + line + "<")

# Ponownie ustaw wskaźnik na początek
f.seek(0, 0)  # f.seek(0)
line = f.readline()
print("Czytaj linię: >" + line + "<")

# Zamknij otwarty plik
f.close()

### Poruszamy się po plikach – tell

* Metoda pliku Pythona
```python
f.tell()
```
zwraca bieżącą pozycję wskaźnika odczytu / zapisu pliku w pliku
* Argumentów – brak

### Przykład

In [None]:
# Otwórz plik
f = open("text.txt", "r")
print("Nazwa pliku: ", f.name)

# Uzyskaj aktualną pozycję pliku.
pos = f.tell()
print("Aktualna pozycja: " + str(pos))

line = f.readline()
print("Czytaj linię: >" + line + "<")
 
# Uzyskaj aktualną pozycję pliku.
pos = f.tell()
print("Aktualna pozycja: " + str(pos))

# Zamknij otwarty plik
f.close()

### Instrukcja `with`

Instrukcja `with` w Pythonie jest używana w obsłudze wyjątków, aby kod był czystszy i bardziej czytelny. Upraszcza zarządzanie wspólnymi zasobami, takimi jak strumienie plików. Zwróć uwagę na następujący przykład kodu, w jaki sposób użycie instrukcji `with` sprawia, że kod jest czystszy.

**Obsługa plików:**

In [None]:
# 1) bez użycia instrukcji with
file = open('file_path', 'w')
file.write('hello world !')
file.close()

In [None]:
# 2) bez użycia instrukcji with
file = open('file_path', 'w')
try:
    file.write('hello world')
finally:
    file.close()

In [None]:
# 3) używanie instrukcji with
with open('file_path', 'w') as file:
    file.write('hello world !')

Zauważ, że w przeciwieństwie do pierwszych dwóch implementacji, nie ma potrzeby wywoływania `file.close()` podczas używania instrukcji `with`. Sama instrukcja `with` zapewnia właściwe pozyskiwanie i uwalnianie zasobów. Wyjątek podczas wywołania `file` w pierwszej implementacji może uniemożliwić poprawne zamknięcie pliku, co może wprowadzić kilka błędów w kodzie, np. wiele zmian w plikach nie będzie obowiązywać, dopóki plik nie zostanie poprawnie zamknięty.

Drugie podejście w powyższym przykładzie zajmuje się wszystkimi wyjątkami, ale użycie instrukcji `with` sprawia, że kod jest zwarty i znacznie bardziej czytelny. W ten sposób instrukcja `with` pomaga uniknąć błędów i wycieków, zapewniając, że zasób zostanie prawidłowo wydany, gdy kod korzystający z zasobu zostanie całkowicie wykonany. Instrukcja `with` jest powszechnie używana ze strumieniami plików, jak pokazano powyżej oraz z blokadami, gniazdami, podprocesami i telnetami itp.

## Moduły

### Import modułów

* Moduł importujemy poleceniem
```python
import <nazwa-modułu>
```
* lub
```python
import <nazwa-modułu> as <alias>
```
* Dla Pythona dostępnych jest wiele różnych modułów.

### `os` - Różne interfejsy systemu operacyjnego

Ten moduł zapewnia przenośny sposób korzystania z funkcji zależnych od systemu operacyjnego. Przy czym, jeśli chcesz tylko odczytać lub zapisać plik, wystarczy funkcja `open()`, jeśli chcesz manipulować ścieżkami, potrzebny jest moduł `os.path` (omówiony później). Do obsługi plików i katalogów wysokiego poziomu należy użyć modułu `shutil` (omówiony później).

Uwagi dotyczące dostępności tych funkcji:
* Konstrukcja wszystkich wbudowanych modułów Pythona zależnych od systemu operacyjnego jest taka, że dopóki dostępna jest ta sama funkcjonalność, używa tego samego interfejsu.
* Rozszerzenia specyficzne dla konkretnego systemu operacyjnego są również dostępne za pośrednictwem modułu `os`, ale korzystanie z nich jest oczywiście zagrożeniem dla przenośności.
* Wszystkie funkcje akceptujące ścieżki lub nazwy plików akceptują zarówno bajty, jak i ciągi.

> **Uwaga:** Wszystkie funkcje w tym module wywołują wyjątek `OSError` (lub jego podklasy) w przypadku nieprawidłowych lub niedostępnych nazw plików i ścieżek lub innych argumentów, które mają poprawny typ, ale nie są akceptowane przez system operacyjny.

#### `os.system(command)`

Wykonuje polecenie (ciąg znaków) w podpowłoce. Jest to zaimplementowane przez wywołanie standardowej funkcji C `system()` i ma te same ograniczenia. Jeśli polecenie wygeneruje jakiekolwiek dane wyjściowe, zostanie ono wysłane do standardowego strumienia wyjściowego interpretera. Standard C nie określa znaczenia wartości zwracanej przez funkcję C, więc wartość zwracana przez funkcję Pythona jest zależna od systemu.

#### Import modułów – przykład

* W poniższym przykładzie ładujemy moduł os
* To jest skrót od **Systemu Operacyjnego** (ang. **_Operating System_**), więc możesz wykonywać zadania systemowe
```python
import os
os.system("dir")    # Windows
os.system("ls")     # UNIX
```
* Korzystając z tego modułu, wywołujemy jedną z jego funkcji o nazwie `system` (uruchamia polecenie)

* W tym przypadku po prostu wyświetli listę plików w katalogu:
  * Polecenie `dir` 	– Windows
  * Polecenie `ls`	– UNIX

In [None]:
import os
# os.system("dir")    # Windows
os.system("ls")     # UNIX

#### `os.mkdir(path)`

Utworzy katalog o nazwie `path`.

In [None]:
import os
os.mkdir('00_abc')

In [None]:
import os
# os.system("dir")    # Windows
os.system("ls")     # UNIX

#### `os.stat(path)`

Uzyskuje status pliku lub deskryptor pliku. Wykonuje odpowiednik wywołania systemowego `stat()` na podanej ścieżce. ścieżka może być określona jako ciąg lub bajty.

In [None]:
import os
statinfo = os.stat('text.txt')
print(statinfo)

### Uzyskiwanie określonych funkcji z modułu

* Możemy też zaimportować (uzyskać) niektóre (określone) obiekty (funkcje) z modułu
```python
from module import <obiekt1>, <obiekt2>, <obiekt3>
```

### Uzyskiwanie określonych funkcji z modułu – przykład

* Istnieje moduł o nazwie `time`, który ma wszelkiego rodzaju funkcje związane z czasem: pobierz datę, godzinę, minutę, sekundę i tak dalej
* To całkiem sporo funkcji
* Powiedzmy, że chcesz, aby program odczekał 2 sekundy
* Jeśli chcesz, możesz zaimportować określoną funkcję zamiast całego modułu

In [None]:
# import time
# print("Dobranoc")
# time.sleep(2)
# print("Dzień dobry")

from time import sleep
print("Dobranoc")
sleep(2)
print("Dzień dobry")

### Importowanie wszystkich funkcji z modułu (z przykładem)

* ***Możliwe jest importowanie wielu (wszystkich) funkcji z modułów***
  * _Nie należy stosować polecenia – nie jest to zalecane_
  ```python
  from module import *
  ```
  * _ponieważ może ono spowodować kolizję nazw pomiędzy funkcjami z różnych modułów_
* Poniższy przykład importuje cały moduł czasu (wszystkie funkcje), którego możesz następnie użyć

In [None]:
from time import *
print('Dobranoc')
sleep(2)
print('Dzień dobry')

### Dostępność obiektów z załadowanych modułów

* Obiekty z załadowanych modułów dostępne są przez strukturę:
  * `nazwa-modułu.obiekt`, lub
  * `obiekt`, gdy importowaliśmy pojedyncze obiekty

* Lista funkcji w module:
  * Aby wyświetlić i zobaczyć wszystkie funkcje i klasy w module, wpisz:

In [None]:
import os
print(dir(os))

### Tworzenie modułu (z przykładem)

* Aby utworzyć moduł, utwórz plik w języku Python
* Następnie zaimportuj go jak każdy inny moduł
* Stwórz swój moduł (`fruit.py`)

In [None]:
def lemon(l):
    print('Lemoniada nr', l)

* Następnie stwórz swój program (`example.py`) i wywołaj funkcję:

In [None]:
import fruit
fruit.lemon(5)

# from fruit import lemon
# lemon(5)

### Wyszukiwanie modułów po ścieżkach systemu plików

* Interpreter Pythona wyszukuje moduły w kolejności:
  * Katalog, w którym jest uruchamiany skrypt (może być to katalog bieżący)
  * Następnie w katalogach zawartych w zmiennej systemowej '`PYTHONPATH`’
  * W katalogach systemowych `PATH`
* Nie znaleziono modułu Pythona?
  * Jeśli pojawi się błąd „`ImportError: No module named`”, oznacza to, że moduł nie jest zainstalowany
  * Możesz zainstalować moduł zewnętrzny za pomocą menedżera pakietów

### Używanie modułu jako skryptu

```sh
python my.py <argumenty>
```
* Moduł `my` jest wykonywany tak jak przy wykonaniu `import my` przy czym nazwa modułu `__name__` jest ustawiana na `__main__`
```python
if __name__ == "__main__":
    import sys
    my_func(int(sys.argv[1]))
```

### Używanie modułu jako skryptu – przykład

```python
def lemon(l):
    print('Lemoniada nr', l)

    
if __name__ == "__main__":
    import sys
    lemon(int(sys.argv[1]))
```

### `glob` - Rozszerzanie wzorca ścieżki w stylu uniksowym

Moduł `glob` odnajduje wszystkie ścieżki pasujące do określonego wzorca zgodnie z regułami używanymi przez powłokę uniksową, chociaż wyniki są zwracane w dowolnej kolejności. Nie jest wykonywane żadne rozwinięcie tyldy, ale `*`, `?` i zakresy znaków wyrażone za pomocą `[]` zostaną poprawnie dopasowane.

Zwróćcie uwagę, że pliki zaczynające się od kropki (`.`) można dopasować tylko do wzorców, które również zaczynają się od kropki.

Aby uzyskać dosłowne dopasowanie, umieśćcie metaznaki w nawiasach. Na przykład `'[?]'` pasuje do znaku `'?'`.

#### `glob.glob(pathname)`

Zwraca prawdopodobnie pustą listę nazw ścieżek, które pasują do ścieżki _pathname_, która musi być ciągiem zawierającym specyfikację ścieżki. Ścieżka _pathname_ może być bezwzględna (jak `/usr/src/Python-1.5/Makefile`) lub względna (jak `../../Tools/*/*.gif`) i może zawierać symbole wieloznaczne w stylu powłoki. Zerwane dowiązania symboliczne są uwzględniane w wynikach (tak jak w powłoce). To, czy wyniki zostaną posortowane, zależy od systemu plików. Jeśli plik spełniający warunki zostanie usunięty lub dodany podczas wywoływania tej funkcji, nie jest określona nazwa ścieżki do tego pliku.

In [None]:
import glob
print(glob.glob('*'))

### `os.path` - Typowe manipulacje ścieżkami

Ten moduł implementuje kilka przydatnych funkcji dotyczących nazw ścieżek. Uzupełnia funkcjonalność czytania lub zapisywania plików (zobacz `open()`), a także funkcjonalność uzyskiwania dostępu do systemu plików (zobacz moduł `os`). Parametry ścieżki mogą być przekazywane jako ciągi lub bajty.

W przeciwieństwie do powłoki uniksowej, Python nie wykonuje żadnych _automatycznych_ rozszerzeń ścieżek.

> **Uwaga:** Ponieważ różne systemy operacyjne mają różne konwencje nazw ścieżek, w standardowej bibliotece znajduje się kilka wersji tego modułu. Moduł `os.path` jest zawsze modułem ścieżki odpowiednim dla systemu operacyjnego, na którym działa Python, i dlatego może być używany w ścieżkach lokalnych. Możecie jednak również importować i używać poszczególnych modułów, jeśli chcesz manipulować ścieżką, która zawsze jest w jednym z różnych formatów. Wszystkie mają ten sam interfejs:
> * `posixpath` dla ścieżek w stylu UNIX
> * `ntpath` dla ścieżek Windows

#### `os.path.exists(path)`

Zwróci `True`, jeśli ścieżka `path` odnosi się do istniejącej ścieżki lub deskryptora otwartego pliku. Zwraca `False` dla uszkodzonych dowiązań symbolicznych. Na niektórych platformach ta funkcja może zwrócić wartość `False`, jeśli nie udzielono pozwolenia na wykonanie żądanego pliku, nawet jeśli ścieżka `path` fizycznie istnieje.

In [None]:
import os.path
print(os.path.exists('text.txt'))

### `shutil` - Operacje na plikach wysokiego poziomu

Moduł `shutil` oferuje szereg operacji wysokiego poziomu na plikach i kolekcjach plików. W szczególności udostępniane są funkcje wspomagające kopiowanie i usuwanie plików. Stanowi to rozszerzenie modułu `os` służącego do operacji na pojedynczych plikach.

> **Ostrzeżenie:** Nawet funkcje kopiowania plików wyższego poziomu nie mogą skopiować wszystkich metadanych pliku.
> Na platformach POSIX oznacza to utratę właściciela i grupy pliku oraz list ACL. W systemie macOS rozwidlenia zasobów i inne metadane nie są używane. Oznacza to, że zasoby zostaną utracone, a typ pliku i kody twórcy nie będą poprawne. W systemie Windows właściciele plików, listy ACL i alternatywne strumienie danych nie są kopiowane.

#### `shutil.rmtree(path)`

Usunie całe drzewo katalogów; `path` musi wskazywać na katalog (ale nie na dowiązanie symboliczne do katalogu).

In [None]:
import shutil
shutil.rmtree('00_abc')

#### `shutil.copyfile(src, dst)`

Skopiuje zawartość (bez metadanych) pliku o nazwie `src` do pliku o nazwie `dst` i zwróci `dst` w najbardziej efektywny sposób. `src` i `dst` są obiektami podobnymi do ścieżki lub nazwami ścieżek podanymi jako łańcuchy.

`dst` musi być pełną nazwą pliku docelowego. Jeśli `src` i `dst` określają ten sam plik, zgłaszany jest wyjątek `SameFileError`.

Lokalizacja docelowa musi być zapisywalna; w przeciwnym razie zostanie zgłoszony wyjątek `OSError`. Jeśli `dst` już istnieje, zostanie zastąpiony. Za pomocą tej funkcji nie można kopiować plików specjalnych, takich jak urządzenia znakowe lub blokowe oraz potoki.

In [None]:
import shutil
shutil.copyfile('text.txt', 'text2.txt')