# Lab 9. Moduł `sys` oraz `os`

## 1. Moduł `sys`

Moduł `sys` dostarcza zmiennych oraz funkcji dla systemu operacyjnego, na którym interpreter Pythona został uruchomiony. Większość funkcji oraz zmiennych działa w trybie readonly.

**Dokumentacja:**
* https://docs.python.org/3/library/sys.html


Poniżej zostaną przedstawione przykłady wykorzystania wybranych elementów tego modułu.

**`sys.argv` oraz `sys.orig_argv`**

Zmienna `sys.argv` przechowuje wartości zmiennych przekazanych do skryptu uruchomionego w interpreterze. Wartość `argv[0]` zawiera nazwę skryptu, który został uruchomiony. `sys.orig_argv` dodatkowo posiada argumenty, które zostały przesłane do powłoki.

In [72]:
!python test.py 1 2 3

Running main...
argv[0] ma wartość test.py
argv[1] ma wartość 1
argv[2] ma wartość 2
argv[3] ma wartość 3
orig_argv[0] ma wartość python
orig_argv[1] ma wartość test.py
orig_argv[2] ma wartość 1
orig_argv[3] ma wartość 2
orig_argv[4] ma wartość 3


W systemie UNIX argumenty mogą być przekazywane jako bajty, więc kod pobierający ich wartości może wyglądać nieco inaczej. Odsyłam do przykładu w dokumentacji https://docs.python.org/3/library/sys.html#sys.argv

Obsługa argumentów przekazywanych w wierszu poleceń do skryptu Pythona to dość obszerny temat i zachęcam do zapoznania się z modułem `argparse` dla osób nim zainteresowanych. Jest to stosunkowo często praktykowana technika dla zadań Machine Learning uruchamianych dla różnych parametrów modelu/biblioteki (np. PyTorch).

**`sys.prefix, sys.base_prefix, sys.exec_prefix, sys.base_exec_prefix, sys.executable`**

Są to zmienne, które ustawiane są w momencie uruchamiania Pythona i ich wartość zależy od tego czy pracujemy ze środowiskiem wirtualnym czy nie. Wskazują na ścieżki do głównego folderu bieżącego interpretera Pythona.

In [25]:
import sys

display(sys.prefix)
display(sys.base_prefix)
display(sys.exec_prefix)
display(sys.base_exec_prefix)
# ścieżka do pliku interpretera
display(sys.executable)

'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313'

'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313'

'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313'

'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313'

'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\python.exe'

**`sys.builtin_module_names`**

In [20]:
# zwraca nazwy modułów wkompilowanych w bieżącą wersję interpretera
sys.builtin_module_names

('_abc',
 '_ast',
 '_bisect',
 '_blake2',
 '_codecs',
 '_codecs_cn',
 '_codecs_hk',
 '_codecs_iso2022',
 '_codecs_jp',
 '_codecs_kr',
 '_codecs_tw',
 '_collections',
 '_contextvars',
 '_csv',
 '_datetime',
 '_functools',
 '_heapq',
 '_imp',
 '_interpchannels',
 '_interpqueues',
 '_interpreters',
 '_io',
 '_json',
 '_locale',
 '_lsprof',
 '_md5',
 '_multibytecodec',
 '_opcode',
 '_operator',
 '_pickle',
 '_random',
 '_sha1',
 '_sha2',
 '_sha3',
 '_signal',
 '_sre',
 '_stat',
 '_statistics',
 '_string',
 '_struct',
 '_symtable',
 '_sysconfig',
 '_thread',
 '_tokenize',
 '_tracemalloc',
 '_typing',
 '_weakref',
 '_winapi',
 'array',
 'atexit',
 'binascii',
 'builtins',
 'cmath',
 'errno',
 'faulthandler',
 'gc',
 'itertools',
 'marshal',
 'math',
 'mmap',
 'msvcrt',
 'nt',
 'sys',
 'time',
 'winreg',
 'xxsubtype',
 'zlib')

**`sys.copyright`**

In [22]:
print(sys.copyright)

Copyright (c) 2001-2024 Python Software Foundation.
All Rights Reserved.

Copyright (c) 2000 BeOpen.com.
All Rights Reserved.

Copyright (c) 1995-2001 Corporation for National Research Initiatives.
All Rights Reserved.

Copyright (c) 1991-1995 Stichting Mathematisch Centrum, Amsterdam.
All Rights Reserved.


**`sys.exit(str: message)`**

Zgłasza wyjątek `SystemExit`, który jest zgłaszany przed zkończeniem pracy interpretera.

In [29]:
sys.exit('System shutdown...')

SystemExit: System shutdown...

**`sys.flags`**

`sys.flags` zwraca flagi, które zostały ustawione dla bieżącej sesji interpretera. Możemy sprawdzić czy jest to sesja z debuggerem, czy jest to sesja interaktywna i wiele innych wylistowanych w tabeli pod adresem https://docs.python.org/3/library/sys.html#sys.flags

In [35]:
sys.flags



**`sys.float_info`**

Zwraca niskopoziomowe informacje o parametrach określających cechy wartości zmiennoprzecinkowych w bieżącej sesji interpretera Pythona.

Szczegóły na temat każdej z wartości w poniższym przykładzie znajdziemy w tabeli pod adresem:
https://docs.python.org/3/library/sys.html#sys.float_info

In [36]:
sys.float_info

sys.float_info(max=1.7976931348623157e+308, max_exp=1024, max_10_exp=308, min=2.2250738585072014e-308, min_exp=-1021, min_10_exp=-307, dig=15, mant_dig=53, epsilon=2.220446049250313e-16, radix=2, rounds=1)

**`sys.getdefaultencoding()`**

Zwraca domyślne kodowanie znaków. Wykorzystywane między innymi przez `str.encode()`

In [37]:
sys.getdefaultencoding()

'utf-8'

**`sys.getrefcount(object)`**

Zwraca liczbę odwołań do obiektu, ale te wartości mogą w niektórych przypadkach (patrz dokumentacja) nie odzwierciedlać faktycznej liczby referencji. Liczba ta jest również zwiększana o 1 dla samego wywołania `getrefcounts()` dla lokalnego odwołania dla argumentu `object`.

In [41]:
dummy = 'Dummy data...'
sys.getrefcount(dummy)

3

In [46]:
# jak widać, nie jest to zbyt miarodajne, ale tutaj również Jupyter Notebook dodaje coś od siebie
sys.getrefcount('aaa')

3

**`sys.getsizeof(object[, default])`**

Ta funkcja zwraca wielkość wyrażoną w bajtach, która została zaalokowana dla tego konkretnego elementu, ale nie elementów do których się odwołuje. Dla przykładu la obiektu list nie będzie to suma ilości zaalokowanej pamięci dla wszystkich jej elementów. Działa poprawnie dla wszystkich typów wbudowanych, ale nie gwarantuje poprawności działania dla bibliotek zezwnętrznych. Wywołuje metodę `__getsizeof__` obiektu.

W dokumentacji znajdziemy link do przykładowej implementacji, która zwróci ilość zaalokowanej pamięci dla obiektu oraz jego elementów składowych: https://code.activestate.com/recipes/577504-compute-memory-footprint-of-an-object-and-its-cont/

W kontekście rozmiarów pamięci zaalokowanej dla obiektu, przedstawiam poniższy kod jako ciekawostkę (ale i przyszłe zadanie do rozwiązania).

In [67]:
lista = [1,2,3]
print(f'Lista {lista} ma rozmiar {sys.getsizeof(lista)} bajtów')

lista2 = list()
lista2.append(1)
lista2.append(2)
lista2.append(3)
print(f'Lista2 {lista2} ma rozmiar {sys.getsizeof(lista2)} bajtów')

lista3 = [] + [1,2,3]
print(f'Lista3 {lista3} ma rozmiar {sys.getsizeof(lista3)} bajtów')

Lista [1, 2, 3] ma rozmiar 88 bajtów
Lista2 [1, 2, 3] ma rozmiar 88 bajtów
Lista3 [1, 2, 3] ma rozmiar 80 bajtów


In [62]:
def get_var_name(var):
    for name, value in globals().items():
        if value is var:
            return name

In [68]:
listas = [lista, lista2, lista3]

lista.append(5)
lista2.append(5)
lista2.append(6)
lista3.append(5)
lista3.append(6)
lista3.append(7)


for list_obj in listas:
    print(f'{get_var_name(list_obj)} {list_obj} ma rozmiar {sys.getsizeof(list_obj)} bajtów')

lista [1, 2, 3, 5] ma rozmiar 88 bajtów
lista2 [1, 2, 3, 5, 6] ma rozmiar 120 bajtów
lista3 [1, 2, 3, 5, 6, 7] ma rozmiar 120 bajtów


**`sys.int_info`**

Podobnie jak dla typu float, zwraca informacje o parametrach reprezentacji liczb całkowitych w bieżącej wersji interpretera Python.

In [71]:
sys.int_info

sys.int_info(bits_per_digit=30, sizeof_digit=4, default_max_str_digits=4300, str_digits_check_threshold=640)

**`sys.path`**

Zwraca listę ścieżek, w których wyszukiwane są moduły dla bieżącego interpretera Pythona.

In [73]:
sys.path

['C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\python313.zip',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\DLLs',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Lib',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313',
 '',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Lib\\site-packages',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Lib\\site-packages\\win32',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Lib\\site-packages\\win32\\lib',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Lib\\site-packages\\Pythonwin']

**`sys.platform`**

Zwraca informacje o platformie, na której działa bieżący interpreter Pythona. Pełna tabelka w dokumentacji: https://docs.python.org/3/library/sys.html#sys.platform

In [74]:
sys.platform

'win32'

**`sys.stdin`, `sys.stdout`, `sys.stderr`**

To moduły (często nazywane strumieniami, tu obiekty plikowe, patrz [tu](https://docs.python.org/3/glossary.html#term-file-object)) do obsługi standardowego wejścia, wyjścia oraz błędów interpretera. Dwa pierwsze posiadają dodatkowe funkcje, które pozwalają na pracę z wejściem i wyjściem do programu uruchamianego w interpreterze. Również inne wbudowane funkcje takie jak `input(), print()` wykorzystują te moduły.

In [91]:
print(list(filter(lambda x: not (x.startswith('__') or x.startswith('_')),dir(sys.stdin))))

['buffer', 'close', 'closed', 'detach', 'encoding', 'errors', 'fileno', 'flush', 'isatty', 'line_buffering', 'mode', 'name', 'newlines', 'read', 'readable', 'readline', 'readlines', 'reconfigure', 'seek', 'seekable', 'tell', 'truncate', 'writable', 'write', 'write_through', 'writelines']


In [76]:
print(dir(sys.stdout))

['__abstractmethods__', '__annotations__', '__class__', '__del__', '__delattr__', '__dict__', '__dir__', '__doc__', '__enter__', '__eq__', '__exit__', '__firstlineno__', '__format__', '__ge__', '__getattribute__', '__getstate__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__next__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__static_attributes__', '__str__', '__subclasshook__', '_abc_impl', '_buffer_lock', '_buffers', '_checkClosed', '_checkReadable', '_checkSeekable', '_checkWritable', '_exc', '_flush', '_flush_buffers', '_flush_pending', '_hooks', '_io_loop', '_is_master_process', '_isatty', '_local', '_master_pid', '_parent_header', '_parent_header_global', '_rotate_buffers', '_schedule_flush', '_setup_stream_redirects', '_should_watch', '_subprocess_flush_pending', '_thread_to_parent', '_thread_to_parent_header', '_watch_pipe_fd', 'close', 'closed', 'detach', 'echo', 'enco

**`sys.version`**

Zwraca wersję interpretera Pythona. Zobacz jeszcze: `sys.api_version, sys.version_info`

In [92]:
sys.version

'3.13.2 (tags/v3.13.2:4f8bb39, Feb  4 2025, 15:23:48) [MSC v.1942 64 bit (AMD64)]'

## 2. Moduł `os`

**Dokumentacja:**
* https://docs.python.org/3/library/os.html#module-os

Moduł `os` dostarcza narzędzi specyficznych dla systemu operacyjnego, na którym bieżący interpreter został uruchomiony. Część z nich jest uniwersalna pomiędzy platformami. Poniżej przedstawione zostaną przykłady wybranych elementów tego modułu.

In [94]:
import os

**`os.environ`**

Pozwala na wypisanie, ale i ustawienie zmiennych środowiskowych. Wartość zmiennych odczytywana jest w momencie inicjalizacji interpretera Pythona, ale w zależności od sposobu jego uruchamiania (IDE, Jupyter) widoczność zmiennych może być nieco inna. Zmienne zdefiniowane w systemie po inicjalizacji Pythona (ale biorąc również pod uwagę w/w narzędzia) nie będą widoczne. Zdefiniowanie tych zmiennych ma charakter tymczasowy, tylko dla bieżącej sesji.

Zobacz również `os.getenv()` oraz `os.putenv()`.

In [96]:
os.environ['JAVA_HOME']

'C:\\Program Files\\OpenLogic\\jdk-17.0.15.6-hotspot'

In [97]:
os.environ['username']

'Krzysztof'

In [101]:
list(filter(lambda x: 'Python' in x, os.environ['PATH'].split(';')))

['C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python312\\Scripts\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python312\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\Scripts\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python313\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Launcher\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python311\\Scripts\\',
 'C:\\Users\\Krzysztof\\AppData\\Local\\Programs\\Python\\Python311\\']

**`os.getcwd()`**

In [103]:
os.getcwd()

'C:\\Users\\Krzysztof\\__projects\\__uwm_zaawansowany_python\\lab_09'

In [106]:
# zmiana bieżącej ścieżki
os.chdir('..')
os.getcwd()

'C:\\Users\\Krzysztof\\__projects'

In [None]:
# oczywiście do zmiany na właściwą dla projektu ścieżkę
os.chdir(r'.\__uwm_zaawansowany_python\lab_09')

In [115]:
os.getcwd()

'C:\\Users\\Krzysztof\\__projects\\__uwm_zaawansowany_python\\lab_09'

In [121]:
os.getlogin()

'Krzysztof'

Moduł `os` zawiera wiele niskopoziomowych funkcji do obsługi plików. Można je znaleźć w sekcji https://docs.python.org/3/library/os.html#file-descriptor-operations. Pozwalają one między innymi na zmianę uprawnień do pliku, odczytywanie danych z pliku w różny sposób, kopiowanie fragmentów między plikami i wiele innych niskopoziomowych funkcji związanych z obsługą plików.

**`os.access(filepath, mode)`**

Dostępne wartości parametru `mode`:
* os.F_OK - czy istnieje
* os.R_OK - odczyt (read)
* os.W_OK - zapis (write)
* os.X_OK - wykonanie (execute)

In [124]:
os.access('.', mode=os.R_OK)

True

In [126]:
# listuje zawartość wskazanego folderu
os.listdir('.')

['.ipynb_checkpoints', 'adv_python_09.ipynb', 'dane', 'test.py']

**`os.mkdir(path, mode=0o777, *, dir_fd=None)`**

Funkcja pozwala stworzyć folder zdefiniowany poprzez atrybut `path`. Zgłasza wyjątek `FileExistsError` jeżeli folder już istnieje lub `FileNotFoundError` jeżeli folder nadrzędny nie istnieje.

In [127]:
os.mkdir('test')

In [128]:
os.access('test', mode=os.R_OK)

True

**`os.makedirs(name, mode=0o777, exist_ok=False)`**

Funkcja, która służy do tworzenia folderów, ale tworzy je rekurencyjnie, jeżeli którykolwiek z podanych w ścieżce nie istnieje (to zależy również od wartości parametru `exist_ok`). Jeżeli `exist_ok` ma wartość `True` to nie jest zgłaszany wyjątek `FileExistsError`.

In [130]:
os.makedirs('./ala/ma/kota')

In [141]:
os.access('./ala/ma/kota', mode=os.R_OK)

True

**`os.remove(path, *, dir_fd=None)`**

Służy do usuwania plików i zgłasza wyjątek `OSError` jeżeli podana ścieżka wskazuje na folder. Do usuwania folderów służy funkcja `os.rmdir()`

In [142]:
!echo "Hello world!" > plik.txt

In [143]:
!ls

adv_python_09.ipynb
ala
dane
plik.txt
test
test.py


In [144]:
os.remove('plik.txt')

In [145]:
!ls

adv_python_09.ipynb
ala
dane
test
test.py


In [147]:
os.remove('ala/ma/kota')

PermissionError: [WinError 5] Odmowa dostępu: 'ala/ma/kota'

**`os.removedirs(name)`**

Usuwanie folderów rekurencyjnie. Usuwanie odbywa się począwszy od liścia i jeżeli któryś z kolejnych folderów nie jest pusty to folder nie zostanie usunięty.

In [148]:
os.removedirs('./ala/ma/kota')

In [149]:
!ls

adv_python_09.ipynb
dane
test
test.py


In [152]:
os.makedirs('./ala/ma/kota')

In [153]:
!echo "Bla bla ..." > ./ala/ma/test.txt

In [154]:
!ls ./ala/ma

kota
test.txt


In [155]:
os.removedirs('./ala/ma/kota')

In [157]:
!ls -R

.:
adv_python_09.ipynb
ala
dane
test
test.py

./ala:
ma

./ala/ma:
test.txt

./dane:

./test:


Jak widać na powyższych przykładach, podfolder o nazwie `kota` ze ścieżki `ala\ma\kota` został usunięty, ale pozostałe nie gdyż podfolder `ma` nie był pusty.

**`os.rename(src, dst, *, src_dir_fd=None, dst_dir_fd=None)`**

Funkcja służy do zmiany nazwy plików lub folderów. `os.renames` służy do tego samego celu, ale w sposób rekurencyjny.

In [159]:
os.rename('./ala/ma','./ala/miała')

In [161]:
!ls -R

.:
adv_python_09.ipynb
ala
dane
test
test.py

./ala:
miaĹ‚a

./ala/miaĹ‚a:
test.txt

./dane:

./test:


In [163]:
# brak poprawnego kodowania wyjścia do UTF-8 można obejść w poniższy sposób (ale nie jest jedyny)
import subprocess

result = subprocess.run(['ls', '-R'], stdout=subprocess.PIPE)
print(result.stdout.decode())

.:
adv_python_09.ipynb
ala
dane
test
test.py

./ala:
miała

./ala/miała:
test.txt

./dane:

./test:



**`os.scandir(path='.')`**

Jest to funkcja, która zwraca iterator obiektów `os.DirEntry` poczynając od wskazanej ścieżki. Elementy są zwracane w porządku arbitralnym, a elementy specjalne `.` oraz `..` są pomijane. Jeżeli kod, który korzysta z drzewa elementów wybranego fragmentu systemu plików będzie wykorzystywał inne funkcje sprawdzające atrybuty tych obiektów (plików, folderów) takie jak uprawnienia, typ zasobu itp. to rozwiązanie bazujące na funkcji `scandir()` będzie znacznie wydajniejsze względem funkcji `listdir()`, która również zostanie tutaj zaprezentowana.

Klasa `os.DirEntry` pozwala na sprawdzenie wartości wielu atrybutów danego zasobu, a ich lista znajduje się w dokumentacji:
* https://docs.python.org/3/library/os.html#os.DirEntry

In [200]:
fs = os.scandir()
for item in fs:
    print(item)

<DirEntry '.ipynb_checkpoints'>
<DirEntry 'adv_python_09.ipynb'>
<DirEntry 'ala'>
<DirEntry 'dane'>
<DirEntry 'test'>
<DirEntry 'test.py'>


In [173]:
# pamiętaj, że iteratory są wyczerpywalne, więc po przejściu należy je ponownie przeładować
files = [f.name for f in fs if f.is_file()]
files

['adv_python_09.ipynb', 'test.py']

In [198]:
# wyświetlenie wybranych atrybutów zasobów, które sa dostępne bez względu na system operacyjny
# istnieją też inne atrybuty, których wartość może nie występować dla każdego systemu operacyjnego
# szczegóły do sprawdzenia w dokumentacji

for item in fs:
    print(item.stat())

os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1746598958, st_mtime=1746433731, st_ctime=1746433198)
os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=44987, st_atime=1746604200, st_mtime=1746604200, st_ctime=1746433198)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1746603658, st_mtime=1746600026, st_ctime=1746599682)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1746598958, st_mtime=1746465310, st_ctime=1746465310)
os.stat_result(st_mode=16895, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=0, st_atime=1746598686, st_mtime=1746598686, st_ctime=1746598686)
os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=288, st_atime=1746600298, st_mtime=1746446660, st_ctime=1746433724)


In [199]:
# list dir wyświetla tylko nazwy zasobów, więc nadaje się idealnie do szybkiego odfiltrowania ich po nazwach
fs = os.listdir()
for item in fs:
    print(item)

.ipynb_checkpoints
adv_python_09.ipynb
ala
dane
test
test.py


In [201]:
[f for f in os.listdir() if f.endswith('.py')]

['test.py']

**`os.walk(top, topdown=True, onerror=None, followlinks=False)`**

Kolejna funkcja pozwalająca na eksplorację systemu plików z poziomu języka Python. Funkcja zwraca trzyelementową krotkę `(dirpath, dirnames, filenames)`,w której:
* `dirpath` - ścieżka do listowanego folderu
* `dirnames` - nazwy wszystkich podfolderów ścieżki `dirpath`
* `filenames` - nazwy wszystkich plików ścieżki `dirpath`

Funkcja domyślnie przechodzi przez strukturę w kierunku top-down, ale możemy to zmienić wartością parametru `topdown`.

In [206]:
for level in os.walk('./ala'):
    print(level)

('./ala', ['miała'], [])
('./ala\\miała', [], ['test.txt'])


In [209]:
for level in os.walk('./ala', topdown=False):
    print(level)

('./ala\\miała', [], ['test.txt'])
('./ala', ['miała'], [])


**Inne wybrane elementy modułu `os`**

In [165]:
# zwraca liczbę procesorów logicznych w systemie
os.cpu_count()

12

In [210]:
# pozwala na wykonanie polecenia powłoki
os.system('dir')

0

Dlaczego taki outpup?

Za dokumentacją (https://docs.python.org/3/library/os.html#os.system):
> On Unix, the return value is the exit status of the process encoded in the format specified for wait().

> On Windows, the return value is that returned by the system shell after running command. The shell is given by the Windows environment variable COMSPEC: it is usually cmd.exe, which returns the exit status of the command run; on systems using a non-native shell, consult your shell documentation.

I również tam znajdziemy informację, że w takim przypadku lepszym pomysłem jest wykorzystanie modułu `subprocess`.

In [213]:
# zwraca separator ścieżek w systemie plików dla bieżącego systemu operacyjnego
os.sep

'\\'

## 3. Moduł `os.path`

Jest to moduł w module `os`, który zawiera przydatne funkcje do pracy ze ścieżkami w systemie plików. Poniżej zaprezentowane zostaną tylko wybrane z nich. Dla pełnego ich przeglądu zapraszam do oficjalnej dokumentacji:
* https://docs.python.org/3/library/os.path.html#module-os.path

Jedną z najpowszechniej wykorzystywanych funkcji jest `os.path.join`, która służy do budowania poprawnej ścieżki w kontekście bieżącego systemu operacyjnego z podanych elementów.

In [222]:
# przyjmijmy, że mamy stałą DATAPATH, która wskazuje na globalny folder z danymi (pamiętajmy, że to znowu konwencja - umowa)
DATAPATH = './dane/'

In [216]:
# nasz plik będzie się nazywał dummy_data.txt
filename = 'dummy_data.txt'

In [223]:
filepath = os.path.join(DATAPATH, filename)
filepath

'./dane/dummy_data.txt'

In [224]:
with open(filepath, 'w', encoding='utf-8') as file:
    file.write('moje dummy data')

In [225]:
os.listdir(DATAPATH)

['dummy_data.txt', 'd_pl_txt.zip']

Inne wybrane funkcje w tym module.

In [226]:
# ścieżka bezwzględna
os.path.abspath(filepath)

'C:\\Users\\Krzysztof\\__projects\\__uwm_zaawansowany_python\\lab_09\\dane\\dummy_data.txt'

In [229]:
# ostatni człon ścieżki, wartość różni się w zależności od tego czy jest to plik czy folder
os.path.basename(filepath)

'dummy_data.txt'

In [228]:
os.path.basename(DATAPATH)

''

In [230]:
os.path.dirname(DATAPATH)

'./dane'

In [231]:
os.path.dirname(filepath)

'./dane'

In [232]:
# czy ścieżka istnieje
os.path.exists(DATAPATH)

True

In [233]:
os.path.exists(filepath)

True

In [236]:
# zwraca rozmiar w bajtach - dla folderów wartość -> 0
os.path.getsize(filepath)

15

In [239]:
# czy plik?
print(os.path.isfile(filepath))
# czy folder?
print(os.path.isdir(filepath))
# czy symlink (głównie UNIX)?
print(os.path.islink(filepath))
# czy ścieżka bezwzględna?
print(os.path.isabs(filepath))

True
False
False
False


In [247]:
# pamiętajmy, że pierwotnie w kodzie ścieżka została zapisana w postaci: './dane/dummy_data.txt'
print(1, os.path.abspath(filepath))
print(2, os.path.normcase(os.path.abspath(filepath)))
print(3, os.path.normpath(os.path.abspath(filepath)))
print(4, os.path.realpath(os.path.abspath(filepath)))
print(5, os.path.relpath(os.path.abspath(filepath)))

1 C:\Users\Krzysztof\__projects\__uwm_zaawansowany_python\lab_09\dane\dummy_data.txt
2 c:\users\krzysztof\__projects\__uwm_zaawansowany_python\lab_09\dane\dummy_data.txt
3 C:\Users\Krzysztof\__projects\__uwm_zaawansowany_python\lab_09\dane\dummy_data.txt
4 C:\Users\Krzysztof\__projects\__uwm_zaawansowany_python\lab_09\dane\dummy_data.txt
5 dane\dummy_data.txt


In [249]:
# teraz naszą ścieżkę zmodyfikujemy nieco
filepath = '../../'
print(1, os.path.abspath(filepath))
print(2, os.path.normcase(os.path.abspath(filepath)))
print(3, os.path.normpath(os.path.abspath(filepath)))
print(4, os.path.realpath(os.path.abspath(filepath)))
print(5, os.path.relpath(os.path.abspath(filepath)))

1 C:\Users\Krzysztof\__projects
2 c:\users\krzysztof\__projects
3 C:\Users\Krzysztof\__projects
4 C:\Users\Krzysztof\__projects
5 ..\..


**`os.path.split`**

Ta funkjca rozdziela ścieżkę na krotkę (bazowa ścieżka bez liścia (zazwyczaj zasób plikowy), liść). Poniżej przykład.

In [250]:
filepath = os.path.join(DATAPATH, filename)
os.path.split(filepath)

('./dane', 'dummy_data.txt')

In [251]:
os.path.split(os.path.abspath(filepath))

('C:\\Users\\Krzysztof\\__projects\\__uwm_zaawansowany_python\\lab_09\\dane',
 'dummy_data.txt')

### Zadania

**Zadanie 1**

Rozpakuj (możesz z poziomu Pythona albo systemu operacyjnego) plik `d_pl_txt.zip` (plik spakowany i podzielony na 3 części znajduje się w podfolderze `./dane`) w folderze `dane`. Wykorzystując narzędzia z modułu `os` wypisz ile jest folderów i ile plików w tym rozpakowanym pliku - czyli poniżej folderu o nazwie `d_pl_txt`.

**Zadanie 2**

Napisz funkcję o nazwie `file_stats`, która przyjmie dwa argumenty:
* `base_path` - ścieżka wyszukiwania
* `folder_name` - nazwa folderu do odszukania

Jeżeli funkcja odnajdzie folder (rekurencyjnie) o podanej nazwie to ma zwrócić liczbę wszystkich plików, które znajdują się w nim (i tylko w nim, bez rekurencji) oraz łączną ich wielkość.

**Zadanie 3**

Napisz funkcję `fs_stats`, która:
* jako argument przyjmuje ścieżkę,
* rekurencyjnie przechodzi przez wszystkie elementy i zapisuje poniższe informacje do ramki pandas:
  * nazwa elementu (folderu lub pliku)
  * ścieżka względna
  * ścieżka bezwzględna
  * czy to folder
  * czy to plik
  * rozmiar w bajtach
  * liczba linii w pliku

**Zadanie 4**

Wykorzystując kod z zadania 3 lub finalną ramkę danych scal zawartość wszystkich plików w jeden zbiór danych i zapisz go do pliku csv.

**Zadanie 5**

Wyjaśnij dlaczego liczba bajtów zaalokowanych dla trzech list przedstawionych w przykładzie użycia funkcji `sys.getsizeof()` różni się (lub nie) dla list o tej samej (lub różnej) ilości elementów?