# Obsługa katalogów i plików

## Tworzenie katalogów

Funkcja `os.makedirs` tworzy katalogi w podanej ścieżce, jeśli jeszcze nie istnieją. Przykładowo, jeśli `PATH` to `"path/to/dir"`, funkcja utworzy katalog `path`, potem `to`, a na końcu `dir`.

- Gdy dowolny z katalogów już istnieje, `makedirs` go pomija. Jeśli cały `PATH` już istnieje, można użyć `os.makedirs(PATH, exist_ok=True)`, by uniknąć błędu.
- Ścieżka absolutna, np. `/path/to/dir`, utworzy katalogi od katalogu głównego, natomiast ścieżka względna, np. `path/to/dir`, będzie tworzona względem bieżącego katalogu roboczego.

Funkcja `os.path.join` łączy fragmenty ścieżki, tworząc poprawną ścieżkę w zależności od systemu operacyjnego. Na przykład, `"path", "to", "dir2"` zostaną połączone w `"path/to/dir2"` na systemach Unixowych lub `"path\to\dir2"` na Windowsie.


In [7]:
import os

PATH = "path/to/dir"
os.makedirs(PATH)

path = os.path.join("path", "to", "dir2")
os.makedirs(path)

## Usuwanie katalogów
Funkcja `os.rmdir` usuwa wskazany katalog `PATH`, ale działa tylko na pustych katalogach. Jeśli podana ścieżka zawiera przynajmniej jeden plik, katalog nie zostanie usunięty.
Funkcja `shutil.rmtree` usunie wskazany katalog z całą zawartością, nawet z plikami.


In [3]:
os.rmdir(PATH)
os.rmdir(path)

import shutil

shutil.rmtree(PATH)

NameError: name 'PATH' is not defined

## Przeglądanie katalogów

In [3]:
"""
Sprawdzanie, czy dana ścieżka odnosi się do pliku, czu katalogu
"""
print(f"{os.path.exists(PATH) = } ")
print(f"{os.path.isdir(PATH) = } ")
print(f"{os.path.isfile(PATH) = } ")

os.path.exists(PATH) = False 
os.path.isdir(PATH) = False 
os.path.isfile(PATH) = False 


In [4]:
"""
os.listdir zwraca listę zawierającą nazwy plików i katalogów znajdujących się bezpośrednio w podanym katalogu, bez rekurencyjnego przeglądania podkatalogów.
"""
os.listdir()

['app.log',
 'obsługa katalogów.ipynb',
 'obsługa plików.ipynb',
 'pass_args_example.py',
 'path',
 'readthisfile.txt',
 'server.log',
 'write.txt']

### Główne atrybuty i metody `DirEntry`

- **`name`** - Nazwa pliku lub katalogu (bez pełnej ścieżki).

- **`path`** - Pełna ścieżka do pliku lub katalogu.

- **`inode()`** - Zwraca numer inode (identyfikator pliku/katalogu na dysku), jeśli system plików na to pozwala.

- **`is_dir(follow_symlinks=True)`** - Zwraca `True`, jeśli wpis jest katalogiem. `follow_symlinks` (domyślnie `True`) określa, czy sprawdzać cel symlinków.

- **`is_file(follow_symlinks=True)`** - Zwraca `True`, jeśli wpis jest plikiem. `follow_symlinks` określa, czy sprawdzać cel symlinków.

- **`is_symlink()`** - Zwraca `True`, jeśli wpis jest dowiązaniem symbolicznym (symlinkiem).

- **`stat(follow_symlinks=True)`** - Zwraca szczegółowe informacje o pliku/katalogu (np. rozmiar, prawa dostępu) jako `os.stat_result`.

- **`__repr__()`** - Reprezentacja `DirEntry` do debugowania i wyświetlania nazwy wpisu. Przykład: `<DirEntry 'filename'>`

In [2]:
import os

for entry in os.scandir():
    print(f"Name: {entry.name}")
    print(f"Path: {entry.path}")
    print(f"Is Directory: {entry.is_dir()}")
    print(f"Is File: {entry.is_file()}")
    print(f"Is Symlink: {entry.is_symlink()}")
    print(f"Stat: {entry.stat()}")
    print("=" * 40)

Name: obsługa katalogów.ipynb
Path: .\obsługa katalogów.ipynb
Is Directory: False
Is File: True
Is Symlink: False
Stat: os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=18103, st_atime=1731423462, st_mtime=1731423462, st_ctime=1731423462)
Name: obsługa plików.ipynb
Path: .\obsługa plików.ipynb
Is Directory: False
Is File: True
Is Symlink: False
Stat: os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=16971, st_atime=1731422850, st_mtime=1731422850, st_ctime=1731422850)
Name: pass_args_example.py
Path: .\pass_args_example.py
Is Directory: False
Is File: True
Is Symlink: False
Stat: os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid=0, st_gid=0, st_size=402, st_atime=1731350466, st_mtime=1731350466, st_ctime=1731057450)
Name: readthisfile.txt
Path: .\readthisfile.txt
Is Directory: False
Is File: True
Is Symlink: False
Stat: os.stat_result(st_mode=33206, st_ino=0, st_dev=0, st_nlink=0, st_uid

In [8]:
"""
Funkcja os.walk w Pythonie służy do rekursywnego przeglądania katalogów, ich podkatalogów i wszystkich znajdujących się w nich plików. Jest przydatna, gdy chcemy uzyskać pełną strukturę katalogu oraz wykonać operacje na plikach w zagnieżdżonych katalogach.
"""
for root, dirs, files in os.walk("."):
    print(f"{root=},\n\t{dirs=},\n\t{files=}\n")

root='.',
	dirs=['path'],
	files=['app.log', 'obsługa katalogów.ipynb', 'obsługa plików.ipynb', 'pass_args_example.py', 'readthisfile.txt', 'server.log', 'write.txt']

root='.\\path',
	dirs=['to'],
	files=[]

root='.\\path\\to',
	dirs=['dir', 'dir2'],
	files=[]

root='.\\path\\to\\dir',
	dirs=[],
	files=[]

root='.\\path\\to\\dir2',
	dirs=[],
	files=[]



## Przenoszenie i kopiowanie plików i katalogów
Moduł shutil w Pythonie oferuje różne metody kopiowania plików, z których każda ma specyficzne funkcjonalności i zastosowania:

Kwestia kopiowania metadanych ma znaczenie przy zachowywaniu historii plików oraz atrybutów bezpieczeństwa. W zależności od zastosowania:

- Zachowanie historii i analizy: `copy2` jest najwygodniejszym wyborem, ponieważ przenosi pełen zestaw atrybutów czasowych, co może być kluczowe w systemach wersjonowania lub archiwizacji.

- Uprawnienia dostępu: jeśli istotne są wyłącznie prawa dostępu, `copy` wystarcza.

- Minimalne kopiowanie: gdy zależy nam tylko na przeniesieniu zawartości bez żadnych dodatkowych metadanych, `copyfile` będzie najlepszym rozwiązaniem, ponieważ wykonuje najmniej operacji na systemie plików.
```python
# Kopiowanie tylko zawartości pliku
shutil.copyfile("source.txt", "destination.txt")

# Kopiowanie zawartości i podstawowych uprawnień
shutil.copy("source.txt", "destination.txt")

# Kopiowanie zawartości i pełnych metadanych
shutil.copy2("source.txt", "destination.txt")
```

In [1]:
import shutil
import os

# Tworzenie struktury katalogów dla przykładu
os.makedirs("./dir1/somedir", exist_ok=True)  # Utworzenie katalogu "somedir" wewnątrz "dir1"
os.makedirs("./dir2", exist_ok=True)  # Utworzenie katalogu "dir2"

# Tworzenie pliku z przykładową zawartością w "dir1"
with open("./dir1/file.txt", mode="w") as file:
    file.write("Testowa zawartość")  # Zapisanie tekstu do pliku "file.txt"

"""
Przenoszenie plików i katalogów.
"""
# Przeniesienie pliku "file.txt" z "dir1" do "dir2"
# shutil.move("./dir1/file.txt", "./dir2")

# Przeniesienie katalogu "somedir" z "dir1" do "dir2"
# shutil.move("./dir1/somedir", "./dir2")

"""
Kopiowanie plików i katalogów.
"""
# Kopiowanie pliku "file.txt" z "dir1" do "dir2" z zachowaniem metadanych. Wersja `copy` nie kopiuje metadanych.
shutil.copy2("./dir1/file.txt", "./dir2")

# Kopiowanie katalogu "somedir" z "dir1" do "dir2/somedir"
if not os.path.exists("./dir2/somedir"):
    shutil.copytree("./dir1/somedir", "./dir2/somedir")


## Typowe wyjątki spotykane w trakcie pracy na plikach

Podczas pracy z plikami i katalogami w Pythonie mogą wystąpić różne błędy związane z dostępnością ścieżek, brakiem odpowiednich uprawnień czy problemami w systemie plików. Najczęściej spotykane wyjątki to:

- **FileNotFoundError**: Występuje, gdy program nie może znaleźć pliku lub katalogu, do którego próbuje uzyskać dostęp. Może to być wynikiem błędnie podanej ścieżki lub braku wymaganego pliku.

- **PermissionError**: Powstaje, gdy brakuje odpowiednich uprawnień do wykonania operacji na pliku lub katalogu. Może pojawić się np. podczas próby usunięcia chronionego pliku lub zapisu w katalogu systemowym.

- **OSError**: Jest bardziej ogólnym wyjątkiem, obejmującym różne problemy związane z systemem operacyjnym i systemem plików, takie jak brak miejsca na dysku, zbyt długa nazwa pliku lub nieznany błąd.

```python
def create_directory(path: str) -> None:
    """Tworzy katalog, jeśli nie istnieje, i obsługuje błędy."""
    try:
        os.makedirs(path, exist_ok=True)
        print(f"Katalog {path} utworzony pomyślnie.")
    except PermissionError:
        print(f"Brak uprawnień do utworzenia katalogu {path}.")
    except FileNotFoundError:
        print(f"Ścieżka {path} jest nieprawidłowa.")
    except OSError as e:
        print(f"Nieoczekiwany błąd: {e}")
```

# Zadania

W ramach zadania domowego stworzony zostanie prosty program do zarządzania e-bookami. Program będzie umożliwiał grupowanie dokumentów w odpowiednich folderach oraz archiwizację dokumentów.

Zad 1.

Zapoznaj się z dokumentacją plików YAML.
[what-is-yaml](https://www.redhat.com/en/topics/automation/what-is-yaml)
[reading-and-writing-yaml-file-in-python](https://www.geeksforgeeks.org/reading-and-writing-yaml-file-in-python/)
Do wczytywania konfiguracji z pliku YAML można wykorzystać przykład z katalogu `yaml_config_example`

Stwórz plik config.yaml, który będzie przechowywał następujące opcje programu:
- ścieżkę do lokalizacji przechowującej e-booki (do biblioteki)
- listę obsługiwanych formatów (.epub, .mobi, .pdf)

Stwórz program `ebook_manager`, który wczyta dane z pliku konfiguracyjnego, a następnie we wskazanej lokalizacji utworzy katalogi dla każdego formatu ebooków (o ile już tam nie istnieją). Niech foldery będą pisane dużymi literami, bez kropki na początku.
Plik konfiguracyjny niech znajduje się w tym samym katalogu co program. W przypadku, gdy plik `config.yaml` nie istnieje, należy powiadomić o tym użytkownika.

Zad 2.
Korzystając z dokumentacji [how-to-use-python-argparse](https://www.cherryservers.com/blog/how-to-use-python-argparse) umożliwić przekazanie do programu `ebook_manager` polecenia jako argument wywołania.
Obsługiwane polecenia:
- `add <path>` - polecenie na razie tylko wypisze tekst: "Dodawanie e-booków ze ścieżki `<path>` do biblioteki..."
- `show` - polecenie na razie wypisze tylko tekst: "Zawartość biblioteki:"
- `archive` - polecenie na razie wypisze tylko tekst: "Tworzenie archiwum..."

Zad 3.
Posiadając dane z pliku konfiguracyjnego oraz komendy przekazywane przez użytkownika, zaimplementować logikę programu:
- polecenie `add` niech przechodzi rekursywnie przez całą zawartość katalogu z argumentu `path` i wyszukuje plików z obsługiwanymi rozszerzeniami. Następnie niech przeniesie pliki do odpowiednich podfolderów biblioteki. Jeśli w docelowej lokalizacji istnieje już plik o takiej nazwie, niech program zapyta użytkownika, czy należy nadpisać plik, czy go pominąć.
- polecenie `show` niech wypisze zawartość wszystkich podkatalogów biblioteki (e-booki pogrupowane wg. rozszerzeń)
- polecenie `archive` niech stworzy w podfolderze `backup` paczkę zawierającą spakowaną zawartość wszystkich katalogów. Niech paczka zawiera w nazwę datę wykonania operacji.