# Jak tworzyć ścieżki like a pro?

## WAŻNE! Zanim zaczniemy!

Zanim zaczniemy, zadanie dla ciebie, w folderze, w którym znajduje się ten notebook utwórz następujące drzewo katalogów i plików:
```
data
├── raw
│   ├── 2024-01-01.csv
│   ├── 2024-01-01.xlsx
│   └── 2024-01-02.csv
└── processed
    ├── 2024-01-01.csv
    └── 2024-01-02.csv
```
same pliki csv mogą być puste, ale muszą istnieć

W tej lekcji poznamy kilka technik tworzenie ścieżek do plików i katalogów w Pythonie. W całości skoncentrujemy się na module `pathlib`.

In [None]:
# zacznijmy od importu klasy Path z modułu pathlib
from pathlib import Path

## Tworzenie obiektu ścieżki

Używając klasy `Path` możemy konstruować obiekty reprezentujące ścieżki do plików i katalogów.

In [None]:
DATA_PATH = Path("data")
# DATA_PATH to zmienna typu Path, która wskazuje na katalog data, i pozwala nam wykonywać operacje na plikach
# w tym katalogu
DATA_PATH

In [None]:
# ale możemy też stworzyć ścieżki do kolejnych katalogów lub plików bez konieczności używania
# slashy czy backslashy
RAW_PATH = Path("data", "raw")
RAW_PATH

## Jak łączyć ścieżki - like a pro?

Jednak prawdziwy pro będzie łączył ścieżki w taki sposób, żeby działało to na każdym systemie operacyjnym!

In [None]:
DATA_2024_01_01_PATH = DATA_PATH / "raw" / "2024-01-01.csv"
DATA_2024_01_01_PATH

## Jak sprawdzić czyli ścieżka / plik / katalog istnieje?

```
data  <-- DATA_PATH
├── raw
│   ├── 2024-01-01.csv <-- DATA_2024_01_01_PATH
│   ├── 2024-01-01.xlsx
│   └── 2024-01-02.csv
└── processed
    ├── 2024-01-01.csv
    └── 2024-01-02.csv
```

In [None]:
# katalog data istnieje, więc otrzymamy True
DATA_PATH.exists()

In [None]:
# plik 2024-01-01.csv istnieje, więc otrzymamy True
DATA_2024_01_01_PATH.exists()

In [None]:
# ale "whatever" nie istnieje, więc otrzymamy False
(DATA_PATH / "whatever").exists()

## Jak sprawdzić czy ścieżka wskazuje na plik czy katalog?

```
data  <-- DATA_PATH
├── raw
│   ├── 2024-01-01.csv <-- DATA_2024_01_01_PATH
│   ├── 2024-01-01.xlsx
│   └── 2024-01-02.csv
└── processed
    ├── 2024-01-01.csv
    └── 2024-01-02.csv
```

In [None]:
DATA_PATH.is_dir()

In [None]:
DATA_PATH.is_file()

In [None]:
DATA_2024_01_01_PATH.is_dir()

In [None]:
DATA_2024_01_01_PATH.is_file()

## Jak przeiterować po plikach w katalogu?

Możemy wykorzystać `iterdir()` do przeiterowania po zawartości katalogu.

In [None]:
for subpath in DATA_PATH.iterdir():
    print(subpath)

In [None]:
for subpath in (DATA_PATH / "raw").iterdir():
    print(subpath)    

## Jak przeiterować po plikach w katalogu określonego typu?

In [None]:
for subpath in DATA_PATH.glob("*.csv"):
    print(subpath)

In [None]:
for subpath in DATA_PATH.glob("**/*.csv"):
    print(subpath)

## Jak pobrać nazwę pliku z pełnej ścieżki?

In [None]:
DATA_2024_01_01_PATH.name

In [None]:
DATA_2024_01_01_PATH.stem

In [None]:
DATA_2024_01_01_PATH.suffix