## Pathlib

[Video](https://youtu.be/m6WbYzCvbBg)

Ein Windows-Pfad nutzt den Backslash. Aber in Python ist der Backslash ein Escape-Zeichen, d.h. wir müssen für
Pfadnamen doppelte Backslashes nehmen. Ein typischer Windows-Pfad:

    s = 'C:\\MyData\\07_Kurse\\PythonThemen\\pathlib\\test.txt'

Linux nutzt Forward-Slash. Mit Pathlib wird das einheitlich.
Wenn wir in Windows arbeiten, erhalten wir mit Path immer einen WindowsPath, in Linux einen PosixPath.

In [69]:
from pathlib import Path

In [70]:
curr = Path.cwd()
curr

WindowsPath('C:/MyData/07_Kurse/PythonThemen/pathlib')

In [71]:
curr2 = Path('.')
curr2

WindowsPath('.')

Es sind nicht dieselben Pfadobjekte, aber beide repräsentieren den gleichen Pfad

In [72]:
print(curr.absolute(), curr2.absolute())

C:\MyData\07_Kurse\PythonThemen\pathlib C:\MyData\07_Kurse\PythonThemen\pathlib


Um herauszufinden, ob zwei Pfade zu demselben Objekt zeigen (egal ob dir oder file oder sonstwas), nutzen wir die samefile-Methode.

In [73]:
curr.samefile(curr2)  

True

Wir können das Home-Directory herausfinden

In [74]:
Path.home()

WindowsPath('C:/Users/khthe')

Ein File erstellen und den Pfad ermmitteln

In [75]:
with open('test.txt','w',encoding='utf-8') as f:
    f.write("Das ist eine Zeile.")

In [76]:
file = Path('test.txt')

In [77]:
file

WindowsPath('test.txt')

In [78]:
file.absolute()

WindowsPath('C:/MyData/07_Kurse/PythonThemen/pathlib/test.txt')

In [79]:
file.stat()

os.stat_result(st_mode=33206, st_ino=5066549583362802, st_dev=13756463696723742297, st_nlink=1, st_uid=0, st_gid=0, st_size=19, st_atime=1763456770, st_mtime=1763456770, st_ctime=1763452523)

In [80]:
# die Größe in Bytes
file.stat().st_size

19

In [81]:
# die Zeit der letzen Modifikation (als Posix-Zeitstempel, lokale Zeit)
file.stat().st_mtime

1763456770.4471593

In [82]:
from datetime import datetime
datetime.fromtimestamp(file.stat().st_mtime)

datetime.datetime(2025, 11, 18, 10, 6, 10, 447159)

In [83]:
Path('test.txt').exists()

True

In Windows müssten wir eine absoluten Pfad so angeben

In [84]:
s = 'C:\\MyData\\07_Kurse\\PythonThemen\\pathlib\\test.txt'

In [85]:
with open(s) as f:
    print(f.read())
 

Das ist eine Zeile.


Mit Pathlib können wir auch in Windows den einfachen Forward-Slash benutzen.
Wir können der open-Funktion auch ein Pfad-Objekt übergeben.

In [86]:
file = Path('C:/Mydata/07_Kurse/PythonThemen/pathlib/test.txt')

In [87]:
with open(file) as f:
    print(f.read())

Das ist eine Zeile.


Wir können testen, ob etwas ein File oder ein Directory ist. Wenn es nicht existiert, wird auch False zurückgegeben. In der Regel also vorher exists() benutzen, dann abfragen ob file oder dir.

In [88]:
file.is_file()

True

In [89]:
file.is_dir()

False

Wir müssen komplexe Pfad nicht als String zusammensetzen


In [90]:
p = Path('MyData').joinpath('07_Kurse','PythonThemen')
p

WindowsPath('MyData/07_Kurse/PythonThemen')

Das Gleiche können wir auch mit dem Slash-Operator machen. Die Bestandteile können String oder Pathobjekte sein.

In [91]:
p = Path('MyData') / '07_Kurse' / 'PythonThemen' / 'pathlib' / 'text.txt'
p

WindowsPath('MyData/07_Kurse/PythonThemen/pathlib/text.txt')

In [92]:
file = Path('C:/Mydata/07_Kurse/PythonThemen/pathlib/test.txt')

Wir können die Bestandteile eines Pfades als Tupel erhalten.

In [93]:
file.parts

('C:\\', 'Mydata', '07_Kurse', 'PythonThemen', 'pathlib', 'test.txt')

Die parents-property erlaubt uns die Aufzählung der Eltern-Hierarchie

In [94]:
for p in file.parents:
    print(p)

C:\Mydata\07_Kurse\PythonThemen\pathlib
C:\Mydata\07_Kurse\PythonThemen
C:\Mydata\07_Kurse
C:\Mydata
C:\


Mit parent bekommen wir die unmittelbaren Eltern

In [95]:
print(file)
print(file.parent)
print(file.parent.parent)

C:\Mydata\07_Kurse\PythonThemen\pathlib\test.txt
C:\Mydata\07_Kurse\PythonThemen\pathlib
C:\Mydata\07_Kurse\PythonThemen


In [96]:
file

WindowsPath('C:/Mydata/07_Kurse/PythonThemen/pathlib/test.txt')

In [97]:
# letzter Bestandteil des Pfads (muss nicht ein file sein)
file.parent.name

'pathlib'

In [98]:
# falls suffix vorhanden 
file.parent.suffix

''

Wir können Verzeichnisse anlegen und löschen

In [99]:
p = Path().cwd() / 'testdir'

In [100]:
p.exists()

False

In [101]:
p.mkdir()

In [102]:
p.exists()

True

In [103]:
# geht nur, wenn directory ist leer
p.rmdir()

In [104]:
p.exists()

False

In [105]:
# hier wird eine ganze Hierarchie von dirs erzeugt.
p = Path().cwd() / 'dir1' / 'dir2' / 'dir3'
p.mkdir(parents = True)

Die Iterdir-Methode zählt die Elemente in einem dir auf (nicht rekursiv).


In [106]:
p = Path().cwd().parent 
for x in p.iterdir():
    print(x)

C:\MyData\07_Kurse\PythonThemen\.git
C:\MyData\07_Kurse\PythonThemen\.gitignore
C:\MyData\07_Kurse\PythonThemen\.ipynb_checkpoints
C:\MyData\07_Kurse\PythonThemen\arcade
C:\MyData\07_Kurse\PythonThemen\fehler
C:\MyData\07_Kurse\PythonThemen\graphviz
C:\MyData\07_Kurse\PythonThemen\grids
C:\MyData\07_Kurse\PythonThemen\matplotlib
C:\MyData\07_Kurse\PythonThemen\pandas
C:\MyData\07_Kurse\PythonThemen\pathlib
C:\MyData\07_Kurse\PythonThemen\readme.md
C:\MyData\07_Kurse\PythonThemen\README1.md
C:\MyData\07_Kurse\PythonThemen\regulaereAusdruecke
C:\MyData\07_Kurse\PythonThemen\sets
C:\MyData\07_Kurse\PythonThemen\shapely
C:\MyData\07_Kurse\PythonThemen\venv
C:\MyData\07_Kurse\PythonThemen\verschiedenes
C:\MyData\07_Kurse\PythonThemen\was_ist_python
C:\MyData\07_Kurse\PythonThemen\zufall


Wenn der Suchstring in der glob-Funktion mit ** beginnt, arbeitet sie rekursiv.

In [107]:
for s in p.glob('**/*.py'):
    print(s)


C:\MyData\07_Kurse\PythonThemen\graphviz\mygraph.py
C:\MyData\07_Kurse\PythonThemen\grids\maze.py
C:\MyData\07_Kurse\PythonThemen\grids\maze01.py
C:\MyData\07_Kurse\PythonThemen\grids\maze02.py
C:\MyData\07_Kurse\PythonThemen\grids\.ipynb_checkpoints\maze01-checkpoint.py


In [108]:
for s in p.glob('**/pa*.ipynb'):
    print(s)

C:\MyData\07_Kurse\PythonThemen\pandas\pandas.ipynb
C:\MyData\07_Kurse\PythonThemen\pathlib\pathlib.ipynb
C:\MyData\07_Kurse\PythonThemen\pandas\.ipynb_checkpoints\pandas-checkpoint.ipynb
C:\MyData\07_Kurse\PythonThemen\pathlib\.ipynb_checkpoints\pathlib-checkpoint.ipynb


In [109]:
for s in p.glob('**/*checkpoint.png'):
    print(s)

C:\MyData\07_Kurse\PythonThemen\matplotlib\.ipynb_checkpoints\figure-checkpoint.png
C:\MyData\07_Kurse\PythonThemen\matplotlib\.ipynb_checkpoints\plot-checkpoint.png
C:\MyData\07_Kurse\PythonThemen\zufall\.ipynb_checkpoints\gluecksrad-checkpoint.png
C:\MyData\07_Kurse\PythonThemen\zufall\.ipynb_checkpoints\gluecksrad3-checkpoint.png


In [110]:
for s in p.glob('**/pa????/*'):
    print(s)

C:\MyData\07_Kurse\PythonThemen\pandas\.ipynb_checkpoints
C:\MyData\07_Kurse\PythonThemen\pandas\beispiele.ipynb
C:\MyData\07_Kurse\PythonThemen\pandas\buchverkauf.xlsx
C:\MyData\07_Kurse\PythonThemen\pandas\buchverkauf_neu.xlsx
C:\MyData\07_Kurse\PythonThemen\pandas\claude.ipynb
C:\MyData\07_Kurse\PythonThemen\pandas\email.csv
C:\MyData\07_Kurse\PythonThemen\pandas\namen.csv
C:\MyData\07_Kurse\PythonThemen\pandas\namen_neu.csv
C:\MyData\07_Kurse\PythonThemen\pandas\noten.csv
C:\MyData\07_Kurse\PythonThemen\pandas\noten_neu.csv
C:\MyData\07_Kurse\PythonThemen\pandas\pandas.ipynb
C:\MyData\07_Kurse\PythonThemen\pandas\tutor.csv
