# Wichtige Bibliotheken im Kontext der Systemadiministration mit Python


    sys: Die sys-Bibliothek bietet Zugriff auf Funktionen und Objekte, die vom Python-Interpreter verwendet werden. Sie ermöglicht das Manipulieren des Python-Laufzeitsystems, wie das Arbeiten mit Command-Line-Argumenten, das Beenden von Programmen und das Abrufen von Systeminformationen.

    os: Die os-Bibliothek ermöglicht es, mit dem zugrundeliegenden Betriebssystem zu interagieren. Sie bietet Funktionen, um Dateien und Verzeichnisse zu erstellen, zu entfernen oder zu ändern, Umgebungsvariablen abzurufen und Prozesse zu verwalten.

    time: Die time-Bibliothek bietet Funktionen zur Arbeit mit Zeit und Datum. Sie ermöglicht das Abrufen der aktuellen Zeit, das Messen von Zeitintervallen, das Umwandeln zwischen verschiedenen Zeitformaten und das Anhalten der Programmausführung für eine bestimmte Zeit.

    subprocess: Mit der subprocess-Bibliothek können externe Prozesse gestartet, gesteuert und überwacht werden. Sie ermöglicht das Ausführen von Shell-Befehlen, das Kommunizieren mit externen Programmen und das Verarbeiten von deren Ausgaben.

    re: Die re-Bibliothek (Regular Expressions) bietet Funktionen, um mit regulären Ausdrücken zu arbeiten. Sie ermöglicht das Durchsuchen, Ersetzen und Manipulieren von Texten anhand von Mustern, die flexible und komplexe Suchkriterien definieren.

    os.path: os.path ist ein Untermodul der os-Bibliothek und enthält Funktionen zur Arbeit mit Datei- und Verzeichnispfaden. Es ermöglicht das Erstellen, Analysieren und Manipulieren von Pfaden auf eine plattformunabhängige Weise.

    shutil: Die shutil-Bibliothek bietet Funktionen zum Kopieren, Verschieben und Löschen von Dateien und Verzeichnissen. Sie ermöglicht das Arbeiten mit Dateisystem-Operationen auf einer höheren Ebene als os und ist hilfreich bei der Durchführung von Dateimanipulationen.

# Das System-Modul: `sys`

## Kommandozeilenparameter abrufen

In [3]:
!cat prg1.py

import sys

if len(sys.argv) > 1:
    for arg in sys.argv[1:]:
        print(f"Argument: {arg}")
else:
    print("Keine Argumente übergeben.")

In [4]:
!python3 prg1.py

Keine Argumente übergeben.


In [5]:
!python3 prg1.py delete all files

Argument: delete
Argument: all
Argument: files


## Exit-Code für aufrufende Programme zur Verfügung stellen

In [14]:
# Dieses "Programm" ruft prg2.py auf
import subprocess
result = subprocess.run(["python3", "prg2.py"], capture_output=True, text=True)

print(f"Ausgabe des Programms:\n{result.stdout}")
print(f"Exit-Code: {result.returncode}")

Ausgabe des Programms:
Ups!
Da ist wohl was schief gelaufen!

Exit-Code: 42


In [15]:
type(result)

subprocess.CompletedProcess

In [16]:
type(result.stdout)

str

In [17]:
result.stdout

'Ups!\nDa ist wohl was schief gelaufen!\n'

In [18]:
type(result.returncode)

int

In [19]:
result.returncode

42

## Informationen über Python-Version zur Verfügung stellen

In [24]:
import sys

print(f"Python Version: {sys.version}")
print("---")
print(f"Python Version Info: {sys.version_info}")

Python Version: 3.9.16 (main, Jan 11 2023, 16:05:54) 
[GCC 11.2.0]
---
Python Version Info: sys.version_info(major=3, minor=9, micro=16, releaselevel='final', serial=0)


In [25]:
type(sys.version)

str

In [27]:
sys.version_info.major

3

In [28]:
sys.version_info.releaselevel

'final'

## Steuern der Pfade, nach der Python nach Modulen sucht

Dies als Quizaufgabe durchführen!

In [29]:
import SuperMathe

ModuleNotFoundError: No module named 'SuperMathe'

In [30]:
import sys
sys.path

['/media/veracrypt1/09_src/central/049_python_for_sysadmin_stuff',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python39.zip',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9/lib-dynload',
 '',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9/site-packages']

In [31]:
new_path = "A/B"
if new_path not in sys.path:
    sys.path.append(new_path)

In [32]:
sys.path

['/media/veracrypt1/09_src/central/049_python_for_sysadmin_stuff',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python39.zip',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9/lib-dynload',
 '',
 '/home/juebrauer/prg/miniconda3/envs/e1/lib/python3.9/site-packages',
 'A/B']

In [33]:
import SuperMathe

In [34]:
SuperMathe.quadriere(3)

9

In [35]:
help(SuperMathe.quadriere)

Help on function quadriere in module SuperMathe:

quadriere(x)
    Diese Funktion liefert nicht x, nicht 2x, NEIN,
    x zum Quadrat zurück!



## Betriebssystem feststellen

In [36]:
import sys

print(f"Betriebssystem: {sys.platform}")

Betriebssystem: linux


## Ausgabe von `print()` umleiten

In [40]:
import sys

with open("output.txt", "w") as output_file:
    original_stdout = sys.stdout
    sys.stdout = output_file

    print("Diese Zeile wird in der Datei 'output.txt' geschrieben.")

    sys.stdout = original_stdout

print("Diese Zeile wird auf dem Bildschirm ausgegeben.")

Diese Zeile wird auf dem Bildschirm ausgegeben.


## Ausgabe der Größe von Objekten in Bytes

In [48]:
import sys

sample_list = [1, 2, 3, 4, 5, 6]
print(f"Größe der Liste in Byte: {sys.getsizeof(sample_list)}")

sample_string = "Hallo, Welt!"
print(f"Größe des Strings in Byte: {sys.getsizeof(sample_string)}")

Größe der Liste in Byte: 152
Größe des Strings in Byte: 61


# Das Betriebssystem-Modul: `os`

## Aktuelles Verzeichnis abrufen, abändern, Liste von Dateien im Verzeichnis

In [1]:
import os

# Aktuelles Verzeichnis abrufen
current_directory = os.getcwd()
print(f"Aktuelles Verzeichnis: {current_directory}")

# Verzeichnis ändern
os.chdir('A/B')
print(f"Verzeichnis geändert zu: {os.getcwd()}")

# Liste aller Dateien und Verzeichnisse im aktuellen Verzeichnis
os.listdir()

Aktuelles Verzeichnis: /media/veracrypt1/09_src/central/049_python_for_sysadmin_stuff
Verzeichnis geändert zu: /media/veracrypt1/09_src/central/049_python_for_sysadmin_stuff/A/B


['SuperMathe.py', '.ipynb_checkpoints', '__pycache__']

In [3]:
help(os.listdir)

Help on built-in function listdir in module posix:

listdir(path=None)
    Return a list containing the names of the files in the directory.
    
    path can be specified as either str, bytes, or a path-like object.  If path is bytes,
      the filenames returned will also be bytes; in all other circumstances
      the filenames returned will be str.
    If path is None, uses the path='.'.
    On some platforms, path may also be specified as an open file descriptor;\
      the file descriptor must refer to a directory.
      If this functionality is unavailable, using it raises NotImplementedError.
    
    The list is in arbitrary order.  It does not include the special
    entries '.' and '..' even if they are present in the directory.



In [6]:
print(os.listdir(".")) # ist das Gleiche wie ...
print(os.listdir())

['SuperMathe.py', '.ipynb_checkpoints', '__pycache__']
['SuperMathe.py', '.ipynb_checkpoints', '__pycache__']


In [9]:
# Was für Benutzeraccounts gibt es auf diesem Rechner?
os.listdir("/home")

['juebrauer']

## Verzeichnisse erstellen

In [16]:
new_directory = 'neues_verzeichnis'

# Einzelnes Verzeichnis erstellen
#os.mkdir(new_directory)

# Mehrere Ebenen von Verzeichnissen erstellen
# Erkläre hier auch die Bedeutung des Schalters `exist_ok`
os.makedirs('verzeichnis1/verzeichnis2/verzeichnis3', exist_ok=True)

In [12]:
help(os.mkdir)

Help on built-in function mkdir in module posix:

mkdir(path, mode=511, *, dir_fd=None)
    Create a directory.
    
    If dir_fd is not None, it should be a file descriptor open to a directory,
      and path should be relative; path will then be relative to that directory.
    dir_fd may not be implemented on your platform.
      If it is unavailable, using it will raise a NotImplementedError.
    
    The mode argument is ignored on Windows.



In [13]:
help(os.makedirs)

Help on function makedirs in module os:

makedirs(name, mode=511, exist_ok=False)
    makedirs(name [, mode=0o777][, exist_ok=False])
    
    Super-mkdir; create a leaf directory and all intermediate ones.  Works like
    mkdir, except that any intermediate path segment (not just the rightmost)
    will be created if it does not exist. If the target directory already
    exists, raise an OSError if exist_ok is False. Otherwise no exception is
    raised.  This is recursive.



## Datei oder Verzeichnis umbenennen

In [17]:
!ls

neues_verzeichnis  __pycache__	SuperMathe.py  verzeichnis1


In [18]:
!echo "Halli-Hallo" > alter_name.txt

In [19]:
!ls

alter_name.txt	neues_verzeichnis  __pycache__	SuperMathe.py  verzeichnis1


In [20]:
!cat alter_name.txt

Halli-Hallo


In [21]:
os.rename('alter_name.txt', 'neuer_name.txt')

In [22]:
!ls

neuer_name.txt	neues_verzeichnis  __pycache__	SuperMathe.py  verzeichnis1


In [23]:
os.listdir()

['SuperMathe.py',
 'neues_verzeichnis',
 '.ipynb_checkpoints',
 'verzeichnis1',
 '__pycache__',
 'neuer_name.txt']

## Quizaufgabe: Dateienamen hinsichtlich Länge normalisieren

1.) Erstelle eine Menge von leeren Dateien in Python:
    
    bild1.txt
    bild17.txt
    bild833.txt
    bild32.txt
    bild402.txt

2.) Benenne die Dateien nun so NACHTRÄGLICH um, dass sie folgendermaßen heißen:

    bild001.txt
    bild017.txt
    bild833.txt
    bild032.txt
    bild402.txt

## Überprüfen, ob ein geg. Pfad eine Datei oder ein Verzeichnis ist

Dies als Quizaufgabe durchführen!

In [10]:
import os
os.getcwd()

'/media/veracrypt1/09_src/central/049_python_for_sysadmin_stuff'

In [11]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'prg2.py',
 'prg1.py',
 'A']

In [13]:
os.mkdir("testdir")

In [14]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'prg2.py',
 'prg1.py',
 'testdir',
 'A']

In [15]:
datei = open("testfile.txt", "w")
datei.write("Test 123\n")
datei.close()

In [16]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'testfile.txt',
 'prg2.py',
 'prg1.py',
 'testdir',
 'A']

In [17]:
os.path.isfile("testdir")

False

In [18]:
os.path.isfile("testfile.txt")

True

In [19]:
os.path.exists("testdir")

True

In [20]:
os.path.exists("testfile.txt")

True

In [21]:
os.path.isdir("testdir")

True

In [22]:
os.path.isdir("testfile.txt")

False

## Eine Datei entfernen

In [23]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'testfile.txt',
 'prg2.py',
 'prg1.py',
 'testdir',
 'A']

In [24]:
# Eine Datei entfernen
if os.path.exists("output.txt"):
    os.remove("output.txt")

In [25]:
help(os.remove)

Help on built-in function remove in module posix:

remove(path, *, dir_fd=None)
    Remove a file (same as unlink()).
    
    If dir_fd is not None, it should be a file descriptor open to a directory,
      and path should be relative; path will then be relative to that directory.
    dir_fd may not be implemented on your platform.
      If it is unavailable, using it will raise a NotImplementedError.



## Ein Verzeichnis entfernen

In [30]:
if not os.path.exists("testdir"):
    os.mkdir("testdir")

In [31]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'testfile.txt',
 'prg2.py',
 'prg1.py',
 'testdir',
 'A']

In [32]:
# Ein leeres Verzeichnis entfernen
os.rmdir('testdir')

In [33]:
os.listdir()

['python_for_sysadmin_stuff.ipynb',
 '.ipynb_checkpoints',
 'testfile.txt',
 'prg2.py',
 'prg1.py',
 'A']

In [34]:
# Ein leeres Verzeichnis entfernen
# Fehler, wenn das Verzeichnis nicht da ist!
os.rmdir('testdir')

FileNotFoundError: [Errno 2] No such file or directory: 'testdir'

In [39]:
# Ein Verzeichnis und seinen Inhalt rekursiv entfernen
# Erkläre, wieso die Bedeutung des Schalters ignore_errors
import shutil
shutil.rmtree('testdir', ignore_errors=True)

In [37]:
help(shutil.rmtree)

Help on function rmtree in module shutil:

rmtree(path, ignore_errors=False, onerror=None)
    Recursively delete a directory tree.
    
    If ignore_errors is set, errors are ignored; otherwise, if onerror
    is set, it is called to handle the error with arguments (func,
    path, exc_info) where func is platform and implementation dependent;
    path is the argument to that function that caused it to fail; and
    exc_info is a tuple returned by sys.exc_info().  If ignore_errors
    is false and onerror is None, an exception is raised.



## Umgebungsvariablen abrufen und setzen

In [40]:
# Umgebungsvariable abrufen
path_variable = os.environ.get('PATH')
print(f"PATH-Variable: {path_variable}")

# Umgebungsvariable ändern
os.environ['MY_DATABASE'] = 'http://123.456.789.000:9999'

PATH-Variable: /home/juebrauer/prg/miniconda3/envs/e1/bin:/home/juebrauer/prg/go/bin:/home/juebrauer/prg/miniconda3/condabin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:/snap/bin:/home/juebrauer/link_to_vcd/09_src/GoKurs/bin


In [41]:
os.environ.get("MY_DATABASE")

'http://123.456.789.000:9999'

## Liste aller Umgebungsvariabeln erhalten

In [44]:
# Alle Umgebungsvariablen und ihre Werte auflisten
for key, value in os.environ.items():
    print(f"{key}: {value}")

SHELL: /bin/bash
SESSION_MANAGER: local/juebrauer-ThinkPad-P72:@/tmp/.ICE-unix/2437,unix/juebrauer-ThinkPad-P72:/tmp/.ICE-unix/2437
QT_ACCESSIBILITY: 1
COLORTERM: truecolor
XDG_CONFIG_DIRS: /etc/xdg/xdg-ubuntu:/etc/xdg
SSH_AGENT_LAUNCHER: gnome-keyring
XDG_MENU_PREFIX: gnome-
GNOME_DESKTOP_SESSION_ID: this-is-deprecated
CONDA_EXE: /home/juebrauer/prg/miniconda3/bin/conda
_CE_M: 
LC_ADDRESS: de_DE.UTF-8
GNOME_SHELL_SESSION_MODE: ubuntu
LC_NAME: de_DE.UTF-8
SSH_AUTH_SOCK: /run/user/1000/keyring/ssh
XMODIFIERS: @im=ibus
DESKTOP_SESSION: ubuntu
LC_MONETARY: de_DE.UTF-8
GTK_MODULES: gail:atk-bridge
PWD: /home/juebrauer/link_to_vcd
LOGNAME: juebrauer
XDG_SESSION_DESKTOP: ubuntu
XDG_SESSION_TYPE: x11
CONDA_PREFIX: /home/juebrauer/prg/miniconda3/envs/e1
GPG_AGENT_INFO: /run/user/1000/gnupg/S.gpg-agent:0:1
SYSTEMD_EXEC_PID: 2474
XAUTHORITY: /run/user/1000/gdm/Xauthority
WINDOWPATH: 2
HOME: /home/juebrauer
USERNAME: juebrauer
LC_PAPER: de_DE.UTF-8
LANG: en_US.UTF-8
LS_COLORS: rs=0:di=01;34:ln=01

## Pfad in Komponenten aufteilen

In [43]:
path = '/pfad/unterpfad1/unterpfad2/datei.txt'
head, tail = os.path.split(path)
print(f"Head: {head}")
print(f"Tail: {tail}")

Head: /pfad/unterpfad1/unterpfad2
Tail: datei.txt


# Das `subprocess`-Modul

Das `subprocess`-Modul in Python ermöglicht es Ihnen, neue Prozesse zu erzeugen, mit deren Ein- und Ausgabe zu interagieren und deren Rückgabestatus abzufragen

## Einen externen Befehl ausführen

In [2]:
import subprocess

result = subprocess.run(["echo", "Hallo, Welt!"])
print("result:", result)
print("Returncode:", result.returncode)

result: CompletedProcess(args=['echo', 'Hallo, Welt!'], returncode=0)
Returncode: 0


In [4]:
result.args

['echo', 'Hallo, Welt!']

In [5]:
result.returncode

0

In [6]:
result.stderr

In [7]:
result.stdout

## Ausgabe eines Befehls abfangen

In [14]:
import subprocess

result = subprocess.run(["echo", "Hallo, Welt!"], capture_output=True, text="True")
print("Output:", result.stdout)

Output: Hallo, Welt!



In [6]:
result.args

['echo', 'Hallo, Welt!']

In [7]:
result.stdout

b'Hallo, Welt!\n'

In [8]:
result.returncode

0

In [10]:
import subprocess

result = subprocess.run(["ls", "-la"], capture_output=True, text="True")
print("Output:", result.stdout)

Output: total 76
drwxrwxr-x  4 juebrauer juebrauer  4096 Mai  2 14:34 .
drwxrwxr-x 53 juebrauer juebrauer  4096 Apr 25 15:43 ..
drwxrwxr-x  4 juebrauer juebrauer  4096 Apr 25 16:43 A
drwxrwxr-x  2 juebrauer juebrauer  4096 Apr 25 16:51 .ipynb_checkpoints
-rw-rw-r--  1 juebrauer juebrauer   143 Apr 25 15:50 prg1.py
-rw-rw-r--  1 juebrauer juebrauer   391 Apr 25 15:58 prg2.py
-rw-rw-r--  1 juebrauer juebrauer 46525 Mai  2 14:34 python_for_sysadmin_stuff.ipynb
-rw-rw-r--  1 juebrauer juebrauer     9 Apr 25 17:21 testfile.txt



In [12]:
result.stdout

'total 76\ndrwxrwxr-x  4 juebrauer juebrauer  4096 Mai  2 14:34 .\ndrwxrwxr-x 53 juebrauer juebrauer  4096 Apr 25 15:43 ..\ndrwxrwxr-x  4 juebrauer juebrauer  4096 Apr 25 16:43 A\ndrwxrwxr-x  2 juebrauer juebrauer  4096 Apr 25 16:51 .ipynb_checkpoints\n-rw-rw-r--  1 juebrauer juebrauer   143 Apr 25 15:50 prg1.py\n-rw-rw-r--  1 juebrauer juebrauer   391 Apr 25 15:58 prg2.py\n-rw-rw-r--  1 juebrauer juebrauer 46525 Mai  2 14:34 python_for_sysadmin_stuff.ipynb\n-rw-rw-r--  1 juebrauer juebrauer     9 Apr 25 17:21 testfile.txt\n'

### Exkurs: Byte-Strings vs. Unicode-Strings

In [18]:
# Ein Unicode-String mit einem Emoji (Unicode-Codepoint: U+1F600)
unicode_string = "Hallo, Welt! 😄"
print(unicode_string)

# Versuch, den Unicode-String als Byte-String zu repräsentieren --> geht nicht!
#byte_string = b"Hallo, Welt! 😄"

# Konvertierung des Unicode-Strings in einen Byte-String mit UTF-8-Encoding
encoded_byte_string = unicode_string.encode("utf-8")
print("Unicode-String nach UTF-8-Encoding:", encoded_byte_string)

# Dekodierung des Byte-Strings zurück in einen Unicode-String
decoded_unicode_string = encoded_byte_string.decode("utf-8")
print("UTF-8-codierter Byte-String zurück in Unicode-String:", decoded_unicode_string)

Hallo, Welt! 😄
Unicode-String nach UTF-8-Encoding: b'Hallo, Welt! \xf0\x9f\x98\x84'
UTF-8-codierter Byte-String zurück in Unicode-String: Hallo, Welt! 😄


## Fehlerausgabe eines Befehls abfangen

In [25]:
import subprocess

result = subprocess.run(["ls", "/non/existent/directory"], capture_output=True, text=True)
print("Output:", result.stdout)
print("Error:", result.stderr)

Output: 
Error: ls: cannot access '/non/existent/directory': No such file or directory



## Befehl mit einer Timeout-Beschränkung ausführen

In [27]:
import subprocess

try:
    result = subprocess.run(["sleep", "5"], timeout=2)
except subprocess.TimeoutExpired:
    print("Der Befehl hat das Timeout überschritten.")

Der Befehl hat das Timeout überschritten.


In [26]:
!man sleep

SLEEP(1)                         User Commands                        SLEEP(1)

NAME
       sleep - delay for a specified amount of time

SYNOPSIS
       sleep NUMBER[SUFFIX]...
       sleep OPTION

DESCRIPTION
       Pause for NUMBER seconds.  SUFFIX may be 's' for seconds (the default),
       'm' for minutes, 'h' for hours or 'd' for days.  NUMBER need not be  an
       integer.   Given  two  or  more arguments, pause for the amount of time
       specified by the sum of their values.

       --help display this help and exit

       --version
              output version information and exit

AUTHOR
       Written by Jim Meyering and Paul Eggert.

REPORTING BUGS
       GNU coreutils online help: <https://www.gnu.org/software/coreutils/>
       Report any translation bugs to <https://translationproject.org/team/>

COPYRIGHT
       Copyright © 2020 Free Software Foundation, Inc.   License  GPLv3+:  GNU
       GPL version 3 or later <https://gnu.org/licenses/gpl.html>.
       This  is

## Ein- und Ausgabe eines Befehls steuern

In [28]:
import subprocess

p = subprocess.Popen(["cat"], stdin=subprocess.PIPE, stdout=subprocess.PIPE, text=True)
output, _ = p.communicate("Hallo, Welt!")
print("Output:", output)

Output: Hallo, Welt!


In [29]:
type(p)

subprocess.Popen

In [30]:
type(output)

str

## Ausgabe eines Befehls als Eingabe an einen anderen Befehl weiterleiten

In [31]:
import subprocess

# Erstelle einen Prozess für den 'ls'-Befehl
ls_process = subprocess.Popen(["ls"], stdout=subprocess.PIPE, text=True)

# Erstelle einen Prozess für den 'grep'-Befehl, um Dateien zu finden, die das Wort 'test' enthalten
grep_process = subprocess.Popen(["grep", "test"], stdin=ls_process.stdout, stdout=subprocess.PIPE, text=True)

# Schließe den Standardausgabekanal des 'ls'-Prozesses, damit 'grep' weiß, wann keine weiteren Daten kommen
ls_process.stdout.close()

# Kommuniziere mit dem 'grep'-Prozess und erfasse die Ausgabe
output, _ = grep_process.communicate()

print("Gefilterte Ausgabe:\n", output)

Gefilterte Ausgabe:
 testfile.txt



## Piping mit 3 Befehlen

In diesem Beispiel erstellen wir zunächst einen Prozess für den ls-Befehl und leiten seine Standardausgabe an einen PIPE-Kanal weiter. Dann erstellen wir einen zweiten Prozess für den grep-Befehl, leiten seine Standardeingabe an den PIPE-Kanal des ersten Prozesses (ls_process.stdout) und leiten seine Standardausgabe an einen weiteren PIPE-Kanal weiter. Wie im vorherigen Beispiel schließen wir den Standardausgabekanal des ls-Prozesses.

Anschließend erstellen wir einen dritten Prozess für den wc-Befehl, leiten seine Standardeingabe an den PIPE-Kanal des zweiten Prozesses (grep_process.stdout) und leiten seine Standardausgabe an einen weiteren PIPE-Kanal weiter. Wir schließen den Standardausgabekanal des grep-Prozesses, um sicherzustellen, dass der wc-Prozess weiß, wann keine weiteren Daten kommen.

Schließlich verwenden wir die communicate()-Methode, um die Ausgabe des wc-Prozesses zu erfassen und die Anzahl der Dateien, die "test" in ihren Namen enthalten, zu drucken.

Dieses Beispiel zeigt, wie subprocess.Popen() verwendet werden kann, um mehrere Prozesse miteinander zu verketten und ihre Kommunikation zu steuern. Sie können diese Technik auch auf andere Befehle oder Programme anwenden, um ihre Ausgabe und Eingabe miteinander zu verbinden.

In [33]:
import subprocess

# Erstelle einen Prozess für den 'ls'-Befehl
ls_process = subprocess.Popen(["ls"], stdout=subprocess.PIPE, text=True)

# Erstelle einen Prozess für den 'grep'-Befehl, um Dateien zu finden, die das Wort 'test' enthalten
grep_process = subprocess.Popen(["grep", "test"], stdin=ls_process.stdout, stdout=subprocess.PIPE, text=True)

# Schließe den Standardausgabekanal des 'ls'-Prozesses, damit 'grep' weiß, wann keine weiteren Daten kommen
ls_process.stdout.close()

# Erstelle einen Prozess für den 'wc'-Befehl, um die Anzahl der gefundenen Dateien zu zählen
wc_process = subprocess.Popen(["wc", "-l"], stdin=grep_process.stdout, stdout=subprocess.PIPE, text=True)

# Schließe den Standardausgabekanal des 'grep'-Prozesses, damit 'wc' weiß, wann keine weiteren Daten kommen
grep_process.stdout.close()

# Kommuniziere mit dem 'wc'-Prozess und erfasse die Ausgabe
output, _ = wc_process.communicate()

print("Anzahl der Dateien, die 'test' im Namen enthalten:", output.strip())

Anzahl der Dateien, die 'test' im Namen enthalten: 2


# Das `shutil`-Modul

Das `shutil`-Modul bietet Datei- und Verzeichnisoperationen auf High-Level-Ebene.

## Verzeichnisse kopieren

In [34]:
import shutil

source_dir = "A"
destination_dir = "A2"

# Kopiere das gesamte 'source_directory' und seinen Inhalt nach 'destination_directory'
shutil.copytree(source_dir, destination_dir)

'A2'

## Dateien/Verzeichnisse umbenennen

In [35]:
import shutil

source = "A2"
destination = "Kopie von Verz. A"

# Verschiebe/umbenenne die Datei 'source.txt' zu 'destination.txt'
shutil.move(source, destination)

'Kopie von Verz. A'

## Packen und Entpacken von Verzeichnissen

In [36]:
import shutil

# Erstelle ein ZIP-Archiv aus dem Inhalt eines Verzeichnisses
shutil.make_archive("archive", "zip", "A")

# Extrahiere den Inhalt eines ZIP-Archivs in ein Verzeichnis
shutil.unpack_archive("archive.zip", "C")

In [39]:
# Was für Archive sind bekannt?
shutil.get_archive_formats()

[('bztar', "bzip2'ed tar-file"),
 ('gztar', "gzip'ed tar-file"),
 ('tar', 'uncompressed tar file'),
 ('xztar', "xz'ed tar-file"),
 ('zip', 'ZIP file')]

## Pfade von Befehlen finden

In [38]:
shutil.which("python3")

'/home/juebrauer/prg/miniconda3/envs/e1/bin/python3'

# Das `re`-Modul

## Alle Vorkommen eines Musters in einem String finden

In [45]:
import re

text = "Python ist eine großartige Programmiersprache. Viele Leute lieben PYTHoN."
pattern = "python"

# Verwende die Flag 're.IGNORECASE' für eine case-insensitive Suche
matches = re.findall(pattern, text, re.IGNORECASE)

for match in matches:
    print("Gefundenes Muster:", match)

Gefundenes Muster: Python
Gefundenes Muster: PYTHoN


## Suchergebnisse in Gruppen festhalten

In [55]:
import re

text = "Meine Telefonnummer ist +49-12345-4567890"
pattern = r"(\+\d{1,3})-(\d{3,5})-(\d{5,7})"

match = re.search(pattern, text)

if match:
    print("Ländervorwahl:", match.group(1))
    print("Ortsvorwahl:", match.group(2))
    print("Telefonnummer:", match.group(3))
else:
    print("Keine Telefonnummer gefunden.")


Ländervorwahl: +49
Ortsvorwahl: 12345
Telefonnummer: 4567890


    r am Anfang des Musters: Das r vor dem Anführungszeichen gibt an, dass dies ein "Raw-String-Literal" ist. In Raw-String-Literalen werden Backslashes (\) als normale Zeichen behandelt und nicht als Escape-Zeichen. Das ist hilfreich, wenn Sie mit regulären Ausdrücken arbeiten, da Backslashes in regulären Ausdrücken häufig vorkommen.

    (\+\d{1,3}): Diese Gruppe sucht nach einem Pluszeichen (+) gefolgt von 1 bis 3 Ziffern (\d{1,3}). Das Pluszeichen muss in regulären Ausdrücken mit einem Backslash escaped werden, da es sonst als Quantifizierer interpretiert wird. Die runden Klammern bilden eine Gruppe, sodass Sie später auf den gefundenen Text zugreifen können (z. B. mit match.group(1)).

    -(\d{3})-: Hier suchen wir nach einem Bindestrich (-), gefolgt von genau 3 Ziffern (\d{3}) und einem weiteren Bindestrich. Die 3 Ziffern sind wieder in einer Gruppe eingeschlossen, um später darauf zugreifen zu können (z. B. mit match.group(2)).

    (\d{7}): Schließlich suchen wir nach genau 7 Ziffern (\d{7}). Diese Ziffern sind ebenfalls in einer Gruppe eingeschlossen, um später darauf zugreifen zu können (z. B. mit match.group(3)).

    Das gesamte Muster sucht also nach einer Telefonnummer, die aus einer Ländervorwahl (1 bis 3 Ziffern mit einem vorangestellten Pluszeichen), einer Ortsvorwahl (genau 3 Ziffern) und einer Telefonnummer (genau 7 Ziffern) besteht, wobei diese Elemente durch Bindestriche getrennt sind. Die Gruppen im Muster ermöglichen es Ihnen, auf die gefundenen Teile der Telefonnummer zuzugreifen und sie separat zu verwenden.

## Erlaubte Zeichen in regulären Ausdrücken

    Metazeichen:
        .: entspricht jedem Zeichen außer einem Zeilenumbruch
        ^: entspricht dem Beginn einer Zeichenkette oder Zeile (abhängig von den Flags)
        $: entspricht dem Ende einer Zeichenkette oder Zeile (abhängig von den Flags)
        *: Quantifizierer; entspricht 0 oder mehr Wiederholungen des vorherigen Zeichens oder Ausdrucks
        +: Quantifizierer; entspricht 1 oder mehr Wiederholungen des vorherigen Zeichens oder Ausdrucks
        ?: Quantifizierer; entspricht 0 oder 1 Wiederholung des vorherigen Zeichens oder Ausdrucks
        {n, m}: Quantifizierer; entspricht n bis m Wiederholungen des vorherigen Zeichens oder Ausdrucks
        |: Alternation; entspricht entweder dem Ausdruck vor oder nach dem |
        (...): Gruppierung; gruppiert einen Teil des Musters, sodass es als Einheit behandelt wird oder um auf den gefundenen Text zuzugreifen
        [...]: Zeichenklasse; entspricht einem der in den eckigen Klammern aufgeführten Zeichen
        [^...]: negative Zeichenklasse; entspricht einem Zeichen, das nicht in den eckigen Klammern aufgeführt ist

    Escape-Sequenzen:
        \d: entspricht einer Ziffer (0-9)
        \D: entspricht einem Nicht-Ziffer-Zeichen
        \s: entspricht einem Leerzeichen (Leerzeichen, Tabulator, Zeilenumbruch usw.)
        \S: entspricht einem Nicht-Leerzeichen-Zeichen
        \w: entspricht einem alphanumerischen Zeichen oder Unterstrich (a-z, A-Z, 0-9, _)
        \W: entspricht einem Nicht-Wort-Zeichen (kein Buchstabe, keine Ziffer, kein Unterstrich)
        \b: entspricht einer Wortgrenze (Übergang zwischen einem Wort- und einem Nicht-Wort-Zeichen)
        \B: entspricht einer Nicht-Wortgrenze
        \\: entspricht einem Backslash-Zeichen (um Metazeichen als normale Zeichen zu behandeln)
        \A: entspricht dem Anfang einer Zeichenkette
        \Z: entspricht dem Ende einer Zeichenkette

## Überprüfen, ob eine gültige eMail-Adresse vorliegt

In [56]:
import re

def is_valid_email(email):
    pattern = r"^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$"
    return bool(re.match(pattern, email))

# Testbeispiele
emails = [
    "test@example.com",
    "test@example",
    "test@.com",
    "test@subdomain.example.com",
    "test@subdomain.example",
]

for email in emails:
    if is_valid_email(email):
        print(f"{email} ist eine gültige E-Mail-Adresse.")
    else:
        print(f"{email} ist keine gültige E-Mail-Adresse.")


test@example.com ist eine gültige E-Mail-Adresse.
test@example ist keine gültige E-Mail-Adresse.
test@.com ist keine gültige E-Mail-Adresse.
test@subdomain.example.com ist eine gültige E-Mail-Adresse.
test@subdomain.example ist eine gültige E-Mail-Adresse.


    ^: entspricht dem Beginn der Zeichenkette
    [a-zA-Z0-9._%+-]+: entspricht einem oder mehr Zeichen aus Buchstaben, Ziffern, Punkten, Unterstrichen, Prozentzeichen, Pluszeichen und Bindestrichen
    @: entspricht dem At-Zeichen (@)
    [a-zA-Z0-9.-]+: entspricht einem oder mehr Zeichen aus Buchstaben, Ziffern, Punkten und Bindestrichen (Domainname)
    \.: entspricht einem Punkt (.)
    [a-zA-Z]{2,}: entspricht zwei oder mehr Buchstaben (Top-Level-Domain)
    $: entspricht dem Ende der Zeichenkette

