# [Zeichenketten (Strings)](https://docs.python.org/3/library/stdtypes.html#text-sequence-type-str)

Zeichenketten sind in der Systemadministration sehr nützlich für die Verarbeitung von Logdateien, Konfigurationsdateien und Ausgaben von Systembefehlen.

In [7]:
mein_string = "Willkommen zum Python Kurs von Lasse!"

# Dies ist ein Kommentar. Kommentare werden von Python ignoriert und dienen nur der Information. 
# Kommentare werden mit einem # am Anfang der Zeile geschrieben.
# Kommentare werden auch oft verwendet, um einzelne Code-Zeilen zu kommentieren.
# Für mehrzeilige Kommentare sollte man Docstrings verwenden.
"""
Dies ist ein Docstring. Docstrings werden von Python ignoriert und dienen nur der Information.
Docstrings werden mit einem \""" am Anfang und einem \""" am Ende geschrieben.
Die Dokumentation sollte keine Erklärung für jeden einzelnen Code-Block geben, sondern nur wichtige Informationen und Hinweise für den Code geben.
Dokumentation sollte immer auf Englisch sein.
"""

# In diesem Kurs werde ich Kommentare falsch verwenden, um die Inhalte zu erklären.
# In einem professionellen Umfeld sollte man Kommentare nur verwenden, wenn es wirklich notwendig ist.

print(mein_string) # Gibt den Wert des Strings aus

Willkommen zum Python Kurs von Lasse!


In [8]:
print(f"Typ: {type(mein_string)}") # Gibt den Typ des Strings aus
print(f"Länge: {len(mein_string)}") # Gibt die Länge des Strings aus

Typ: <class 'str'>
Länge: 37


## Grundlegende String-Operationen

### Indexierung und Slicing

Indexierung und Slicing sind grundlegende Operationen, die in der Systemadministration häufig verwendet werden, um bestimmte Teile eines Strings zu extrahieren oder zu manipulieren.


In [5]:
log_eintrag = "2023-05-15 10:30:15 ERROR: Festplatte voll"
print(f"Erstes Zeichen: {log_eintrag[0]}") # Gibt das erste Zeichen des Strings aus
print(f"Letztes Zeichen: {log_eintrag[-1]}") # Gibt das letzte Zeichen des Strings aus
print(f"Datum: {log_eintrag[:10]}") # Gibt den Teil des Strings vom Anfang bis zum 10. Zeichen aus
print(f"Uhrzeit: {log_eintrag[11:19]}") # Gibt den Teil des Strings vom 11. bis zum 19. Zeichen aus
print(f"Fehlertyp: {log_eintrag[20:25]}") # Gibt den Teil des Strings vom 20. bis zum 25. Zeichen aus
print(f"Fehler: {log_eintrag[27:]}") # Gibt den Teil des Strings vom 27. Zeichen bis zum Ende aus

Erstes Zeichen: 2
Letztes Zeichen: l
Datum: 2023-05-15
Uhrzeit: 10:30:15
Fehlertyp: ERROR
Fehler: Festplatte voll


### Einhaltung von [PEP8](https://www.python.org/dev/peps/pep-0008/#maximum-line-length) bei langen Zeichenketten

In der Systemadministration können lange Zeichenketten beispielsweise bei der Erstellung von Konfigurationsdateien oder Skripten vorkommen.

In [1]:
lange_zeichenkette = (
    "Dies ist ein Beispiel für eine lange Zeichenkette, "
    "die in der Systemadministration vorkommen könnte. "
    "Sie könnte beispielsweise eine komplexe Konfiguration "
    "oder einen langen Befehl darstellen."
    "Ein String kann auch Sonderzeichen enthalten. !@#$%^&*()_+-=[]{}|;:,.<>? "
    "und viele mehr."
)
print(lange_zeichenkette)

Dies ist ein Beispiel für eine lange Zeichenkette, die in der Systemadministration vorkommen könnte. Sie könnte beispielsweise eine komplexe Konfiguration oder einen langen Befehl darstellen.Ein String kann auch Sonderzeichen enthalten. !@#$%^&*()_+-=[]{}|;:,.<>? und viele mehr.


## `str.replace()`

Die `replace()`-Methode ist besonders nützlich in der Systemadministration, um Textersetzungen in Konfigurationsdateien oder Logdateien vorzunehmen.

In [None]:
help(str.replace)

In [None]:
konfiguration = "server_ip = 192.168.1.100"
neue_konfiguration = konfiguration.replace("192.168.1.100", "10.0.0.1") # Ersetzt den alten Wert durch den neuen Wert
print(f"Alte Konfiguration: {konfiguration}") # Gibt die alte Konfiguration aus
print(f"Neue Konfiguration: {neue_konfiguration}") # Gibt die neue Konfiguration aus

## f-strings

F-Strings sind sehr nützlich in der Systemadministration, um dynamische Werte in Strings einzufügen, z.B. für Logmeldungen oder Konfigurationsdateien.

In [9]:
hostname = "webserver01"
ip_adresse = "192.168.1.10"
cpu_auslastung = 75.5
ram_nutzung = 8.2
print(f"Server {hostname} (IP: {ip_adresse})")
print(f"CPU-Auslastung: {cpu_auslastung}%")
print(f"RAM-Nutzung: {ram_nutzung}%")
print(f"Status: {'OK' if cpu_auslastung < 80 and ram_nutzung < 90 else 'KRITISCH'}")

Server webserver01 (IP: 192.168.1.10)
CPU-Auslastung: 75.5%
RAM-Nutzung: 8.2%
Status: OK


### Alternative Formatierungsmethoden

Neben f-strings gibt es noch andere Möglichkeiten zur String-Formatierung in Python.

## `.format()` Methode und `%-Formatierung`

Die `.format()` Methode ist eine weitere Möglichkeit zur String-Formatierung in Python. Sie bietet eine flexible und lesbare Art, Werte in Strings einzufügen.

Die `%-Formatierung` ist veraltet, aber in der Systemadministration noch häufig verwendet

In [None]:
print("Server {} (IP: {})".format(hostname, ip_adresse))
print("CPU-Auslastung: {:.1f}%".format(cpu_auslastung))
print("RAM-Nutzung: {:.1f} GB".format(ram_nutzung))


print("Server %s (IP: %s)" % (hostname, ip_adresse))
print("CPU-Auslastung: %.1f%%" % cpu_auslastung)
print("RAM-Nutzung: %.1f GB" % ram_nutzung)

## `str.join()`

Die `join()`-Methode ist besonders nützlich in der Systemadministration, um Listen von Strings zu einem einzelnen String zusammenzufügen, z.B. bei der Erstellung von Kommandozeilenargumenten oder Pfaden.

In [None]:
log_dateien = ["system.log", "apache_access.log", "mysql_error.log"]
zu_analysierende_logs = " ".join(log_dateien)
print(f"grep 'ERROR' {zu_analysierende_logs}")

## `str.upper(), str.lower(), str.title()`

Diese Methoden sind in der Systemadministration nützlich für die Formatierung von Texten, z.B. bei der Vereinheitlichung von Benutzereingaben oder der Formatierung von Ausgaben.

In [None]:
benutzer_eingabe = "AkTiViErEn"
print(f"Ursprüngliche Eingabe: {benutzer_eingabe}")
print(f"Großbuchstaben: {benutzer_eingabe.upper()}")
print(f"Kleinbuchstaben: {benutzer_eingabe.lower()}")
print(f"Titel-Format: {benutzer_eingabe.title()}")

## `str.strip()`

Die `strip()`-Methode ist besonders nützlich in der Systemadministration, um unerwünschte Leerzeichen oder Zeilenumbrüche aus Eingaben oder Dateiinhalten zu entfernen.

In [None]:
log_zeile = " \n \t 2023-05-15 10:30:15 ERROR: Festplatte voll \n"
bereinigt = log_zeile.strip()
print(f"Original: {repr(log_zeile)}")
print(f"Bereinigt: {repr(bereinigt)}")

## `str.split()`

Die `split()`-Methode ist in der Systemadministration sehr nützlich, um Strings in Listen aufzuteilen, z.B. bei der Verarbeitung von Logdateien oder Kommandozeilenausgaben.

In [None]:
prozess_info = "apache2 1234 www-data 0.5 5.2 10:30:15"
felder = prozess_info.split() # Splitet den String anhand des Leerzeichens und gibt eine Liste von Strings zurück
print(f"Prozessname: {felder[0]}") # Gibt den ersten Wert der Liste aus
print(f"PID: {felder[1]}") # Gibt den zweiten Wert der Liste aus
print(f"Benutzer: {felder[2]}") # Gibt den dritten Wert der Liste aus
print(f"CPU-Nutzung: {felder[3]}%") # Gibt den vierten Wert der Liste aus
print(f"Speichernutzung: {felder[4]}%") # Gibt den fünften Wert der Liste aus
print(f"Startzeit: {felder[5]}") # Gibt den sechsten Wert der Liste aus

## `str.startswith()` und `str.endswith()`, 

Die `str.startswith()`-Methode ist in der Systemadministration nützlich, um zu überprüfen, ob ein String mit einem bestimmten Präfix beginnt. Dies kann bei der Filterung von Logdateien, der Überprüfung von Dateinamen oder der Validierung von Benutzereingaben hilfreich sein.

Die `str.endswith()`-Methode ist in der Systemadministration nützlich, um zu überprüfen, ob ein String mit einem bestimmten Suffix endet. Dies kann ebenfalls bei der Filterung von Logdateien, der Überprüfung von Dateiendungen oder der Validierung von Benutzereingaben hilfreich sein.

In [10]:
dateiname = "server_log_2024.txt"
print(f"Beginnt mit 'server_log': {dateiname.startswith('server_log')}") # Prüft ob der String mit "server_log" beginnt
print(f"Endet mit '.txt': {dateiname.endswith('.txt')}") # Prüft ob der String mit ".txt" endet


Beginnt mit 'server_log': True
Endet mit '.txt': True


## `str.find()`

Die `find()`-Methode ist in der Systemadministration sehr nützlich, um die Position eines Substrings in einem String zu finden. Dies kann bei der Analyse von Logdateien, der Extraktion von Informationen aus strukturierten Texten oder der Verarbeitung von Konfigurationsdateien hilfreich sein.

In [6]:
log_eintrag = "2023-05-15 10:30:15 ERROR: Festplatte voll"
fehler_position = log_eintrag.find("ERROR")
if fehler_position != -1:
    print(f"Fehlermeldung gefunden an Position: {fehler_position}")
    fehler_nachricht = log_eintrag[fehler_position + 7:]  # +7 um "ERROR: " zu überspringen
    print(f"Fehlernachricht: {fehler_nachricht}")
else:
    print("Keine Fehlermeldung gefunden")

# Beispiel für die Verwendung von find() mit einem Startindex
zeitstempel_ende = log_eintrag.find(" ", 10)  # Suche nach dem ersten Leerzeichen ab Position 10
if zeitstempel_ende != -1:
    zeitstempel = log_eintrag[:zeitstempel_ende]
    print(f"Zeitstempel: {zeitstempel}")

# Beispiel für die Verwendung von find(), wenn der Substring nicht gefunden wird
nicht_vorhanden = log_eintrag.find("WARNING")
print(f"Position von 'WARNING': {nicht_vorhanden}")  # Gibt -1 aus, da 'WARNING' nicht im String vorkommt


Fehlermeldung gefunden an Position: 20
Fehlernachricht: Festplatte voll
Zeitstempel: 2023-05-15


## Verkettung mehrerer Methoden

In der Systemadministration ist es oft nützlich, mehrere String-Methoden hintereinander aufzurufen, um Daten effizient zu verarbeiten.

In [11]:
log_eintrag = "   [WARNUNG] Festplattenplatz niedrig (10% frei)   "
bereinigter_eintrag = log_eintrag.strip().lower().replace("warnung", "KRITISCH")
print(f"Original: {log_eintrag}")
print(f"Bereinigt: {bereinigter_eintrag}")

Original:    [WARNUNG] Festplattenplatz niedrig (10% frei)   
Bereinigt: [KRITISCH] festplattenplatz niedrig (10% frei)


## [Escape-Zeichen](https://docs.python.org/3/reference/lexical_analysis.html#string-and-bytes-literals)

Escape-Zeichen sind in der Systemadministration wichtig, um spezielle Zeichen in Strings darzustellen, z.B. in Skripten oder Konfigurationsdateien.

In [12]:
pfad = "C:\\Users\\Admin\\Scripts"
print(f"Windows-Pfad: {pfad}")

mehrzeilig = "Erste Zeile\nZweite Zeile\nDritte Zeile"
print(f"Mehrzeiliger Text:\n{mehrzeilig}")

escaped_string = ("Hier ist eine Liste von häufig verwendeten Escape-Zeichen in Python mit Erklärungen:\n"
                  "- \\n: Zeilenumbruch (new line) - Beginnt eine neue Zeile\n"
                  "- \\t: Tabulator - Fügt einen horizontalen Tabulator ein\n"
                  "- \\r: Wagenrücklauf (carriage return) - Setzt den Cursor an den Anfang der aktuellen Zeile\n"
                  "- \\b: Backspace - Löscht das vorherige Zeichen\n"
                  "- \\f: Seitenvorschub (form feed) - Beginnt eine neue Seite (in Druckern oder Textverarbeitungen)\n"
                  "- \\': Einzelnes Anführungszeichen - Ermöglicht die Verwendung in Strings mit einfachen Anführungszeichen\n"
                  "- \\\": Doppeltes Anführungszeichen - Ermöglicht die Verwendung in Strings mit doppelten Anführungszeichen\n"
                  "- \\\\: Backslash - Stellt einen Backslash im String dar\n"
                  "- \\uXXXX: Unicode-Zeichen - Stellt ein Unicode-Zeichen mit dem 4-stelligen Hexadezimalcode XXXX dar\n"
                  "- \\xXX: ASCII-Zeichen - Stellt ein ASCII-Zeichen mit dem 2-stelligen Hexadezimalcode XX dar")
print(escaped_string)

# Beispiele für die Anwendung einiger Escape-Zeichen
print("\nBeispiele:")
print("Unicode-Herz: \u2764")
print("Tab-getrennte\tWerte")

Windows-Pfad: C:\Users\Admin\Scripts
Mehrzeiliger Text:
Erste Zeile
Zweite Zeile
Dritte Zeile
Hier ist eine Liste von häufig verwendeten Escape-Zeichen in Python mit Erklärungen:
- \n: Zeilenumbruch (new line) - Beginnt eine neue Zeile
- \t: Tabulator - Fügt einen horizontalen Tabulator ein
- \r: Wagenrücklauf (carriage return) - Setzt den Cursor an den Anfang der aktuellen Zeile
- \b: Backspace - Löscht das vorherige Zeichen
- \f: Seitenvorschub (form feed) - Beginnt eine neue Seite (in Druckern oder Textverarbeitungen)
- \': Einzelnes Anführungszeichen - Ermöglicht die Verwendung in Strings mit einfachen Anführungszeichen
- \": Doppeltes Anführungszeichen - Ermöglicht die Verwendung in Strings mit doppelten Anführungszeichen
- \\: Backslash - Stellt einen Backslash im String dar
- \uXXXX: Unicode-Zeichen - Stellt ein Unicode-Zeichen mit dem 4-stelligen Hexadezimalcode XXXX dar
- \xXX: ASCII-Zeichen - Stellt ein ASCII-Zeichen mit dem 2-stelligen Hexadezimalcode XX dar

Beispiele:
Unic