# Python String-Operationen - Übersicht und Beispiele

Strings sind einer der wichtigsten Datentypen in Python. Dieses Notebook zeigt die wichtigsten String-Operationen und -Methoden mit praktischen Beispielen.

## Inhaltsverzeichnis
1. Grundlagen und String-Erstellung
2. String-Formatierung
3. String-Methoden und Manipulation
4. Suchen und Ersetzen
5. Aufteilen und Verbinden
6. String-Validierung und Prüfungen
7. Reguläre Ausdrücke]
8. Encoding und Unicode
9. String-Vergleiche und Sortierung

---

## 1. Grundlagen und String-Erstellung 

In [None]:
# Einfache Strings
einfacher_string = "Hallo Welt"
anderer_string = 'Python ist großartig'
print(f"Einfache Strings: '{einfacher_string}' und '{anderer_string}'")

# Mehrzeilige Strings
mehrzeiliger_string = """Dies ist ein
mehrzeiliger String
mit mehreren Zeilen"""

alternativer_string = '''Auch mit
einfachen Anführungszeichen
möglich'''

print("Mehrzeiliger String:")
print(mehrzeiliger_string)

# String-Länge und grundlegende Info
text = "Python Programmierung"
print(f"\nString-Informationen für '{text}':")
print(f"  Länge: {len(text)}")
print(f"  Typ: {type(text)}")
print(f"  Erstes Zeichen: '{text[0]}'")
print(f"  Letztes Zeichen: '{text[-1]}'")

### String-Indizierung und Slicing

In [None]:
# String-Zugriff mit Indizes
beispiel_text = "Python ist fantastisch!"
print(f"Beispieltext: '{beispiel_text}'")
print(f"Länge: {len(beispiel_text)}")

print("\nIndizierung:")
print(f"  Index 0: '{beispiel_text[0]}'")
print(f"  Index 7: '{beispiel_text[7]}'")
print(f"  Index -1 (letztes): '{beispiel_text[-1]}'")
print(f"  Index -2 (vorletztes): '{beispiel_text[-2]}'")

print("\nSlicing:")
print(f"  [0:6]: '{beispiel_text[0:6]}'")
print(f"  [7:10]: '{beispiel_text[7:10]}'")
print(f"  [:6]: '{beispiel_text[:6]}'")
print(f"  [7:]: '{beispiel_text[7:]}'")
print(f"  [::2]: '{beispiel_text[::2]}'")  # Jedes zweite Zeichen
print(f"  [::-1]: '{beispiel_text[::-1]}'")  # Umgekehrt

# String-Iteration
print("\nZeichen-Iteration:")
for i, zeichen in enumerate(beispiel_text[:10]):  # Nur erste 10 Zeichen
    print(f"  Position {i}: '{zeichen}'")

---

## 2. String-Formatierung

### Moderne f-String Formatierung (Python 3.6+)

In [None]:
# f-String Beispiele
name = "Anna"
alter = 25
gehalt = 45000.50
pi = 3.14159265359

print("f-String Formatierung:")
print(f"Name: {name}")
print(f"Alter: {alter} Jahre")
print(f"In 10 Jahren: {alter + 10} Jahre")

# Zahlenformatierung
print(f"\nZahlenformatierung:")
print(f"Gehalt: {gehalt:.2f} EUR")
print(f"Gehalt (mit Tausendertrennzeichen): {gehalt:,.2f} EUR")
print(f"Pi auf 3 Stellen: {pi:.3f}")
print(f"Pi in wissenschaftlicher Notation: {pi:.2e}")

# Ausrichtung und Padding
print(f"\nAusrichtung:")
print(f"Links ausgerichtet: '{name:<10}'")
print(f"Rechts ausgerichtet: '{name:>10}'")
print(f"Zentriert: '{name:^10}'")
print(f"Mit Füllzeichen: '{name:*^15}'")

# Datum und Zeit
from datetime import datetime
jetzt = datetime.now()
print(f"\nDatum/Zeit Formatierung:")
print(f"Aktuell: {jetzt}")
print(f"Formatiert: {jetzt:%d.%m.%Y %H:%M:%S}")
print(f"Nur Datum: {jetzt:%d.%m.%Y}")

### Weitere Formatierungsmethoden

In [None]:
# .format() Methode
template = "Hallo {name}, du bist {alter} Jahre alt und verdienst {gehalt:.2f} EUR"
formatiert = template.format(name=name, alter=alter, gehalt=gehalt)
print("format() Methode:")
print(formatiert)

# Mit Positionen
template2 = "Hallo {0}, du bist {1} Jahre alt"
formatiert2 = template2.format(name, alter)
print(formatiert2)

# Alte %-Formatierung (noch gültig, aber nicht empfohlen)
alte_formatierung = "Hallo %s, du bist %d Jahre alt" % (name, alter)
print("Alte %-Formatierung:")
print(alte_formatierung)

# Template Strings (für benutzerdefinierte Formatierung)
from string import Template
tmpl = Template("Hallo $name, willkommen in $stadt!")
ergebnis = tmpl.substitute(name=name, stadt="Berlin")
print("Template String:")
print(ergebnis)

---

## 3. String-Methoden und Manipulation

### Groß-/Kleinschreibung

In [None]:
test_text = "PyThOn PrOgRaMmIeRuNg"
print(f"Original: '{test_text}'")

print("\nGroß-/Kleinschreibung:")
print(f"  lower(): '{test_text.lower()}'")
print(f"  upper(): '{test_text.upper()}'")
print(f"  capitalize(): '{test_text.capitalize()}'")
print(f"  title(): '{test_text.title()}'")
print(f"  swapcase(): '{test_text.swapcase()}'")

# Überprüfung der Schreibweise
beispiele = ["GROSSBUCHSTABEN", "kleinbuchstaben", "Gemischt", "123ABC", "abc123"]
print("\nSchreibweise-Überprüfung:")
for text in beispiele:
    print(f"  '{text}': isupper={text.isupper()}, islower={text.islower()}, istitle={text.istitle()}")

### Whitespace-Behandlung

In [None]:
# Whitespace entfernen
unordentlicher_text = "   Hallo Welt!   \n\t  "
print(f"Original (mit Anführungszeichen): '{unordentlicher_text}'")

print("\nWhitespace-Bereinigung:")
print(f"  strip(): '{unordentlicher_text.strip()}'")
print(f"  lstrip(): '{unordentlicher_text.lstrip()}'")
print(f"  rstrip(): '{unordentlicher_text.rstrip()}'")

# Spezifische Zeichen entfernen
text_mit_punkten = "...Hallo Welt!..."
print(f"\nSpezifische Zeichen entfernen:")
print(f"  Original: '{text_mit_punkten}'")
print(f"  strip('.'): '{text_mit_punkten.strip('.')}'")

# Whitespace durch andere Zeichen ersetzen
text_mit_tabs = "Hallo\tWelt\tPython"
print(f"\nTab-Behandlung:")
print(f"  Original: '{text_mit_tabs}'")
print(f"  expandtabs(4): '{text_mit_tabs.expandtabs(8)}'")

### String-Ausrichtung und Auffüllung

In [None]:
wort = "Python"
print(f"Original: '{wort}'")

print("\nAusrichtung und Auffüllung:")
print(f"  ljust(15): '{wort.ljust(15)}'")
print(f"  rjust(15): '{wort.rjust(15)}'")
print(f"  center(15): '{wort.center(15)}'")
print(f"  center(15, '*'): '{wort.center(15, '*')}'")
print(f"  zfill(10): '{wort.zfill(10)}'")

# Zahlen auffüllen
nummer = "42"
print(f"\nZahlen auffüllen:")
print(f"  '{nummer}' -> zfill(5): '{nummer.zfill(5)}'")

---

## 4. Suchen und Ersetzen

### String-Suche

In [None]:
langer_text = "Python ist eine großartige Programmiersprache. Python macht Spaß!"
suchbegriff = "Python"

print(f"Text: '{langer_text}'")
print(f"Suchbegriff: '{suchbegriff}'")

print("\nSuch-Methoden:")
print(f"  find('{suchbegriff}'): {langer_text.find(suchbegriff)}")
print(f"  rfind('{suchbegriff}'): {langer_text.rfind(suchbegriff)}")
print(f"  index('{suchbegriff}'): {langer_text.index(suchbegriff)}")
print(f"  count('{suchbegriff}'): {langer_text.count(suchbegriff)}")

# Boolean-Suchen
print(f"\nBoolean-Suchen:")
print(f"  '{suchbegriff}' in text: {suchbegriff in langer_text}")
print(f"  startswith('Python'): {langer_text.startswith('Python')}")
print(f"  endswith('Spaß!'): {langer_text.endswith('Spaß!')}")

# Case-insensitive Suche
print(f"  'python' in text (case-sensitive): {'python' in langer_text}")
print(f"  'python' in text.lower(): {'python' in langer_text.lower()}")

# Alle Positionen finden
def find_all_positions(text, substring):
    positions = []
    start = 0
    while True:
        pos = text.find(substring, start)
        if pos == -1:
            break
        positions.append(pos)
        start = pos + 1
    return positions

alle_positionen = find_all_positions(langer_text, "e")
print(f"\nAlle Positionen von 'e': {alle_positionen}")

### String-Ersetzung

In [None]:
original_text = "Ich mag Java. Java ist toll. Java macht Spaß!"
print(f"Original: '{original_text}'")

print("\nErsetzungs-Methoden:")
# Alle Vorkommen ersetzen
ersetzt_alle = original_text.replace("Java", "Python")
print(f"  replace('Java', 'Python'): '{ersetzt_alle}'")

# Begrenzte Anzahl ersetzen
ersetzt_begrenzt = original_text.replace("Java", "Python", 2)
print(f"  replace('Java', 'Python', 2): '{ersetzt_begrenzt}'")

# Mehrfache Ersetzungen
def multiple_replace(text, replacements):
    for old, new in replacements.items():
        text = text.replace(old, new)
    return text

ersetzungen = {"Java": "Python", "toll": "fantastisch", "Spaß": "Freude"}
mehrfach_ersetzt = multiple_replace(original_text, ersetzungen)
print(f"  Mehrfache Ersetzung: '{mehrfach_ersetzt}'")

# Case-insensitive Ersetzung
def replace_case_insensitive(text, old, new):
    import re
    return re.sub(re.escape(old), new, text, flags=re.IGNORECASE)

case_ersetzt = replace_case_insensitive("JAVA java Java", "java", "Python")
print(f"  Case-insensitive: '{case_ersetzt}'")

---

## 5. Aufteilen und Verbinden

### String aufteilen

In [None]:
# Verschiedene Trennzeichen
csv_data = "Anna,25,Berlin,Entwicklerin"
space_data = "Python ist eine großartige Sprache"
mixed_data = "Apfel;Banane,Orange:Traube"

print("String-Aufteilung:")
print(f"CSV-Daten: '{csv_data}'")
print(f"  split(','): {csv_data.split(',')}")

print(f"\nSpace-separated: '{space_data}'")
print(f"  split(): {space_data.split()}")  # Standardmäßig bei Whitespace
print(f"  split(' ', 2): {space_data.split(' ', 2)}")  # Nur 2 Teilungen

print(f"\nGemischte Trennzeichen: '{mixed_data}'")
# Mehrere Trennzeichen mit regex
import re
teile = re.split('[;,:]+', mixed_data)
print(f"  re.split('[;,:]+', text): {teile}")

# Zeilen aufteilen
mehrzeiliger_text = """Erste Zeile
Zweite Zeile
Dritte Zeile"""
print(f"\nMehrzeiliger Text aufteilen:")
zeilen = mehrzeiliger_text.splitlines()
print(f"  splitlines(): {zeilen}")

# Partition (teilt nur beim ersten Vorkommen)
email = "benutzer@example.com"
print(f"\nPartition bei '{email}':")
benutzer, at, domain = email.partition('@')
print(f"  partition('@'): benutzer='{benutzer}', at='{at}', domain='{domain}'")

### Strings verbinden

In [None]:
# Liste von Strings verbinden
früchte = ["Apfel", "Banane", "Orange", "Traube"]
print("String-Verbindung:")
print(f"Liste: {früchte}")

print(f"  join mit Komma: '{', '.join(früchte)}'")
print(f"  join mit ' und ': '{' und '.join(früchte)}'")
print(f"  join ohne Trennzeichen: '{''.join(früchte)}'")

# Zahlen verbinden (müssen erst zu Strings konvertiert werden)
zahlen = [1, 2, 3, 4, 5]
zahlen_string = ", ".join(map(str, zahlen))
print(f"  Zahlen verbinden: '{zahlen_string}'")

# Pfade verbinden (sicherer mit os.path.join für echte Pfade)
pfad_teile = ["home", "benutzer", "dokumente", "datei.txt"]
pfad = "/".join(pfad_teile)
print(f"  Pfad verbinden: '{pfad}'")

# Komplexere Verbindungen
personen = [
    {"name": "Anna", "alter": 25},
    {"name": "Bob", "alter": 30},
    {"name": "Clara", "alter": 28}
]

personen_liste = ", ".join([f"{p['name']} ({p['alter']})" for p in personen])
print(f"  Personen-Liste: '{personen_liste}'")

---

## 6. String-Validierung und Prüfungen

### Zeichen-Typ Prüfungen

In [None]:
test_strings = [
    "12345",      # Nur Ziffern
    "AbcDef",     # Nur Buchstaben
    "Abc123",     # Alphanumerisch
    "   ",        # Nur Whitespace
    "Hello World", # Alphanumerisch mit Space
    "",           # Leer
    "١٢٣٤٥",      # Unicode-Ziffern
    "αβγδε"       # Unicode-Buchstaben
]

print("String-Validierung:")
print(f"{'String':<15} {'isdigit':<8} {'isalpha':<8} {'isalnum':<8} {'isspace':<8} {'isupper':<8} {'islower':<8}")
print("-" * 80)

for s in test_strings:
    display_s = repr(s) if s == "" or s.isspace() else s
    print(f"{display_s:<15} {s.isdigit()!s:<8} {s.isalpha()!s:<8} {s.isalnum()!s:<8} {s.isspace()!s:<8} {s.isupper()!s:<8} {s.islower()!s:<8}")

# Spezielle Prüfungen
print(f"\nSpezielle Prüfungen:")
test_cases = {
    "123": "isdecimal",
    "abc": "isascii",
    "Hello": "istitle",
    "hello_world": "isidentifier",
    "123abc": "isidentifier"
}

for text, method in test_cases.items():
    result = getattr(text, method)()
    print(f"  '{text}'.{method}(): {result}")

### Praktische Validierungsfunktionen

In [None]:
def validate_email(email):
    """Einfache E-Mail-Validierung"""
    if "@" not in email:
        return False, "Kein @ gefunden"
    
    parts = email.split("@")
    if len(parts) != 2:
        return False, "Mehr als ein @ gefunden"
    
    local, domain = parts
    if not local or not domain:
        return False, "Lokaler Teil oder Domain fehlt"
    
    if "." not in domain:
        return False, "Kein Punkt in Domain"
    
    return True, "Gültig"

def validate_phone(phone):
    """Einfache Telefonnummer-Validierung"""
    # Entfernen von Leerzeichen und Bindestrichen
    cleaned = phone.replace(" ", "").replace("-", "").replace("(", "").replace(")", "")
    
    if cleaned.startswith("+"):
        cleaned = cleaned[1:]
    
    if not cleaned.isdigit():
        return False, "Enthält ungültige Zeichen"
    
    if len(cleaned) < 7 or len(cleaned) > 15:
        return False, "Ungültige Länge"
    
    return True, "Gültig"

def validate_password(password):
    """Passwort-Stärke prüfen"""
    errors = []
    
    if len(password) < 8:
        errors.append("Mindestens 8 Zeichen")
    
    if not any(c.isupper() for c in password):
        errors.append("Mindestens ein Großbuchstabe")
    
    if not any(c.islower() for c in password):
        errors.append("Mindestens ein Kleinbuchstabe")
    
    if not any(c.isdigit() for c in password):
        errors.append("Mindestens eine Zahl")
    
    special_chars = "!@#$%^&*()_+-=[]{}|;:,.<>?"
    if not any(c in special_chars for c in password):
        errors.append("Mindestens ein Sonderzeichen")
    
    if errors:
        return False, "; ".join(errors)
    return True, "Starkes Passwort"

# Tests der Validierungsfunktionen
print("\nValidierungs-Tests:")

emails = ["test@example.com", "invalid.email", "user@domain", "multi@@domain.com"]
for email in emails:
    valid, msg = validate_email(email)
    print(f"  E-Mail '{email}': {'✓' if valid else '✗'} {msg}")

phones = ["+49 123 456789", "0123-456-7890", "123", "abc-def-ghij"]
for phone in phones:
    valid, msg = validate_phone(phone)
    print(f"  Telefon '{phone}': {'✓' if valid else '✗'} {msg}")

passwords = ["Passwort123!", "schwach", "StarkesPasswort123!", "NoSpecial123"]
for pwd in passwords:
    valid, msg = validate_password(pwd)
    print(f"  Passwort '{pwd}': {'✓' if valid else '✗'} {msg}")


---

## 7. String-Vergleiche und Sortierung

### Verschiedene Vergleichsarten

In [None]:
# Basis-Vergleiche
strings = ["Python", "python", "PYTHON", "Java", "java"]

print("String-Vergleiche:")
print("Exakte Vergleiche:")
for s in strings:
    print(f"  '{s}' == 'Python': {s == 'Python'}")

print("\nCase-insensitive Vergleiche:")
for s in strings:
    print(f"  '{s}'.lower() == 'python': {s.lower() == 'python'}")

# Lexikographische Vergleiche
print(f"\nLexikographische Vergleiche:")
vergleiche = [("abc", "abd"), ("Apple", "apple"), ("123", "45")]
for a, b in vergleiche:
    print(f"  '{a}' < '{b}': {a < b}")
    print(f"  '{a}' > '{b}': {a > b}")

# String-Ähnlichkeit (einfache Implementierung)
def string_similarity(s1, s2):
    """Einfache Ähnlichkeitsberechnung basierend auf gemeinsamen Zeichen"""
    s1, s2 = s1.lower(), s2.lower()
    gemeinsam = len(set(s1) & set(s2))
    gesamt = len(set(s1) | set(s2))
    return gemeinsam / gesamt if gesamt > 0 else 0

print(f"\nString-Ähnlichkeit:")
wort_paare = [("Python", "Jython"), ("Hallo", "Hello"), ("abc", "xyz")]
for w1, w2 in wort_paare:
    ähnlichkeit = string_similarity(w1, w2)
    print(f"  '{w1}' vs '{w2}': {ähnlichkeit:.2f}")


### Sortierung und Locale

In [None]:
# String-Sortierung
namen = ["Müller", "Schmidt", "Öztürk", "Andersson", "álex", "Zöller"]
print(f"Unsortiert: {namen}")

# Standard-Sortierung (ASCII)
standard_sortiert = sorted(namen)
print(f"Standard sortiert: {standard_sortiert}")

# Case-insensitive Sortierung
case_insensitive = sorted(namen, key=str.lower)
print(f"Case-insensitive: {case_insensitive}")

# Längen-Sortierung
nach_länge = sorted(namen, key=len)
print(f"Nach Länge: {nach_länge}")

# Umgekehrte Sortierung
umgekehrt = sorted(namen, reverse=True)
print(f"Umgekehrt: {umgekehrt}")

# Natürliche Sortierung (für Zahlen in Strings)
gemischte_liste = ["item1", "item10", "item2", "item20", "item3"]
print(f"\nGemischte Liste: {gemischte_liste}")
print(f"Standard sortiert: {sorted(gemischte_liste)}")

# Natürliche Sortierung (vereinfacht)
import re
def natural_sort_key(text):
    return [int(part) if part.isdigit() else part.lower() 
            for part in re.split(r'(\d+)', text)]

natürlich_sortiert = sorted(gemischte_liste, key=natural_sort_key)
print(f"Natürlich sortiert: {natürlich_sortiert}")

# Benutzerdefinierte Sortierung
personen = [
    "Anna Müller",
    "Bob Schmidt", 
    "Clara Öztürk",
    "David Andersson"
]

# Nach Nachnamen sortieren
def nachname_key(vollname):
    return vollname.split()[-1].lower()

nach_nachname = sorted(personen, key=nachname_key)
print(f"\nPersonen nach Nachname: {nach_nachname}")


---

## Zusammenfassung der wichtigsten String-Operationen

| Kategorie | Methode/Operation | Beschreibung |
|-----------|------------------|--------------|
| **Grundlagen** | `len(s)` | String-Länge |
| | `s[i]`, `s[i:j]` | Indizierung und Slicing |
| | `s1 + s2` | String-Konkatenation |
| **Formatierung** | `f"{var}"` | f-String (empfohlen) |
| | `s.format()` | format()-Methode |
| | `s % values` | %-Formatierung (veraltet) |
| **Manipulation** | `s.lower()`, `s.upper()` | Groß-/Kleinschreibung |
| | `s.strip()` | Whitespace entfernen |
| | `s.replace(old, new)` | Text ersetzen |
| **Suchen** | `s.find(sub)` | Substring-Position |
| | `s.count(sub)` | Anzahl Vorkommen |
| | `sub in s` | Enthält Substring |
| | `s.startswith()`, `s.endswith()` | Präfix/Suffix prüfen |
| **Aufteilen** | `s.split(sep)` | String aufteilen |
| | `sep.join(list)` | Liste verbinden |
| | `s.splitlines()` | Zeilen aufteilen |
| **Validierung** | `s.isdigit()`, `s.isalpha()` | Zeichen-Typ prüfen |
| | `s.isspace()` | Nur Whitespace |
| **Regex** | `re.search()`, `re.findall()` | Muster suchen |
| | `re.sub()` | Mit Regex ersetzen |
| **Unicode** | `s.encode()`, `s.decode()` | Encoding/Decoding |

## Wichtige Tipps

1. **f-Strings verwenden**: Moderne und lesbare Formatierung
2. **strip() für Benutzereingaben**: Entfernt ungewollte Whitespace
3. **join() statt +**: Effizienter für viele Strings
4. **in-Operator**: Einfachste Art zu prüfen, ob Substring enthalten
5. **Validierung implementieren**: Benutzereingaben immer prüfen