# Bank Marketing Analysis - Imperative Implementierung

**Autoren:** Peter Ngo, Alex Uscata  
**Klasse:** INA 23A  
**Modul:** M323 - Funktionale Programmierung  
**Datum:** 2026-01-06  
**Version:** 2.0.0

Dieses Notebook demonstriert die imperative Analyse von Bank-Marketing-Daten mit Schwerpunkt auf:
- **Explizite Iteration** mit `for`-Schleifen
- **Mutable State** und schrittweise Aktualisierung
- **Kontrollflussbefehle** (`continue`, `break`)
- **Index-basierte Zugriffe** und manuelle Akkumulation
- **Transparente Ausführung** durch explizite Schritte

## Setup & Daten laden

Lädt die Bank-Daten und initialisiert die imperative Analyse-Umgebung.

In [1]:
import sys
import os
import math

# Pfad zum src-Ordner hinzufügen
sys.path.insert(0, os.path.abspath('../src'))

# Imports der imperativen Version
from imperative_version import (
    # Core analysis functions
    apply_filters, success_overall, duration_stats, 
    duration_buckets, group_metrics, marital_compare,
    compare_two_groups, anova_f_balance, 
    
    # Statistical functions
    mean, variance_population,
    
    # Grouping functions
    group_by_key
)
from common_io import load_bank_data, header, table, fmt_pct, fmt_num, fmt_int

# Daten laden
data = load_bank_data()
current = list(data)

print(f"✓ Datensätze geladen: {len(data)}")
print(f"✓ Imperative Version V1.0 geladen")
print(f"✓ Charakteristik: Explizite Schleifen, mutable State")

✓ Datensätze geladen: 7474
✓ Imperative Version V1.0 geladen
✓ Charakteristik: Explizite Schleifen, mutable State


---
## Demo: Imperative Iteration vs. Funktionale Ansätze

Diese Demos zeigen die imperativen Techniken im Vergleich zur funktionalen Variante.

### Explizite For-Schleifen
Imperative Programme verwenden explizite Schleifen mit mutablem State.

In [None]:
print(header("IMPERATIVE: EXPLIZITE FOR-SCHLEIFE"))

# Beispiel: Summe berechnen mit mutablem Akkumulator
numbers = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

# Imperative Methode: Explizite Schleife mit mutabler Variable
total = 0  # Mutable Akkumulator
for num in numbers:
    total += num  # Schrittweise Mutation

print(f"Zahlen: {numbers}")
print(f"Summe (imperativ): {total}")
print()

# Vergleich zur funktionalen Variante (nur zur Demonstration)
functional_total = sum(numbers)  # Deklarativ, keine explizite Schleife
print(f"Summe (funktional): {functional_total}")
print()

print("✓ Imperativ: Explizite Schleife, mutable State (total)")
print("✓ Jeder Schritt ist sichtbar und nachvollziehbar")
print("✓ State wird durch += modifiziert")

---
## Demo: Continue-Statements für Filterung

Imperative Filterung mit `continue` für Early Exit.

In [None]:
print(header("IMPERATIVE: CONTINUE-STATEMENTS"))

# Test-Datensätze
test_data = [
    {'housing': True, 'balance': 1500, 'name': 'Record 1'},
    {'housing': True, 'balance': 500, 'name': 'Record 2'},
    {'housing': False, 'balance': 2000, 'name': 'Record 3'},
    {'housing': True, 'balance': 1200, 'name': 'Record 4'},
]

# Imperative Filterung: housing=True UND balance>1000
filtered = []  # Mutable Result-Liste

for row in test_data:
    # Frühe Exits mit continue
    if row.get('housing') is not True:
        continue  # Überspringen, wenn housing != True
    
    if row.get('balance', 0) <= 1000:
        continue  # Überspringen, wenn balance <= 1000
    
    # Nur wenn beide Bedingungen erfüllt
    filtered.append(row)

print("Gefilterte Datensätze (housing=True AND balance>1000):")
for r in filtered:
    print(f"  ✓ {r['name']}: housing={r['housing']}, balance={r['balance']}")

print(f"\nResultat: {len(filtered)} von {len(test_data)} Datensätzen")
print()
print("✓ Imperativ: Explizite for-Schleife mit continue")
print("✓ Continue sorgt für frühen Loop-Exit")
print("✓ Filtered-Liste wird schrittweise aufgebaut (append)")

---
## Demo: Index-basierte Manipulation

Zeigt wie imperative Programme Listen mit Indices direkt manipulieren.

In [None]:
print(header("IMPERATIVE: INDEX-BASIERTE MANIPULATION"))

# Beispiel: Bucket-Counts für Duration-Kategorien
# Simuliert die duration_buckets Logik

durations = [45, 120, 75, 200, 30, 150, 80]
bucket_size = 60

# Schritt 1: Maximale Duration finden (imperativ)
max_d = 0
for d in durations:
    if d > max_d:
        max_d = d

print(f"Durations: {durations}")
print(f"Max Duration: {max_d}")
print()

# Schritt 2: Buckets erstellen (mutable Liste von Listen)
buckets = []
start = 0
while start <= max_d:
    buckets.append([start, 0])  # [start, count]
    start += bucket_size

print(f"Initialisierte Buckets: {buckets}")
print()

# Schritt 3: Durations in Buckets einordnen (Index-basiert)
for d in durations:
    idx = d // bucket_size
    if idx >= len(buckets):
        idx = len(buckets) - 1
    buckets[idx][1] += 1  # Direkte Index-Mutation!

print("Buckets nach Zählung:")
for start, count in buckets:
    end = start + bucket_size - 1
    print(f"  {start:>3d}-{end:<3d}: {count} Einträge")

print()
print("✓ Imperativ: Index-basierte Manipulation (buckets[idx][1] += 1)")
print("✓ Mutable Listen werden direkt modifiziert")
print("✓ While-Schleife für Bucket-Erstellung")

---
---
# DATENANALYSE

Die folgenden Optionen führen verschiedene Analysen auf dem Bank-Marketing-Datensatz durch.
Alle Funktionen verwenden imperative Programmierkonzepte (explizite Schleifen, mutable State).

---
## Option 1: Erfolgsquote gesamt

Zeigt die Gesamterfolgsquote der Marketingkampagne.

In [9]:
print(header("ERFOLGSQUOTE"))
total, yes_count, quote = success_overall(current)
rows = [
    ["Total", str(total)],
    ["Yes", str(yes_count)],
    ["Quote", fmt_pct(quote)]
]
print(table(["Metric", "Value"], rows, aligns=["<", ">"]))

                              ERFOLGSQUOTE                              
Metric |  Value
-------+-------
Total  |   3409
Yes    |   1436
Quote  |  42.1%


---
## Option 2: Filter setzen

Filtert die Daten nach housing, loan und balance-Kriterien.

**Anleitung:** Passe die Werte unten an:
- `housing_filter`: `True` für yes, `False` für no, `None` für keinen Filter
- `loan_filter`: `True` für yes, `False` für no, `None` für keinen Filter
- `balance_gt_filter`: Mindestwert für balance oder `None`

In [None]:
# === PARAMETER ANPASSEN ===
housing_filter = None      # None, True oder False
loan_filter = None         # None, True oder False
balance_gt_filter = None   # None oder z.B. 1000

# Imperative Methode: apply_filters verwendet explizite for-Schleife mit continue
current = apply_filters(data, housing_filter, loan_filter, balance_gt_filter)

print(header("FILTER RESULT (Imperativ)"))
print(f"Aktueller Datenbestand: {len(current)} / {len(data)}")
print(f"\nAngewendete Filter:")
print(f"  housing = {housing_filter}")
print(f"  loan = {loan_filter}")
print(f"  balance > {balance_gt_filter}")
print(f"\n✓ Imperativ: for-Schleife mit continue-Statements")
print(f"✓ Ergebnis-Liste wird schrittweise aufgebaut")

                       FILTER RESULT (Imperativ)                        
Aktueller Datenbestand: 3409 / 7474

Angewendete Filter:
  housing = True
  loan = None
  balance > None

✓ Imperativ: for-Schleife mit continue-Statements
✓ Ergebnis-Liste wird schrittweise aufgebaut


---
## Option 3: Transformationen

Berechnet Statistiken für transformierte Balance-Werte:
- `log(balance)` - Logarithmische Transformation
- `balance^2+1` - Quadratische Transformation

In [None]:
print(header("TRANSFORMATIONEN (imperativ)"))

# Imperative Methode: Explizite for-Schleife mit mutablen Listen
logs = []  # Mutable Akkumulator
sq1 = []   # Mutable Akkumulator

for row in current:
    bal = row.get("balance")
    if isinstance(bal, (int, float)):
        b = float(bal)
        sq1.append(b * b + 1.0)  # Direkte Mutation der Liste
        if b > 0.0:
            logs.append(math.log(b))  # Direkte Mutation der Liste

def stats_line(name, values):
    mu = mean(values)
    var = variance_population(values)
    mn = min(values) if values else None
    mx = max(values) if values else None
    return [name, str(len(values)), fmt_num(mn), fmt_num(mx), fmt_num(mu), fmt_num(var)]

rows = [
    stats_line("log(balance)", logs),
    stats_line("balance^2+1", sq1)
]
print(table(["Transform", "n", "min", "max", "mean", "var"], rows, aligns=["<", ">", ">", ">", ">", ">"]))

print(f"\n✓ Imperativ: Explizite for-Schleife über current")
print(f"✓ Mutable Listen (logs, sq1) werden mit append() gefüllt")
print(f"✓ Schrittweise Verarbeitung, jede Zeile einzeln")

---
## Option 4a: Duration Analyse

Statistische Auswertung der Gesprächsdauer (duration).

In [None]:
print(header("DURATION ANALYSE"))
mn, mx, mu, var = duration_stats(current)
rows = [[fmt_int(mn), fmt_int(mx), fmt_num(mu), fmt_num(var)]]
print(table(["min", "max", "mean", "var"], rows, aligns=[">", ">", ">", ">"]])

## Option 4b: Duration Buckets

Gruppierung der Duration in Intervalle mit Erfolgsquoten.

**Anleitung:** Passe `bucket_size` an (z.B. 60 für 60 Sekunden-Intervalle).

In [None]:
# === PARAMETER ANPASSEN ===
bucket_size = 60  # Intervallgröße in Sekunden

buckets = duration_buckets(current, bucket_size)
b_rows = [[label, str(cnt), fmt_pct(rate)] for (label, cnt, rate) in buckets]

print(header("DURATION BUCKETS"))
print(table(["bucket", "count", "success"], b_rows, aligns=["<", ">", ">"]])

---
## Option 5: Group by Education

Gruppiert die Daten nach Bildungsniveau und zeigt Durchschnittswerte.

In [None]:
print(header("GROUP BY EDUCATION"))
metrics = group_metrics(current, "education")
rows = []
for name, cnt, avg_age, avg_bal, rate in metrics:
    rows.append([name or "(blank)", str(cnt), fmt_num(avg_age, 1), fmt_num(avg_bal, 2), fmt_pct(rate)])
print(table(["education", "count", "avg(age)", "avg(balance)", "success"], rows, aligns=["<", ">", ">", ">", ">"]))

anova = anova_f_balance(current, "education")
print()
if anova is None:
    print("ANOVA F-Wert: n/a")
else:
    f_value, df_b, df_w = anova
    print(f"ANOVA F-Wert: {fmt_num(f_value, 2)} (df={df_b},{df_w})")

---
## Option 6: Group by Marital

Gruppiert die Daten nach Familienstand (single, married, divorced).

In [None]:
print(header("GROUP BY MARITAL"))
metrics = marital_compare(current)
rows = []
for name, cnt, avg_bal, avg_dur, rate in metrics:
    rows.append([name, str(cnt), fmt_num(avg_bal, 2), fmt_num(avg_dur, 1), fmt_pct(rate)])
print(table(["marital", "count", "avg(balance)", "avg(duration)", "success"], rows, aligns=["<", ">", ">", ">", ">"]))

---
## Option 7: Vergleich zweier Gruppen

Vergleicht zwei spezifische Gruppen innerhalb eines Feldes.

**Anleitung:**
1. Wähle das Feld: `education`, `marital` oder `job`
2. Wähle zwei Gruppen zum Vergleichen

In [None]:
# === PARAMETER ANPASSEN ===
field = "education"  # "education", "marital" oder "job"
group_a = "tertiary"  # Erste Gruppe
group_b = "secondary" # Zweite Gruppe

# Verfügbare Gruppen anzeigen
available = sorted({(r.get(field) or "") for r in current})
print(f"Verfügbare Gruppen in '{field}': {', '.join(available)}")
print()

# Vergleich durchführen
print(header("VERGLEICH ZWEIER GRUPPEN"))
m1, m2 = compare_two_groups(current, field, group_a, group_b)

def row(m):
    name, cnt, avg_age, avg_bal, avg_dur, rate = m
    return [name or "(blank)", str(cnt), fmt_num(avg_age, 1), fmt_num(avg_bal, 2), fmt_num(avg_dur, 1), fmt_pct(rate)]

rows = [row(m1), row(m2)]
print(table([field, "count", "avg(age)", "avg(balance)", "avg(duration)", "success"], rows, aligns=["<", ">", ">", ">", ">", ">"]))

delta = m1[-1] - m2[-1]
sign = "+" if delta >= 0 else ""
print(f"\nΔ Erfolgsquote (A-B): {sign}{delta * 100:0.1f}%")

---
## Option 8: ANOVA-ähnlicher F-Wert

Berechnet einen F-Wert für die Balance-Unterschiede zwischen Gruppen.

**Anleitung:** Wähle das Gruppierungsfeld (`education`, `marital` oder `job`).

In [None]:
# === PARAMETER ANPASSEN ===
field = "education"  # "education", "marital" oder "job"

print(header("ANOVA-ÄHNLICHER F-WERT (BALANCE)"))
result = anova_f_balance(current, field)

if result is None:
    print("Nicht genug Daten für F-Berechnung (mind. 2 Gruppen, ausreichend Beobachtungen).")
else:
    f_value, dfb, dfw = result
    f_text = "inf" if math.isinf(f_value) else f"{f_value:0.3f}"
    print(f"F({dfb}, {dfw}) = {f_text}")
    print()
    if math.isinf(f_value):
        print("Interpretation: Innerhalb-Varianz ist 0; Gruppenmittelwerte unterscheiden sich stark")
        print("oder Werte sind konstant pro Gruppe.")
    elif f_value < 1.5:
        print("Interpretation: Eher geringe Unterschiede der Mittelwerte zwischen Gruppen")
        print("(relativ zur Streuung).")
    elif f_value < 5.0:
        print("Interpretation: Moderate Unterschiede der Mittelwerte zwischen Gruppen.")
    else:
        print("Interpretation: Deutliche Unterschiede der Mittelwerte zwischen Gruppen möglich")
        print("(hoher F-Wert).")

---
## Filter zurücksetzen

Setzt den Datensatz auf die ursprünglichen Daten zurück.

In [None]:
current = list(data)
print(f"✓ Filter zurückgesetzt: {len(current)} Datensätze aktiv")