# Banking-Agent mit neurobiologisch inspiriertem Gedächtnis

## Der Paradigmenwechsel: Vom reaktiven Chatbot zum erinnernden Partner

Stellen Sie sich vor, Sie gehen in die Online-Filiale Ihrer Bank. Dort begrüßt Sie kein anonymer Chatbot, sondern ein digitaler Finanzexperte, der Sie mit den Worten anspricht:

*„Guten Tag, Herr Müller. Ich erinnere mich, dass wir im letzten Gespräch Ihre Sorgen bezüglich der Inflation besprochen haben. Sie sagten, dass die Ausbildung Ihrer Tochter Lisa in fünf Jahren finanziert werden muss und Sie deshalb eher vorsichtig investieren möchten. Sollen wir unser Gespräch dazu fortsetzen?“*

**Beim nächsten Termin des Banking-Agenten:**

*„Herr Müller, ich habe Ihre Situation berücksichtigt. Angesichts Ihrer Bedenken zur Inflation und des Zeithorizonts bis zu Lisas Studium habe ich eine ausgewogene Anlagestrategie vorbereitet. Möchten Sie, dass ich sie Ihnen vorstelle?“*

Was auf den ersten Blick wie normaler Kundenservice wirkt, markiert in Wahrheit einen grundlegenden Paradigmenwechsel in der Entwicklung künstlicher Intelligenz. Das System reagiert nicht nur auf aktuelle Anfragen, sondern verfügt über ein funktionales Gedächtnis: Es erinnert sich an frühere Gespräche, erkennt Zusammenhänge zwischen Interaktionen und schafft so Kontinuität und Vertrauen in der Kundenbeziehung.

### Warum ist Gedächtnis für agentenbasierte KI-Systeme entscheidend?

Im Bank- und Versicherungswesen ist Vertrauen die Grundlage jeder Kundenbeziehung. Ein Kunde, der seine finanzielle
Situation, Ziele und Sorgen immer wieder neu erklären muss, fühlt sich nicht verstanden.
Ein Banking-Agent mit Gedächtnis hingegen:

- **Erkennt Muster:** Wiederkehrende Gespräche, Sparziele, Relevanzprofile
- **Lernt kontinuierlich:** Passt Empfehlungen an neue Lebenssituationen an
- **Vergisst selektiv:** Behält Relevantes, verwirft Überflüssiges
- **Priorisiert intelligent:** Fokussiert auf das Wesentliche in der Informationsflut

### Die drei neurobiologischen Säulen, Selektive Gedächtnisfilterung, Plastische Gewichtsanpassung und Adaptives Vergessen

Dieses Notebook zeigt, wie zentrale Mechanismen des menschlichen Gehirns auf Banking-Agenten übertragen werden können:

1. **Selektive Gedächtnisfilterung** (Thalamus, Amygdala, Hippocampus, Präfrontaler Kortex)
   *Notebook:* `selective_memory_filtering/selective_memory_filtering.ipynb`
    - Trennt relevante von irrelevanten Kundengespräche
    - Priorisiert wichtige Gesprächsinhalte und Lebensereignisse
    - Berücksichtigt Kontext und zeitliche Dringlichkeit
    - Verhindert impulsive Speicherung durch Konsolidierungs-Mechanismus

2. **Plastische Gewichtsanpassung** (Synaptische Plastizität, LTP/LTD)
   *Notebook:* `plastic_memory/plastic_memory.ipynb`
    - Lernt aus Kundenfeedback und Gesprächsmustern
    - Verstärkt erfolgreiche Empfehlungen
    - Schwächt ineffektive Strategien ab

3. **Adaptives Vergessen** (Ebbinghaus-Kurve, Interferenz, Homeostatic Scaling)
   *Notebook:* `adaptive_forgetting/adaptive_forgetting.ipynb`
    - Löscht veraltete Informationen zeitabhängig
    - Ersetzt überholte Muster durch neue
    - Bewahrt Systemkapazität und Reaktionsfähigkeit

Ein solcher Banking-Agent steht exemplarisch für den Übergang von reaktiver Interaktion zu kontinuierlichem,
kontextbewusstem Lernen – ein Schritt hin zu wirklich adaptiven, erinnernden KI-Systemen.

---

## Setup und Imports

In [1]:
from __future__ import annotations

import importlib.util
import sys
import warnings
from pathlib import Path

import ipywidgets as widgets
import matplotlib.pyplot as plt
import numpy as np
from ipywidgets import interact

warnings.filterwarnings("ignore")

# Notebook-Styling laden
NOTEBOOK_DIR = Path.cwd()
PROJECT_ROOT = (
    NOTEBOOK_DIR.parent
    if (NOTEBOOK_DIR.parent / "notebook_style.py").exists()
    else NOTEBOOK_DIR
)

spec = importlib.util.spec_from_file_location(
    "notebook_style", PROJECT_ROOT / "notebook_style.py"
)
if spec is None or spec.loader is None:
    raise ImportError("notebook_style.py nicht gefunden")

nb_style = importlib.util.module_from_spec(spec)
sys.modules["notebook_style"] = nb_style
spec.loader.exec_module(nb_style)

PLOT_COLORS = nb_style.setup_plot_style(
    aliases={
        'correct': 'primary',
        'incorrect': 'quaternary',
        'prediction': 'secondary',
        'stored': 'accent',
    },
    cycle_keys=("primary", "secondary", "accent"),
)

SEED = int(nb_style.SEED)
np.random.seed(SEED)

---

### Die 3 Säulen: Mathematische Modelle

#### *Säule 1: Selektive Filterung*
**Salienz-Score:** S(t) = w_importance·importance_norm + w_recency·exp(−age/τ) + w_relevance·relevance
- **importance_norm** = min(importance/1.0, 1.0) — Robuste Normierung
- **exp(−age/τ)** — Exponentieller Abfall (Recency-Effekt)
- **relevance** ∈ [0,1] — Relevanz-Score

**Gating-Regel:** Speichere wenn S(t) ≥ θ; bei vollem Speicher (K Gespräche) ersetze das mit geringster Salienz.

#### *Säule 2: Plastische Gewichte*
**Vorhersage:** ŷ = σ(w·x) — Sigmoid-Aktivierung

**Delta-Regel:** Δw = η(y − ŷ)x − αw
- **η(y − ŷ)x** — Fehler-getriebenes Lernen (LTP bei y − ŷ > 0, LTD bei y − ŷ < 0)
- **−αw** — Homeostase (Gewichtsdecay)

#### *Säule 3: Adaptives Vergessen*
**EMA mit adaptiver Lernrate:** m_t = (1−λ_t)·m_{t-1} + λ_t·x_t

**Adaptive Lernrate:** λ_t = clip(λ_min + k·|e|/σ, λ_min, λ_max)
- **|e|** = |y − ŷ| — Fehler
- **σ** = std(|e|) — Fehler-Standardabweichung
- **Peaks von λ_t** an Regimewechseln (Überraschungen)

**Hinweis:** τ ≈ 1/λ für kleine λ; exakt: τ = −1/ln(1−λ)

---

### Praktisches Szenario: Banking-Agent mit Kundengesprächen

**Das Szenario: Herr Müller und sein digitaler Finanzberater**

Stellen Sie sich vor, Herr Müller führt über mehrere Wochen hinweg Gespräche mit seinem Banking-Agent:

- **Gespräch 1:** Herr Müller erwähnt, dass er Sorgen bezüglich der Inflation hat und dass die Ausbildung seiner Tochter Lisa in fünf Jahren finanziert werden muss. Er möchte eher vorsichtig investieren.
- **Gespräch 2:** Er fragt nach Sparoptionen für Lisas Ausbildung.
- **Gespräch 3:** Er berichtet von einer Erbschaft und möchte diese anlegen.
- **Gespräch 4:** Er ist besorgt über Marktvolatilität und möchte seine Strategie überprüfen.

**Das Problem für den Agent:**
1. **Welche Gesprächsinhalte sind wichtig genug zum Speichern?** (Säule 1: Filterung)
   - Lisas Ausbildung ist wichtig → speichern
   - Tagesaktuelle Marktkommentare sind weniger wichtig → verwerfen

2. **Wie lernt der Agent aus Feedback?** (Säule 2: Plastizität)
   - Wenn Herr Müller sagt "Diese Empfehlung war genau richtig" → Gewichte verstärken
   - Wenn er sagt "Das passt nicht zu meiner Situation" → Gewichte abschwächen

3. **Wie vergisst der Agent alte Informationen?** (Säule 3: Vergessen)
   - Alte Marktkommentare verblassen schnell
   - Wichtige Ziele (Lisas Ausbildung) bleiben länger präsent
   - Bei großen Veränderungen (z.B. Erbschaft) passt sich die Lernrate an

**Features pro Gespräch:**
- **importance:** Wichtigkeit des Gesprächsinhalts (0.0-1.0)
  - Finanzielle Ziele: 0.8-1.0
  - Persönliche Situation: 0.6-0.8
  - Marktkommentare: 0.2-0.4
- **recency:** Wie lange ist das Gespräch her (0-30 Tage)
- **relevance:** Relevanz für aktuelle Empfehlung (0.0-1.0)

**Feedback:**
- **y = 1:** Empfehlung war hilfreich und passend
- **y = 0:** Empfehlung war nicht hilfreich oder passte nicht

**Ziel:** Der Agent lernt, bessere Empfehlungen zu geben, indem er:
- Wichtige Gesprächsinhalte speichert (Säule 1)
- Aus Feedback lernt (Säule 2)
- Sich schnell an Veränderungen anpasst (Säule 3)

---

### Implementierung

In [2]:
# Hilfsfunktionen für die 3 Säulen

def sigmoid(x):
    """Sigmoid-Aktivierungsfunktion."""
    return 1.0 / (1.0 + np.exp(-np.clip(x, -500, 500)))


def compute_salience(importance, age, relevance, w, tau, p95):
    """Berechnet Salienz-Score."""
    importance_norm = np.clip(importance / p95, 0.0, 1.0)
    recency = np.exp(-age / tau)
    s = w['importance'] * importance_norm + w['recency'] * recency + w['relevance'] * relevance
    return float(np.clip(s, 0.0, 1.0))


def gate_memory(conversations, theta, k, w, tau, p95):
    """Filtert Gespräche und speichert."""
    memory = []
    stored_indices = []
    salience_scores = []

    for i, conv in enumerate(conversations):
        s = compute_salience(conv['importance'], conv['age'], conv['relevance'], w, tau, p95)
        salience_scores.append(s)

        if s >= theta:
            if len(memory) < k:
                memory.append(conv)
                stored_indices.append(i)
            else:
                min_idx = np.argmin([compute_salience(m['importance'], m['age'], m['relevance'], w, tau, p95)
                                     for m in memory])
                memory[min_idx] = conv
                stored_indices[min_idx] = i

    return memory, stored_indices, salience_scores


def delta_update(w, x, y, y_pred, eta, alpha):
    """Delta-Update für Gewichte."""
    error = y - y_pred
    dw = eta * error * x - alpha * w
    return w + dw


def plot_results(y_true, y_pred, memory, lambda_t_list, theta, true_rate=None, memory_saliences=None):
    """Visualisiert die Ergebnisse der 3 Säulen."""
    fig, axes = plt.subplots(2, 2, figsize=(20, 7))

    ax = axes[0, 0]
    ax.scatter(range(len(y_true)), y_true, s=18, alpha=0.35, color=PLOT_COLORS.get('incorrect', '#d62728'), label='Beobachtungen (y)')
    ax.plot(y_pred, label='Vorhersage (ŷ)', alpha=0.85, linewidth=2, color=PLOT_COLORS.get('prediction', '#ff7f0e'))
    if true_rate is not None:
        ax.plot(true_rate, label='Wahre Rate (nur Lernzwecke)', alpha=0.8, linestyle='--', color='black', linewidth=2)
    ax.set_xlabel('Gesprächs-Index')
    ax.set_ylabel('Rate')
    ax.set_title('Säule 2 & 3: Vorhersage vs. Wahrheit')
    ax.legend()
    ax.grid(True, alpha=0.3)

    ax = axes[0, 1]
    if memory_saliences is not None and len(memory_saliences) > 0:
        vals = list(memory_saliences)
        order = np.argsort(vals)[::-1]
        vals = [vals[i] for i in order]
        ax.barh(range(len(vals)), vals, color=PLOT_COLORS.get('stored', '#9467bd'), alpha=0.8)
        ax.set_xlabel('Salienz S(t)')
        ax.set_xlim(0, 1.0)
    else:
        vals = [m.get('importance', 0.0) for m in memory]
        ax.barh(range(len(vals)), vals, color=PLOT_COLORS.get('stored', '#9467bd'), alpha=0.8)
        ax.set_xlabel('Wichtigkeit')
    ax.set_yticks(range(len(vals)))
    ax.set_yticklabels([f'#{i+1}' for i in range(len(vals))], fontsize=9)
    ax.axvline(theta, color=PLOT_COLORS.get('prediction', '#ff7f0e'), linestyle='--', label=f'θ={theta:.2f}')
    ax.set_title(f'Säule 1: Selektive Filterung (K={len(vals)})')
    ax.legend()
    ax.grid(True, alpha=0.3, axis='x')

    ax = axes[1, 0]
    ax.plot(lambda_t_list, color=PLOT_COLORS.get('stored', '#9467bd'), alpha=0.9, linewidth=2)
    ax.set_xlabel('Gesprächs-Index')
    ax.set_ylabel('λ_t (adaptive Lernrate)')
    ax.set_title('Säule 3: Adaptives Vergessen')
    ax.grid(True, alpha=0.3)

    ax = axes[1, 1]
    errors = np.abs(np.array(y_true) - np.array(y_pred))
    ax.plot(errors, color=PLOT_COLORS.get('prediction', '#ff7f0e'), alpha=0.9, linewidth=2)
    ax.fill_between(range(len(errors)), errors, alpha=0.15, color=PLOT_COLORS.get('prediction', '#ff7f0e'))
    ax.set_xlabel('Gesprächs-Index')
    ax.set_ylabel('Absoluter Fehler')
    ax.set_title('Vorhersagefehler')
    ax.grid(True, alpha=0.3)

    plt.tight_layout()
    plt.show()
    plt.close(fig)


In [3]:
def simulate_conversations(t=300, drift_strength=0.0, seed=SEED):
    """Generiert Kundengespräche"""
    rng = np.random.default_rng(seed)
    conversations = []

    betas1 = np.array([1.2, 0.6, 1.0])
    betas2 = np.array([0.4, 1.2, 1.4])

    def logit_from_rate(p):
        eps=1e-6
        p=float(np.clip(p, eps, 1-eps))
        return np.log(p/(1-p))

    for step in range(t):
        # Basisrate mit Drift
        base_rate = 0.20 if step < t // 2 else 0.20 + 0.30 * drift_strength
        b0 = logit_from_rate(base_rate)

        # Features pro Gespräch
        importance = rng.uniform(0.2, 1.0)
        age = rng.uniform(0, 30)
        relevance = rng.uniform(0.0, 1.0)

        # Normierte Features für das Logit
        importance_norm = np.clip(importance, 0.0, 1.0)
        recency = 1.0 - (age / 30.0)
        x = np.array([importance_norm, recency, relevance])

        # Phasenabhängige Betas
        betas = betas1 if step < t // 2 else (1 - drift_strength) * betas1 + drift_strength * betas2

        # Erfolgsrate und Label
        logit = b0 + float(np.dot(betas, x))
        true_rate = 1.0/(1.0 + np.exp(-np.clip(logit, -12, 12)))
        y = 1 if rng.random() < true_rate else 0

        conversations.append({'importance': importance, 'age': age, 'relevance': relevance, 'y': y, 'true_rate': true_rate})

    return conversations

### Interaktives Beispiel: Kundengespräche mit Herr Müller

- Oben links: Beobachtungen (Punkte), Vorhersage (blau), wahre Rate (gestrichelt; nur Lernzwecke).
- Oben rechts: Aktueller Speicher (Top-K) nach Salienz S(t) mit Schwelle θ.
- Unten links: Adaptive Lernrate λ_t (steigt bei Überraschung).
- Unten rechts: Absoluter Vorhersagefehler.


In [4]:
conversations = simulate_conversations(t=300, drift_strength=0.3, seed=SEED)
importances = [conv['importance'] for conv in conversations]
p95 = np.percentile(importances, 95)


def update_plot(theta=0.5, k=10, tau=10.0, eta=0.1, alpha=0.01, k_surprise=0.05):
    """Aktualisiert die Plots basierend auf den Parametern."""

    w = {'importance': 0.35, 'recency': 0.35, 'relevance': 0.30}

    total = w['importance'] + w['recency'] + w['relevance']
    if total > 0:
        w = {k: v/total for k,v in w.items()}

    # Filtere Gespräche
    memory, stored_indices, salience_scores = gate_memory(conversations, theta, k, w, tau, p95)

    # Salienz der gespeicherten Gespräche extrahieren
    memory_saliences = [salience_scores[i] for i in stored_indices]

    # Simuliere das Lernen (Säule 2 & 3)
    w_learn = np.array([0.5, 0.5, 0.5])
    predictions = []
    lambda_t_list = []
    errors = []

    lambda_min, lambda_max = 0.01, 0.3

    for conv in conversations:
        x = np.array([conv['importance'], conv['age'] / 30, conv['relevance']])
        y_pred = sigmoid(np.dot(w_learn, x))
        predictions.append(y_pred)

        # Fehler
        error = abs(conv['y'] - y_pred)
        errors.append(error)

        # Adaptive Lernrate (Säule 3)
        if len(errors) > 1:
            sigma = np.std(errors[-min(20, len(errors)):])
            lambda_t = np.clip(lambda_min + k_surprise * error / (sigma + 1e-6), lambda_min, lambda_max)
        else:
            lambda_t = lambda_min
        lambda_t_list.append(lambda_t)

        # Delta-Update (Säule 2)
        # Effektive Lernrate durch adaptive Vergessensdynamik
        eta_eff = max(1e-6, eta * (lambda_t / 0.3))
        w_learn = delta_update(w_learn, x, conv['y'], y_pred, eta_eff, alpha)

    # Visualisiere
    true_rate_array = np.array([conv['true_rate'] for conv in conversations])
    plot_results(np.array([conv['y'] for conv in conversations]), predictions, memory, lambda_t_list, theta, true_rate=true_rate_array, memory_saliences=memory_saliences)

    # Statistik
    print("\nStatistik:")
    accepted = sum(s >= theta for s in salience_scores)
    print(f"  - Gespeicherte Gespräche: {len(memory)}/{k}")
    print(f"  - Akzeptanzrate (S≥θ): {accepted/len(conversations)*100:.1f}%")
    print(f"  - Durchschnittlicher Fehler: {np.mean(errors):.3f}")
    print(f"  - Durchschnittliche λ_t: {np.mean(lambda_t_list):.3f}")
    print(f"  - Parameter: θ={theta:.2f}, K={k}, τ={tau:.1f}, η={eta:.3f}, α={alpha:.3f}, k_surprise={k_surprise:.2f}")


# Interaktive Slider
interact(
    update_plot,
    theta=widgets.FloatSlider(0.5, min=0.0, max=1.0, step=0.05,
                               description='θ (Schwelle):'),
    k=widgets.IntSlider(10, min=5, max=20, step=1,
                         description='K (Kapazität):'),
    tau=widgets.FloatSlider(10.0, min=1.0, max=30.0, step=1.0,
                             description='τ (Recency):'),
    eta=widgets.FloatSlider(0.1, min=0.01, max=0.5, step=0.05,
                             description='η (Lernrate):'),
    alpha=widgets.FloatSlider(0.01, min=0.0, max=0.1, step=0.01,
                               description='α (Decay):'),
    k_surprise=widgets.FloatSlider(0.05, min=0.0, max=1.0, step=0.05,
                           description='k_surprise (Adaptivität):')
)

interactive(children=(FloatSlider(value=0.5, description='θ (Schwelle):', max=1.0, step=0.05), IntSlider(value…

<function __main__.update_plot(theta=0.5, k=10, tau=10.0, eta=0.1, alpha=0.01, k_surprise=0.05)>

---

### Interpretation der Ergebnisse

**Was beobachten wir?**

**Säule 1 (Selektive Filterung):**
- Hoher θ: Wenige Gespräche werden gespeichert (nur die wichtigsten)
- Niedriger θ: Viele Gespräche werden gespeichert
- Großes K: Speicher füllt sich langsamer
- Kleines K: Speicher füllt sich schnell, alte Gespräche werden ersetzt

**Säule 2 (Plastische Gewichte):**
- Hohe η: Agent lernt schnell, aber kann überkorrigieren
- Niedrige η: Agent lernt langsam, aber stabil
- Hohe α: Gewichte verfallen schnell (Homeostase)
- Niedrige α: Gewichte bleiben länger erhalten

**Säule 3 (Adaptives Vergessen):**
- Hohe k: Adaptive Lernrate reagiert stark auf Fehler (schnelle Anpassung)
- Niedrige k: Adaptive Lernrate reagiert schwach (stabiles Lernen)
- Peaks von λ_t: Zeigen Regimewechsel (Überraschungen)

**Praxisleitfaden:**
- **Konservativ:** Hoher θ, kleine K, niedrige η, hohe α → Stabile, vorsichtige Empfehlungen
- **Ausgewogen:** Mittlerer θ, mittleres K, mittlere η, mittlere α → Balance zwischen Stabilität und Lernfähigkeit
- **Aggressiv:** Niedriger θ, große K, hohe η, niedrige α → Schnelles Lernen, aber risikobehaftet

---

### Neurobiologische Grundlagen

#### Warum funktioniert dieses Modell biologisch?

**Säule 1: Salienz-gesteuerte Speicherung <-> Hippocampale/Neuromodulatorische Filter**
- Das Gehirn speichert bevorzugt auffällige (salient) Ereignisse
- Der Hippocampus bindet Ereignisse episodisch (Ort, Zeit, Kontext)
- Neuromodulatoren (Dopamin, Noradrenalin) verstärken die Speicherung wichtiger Ereignisse
- Dieses Modell: S(t) ≥ θ entscheidet über Speicherung

**Säule 2: Plastische Gewichte <-> Synaptische Plastizität (LTP/LTD)**
- Long-Term Potentiation (LTP): Synapsen werden stärker bei wiederholter Aktivierung
- Long-Term Depression (LTD): Synapsen werden schwächer bei Inaktivität
- Delta-Regel: Δw = η(y − ŷ)x − αw implementiert genau diesen Mechanismus
- Positiver Fehler (y − ŷ > 0) → LTP (Gewichte erhöhen sich)
- Negativer Fehler (y − ŷ < 0) → LTD (Gewichte verringern sich)
- −αw als Homeostase: Verhindert, dass Gewichte unbegrenzt wachsen

**Säule 3: Adaptives Vergessen <-> Ebbinghaus-Kurve & Adaptive Lernrate**
- Ebbinghaus-Vergessenskurve: Gedächtnisspuren verblassen exponentiell
- EMA: m_t = (1−λ_t)·m_{t-1} + λ_t·x_t beschreibt diesen Verfall
- Adaptive Lernrate: λ_t erhöht sich bei Überraschungen (großen Fehlern)
- Biologisch: Neuromodulatoren (Dopamin, Noradrenalin) erhöhen die Lernrate bei wichtigen Ereignissen

---

#### Zusammenfassung
Das Banking-Agent-Modell integriert drei zentrale neurobiologische Prinzipien – hippocampale Gedächtnisbildung, synaptische Plastizität und neuromodulatorische Steuerung – in einer praxisorientierten Architektur für agentenbasierte KI-Systeme.