# Notebook 1 – Geschichte und Agenten

Dieses Notebook veranschaulicht das Agentenmodell und setzt es in Beziehung zur KI-Geschichte. Es ist als Live-Demo gedacht und nutzt entweder **aima-python** oder eine minimale Eigenimplementierung.

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

np.random.seed(42)


## Setup aima-python (optional)

Wenn du aima-python lokal oder auf Kaggle nutzen willst, kannst du das Repo installieren. Falls Installation nicht möglich ist, überspringe diesen Block und nutze die Minimal-Demo darunter.

In [None]:
## Optional: aima-python installieren
# !pip -q install git+https://github.com/aimacode/aima-python.git
# Hinweis: In Kaggle ggf. Internet aktivieren. Lokal ggf. in venv.


## Agent und Umgebung als Minimalmodell

Ein einfacher Reflex-Agent reagiert nur auf die aktuelle Wahrnehmung.

In [None]:
from dataclasses import dataclass

@dataclass
class SimpleEnv:
    size: int = 5
    goal: int = 4

    def reset(self):
        self.pos = 0
        return self.pos

    def step(self, action):
        # action: -1 links, +1 rechts
        self.pos = max(0, min(self.size-1, self.pos + action))
        reward = 1 if self.pos == self.goal else -0.01
        done = self.pos == self.goal
        return self.pos, reward, done

def reflex_agent(obs):
    # Immer nach rechts
    return +1

env = SimpleEnv()
obs = env.reset()
total = 0
for t in range(20):
    action = reflex_agent(obs)
    obs, r, done = env.step(action)
    total += r
    if done:
        break
total, obs


## Historischer Kontrast als Kurz-Timeline

Ergänze hier deine eigene Timeline aus Session 1.

In [None]:
timeline = ['1956 Dartmouth', '1970s Expertensysteme', 'KI-Winter', '1990s Lernen aus Daten', '2010s Deep Learning']
for t in timeline:
    print('-', t)


## Mini-Übung

Ändere die Agentenregel so, dass der Agent manchmal zufällig handelt. Vergleiche die Gesamtbelohnung.

In [None]:
import random

def noisy_reflex(obs, p=0.2):
    return random.choice([-1, +1]) if random.random() < p else +1

scores=[]
for _ in range(50):
    obs=env.reset(); total=0
    for t in range(30):
        a=noisy_reflex(obs, p=0.2)
        obs,r,done=env.step(a)
        total+=r
        if done: break
    scores.append(total)

pd.Series(scores).describe()
