# Dokumentation: Autonomes Agenten-System

**Version: 1.0.0**

Dieses Dokument beschreibt die Architektur, die Ziele und den Entwicklungspfad des autonomen Agenten-Systems. Es dient als zentrale Anlaufstelle, um das aktuelle System zu verstehen und die zukünftige Entwicklung zu planen.

## 1. Projektziele

Das Projekt verfolgt zwei miteinander verbundene Hauptziele:

1.  **Funktionale Autonomie:** Das primäre Ziel ist die Entwicklung eines Agenten, der komplexe, abstrakt definierte Aufgaben (z.B. "Erstelle ein Spiel", "Schreibe eine API") selbstständig in konkrete Schritte zerlegen, ausführen, testen und dokumentieren kann. Der Agent operiert dabei ausschließlich über die Kommandozeile und nutzt die zur Verfügung gestellten Werkzeuge.

2.  **Evolutionäre Kompetenz (Lernfähigkeit):** Das übergeordnete, strategische Ziel ist, dass das System nicht statisch bleibt, sondern mit jeder Aufgabe und jedem Fehler lernt und seine Fähigkeiten verbessert. Das System soll eine Form von "Gedächtnis" entwickeln, das es ihm erlaubt, vergangene Fehler in Zukunft zu vermeiden und Best Practices über Projektgrenzen hinweg zu generalisieren. Langfristig soll so ein immer fähigerer und robusterer autonomer Entwickler entstehen.

## 2. Kernarchitektur

Die Architektur des Systems basiert auf drei Säulen: einem definierten Arbeitsablauf, einem strukturierten Lernmechanismus und einer klaren Versionierung.

### 2.1 Arbeitsablauf: `agent_manual.md`

Das Herzstück des Agentenverhaltens ist im `agent_manual.md` definiert. Es schreibt einen strengen, testgetriebenen Entwicklungszyklus (Test-Driven Development, TDD) vor:

1.  **Planung:** Analyse der Aufgabe, Konsultation der Wissensdatenbank und Erstellung einer `roadmap.md` mit allen Features.
2.  **Testen:** Für jedes Feature wird zuerst ein Test geschrieben, der fehlschlägt.
3.  **Implementierung:** Es wird der minimal nötige Code geschrieben, damit der Test erfolgreich ist.
4.  **Refactoring:** Der Code wird verbessert und aufgeräumt.
5.  **Dokumentation:** Nach Abschluss aller Features werden die finalen Dokumente (`README.md`, `TUTORIAL.md` etc.) erstellt.

Dieser Zyklus stellt sicher, dass die Ergebnisse überprüfbar und von hoher Qualität sind.

### 2.2 Versionierung

Um die Entwicklung des Agenten-Systems selbst nachvollziehbar zu machen, wurde ein einfaches Versionierungssystem eingeführt:

-   **`VERSION`:** Eine Datei im Hauptverzeichnis, die die aktuelle Version des Gesamtsystems nach [Semantischer Versionierung](https://semver.org/lang/de/) (z.B. `1.0.0`) enthält. `MAJOR`-Änderungen für inkompatible Prozessänderungen, `MINOR` für neue Features (wie die Wissensdatenbank) und `PATCH` für Bugfixes.
-   **`.agent_version`:** Bei der Erstellung eines Projekts wird die aktuelle Systemversion aus der `VERSION`-Datei gelesen und in eine `.agent_version`-Datei innerhalb des Projektordners geschrieben. Dies ermöglicht eine exakte Zuordnung, nach welchem "Rezept" ein Projekt erstellt wurde.

### 2.3 Der Lernmechanismus: Incident-Knowledge-Loop

Dies ist die wichtigste Neuerung in Version 1.0.0 und der erste Schritt zu einem intelligenten, lernfähigen System. Es löst das Problem, dass der Agent Fehler zwar reaktiv behebt, aber nicht proaktiv aus ihnen lernt.

**Das Problem:** Ohne ein Gedächtnis würde der Agent ähnliche Fehler (z.B. grundlegende Physik-Fehler in Spielen) immer wieder machen.

**Die Lösung:** Ein strukturierter Wissenskreislauf.

```
      +------------------+       +----------------------+       +---------------------+
      |   Neues Projekt  |------>| Konsultiere Wissens- |------>|   Proaktive Planung |
      |      (z.B. Spiel B)  |       |       datenbank      |       | (z.B. Test für Physik)|
      +------------------+       +----------+-----------+       +----------+----------+
                                            ^                         |
                                            | LERNEN                  | AUSFÜHRUNG
                                            |                         v
      +------------------+       +----------+-----------+       +----------+----------+
      | Incident Report  |<------|   Generalisiere zu   |<------|      Fehler in      |
      | (in /knowledge_base) |       |      Prinzip         |       |    Spiel A gefunden   |
      +------------------+       +----------------------+       +---------------------+
```

**So funktioniert der Kreislauf:**

1.  **Fehlerbehebung & Analyse:** Wenn ein Fehler auftritt und behoben wird (wie beim `Doodle Jump`-Projekt), erstellt der Agent einen **`Incident Report`** in Form einer Markdown-Datei im `/knowledge_base`-Ordner.
2.  **Strukturierte Erfassung:** Jeder Report hat eine feste Struktur (Symptom, Ursache, Lösung, spezifisches Learning und – am wichtigsten – ein **generalisiertes Prinzip**).
3.  **Wissensanwendung:** Wenn der Agent ein **neues** Projekt startet, durchsucht er die `knowledge_base` nach relevanten `GeneralizedPrinciple`-Einträgen. 
4.  **Proaktive Planung:** Die gefundenen Prinzipien werden zu konkreten, verpflichtenden Aufgaben in der `roadmap.md` des neuen Projekts. So wird aus dem reaktiven Fix für *Spiel A* eine proaktive Test-Anforderung für *Spiel B*.

**Der Weg zu RAG (Retrieval-Augmented Generation):**
Dieses System ist die Vorstufe zu einem echten RAG-System. Aktuell basiert die Suche auf einfachen Keywords. Der nächste logische Schritt ist, die `Incident Reports` in einem Vektor-Index zu speichern und eine semantische Suche zu implementieren. Dadurch kann der Agent Zusammenhänge zwischen Problemen erkennen, die auf reiner Keyword-Ebene nicht sichtbar wären.

## 3. Analyse der aktuellen Schwächen

Eine ehrliche Analyse zeigt folgende Limitationen des aktuellen Systems (Version 1.0.0):

1.  **Reaktive Fehlererkennung:** Der Agent ist darauf angewiesen, dass ein Mensch einen Fehler meldet. Er besitzt keine eigene Fähigkeit zur Verifikation, ob ein Projekt (z.B. ein Spiel) tatsächlich funktioniert oder nur syntaktisch korrekten Code darstellt. Er kann nicht "sehen" oder "ausprobieren".

2.  **Rudimentäre Wissens-Suche:** Die aktuelle Suche in der Wissensdatenbank ist sehr einfach (Keyword-basiert). Sie kann keine konzeptionellen Ähnlichkeiten zwischen Problemen erkennen, wenn die Schlagwörter nicht übereinstimmen.

3.  **Begrenzte Test-Tiefe:** Test-Driven Development (TDD) ist exzellent für die Logik, aber unzureichend für Aspekte der User Experience (UX) oder des visuellen Designs. Ein Test kann prüfen, ob ein Sprung-Wert korrekt berechnet wird, aber nicht, ob sich der Sprung für den Spieler "gut anfühlt" oder ob die Grafiken korrekt angezeigt werden.

4.  **Fehlende Selbst-Reflexion über den Prozess:** Der Agent folgt dem `agent_manual.md` starr. Wenn der Prozess selbst fehlerhaft oder ineffizient ist, hat der Agent keine Metrik oder Fähigkeit, dies zu erkennen und eine Verbesserung des Manuals vorzuschlagen.

## 4. Ausblick: Der Pfad zu größerer Autonomie

Basierend auf den aktuellen Schwächen und dem Stand der Forschung im Bereich autonomer Agenten, schlage ich folgende Entwicklungsrichtungen vor, um die nächste Stufe der Autonomie zu erreichen:

### 4.1 Schritt 1: Proaktive Verifikation & Selbst-Korrektur

Das System muss lernen, seine eigene Arbeit zu überprüfen. Dies kann durch einen neuen Schritt am Ende des Entwicklungszyklus geschehen: die **Verifikations-Phase**.

-   **Headless Browser-Tests:** Für Web-Projekte kann der Agent einen Headless Browser (z.B. via Playwright oder Puppeteer) starten, die Seite laden und auf Konsole-Fehler prüfen. Er könnte sogar einfache Interaktionen simulieren (z.B. einen Button klicken).
-   **Visuelle Verifikation (VLM):** Zukünftig könnte der Agent Screenshots seiner erstellten Anwendung an ein multimodales Modell (Visual Language Model, VLM) senden und Fragen stellen wie: "Sieht diese Seite kaputt aus?" oder "Wird das Spiel korrekt gerendert?". Dies wäre ein Quantensprung von der Code-Prüfung zur echten Ergebnis-Prüfung.

Wenn in dieser Phase ein Fehler entdeckt wird, startet der Agent selbstständig einen neuen `Incident-Knowledge-Loop`, ohne auf menschliches Feedback angewiesen zu sein.

### 4.2 Schritt 2: Implementierung eines echten RAG-Systems

Die aktuelle Wissensdatenbank muss zu einem echten RAG-System ausgebaut werden:

1.  **Embedding:** Jeder `Incident Report` wird beim Speichern durch ein Text-Embedding-Modell in einen Vektor umgewandelt.
2.  **Vektor-Datenbank:** Diese Vektoren werden in einer spezialisierten Vektor-Datenbank (z.B. ChromaDB, FAISS, Pinecone) gespeichert.
3.  **Semantische Suche:** Bei der Planung eines neuen Projekts formuliert der Agent eine semantische Anfrage (z.B. "Wie stelle ich sicher, dass die grundlegende Spielmechanik funktioniert?") und erhält die relevantesten vergangenen Lektionen zurück, auch wenn die Keywords nicht exakt passen.

### 4.3 Schritt 3: Multi-Agenten-Architektur (Spezialisierung)

Statt eines einzigen Agenten, der alles macht, könnte das System in spezialisierte Rollen aufgeteilt werden, die zusammenarbeiten. Dies spiegelt menschliche Software-Teams wider und ist ein aktives Forschungsfeld (z.B. MetaGPT, ChatDev).

-   **`Projekt-Manager-Agent`:** Zerlegt die Hauptaufgabe und pflegt die `roadmap.md`.