## Herzlich Willkommen zu dem Packaging Valley Makeathon, willkommen bei Bosch Rexroth

### Einführung in die Tools des Makeathons

#### Jupyter Notebook
**Ansprechpartner:** René Kübler

Das Jupyter Notebook bietet eine interaktive Umgebung, um Python-Code auszuführen und diesen direkt mit erklärenden Textbausteinen zu kombinieren. Im Rahmen des Makeathons nutzen wir Jupyter Notebooks, um über eine API mit einem Large Language Model (LLM) wie in dem Fall Gemini Pro zu kommunizieren.

Die folgenden Abschnitte erläutern die Funktionsweise der Codeblöcke im Notebook. Unser Ziel ist es, euch ein tieferes Verständnis für die implementierten Lösungen zu vermitteln. Neben diesen Erklärungen findet ihr im Notebook auch die konkreten Aufgabenstellungen sowie hilfreiche Hinweise. Bei weiterführenden Fragen stehen euch die genannten Ansprechpartner sowie das gesamte Team gerne zur Verfügung.


#### ctrlX Works
**Ansprechpartner:** Julian Schill, René Kübler

ctrlX Works ist unsere Plattform zur Simulation der ctrlX, unserer eigens entwickelten Speicherprogrammierbaren Steuerung (SPS). Die ctrlX ist das Herzstück vieler Maschinen in unserer Modellfabrik, beispielsweise steuert sie flow6D. Während des Makeathons nutzen wir ctrlX Works, um euren entwickelten Code ausführlich zu testen, bevor er auf die reale ctrlX-Steuerung übertragen wird, die letztlich die Maschinen bedient.


#### ctrlX FLOW6D
**Ansprechpartner:** Julian Schill

Das flow6D-System ist ein innovatives Transportsystem, das wir mit der ctrlX ansteuern werden. Es ermöglicht die Bewegung von Werkstücken auf sechs Achsen. Die zentrale Herausforderung und zugleich eure Kernaufgabe wird es sein, diese sogenannten „Mover“, die die Teile transportieren, anzusteuern über die ctrlX.


### Der Code des Notebooks

#### 1. Import der Bibliotheken

Im ersten Codeblock werden die benötigten Bibliotheken `requests` und `json` importiert.

*   **`requests`**: Diese Bibliothek ermöglicht es uns, HTTP-Anfragen zu stellen, beispielsweise um mit einer API zu kommunizieren.
*   **`json`**: Diese Bibliothek dient der Arbeit mit JSON-Daten (JavaScript Object Notation). JSON ist ein weit verbreitetes, leichtgewichtiges Datenformat zum strukturierten Speichern und Übertragen von Daten. Es wird oft für Konfigurationsparameter oder als einfacher Output bei Tests verwendet, kann aber auch ganze Dateien umfassen, um komplexe Datenstrukturen abzubilden.

In [1]:
!pip install requests

Looking in indexes: https://anu9rng:****@rb-artifactory.bosch.com/artifactory/api/pypi/python-virtual/simple


In [None]:
import requests # For the http request
import json # For the transfer of the parameters
import time # Calculating the time from the web request

#### 2. API-Konfiguration und Authentifizierung

Dieser Codeblock definiert die grundlegenden Parameter für die Kommunikation mit dem Google Cloud Gateway, das den Zugang zum Large Language Model ermöglicht.

*   **`API_GATEWAY_URL`**: Dies ist die Basis-URL des Google Cloud Gateways. Alle API-Anfragen an das Gemini Pro Modell werden an diese Adresse gesendet.
*   **`GATEWAY_API_KEY`**: Dieser Schlüssel dient der Authentifizierung gegenüber dem Google Cloud Gateway selbst. Er identifiziert eure Anwendung als berechtigt, das Gateway zu nutzen.
*   **`USER_API_KEY`**: Dieser persönliche Schlüssel identifiziert euch als spezifischen Nutzer. Er wird verwendet, um eure individuellen Anfragen zu verifizieren und zuzuordnen.

Anschließend werden diese Schlüssel zusammen mit dem `Content-Type` in einem **`headers`**-Dictionary gebündelt. Dieses `headers`-Dictionary wird bei jeder API-Anfrage mitgesendet und stellt sicher, dass die Kommunikation korrekt formatiert und authentifiziert ist.

In [None]:

API_GATEWAY_URL =  "https://gemini-main-gateway-2zozxknb.ew.gateway.dev/"


GATEWAY_API_KEY = ""


USER_API_KEY = ""

prompt_text = " Write a test Hello World"

timeout_seconds = 600 # hppt request timeout

headers = {
    "Content-Type": "application/json",
    "x-api-key": GATEWAY_API_KEY,
    "x-user-api-key": USER_API_KEY,
    "LLM_parameters": "False" # auf "True" setzen um die Parameter zu benutzen
}


#### 3. Nutzerprompt

Im folgenden Abschnitt könnt ihr eure Anfrage an Gemini Pro eingeben. Dieser Prompt wird als Eingabe für das Large Language Model dienen, um die gewünschte Antwort zu generieren.

In [7]:
#prompt_text = "test, respnd test"

prompt_text = ''' import time
from flow6d import System,Mover

def main():
    """Demonstrates the MoverSystem and Mover classes with dynamic discovery."""
    system = System()

    available_mover_ids = system.list_available_movers()
    print(f"Available Movers: {available_mover_ids}")

    if not available_mover_ids:
        print("No movers available. Exiting.")
        return

    selected_mover_id = available_mover_ids[0]

    if selected_mover_id not in available_mover_ids:
        print(f"Invalid mover ID selected. Exiting.")
        return

    mover = system.get_mover(selected_mover_id)

    if not mover:
        print(f"Could not retrieve mover {selected_mover_id}. Exiting.")
        return

    target_positions = [
        (0.15, 0.2, 0.045, 0.0, 0.0, 0.0, 0.2, 0.1, 0.3, 0.2, 50.0, 50.0),
        (0.15, 0.5, 0.05, 0.0, 0.0, 0.0, 0.2, 0.1, 0.3, 0.2, 50.0, 50.0),
        (0.15, 0.2, 0.045, 0.0, 0.0, 0.0, 0.2, 0.1, 0.3, 0.2, 50.0, 50.0),
        (0.15, 0.5, 0.05, 0.0, 0.0, 0.0, 0.2, 0.1, 0.3, 0.2, 50.0, 50.0)
    ]


    print(f"\n--- Controlling Mover {mover.mover_id} ---")

    for x, y, z, rx, ry, rz, lin_vel, rot_vel, lin_acc, rot_acc, lin_jerk, rot_jerk in target_positions:
        mover.move_linear(
            x, y, z, rx, ry, rz, linear_velocity=lin_vel,
            rotation_velocity=rot_vel, linear_acceleration=lin_acc,
            rotation_acceleration=rot_acc, linear_jerk=lin_jerk, rotation_jerk=rot_jerk
        )

        while True:
            state = mover.get_moverstate()
            if state == "Holding":
                break
            current_position = mover.get_position()
            if current_position:
                print(
                    f"Current Position: x={current_position.get('x')}, "
                    f"y={current_position.get('y')}, z={current_position.get('z')}"
                )
            time.sleep(0.1)            
        print("point reached")

if __name__ == "__main__":
    main()

schreibe mir das programm so um das ich einen Mover von postion 1 zu position 2 benege, benutze das für das Beispiel siehe oben

    
'''



## 4. Konfiguration der API-Anfrage (Payload)

Dieser Codeblock definiert den `payload` (die "Nutzlast"), der die tatsächlichen Daten und Einstellungen für die Anfrage an das Gemini Pro Modell enthält.

*   **`prompt`**: Dies ist der eigentliche Text, den ihr als Anweisung oder Frage an das Large Language Model senden möchtet. Hier wird der zuvor definierte `prompt_text` eingesetzt.
*   **`temperature`**: Steuert die Kreativität und Zufälligkeit der generierten Antwort.
    *   Ein Wert nahe 0 (z.B. 0.0) führt zu sehr deterministischen und konservativen Antworten (weniger Variation).
    *   Ein höherer Wert (z.B. 1.0) führt zu kreativeren und diverseren Antworten, die aber auch weniger vorhersehbar sein können.
    *   **Standardempfehlung:** Für die meisten Anwendungsfälle liegt ein guter Startwert oft zwischen 0.5 und 0.9.
*   **`top_p`**: Auch bekannt als "nucleus sampling". Dieser Parameter begrenzt die Auswahl der nächsten Wörter auf eine bestimmte kumulative Wahrscheinlichkeitsverteilung.
    *   Ein Wert von 1.0 (Standard) bedeutet, dass alle Wörter berücksichtigt werden.
    *   Ein Wert von 0.9 würde beispielsweise bedeuten, dass nur die Top-Wörter berücksichtigt werden, deren kumulierte Wahrscheinlichkeit 90% erreicht. Dies kann helfen, weniger plausible Wörter zu vermeiden und die Kohärenz zu verbessern.
*   **`top_k`**: Limitiert die Auswahl der nächsten Wörter auf die `k` wahrscheinlichsten Optionen.
    *   Ein Wert von 1 würde nur das wahrscheinlichste Wort auswählen.
    *   Ein höherer Wert (z.B. 32) erweitert die Auswahl auf die 32 wahrscheinlichsten Wörter.
    *   Dies kann dazu beitragen, die Vielfalt der generierten Antworten zu erhöhen, während gleichzeitig unpassende Wörter ausgeschlossen werden.
*   **`candidate_count`**: Gibt an, wie viele verschiedene Antwortvorschläge (Kandidaten) das Modell generieren soll.
    *   Ein Wert von 1 (Standard) bedeutet, dass nur eine Antwort generiert wird.
    *   Höhere Werte können nützlich sein, um verschiedene Formulierungen oder Ansätze des Modells zu vergleichen.
*   **`max_output_tokens`**: Definiert die maximale Länge der vom Modell generierten Antwort, gemessen in Tokens. Ein Token kann ein Wort, ein Teil eines Wortes oder ein Satzzeichen sein.
    *   Ein höherer Wert erlaubt längere Antworten, kann aber auch die Rechenzeit erhöhen.
    *   Stellt sicher, dass das Modell genügend "Platz" hat, um eine vollständige Antwort zu generieren.

In [8]:
payload = {
    "prompt": prompt_text,
    "temperature"       : 0.9,
    "top_p"             : 1.0,
    "top_k"             : 32,
    "candidate_count"   : 1,
    "max_output_tokens" : 100000
}


#### 5. Ausführen der API-Anfrage und Fehlerbehandlung

Dieser Codeblock ist für das Senden der konfigurierten Anfrage an die Gemini Pro API und für die robuste Behandlung potenzieller Fehler zuständig.

Der gesamte Vorgang ist in einem `try...except`-Block gekapselt, um auf mögliche Probleme während der Kommunikation reagieren zu können.

*   **`try` Block**:
    *   **`response = requests.post(API_GATEWAY_URL, headers=headers, data=json.dumps(payload))`**: Hier wird die eigentliche POST-Anfrage gesendet.
        *   `API_GATEWAY_URL`: Die zuvor definierte URL des API-Gateways.
        *   `headers`: Das Dictionary mit den Authentifizierungs-Headern.
        *   `data=json.dumps(payload)`: Der konfigurierte `payload` (Nutzer-Prompt und Parameter) wird in ein JSON-Format umgewandelt und als Datenkörper der Anfrage mitgeschickt.
    *   **`response.raise_for_status()`**: Diese Methode prüft den Statuscode der Serverantwort. Wenn der Statuscode auf einen Client-Fehler (4xx) oder Server-Fehler (5xx) hinweist, wird automatisch eine `requests.exceptions.HTTPError` Ausnahme ausgelöst. Dies vereinfacht die Fehlererkennung.
    *   **`print("STATUSCODE:", response.status_code)`**: Gibt den HTTP-Statuscode der erfolgreichen Antwort aus (erwartet wird `200` für "OK").
    *   **`print(response.text)`**: Zeigt den eigentlichen Textinhalt der Serverantwort an, welche die generierte Antwort von Gemini Pro enthalten sollte.

*   **`except requests.exceptions.HTTPError as e` Block**:
    *   Dieser Block wird ausgeführt, wenn die `response.raise_for_status()`-Methode einen HTTP-Fehler erkannt hat (z.B. falsche Authentifizierung, Serverfehler).
    *   Er gibt detaillierte Informationen über den aufgetretenen Fehler aus, einschließlich des Statuscodes und der Fehlermeldung vom Server, um die Problembehebung zu erleichtern.

*   **`except requests.exceptions.RequestException as e` Block**:
    *   Dieser Block fängt alle anderen Arten von `requests`-spezifischen Fehlern ab, die nicht direkt HTTP-Fehler sind. Dazu gehören beispielsweise Probleme mit der Netzwerkverbindung, DNS-Fehler oder Timeouts.
    *   Er informiert den Benutzer über einen allgemeinen Verbindungsfehler.

Hinweise: 

- Diese robuste Fehlerbehandlung ist entscheidend, um die Stabilität der Anwendung zu gewährleisten und bei Problemen nützliche Rückmeldungen zu liefern.
- In der Cloud wird dein Prompt noch durch folgenden 

In [None]:
try:
    start_time = time.time()
    # make a post request
    response = requests.post(
                            API_GATEWAY_URL, 
                            headers=headers, 
                            data=json.dumps(payload),
                            timeout= timeout_seconds,
                            )

    # look for a 4xx 5xx error)
    response.raise_for_status()

    
    print("\n--- ERFOLG! ---")
    print("STATUSCODE:", response.status_code) # should send 200
    print("\nAntwort vom Gemini-Modell:")
    print(response.text)
    print("------------------------------------------")
    print("\nThe system is WOrking successfully")
    end_time = time.time()
    time_dif = end_time - start_time
    print(f"time for response: {time_dif}")

except requests.exceptions.HTTPError as e:
    # takes care of Errors linke 404, 403, 500
    print("\n--- An error occurred  ---")
    print(f"Statuscode: {e.response.status_code}")
    print(f"Server Message: {e.response.text}")
    print("---------------------------------")

except requests.exceptions.RequestException as e:
    # takess care of network issues
    print(f"\nAn connection Error occurred  {e}")


--- EIN FEHLER IST AUFGETRETEN ---
Statuscode: 504
Antwort vom Server: {"code":504,"message":"upstream request timeout"}

---------------------------------


#### Aufgabenebschreibung
1.1 Schreibe einen Prompt, der den Mover von Position 1 zu Position 2 fahren lässt. Dabei sollen die Mover mit den folgenden Parametern angesteuert werden:
- Position x
- Position y
- Geschwindigkeit

1.2 Erweitere den Prompt so, dass die folgenden Parameter auch angesteuert werden:
- Wippen
- Drehen

2.1 Baue die Anfrage so um, dass du einen Nutzerprompt hast und einen Systemprompt. Dabei unterscheiden sich die beiden insofern, dass der Nutzerprompt sich bei jeder Anfrage verändert und der Systemprompt jedes Mal gleich bleibt. Dabei spiegelt der Nutzerprompt die Intention des Nutzers wider und der Systemprompt reguliert die Nutzerausgabe.

2.2 Schreibe einen einfachen Satz in die Nutzerausgabe, wie "Ich will, dass der Mover von hier (x,y) zu (x,y) fährt und sich an Position (x,y) dreht". Schreibe den Systemprompt so, dass er eine Anfrage händeln kann, die z. B. unvollständig oder sehr unkonkret ist.

2.3 Ändere deinen Systemprompt so, dass das System in der Lage ist, mit unterschiedlichen Hindernissen umzugehen und diese zu umfahren.

2.4 Szenario: Ein Mover wartet und steht dabei einem anderem im Weg. Erweitere deinen Systemprompt so, dass der Mover 1 zu dem Mover 2 fährt, wartet, bis dieser seine Position verlassen hat, um Platz zu machen, und fahre im Anschluss den Mover 1 an die Position von Mover 1.

3.1 Es gibt einen Hindernis-Parcours. Wie einfach kann der User-Prompt sein, sodass der Mover den Parcours durchläuft?

3.2 Lass zwei Mover mit einander inteagieren, so das beide sich parallel bewegen.

#### Prompting-Techniken und Probleme bei der Codegenerierung

Bei der Nutzung von Large Language Models (LLMs) zur Codegenerierung ist die Qualität des Prompts entscheidend für das Ergebnis. Ein gut formulierter Prompt kann zu präzisem, lauffähigem und optimiertem Code führen, während ein unklarer oder unvollständiger Prompt zu irrelevanten, fehlerhaften oder sogar unsicheren Ergebnissen führen kann.

##### Häufige Prompting-Techniken für Codegenerierung:

1.  **Zero-Shot Prompting:**
    *   **Beschreibung:** Eine direkte Anweisung, ohne Beispiele. Das LLM muss die Aufgabe aus dem Kontext und seinem Training selbstständig lösen.
    *   **Beispiel:** "Schreibe eine Python-Funktion, die zwei Zahlen addiert."
    *   **Anwendung:** Gut für einfache, klar definierte Aufgaben.

2.  **Few-Shot Prompting:**
    *   **Beschreibung:** Der Prompt enthält ein oder mehrere Beispiele für die gewünschte Eingabe und Ausgabe, um das LLM auf das gewünschte Format oder den Stil einzustimmen.
    *   **Beispiel:**
        
      Beispiel 1:
      Input: Eine Funktion, die "Hallo Welt" ausgibt. <br>
      Output: <br>
      def greet_world(): <br>
      <div style="margin-left: 2em;">print("Hallo Welt")
      </div>
      <br> Beispiel 2:
      Input: Eine Funktion, die zwei Zahlen addiert. <br>
      Output: <br>
      def add_numbers(a, b): <br>
      <div style="margin-left: 2em;"> return a + b </div> <br>

      Input: Eine Funktion, die den größten Wert in einer Liste findet.
      Output:
     
        
    *   **Anwendung:** Ideal, um das LLM an spezifische Coding-Stile, komplexe Logiken oder die Einhaltung bestimmter API-Signaturen zu gewöhnen.

3.  **Chain-of-Thought (CoT) Prompting:**
    *   **Beschreibung:** Das LLM wird angewiesen, seine Denkprozesse oder Zwischenschritte zu verbalisieren, bevor es die endgültige Antwort (den Code) generiert. Dies hilft dem Modell, komplexe Probleme schrittweise zu lösen.
    *   **Beispiel:** "Schreibe eine Python-Funktion, die prüft, ob eine Zahl prim ist. Denke Schritt für Schritt darüber nach, wie eine Primzahl definiert ist und welche Prüfungen notwendig sind, bevor du den Code schreibst."
    *   **Anwendung:** Besonders nützlich für algorithmenlastige oder mehrstufige Codierungsaufgaben.

4.  **Role-Playing / Persona Prompting:**
    *   **Beschreibung:** Das LLM nimmt die Rolle eines bestimmten Experten an (z.B. ein erfahrener Python-Entwickler, ein Sicherheitsexperte).
    *   **Beispiel:** "Du bist ein erfahrener JavaScript-Entwickler. Schreibe eine asynchrone Funktion, die Daten von einer API abruft und Fehler behandelt."
    *   **Anwendung:** Beeinflusst den Stil, die Best Practices und die Gründlichkeit des generierten Codes.

##### Häufige Probleme bei der Codegenerierung durch LLMs:

1.  **"Lost in the Middle" (Verlust im Kontext):**
    *   **Problem:** LLMs tendieren dazu, Informationen am Anfang und Ende eines längeren Prompts besser zu verarbeiten als jene in der Mitte. Bei umfangreichen Code-Anfragen oder detaillierten Spezifikationen in der Mitte des Prompts kann das LLM wichtige Details übersehen.
    *   **Lösung:** Schlüsselinformationen oder entscheidende Randbedingungen am Anfang oder Ende des Prompts platzieren. Prompts in kleinere, fokussierte Schritte unterteilen.

2.  **Unzureichende oder Vage Spezifikationen:**
    *   **Problem:** Wenn der Prompt zu allgemein gehalten ist (z.B. "Schreibe eine Web-App"), fehlt dem LLM die notwendige Klarheit über die gewünschte Funktionalität, Technologie (Frameworks, Sprachen), Architektur oder Fehlerbehandlung.
    *   **Lösung:** So präzise wie möglich sein: Gebt die gewünschte Programmiersprache, Frameworks, erwartete Ein- und Ausgaben, Fehlerbehandlungsstrategien und Testfälle an.

3.  **Halluzinationen / Faktische Fehler im Code:**
    *   **Problem:** Das LLM kann Code generieren, der syntaktisch korrekt aussieht, aber logische Fehler enthält, falsche APIs verwendet oder Best Practices ignoriert. Dies ist besonders kritisch bei sicherheitsrelevantem Code.
    *   **Lösung:** Prompting mit expliziten Anforderungen an Robustheit, Effizienz oder Sicherheitsaspekte. Immer den generierten Code *gründlich überprüfen und testen*, da LLMs keine Garantien für Korrektheit bieten.

4.  **Fehlende Kontextkenntnisse (Domänenwissen):**
    *   **Problem:** LLMs haben kein intrinsisches Verständnis für eure spezifische Codebasis, interne APIs, Unternehmensstandards oder komplexe Domänenlogiken. Der generierte Code passt möglicherweise nicht nahtlos in eure bestehende Infrastruktur.
    *   **Lösung:** Relevante Code-Snippets, API-Dokumentationen oder interne Richtlinien im Prompt bereitstellen (Few-Shot). Fine-Tuning des Modells mit eigenen Daten (fortgeschritten).

5.  **Formatierungs- und Layout-Probleme:**
    *   **Problem:** Obwohl LLMs Code generieren können, halten sie sich nicht immer an spezifische Code-Formatierungsstandards (PEP8 für Python, etc.), Indentierungskonventionen oder bevorzugte Kommentierungsstile.
    *   **Lösung:** Im Prompt explizit Formatierungsregeln (z.B. "halte dich an PEP8", "verwende 4 Leerzeichen für Einrückungen") und Kommentierungsstile vorgeben. Beispiele (Few-Shot) für den gewünschten Stil sind hier sehr effektiv.

Durch das Verständnis dieser Techniken und potenziellen Fallstricke könnt ihr die Effektivität von LLMs bei der Codegenerierung erheblich steigern und bessere, zuverlässigere Ergebnisse erzielen.#

#### Inforamtionen zum Google Cloud Backend

Informationen zum Backend: https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/2-5-pro?hl=de

Für weitere Informationen wende dich gerne an Rene Kübler
