# GPT-OSS mit OpenWebUI in Google Colab

Dieses Notizbuch richtet das `gpt-oss:20b`-Modell mit Ollama ein und macht es über eine öffentliche OpenWebUI-Schnittstelle zugänglich.

**Anleitung:**
1. Stellen Sie sicher, dass Ihre Colab-Laufzeit auf eine GPU-Instanz eingestellt ist (`Laufzeit` > `Laufzeittyp ändern` > `T4 GPU`).
2. Führen Sie die Zellen nacheinander aus, indem Sie auf das "Play"-Symbol klicken oder `Shift + Enter` drücken.

In [None]:
#@markdown Führen Sie diese Zelle aus, um alle erforderlichen Abhängigkeiten zu installieren.
#@markdown > ⏳ **Dies kann einige Minuten dauern.**
%%capture
print("⏳ Installation von Ollama, OpenWebUI und ngrok wird gestartet...")
!pip install open-webui pyngrok nest-asyncio
!curl -fsSL https://ollama.com/install.sh | sh
print("✅ Installation abgeschlossen!")

## 2. Server starten und auf die Web-UI zugreifen

Fügen Sie unten Ihren `ngrok`-Authtoken ein. Sie finden Ihren Token auf dem [ngrok Dashboard](https://dashboard.ngrok.com/get-started/your-authtoken).

⚠️ **Sicherheitswarnung:** Das direkte Einfügen von geheimen Schlüsseln (wie Ihrem ngrok-Token) in Notizbücher wird nicht empfohlen, insbesondere wenn Sie das Notizbuch teilen möchten. Die sicherste Methode ist die Verwendung von **Colab Secrets** (Schlüssel-Symbol in der Seitenleiste). Das Skript ist so konzipiert, dass es Secrets automatisch erkennt, falls vorhanden.

In [None]:
#@markdown Fügen Sie hier Ihren ngrok Authtoken ein.
NGROK_AUTHTOKEN = ""  #@param {type:"string"}

#@markdown Führen Sie diese Zelle aus, um Ollama und OpenWebUI zu starten.
#@markdown > ⏳ **Das Herunterladen des Modells kann eine Weile dauern.**
import os
import asyncio
import nest_asyncio
from pyngrok import ngrok

# Erlaubt die verschachtelte Verwendung von asyncio.run() in Umgebungen wie Colab
nest_asyncio.apply()

async def run_ollama():
    # Ngrok Authtoken konfigurieren, falls vorhanden
    if NGROK_AUTHTOKEN:
        ngrok.set_auth_token(NGROK_AUTHTOKEN)
        print("✅ ngrok Authtoken konfiguriert.")
    else:
        print("⚠️ Kein ngrok Authtoken angegeben. Es wird versucht, ohne Authentifizierung fortzufahren. Dies kann fehlschlagen.")

    # Ollama im Hintergrund starten
    ollama_process = await asyncio.create_subprocess_shell(
        'ollama serve',
        stdout=asyncio.subprocess.PIPE,
        stderr=asyncio.subprocess.PIPE
    )
    print("⏳ Ollama-Server wird gestartet...")
    # Kurz warten, bis der Server bereit ist
    await asyncio.sleep(5)

    # Modell herunterladen
    print("⏳ Lade das gpt-oss:20b Modell herunter. Dies kann einige Zeit dauern...")
    pull_process = await asyncio.create_subprocess_shell(
        'ollama pull gpt-oss:20b',
        stdout=asyncio.subprocess.PIPE,
        stderr=asyncio.subprocess.PIPE
    )
    await pull_process.communicate()
    print("✅ Modell erfolgreich heruntergeladen!")

    # OpenWebUI starten
    print("⏳ OpenWebUI wird gestartet...")
    os.environ['OLLAMA_BASE_URL'] = 'http://127.0.0.1:11434'
    webui_process = await asyncio.create_subprocess_shell(
        'open-webui --host 0.0.0.0 --port 8080',
        stdout=asyncio.subprocess.PIPE,
        stderr=asyncio.subprocess.PIPE
    )
    await asyncio.sleep(10) # Zeit geben zum Starten

    # Ngrok-Tunnel einrichten und öffentliche URL ausgeben
    try:
      public_url = ngrok.connect(8080)
      print(f"\n✅ OpenWebUI ist bereit! Öffnen Sie diesen Link in Ihrem Browser:\n{public_url}")
    except Exception as e:
      print(f'\nFehler beim Starten von ngrok: {e}')
      print("Bitte stellen Sie sicher, dass Ihr Authtoken korrekt ist. Sie können ihn oben eingeben oder als Colab Secret namens 'NGROK_AUTHTOKEN' speichern.")
    
    # Prozesse am Leben halten
    await asyncio.gather(ollama_process.wait(), webui_process.wait())

# Führt die asynchrone Funktion aus
asyncio.run(run_ollama())