# Ollama & OpenWebUI in Google Colab\n\nDieses Notizbuch richtet ein Ollama-Sprachmodell ein und macht es √ºber eine √∂ffentliche OpenWebUI-Schnittstelle zug√§nglich.\n\n**Anleitung:**\n1. Stellen Sie sicher, dass Ihre Colab-Laufzeit auf eine GPU-Instanz eingestellt ist (`Laufzeit` > `Laufzeittyp √§ndern` > `T4 GPU`).\n2. F√ºhren Sie die Zellen nacheinander aus. √úberpr√ºfen Sie nach jedem Schritt die Ausgaben.

## 1. Installation

In [None]:
#@markdown F√ºhren Sie diese Zelle aus, um alle erforderlichen Abh√§ngigkeiten zu installieren.\n#@markdown > ‚è≥ **Dies kann einige Minuten dauern.**\n%%capture\nprint("‚è≥ Installation von Ollama, OpenWebUI und ngrok wird gestartet...")\n!pip install open-webui pyngrok nest-asyncio\n!curl -fsSL https://ollama.com/install.sh | sh\nprint("‚úÖ Installation abgeschlossen!")

### Installationspr√ºfung

In [None]:
#@markdown F√ºhren Sie diese Zelle aus, um zu √ºberpr√ºfen, ob Ollama korrekt installiert wurde.\nimport os
print("--- √úberpr√ºfung des Installationspfads ---")
path = !which ollama
if path:
    print(f"‚úÖ Ollama gefunden in: {path[0]}")
else:
    print("‚ùå Ollama wurde nicht im Systempfad gefunden.")

print("\n--- √úberpr√ºfung der Version ---")
version = !ollama --version
if version:
    print(f"‚úÖ {version[0]}")
else:
    print("‚ùå Ollama-Version konnte nicht abgerufen werden.")

## 2. Systemressourcen pr√ºfen\n\nF√ºhren Sie diese Zelle aus, um den verf√ºgbaren Speicherplatz und Arbeitsspeicher zu √ºberpr√ºfen. Gro√üe Modelle ben√∂tigen viel von beidem.

In [None]:
print("--- Festplattenspeicher ---")
!df -h | grep -E 'Filesystem|overlay'
print("\n--- Arbeitsspeicher (RAM) ---")
!free -h

## 3. Konfiguration und Start\n\nGeben Sie hier Ihre Konfiguration ein.\n\nüí° **Hinweis zu den Modellen:** Gro√üe Modelle wie `gpt-oss:20b` (ca. 12 GB) oder `llama3:70b` (ca. 40 GB) ben√∂tigen extrem viel RAM und Speicherplatz. **Das Standardmodell `llama3:8b` (ca. 5 GB) ist eine gute Wahl f√ºr Standard-Colab-Instanzen.** Wenn Sie auf Schwierigkeiten sto√üen, versuchen Sie es mit einem noch kleineren Modell wie `phi3` (ca. 2.5 GB).\n\n‚ö†Ô∏è **Sicherheitswarnung:** Das direkte Einf√ºgen von geheimen Schl√ºsseln wird nicht empfohlen. Die sicherste Methode ist die Verwendung von **Colab Secrets**.

In [None]:
#@markdown ---#@markdown ### Konfiguration\n#@markdown Geben Sie das Ollama-Modell an, das Sie verwenden m√∂chten.\nMODEL_NAME = "llama3:8b" #@param {type:"string"}\n#@markdown Geben Sie Ihren ngrok Authtoken ein.\nNGROK_AUTHTOKEN = ""  #@param {type:"string"}\n#@markdown ---\nimport os\nimport asyncio\nimport nest_asyncio\nfrom pyngrok import ngrok\nimport urllib.request\n\nnest_asyncio.apply()\n\nasync def wait_for_service(url, timeout=120):\n    print(f"‚è≥ √úberpr√ºfe die Erreichbarkeit von {url} (Timeout: {timeout}s)...")\n    start_time = asyncio.get_event_loop().time()\n    while True:\n        try:\n            with urllib.request.urlopen(url, timeout=5) as response:\n                if response.status >= 200 and response.status < 300:\n                    print(f"‚úÖ Dienst unter {url} ist erreichbar.")\n                    return True\n        except Exception:\n            pass\n        if (asyncio.get_event_loop().time() - start_time) > timeout:\n            print(f"‚ùå Zeit√ºberschreitung beim Warten auf {url}.")\n            return False\n        await asyncio.sleep(5)\n\nasync def run_ollama():\n    if NGROK_AUTHTOKEN:\n        ngrok.set_auth_token(NGROK_AUTHTOKEN)\n        print("‚úÖ ngrok Authtoken konfiguriert.")\n    else:\n        print("‚ö†Ô∏è Kein ngrok Authtoken angegeben. Tunnel k√∂nnte fehlschlagen.")\n\n    with open('ollama.log', 'w') as f: f.write('')\n    with open('webui.log', 'w') as f: f.write('')\n    with open('pull.log', 'w') as f: f.write('')\n\n    print("‚è≥ Starte Ollama-Server...")\n    ollama_process = await asyncio.create_subprocess_shell('ollama serve > ollama.log 2>&1')\n    ollama_ready = await wait_for_service("http://127.0.0.1:11434")\n    if not ollama_ready:\n        print("‚ùå Ollama-Server wurde nicht rechtzeitig erreichbar. Pr√ºfe ollama.log.")\n        return\n\n    print(f"‚è≥ Lade das Modell '{MODEL_NAME}' herunter. Dies kann einige Zeit dauern...")\n    pull_process = await asyncio.create_subprocess_shell(f'ollama pull {MODEL_NAME} > pull.log 2>&1')\n    await pull_process.wait()\n    if pull_process.returncode != 0:\n        print("‚ùå Fehler beim Herunterladen. Schau in pull.log und ollama.log.")\n        return\n    print(f"‚úÖ Modell '{MODEL_NAME}' erfolgreich heruntergeladen!")\n\n    print("‚è≥ Starte OpenWebUI-Server...")\n    os.environ['OLLAMA_BASE_URL'] = 'http://127.0.0.1:11434'\n    webui_process = await asyncio.create_subprocess_shell('open-webui --host 0.0.0.0 --port 8080 > webui.log 2>&1')\n\n    server_ready = await wait_for_service("http://127.0.0.1:8080")\n    if server_ready:\n        try:\n            public_url = ngrok.connect(8080)\n            print(f"\n‚úÖ OpenWebUI ist bereit! Link: {public_url}")\n        except Exception as e:\n            print(f'\n‚ùå Fehler beim Starten von ngrok: {e}')\n    else:\n        print("\n‚ùå OpenWebUI konnte nicht gestartet werden. Siehe webui.log")\n\n    print("\n‚ÑπÔ∏è Warte auf das Beenden von OpenWebUI (die Zelle bleibt offen).")\n    await webui_process.wait()\n\nasyncio.run(run_ollama())

---## 4. Fehlerbehebung\n\nWenn Sie Probleme haben, f√ºhren Sie diese Zelle aus, um die Log-Dateien anzuzeigen.

In [None]:
print("--- OLLAMA LOG (ollama.log) ---")
with open('ollama.log', 'r') as f:
    print(f.read())
\nprint("\n--- MODEL PULL LOG (pull.log) ---")
with open('pull.log', 'r') as f:
    print(f.read())
\nprint("\n--- OPENWEBUI LOG (webui.log) ---")
with open('webui.log', 'r') as f:
    print(f.read())