<p><font size="7" color='grey'> <b>
Anwendung Generativer KI
</b></font> </br></p>

<p><font size="6" color='grey'> <b>
Modul 08: Multimodal und Text-zu-Bild
</b></font> </br></p>


---

# 1 | Übersicht
---

# Teil 10.1: StreamLit in Google Colab ausführen

In diesem Modul erkunden wir Streamlit, ein leistungsstarkes Tool zum Erstellen interaktiver Webanwendungen. Streamlit bietet eine einfache und intuitive Möglichkeit, Benutzeroberflächen für unsere generativen KI-Anwendungen zu erstellen, sodass Benutzer in Echtzeit mit KI-Modellen interagieren können. Durch die Verwendung von Streamlit können wir die Zugänglichkeit und Benutzerfreundlichkeit unserer KI-Lösungen verbessern und es einfacher machen, Ergebnisse zu präsentieren, Benutzereingaben zu akzeptieren und Daten zu visualisieren – alles über eine webbasierte Schnittstelle, ohne dass umfassende Kenntnisse in der Webentwicklung erforderlich sind.

* [StreamLit](https://streamlit.io/)
* [StreamLit Documentation](https://docs.streamlit.io/)

Streamlit ist eine Open-Source-Python-Bibliothek, mit der sich benutzerdefinierte Webanwendungen für Projekte im Bereich maschinelles Lernen und Datenwissenschaft einfach erstellen und teilen lassen. Streamlit wurde mit Blick auf Einfachheit entwickelt und ermöglicht es Entwicklern, Datenskripte mit nur wenigen Codezeilen in interaktive Apps umzuwandeln. Es bietet integrierte Komponenten wie Schieberegler, Schaltflächen, Texteingabe und Diagramme, die mühelos in eine Anwendung integriert werden können. Streamlit aktualisiert die App automatisch, wenn der Code aktualisiert wird, und bietet eine sofortige Vorschau der Änderungen. Dies macht es zu einem idealen Tool zum schnellen Erstellen und Bereitstellen von Schnittstellen für KI-Modelle, Datenvisualisierungen und verschiedene Datenwissenschaftsaufgaben.


## Hallo Welt StreamLit

Als Nächstes sehen wir uns eine einfache „Hallo Welt!“-Anwendung in Streamlit an, um eine praktische Einführung in deren Funktionalität zu erhalten. Dieses grundlegende Beispiel zeigt, wie Sie mit nur wenigen Zeilen Python-Code eine Streamlit-App erstellen und ausführen. Nachdem wir die App erstellt haben, untersuchen wir, wie Sie sie mit Google Colab bereitstellen und über eine Weboberfläche zugänglich machen.

Wir müssen eine Datei „app.py“ schreiben, und das tun wir mit der Zeile „%%writefile app.py“, einem magischen Befehl, der in Umgebungen wie Jupyter Notebook verwendet wird, um den Code zu erstellen und in einer neuen Datei namens „app.py“ zu speichern. Im Skript importiert die Anweisung „import streamlit as st“ die Streamlit-Bibliothek und weist ihr zur einfacheren Verwendung den Alias ​​„st“ zu. Die Zeile „st.write(„Hello World“)“ ist ein einfacher Befehl in Streamlit, der den Text „Hello World“ an die Anwendungsschnittstelle ausgibt. Wenn dieses Skript mit Streamlit ausgeführt wird, startet es eine Web-App, die die Nachricht „Hello World“ anzeigt und als grundlegendes Beispiel dafür dient, wie Streamlit eine Benutzeroberfläche erstellen kann.

In [None]:
%%writefile app.py
import streamlit as st

st.write("Hello World")


In diesem Modul verwenden wir npx, um einen sicheren Tunnel zum Streamlit-Server zu erstellen, der in unserer Google Colab-Umgebung läuft. Da Colab in einer Remote-Umgebung ohne direkten Zugriff auf localhost ausgeführt wird, können wir durch Tunneln die Streamlit-App im Web verfügbar machen und mit ihr interagieren. Um diesen Tunnel einzurichten, verwenden wir den folgenden Befehl, um das erforderliche Passwort abzurufen. Dieses Passwort entspricht der IP-Adresse des Colab-Knotens, auf dem unser Streamlit-Server läuft. Mithilfe dieser IP-Adresse können wir unsere Verbindung durch den Tunnel authentifizieren und so einen sicheren Pfad für den Zugriff auf die Streamlit-App von unserem lokalen Browser aus bereitstellen.

In [None]:
!curl https://loca.lt/mytunnelpassword

Als nächstes starten wir StreamLit, damit es im Hintergrund unserer CoLab-Instanz ausgeführt wird.

In [None]:
!streamlit run app.py &>/content/logs.txt &

Wir sind jetzt bereit, den Tunnel zu starten. Sie erhalten eine URL für den Zugriff auf Ihre StreamLit-App. Sie müssen das zuvor erhaltene Passwort/die IP-Adresse eingeben. Dieser Befehl wird so lange ausgeführt, bis Sie ihn stoppen.

In [None]:
!npx localtunnel --port 8501

## Einfache StreamLit-Eingabe

Nun sehen wir uns ein Beispiel an, das zeigt, wie man einen mathematischen Ausdruck vom Benutzer über eine einfache Schnittstelle akzeptiert und auswertet. Der folgende Code erstellt eine einfache Streamlit-Anwendung, die einen mathematischen Ausdruck als Eingabe verwendet und auswertet und dabei sicherstellt, dass nur gültige Eingaben akzeptiert werden.

Das Skript beginnt mit dem Importieren der erforderlichen Bibliotheken streamlit und re. Es definiert eine Funktion evaluate_expression(expression), die einen regulären Ausdruck (re.match) verwendet, um nur Zahlen, Operatoren (+, -, *, /) und Klammern in der Eingabe zuzulassen. Wenn die Eingabe gültig ist, versucht es, den Ausdruck mithilfe der eval()-Funktion von Python auszuwerten. Wenn die Auswertung fehlschlägt, wird eine Fehlermeldung zurückgegeben. Die Streamlit-App selbst besteht aus einem Titel, „Simple Expression Evaluator“, und einem Texteingabefeld, in das der Benutzer einen mathematischen Ausdruck eingeben kann. Sobald der Benutzer den Ausdruck eingibt, wird das Ergebnis berechnet und auf der Seite angezeigt. Wenn die Eingabe ungültige Zeichen enthält, benachrichtigt die App den Benutzer.

In [None]:
%%writefile app.py
import streamlit as st
import re

def evaluate_expression(expression):
    # Erlaube nur Zahlen, Operatoren und Klammern
    if re.match(r'^[0-9+\-*/(). ]+$', expression):
        try:
            # Bewerten Sie den Ausdruck
            result = eval(expression)
            return result
        except Exception as e:
            return f"Error: {str(e)}"
    else:
        return "Invalid input: Only numbers and mathematical operators are allowed."

# Streamlit-App
st.title("Simple Expression Evaluator")

# Benutzereingabe
expression = st.text_input("Enter a mathematical expression:", "")

# Ergebnisse auswerten und anzeigen
if expression:
    result = evaluate_expression(expression)
    st.write(f"Result: {result}")

Wie zuvor holen wir uns das Passwort, starten den Server und anschließend den Tunnel.

In [None]:
!curl https://loca.lt/mytunnelpassword

In [None]:
!streamlit run app.py &>/content/logs.txt &

In [None]:
!npx localtunnel --port 8501

# Modul 10 Aufgabe

Die erste Aufgabe findet ihr hier: [assignment 10](https://github.com/jeffheaton/app_generative_ai/blob/main/assignments/assignment_yourname_t81_559_class10.ipynb)

# Teil 10.2: StreamLit-Einführung


In diesem Modul erkunden wir Streamlit, ein leistungsstarkes Tool zum Erstellen interaktiver Webanwendungen mit minimalem Code. Wir werden zwei praktische Beispiele durchgehen, um seine Fähigkeiten zu demonstrieren:

1. Generator für Tilgungstabellen: Im ersten Beispiel verwenden wir die Benutzeroberflächenelemente von Streamlit, um einen einfachen Generator für Tilgungstabellen zu erstellen. Sie werden sehen, wie einfach es ist, Benutzereingaben zu erfassen, zu verarbeiten und die Ergebnisse in einem interaktiven Format anzuzeigen.

2. Multimodale Bildtransformation: Das zweite Beispiel zeigt die Leistungsfähigkeit multimodaler Modelle. Wir erstellen eine Anwendung, mit der Sie Bilder hochladen und diese mithilfe von KI in Cartoon-Versionen umwandeln können. Dadurch erhalten Sie ein Verständnis dafür, wie Streamlit die Bildverarbeitung und Anzeigeergebnisse effektiv handhaben kann.

Am Ende dieses Moduls verfügen Sie über ein solides Verständnis für die Verwendung von Streamlit zum Erstellen sowohl datengesteuerter als auch KI-gestützter Anwendungen.

## Beispiel für eine Kreditberechnung


Dieser Code erstellt einen Tilgungsrechner mithilfe von Streamlit, einer Bibliothek zum Erstellen interaktiver Webanwendungen in Python. Die Anwendung besteht aus einer Funktion zum Berechnen des Tilgungsplans und einer einfachen Benutzeroberfläche zum Eingeben von Kreditdetails und Anzeigen der Ergebnisse.

Die Funktion ```calculate_amortization``` verwendet drei Parameter: ```loan_amount```, ```annual_rate``` und ```years```. Sie berechnet zunächst den monatlichen Zinssatz und die Gesamtzahl der Zahlungen während der Laufzeit des Kredits. Anhand dieser berechnet sie die monatliche Zahlung anhand der Standardformel zur Tilgung von Krediten. Anschließend erstellt sie iterativ einen Tilgungsplan, berechnet die Zins- und Tilgungsanteile jeder Zahlung und aktualisiert den Restbetrag. Die Ergebnisse werden in einer Liste gespeichert, die dann in einen Pandas ```DataFrame`` mit Spalten für jeden Monat, Zahlungsbetrag, gezahlte Tilgung, gezahlte Zinsen und Restbetrag umgewandelt wird.

Die Benutzeroberfläche der Streamlit-App beginnt mit dem Titel „Kredittilgungsrechner“. Sie bietet dem Benutzer Eingabefelder, in denen er den Kreditbetrag, den jährlichen Zinssatz und die Kreditlaufzeit in Jahren angeben kann. Diese Eingaben verwenden Streamlits number_input-Methode, mit der Benutzer Werte einfach anpassen können.

Wenn Sie auf die Schaltfläche „Amortisierungstabelle berechnen“ klicken, ruft die Anwendung die Funktion calculate_amortization mit den Eingabewerten auf und zeigt den resultierenden DataFrame an. Außerdem wird der monatliche Zahlungsbetrag angezeigt. Darüber hinaus generiert die Anwendung eine herunterladbare CSV-Datei der Amortisierungstabelle, sodass Benutzer die Ergebnisse lokal speichern können. Diese Funktionalität wird durch die Methode st.download_button bereitgestellt, die die CSV-Daten des DataFrame übernimmt und als herunterladbare Datei anbietet.

In [None]:
%%writefile app.py

import streamlit as st
import pandas as pd

# Funktion zur Berechnung der Kreditamortisierung
def calculate_amortization(loan_amount, annual_rate, years):
    monthly_rate = annual_rate / 12 / 100
    num_payments = years * 12
    monthly_payment = loan_amount * (monthly_rate * (1 + monthly_rate) ** num_payments) / ((1 + monthly_rate) ** num_payments - 1)

    # Tilgungsplan erstellen
    amortization_data = []
    balance = loan_amount
    for i in range(1, num_payments + 1):
        interest_payment = balance * monthly_rate
        principal_payment = monthly_payment - interest_payment
        balance -= principal_payment
        amortization_data.append([i, monthly_payment, principal_payment, interest_payment, max(balance, 0)])

    # DataFrame erstellen
    df = pd.DataFrame(amortization_data, columns=['Month', 'Payment', 'Principal', 'Interest', 'Balance'])
    return df

# Streamlit App
st.title('Loan Amortization Calculator')

# Eingabefelder
loan_amount = st.number_input('Loan Amount', value=300000.0, min_value=0.0, step=1000.0)
annual_rate = st.number_input('Annual Interest Rate (%)', value=7.5, min_value=0.0, step=0.1)
years = st.number_input('Loan Term (years)', value=30, min_value=1, step=1)

# Tilgungsplan berechnen
if st.button('Calculate Amortization Table'):
    amortization_df = calculate_amortization(loan_amount, annual_rate, years)
    st.write(f'Monthly Payment: ${amortization_df["Payment"][0]:,.2f}')
    st.dataframe(amortization_df)

    # Herunterladbare CSV
    csv = amortization_df.to_csv(index=False)
    st.download_button(label="Download Amortization Table as CSV", data=csv, file_name='amortization_schedule.csv', mime='text/csv')


Als Nächstes erhalten wir das Passwort für unseren StreamLit-Server, den wir gerade starten.

In [None]:
!curl https://loca.lt/mytunnelpassword

Wir starten den StreamLit-Server und erhalten seine URL. Sie benötigen das obige Passwort, wenn Sie auf die angegebene URL zugreifen.

In [None]:
!streamlit run app.py server1 &>/content/logs.txt &
!npx --yes localtunnel --port 8501

## Cartoon-Bild

Dieser Code erstellt eine Streamlit-Anwendung, die hochgeladene Bilder mithilfe eines multimodalen Large Language Model (LLM) und Bildgenerierungstools in cartoonartige Versionen umwandelt. Die Anwendung ermöglicht es Benutzern, ein Bild hochzuladen, verarbeitet es mit einem KI-Modell und generiert eine cartoonartige Version, die dann heruntergeladen werden kann.

Die Kernfunktionalität ist in der Funktion „modify_image“ gekapselt. Diese Funktion beginnt mit der Initialisierung des GPT-Modells, genauer gesagt „gpt-4o-mini“. Wenn ein Bild hochgeladen wird, wird es in eine base64-codierte Zeichenfolge konvertiert, um die Kommunikation mit dem LLM zu erleichtern. Es wird eine Nachricht erstellt, die eine Textaufforderung und das base64-codierte Bild kombiniert und dann an das GPT-Modell gesendet wird, um eine geänderte Aufforderung zu generieren. Die Antwort des Modells enthält eine Aufforderung, die das Bild im Cartoon-Stil darstellen soll.

Nach Erhalt dieser Cartoon-Eingabeaufforderung verwendet die Funktion das DALL-E-Modell („dall-e-3“) von OpenAI, um basierend auf der Eingabeaufforderung ein neues Bild zu generieren. Der Bildgenerierungsprozess gibt eine URL zurück, die dann abgerufen und zur weiteren Verarbeitung in ein PIL-Bildobjekt konvertiert wird.

Die Streamlit-App-Oberfläche beginnt mit einem Titel: „Cartoonify Image with Multimodal LLM“. Sie bietet einen Bild-Uploader mit der Methode st.file_uploader, mit dem Benutzer Bilder im JPEG- oder PNG-Format hochladen können. Sobald ein Bild hochgeladen ist, wird es mit der Methode st.image von Streamlit angezeigt.

Anschließend wird die Funktion „modify_image“ aufgerufen, um das hochgeladene Bild zu verarbeiten und in einen Cartoon-Stil umzuwandeln. Während dieser Vorgang abläuft, wird eine Meldung („Cartoon-Version wird erstellt …“) angezeigt, die auf die laufende Aktivität hinweist. Das Cartoon-Bild wird dann in der App angezeigt.

Schließlich bietet die App die Möglichkeit, das Cartoon-Bild herunterzuladen. Dies wird erreicht, indem das geänderte Bild in einem Puffer gespeichert und Streamlits st.download_button verwendet wird, damit der Benutzer es im JPEG-Format herunterladen kann. Dies bietet Benutzern eine nahtlose Möglichkeit, das transformierte Bild nicht nur anzuzeigen, sondern auch lokal zu speichern.

In [None]:
%%writefile app.py

import streamlit as st
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
import base64
import httpx
from openai import OpenAI
from PIL import Image
from io import BytesIO
import matplotlib.pyplot as plt
import requests

def modify_image(image, prompt):
    # Initialisieren des GPT-Modells
    model = ChatOpenAI(model="gpt-4o-mini")

    # Konvertieren Sie das hochgeladene Bild in Base64
    buffered = BytesIO()
    image.save(buffered, format="JPEG")
    image_data = base64.b64encode(buffered.getvalue()).decode("utf-8")

    # Erstellen Sie eine Nachricht mit Text und Bild
    message = HumanMessage(
        content=[
            {"type": "text", "text": prompt},
            {"type": "image_url", "image_url": {"url": f"data:image/jpeg;base64,{image_data}"}},
        ],
    )

    # Erhalten Sie eine Antwort mit einer geänderten Eingabeaufforderung von GPT
    response = model.invoke([message])
    cartoon_prompt = response.content

    # Initialisieren Sie das DALL-E-Modell, um das Bild zu generieren
    client = OpenAI()

    # Generieren Sie das Bild basierend auf der von GPT generierten Cartoon-Eingabeaufforderung
    response = client.images.generate(
        model="dall-e-3",
        prompt=cartoon_prompt,
        size="1024x1024",
        quality="standard",
        n=1,
    )

    # Holen Sie sich die Bild-URL von DALL-E
    image_url = response.data[0].url

    # Holen Sie sich das generierte Bild
    response2 = requests.get(image_url)
    img = Image.open(BytesIO(response2.content))

    return img

# Streamlit-App
st.title("Cartoonify Image with Multimodal LLM")

# Bild-Upload
uploaded_image = st.file_uploader("Upload an image", type=["jpg", "jpeg", "png"])

if uploaded_image is not None:
    # Öffnen Sie das Bild mit PIL
    image = Image.open(uploaded_image)

    # Das Originalbild anzeigen
    st.image(image, caption='Uploaded Image', use_column_width=True)

    # Ändern Sie das Bild so, dass es wie ein Cartoon aussieht
    st.write("Generating cartoon version...")
    cartoon_img = modify_image(image, "Output a prompt that would render this image as a cartoon.")

    # Zeigen Sie das Cartoon-Bild an
    st.image(cartoon_img, caption='Cartoonified Image', use_column_width=True)

    # Bieten Sie eine Option zum Herunterladen des Cartoon-Bildes an
    buffered = BytesIO()
    cartoon_img.save(buffered, format="JPEG")
    st.download_button(
        label="Download Cartoon Image",
        data=buffered.getvalue(),
        file_name="cartoon_image.jpg",
        mime="image/jpeg"
    )


Als Nächstes erhalten wir das Passwort für unseren StreamLit-Server, den wir gerade starten.

In [None]:
!curl https://loca.lt/mytunnelpassword

Wir starten den StreamLit-Server und erhalten seine URL. Sie benötigen das obige Passwort, wenn Sie auf die angegebene URL zugreifen.

In [None]:
!streamlit run app.py server1 &>/content/logs.txt &
!npx --yes localtunnel --port 8501

# Teil 10.3: Den Streamlit-Status verstehen

Streamlit ist ein leistungsstarkes Framework zum Erstellen interaktiver Webanwendungen in Python. Beim Erstellen dynamischerer und komplexerer Apps müssen Sie jedoch möglicherweise Informationen zwischen Benutzerinteraktionen beibehalten, z. B. vorherige Eingaben verfolgen, Berechnungen speichern oder Auswahlen speichern. Hier wird die Statusverwaltung von Streamlit unverzichtbar.

In Streamlit bezieht sich „Status“ auf den Mechanismus zum Speichern und Verwalten von Daten während einer Benutzersitzung. Ohne Statusverwaltung löst jede Interaktion (wie das Klicken auf eine Schaltfläche oder das Ändern einer Eingabe) eine erneute Ausführung der gesamten App aus, wobei alle Werte zurückgesetzt werden, die Sie möglicherweise beibehalten möchten. Mit „Status“ können Sie diese Werte beibehalten und erweiterte und reaktionsfähigere Verhaltensweisen in Ihrer App ermöglichen.

### Wie Streamlit den Status verarbeitet
Streamlit bietet eine einfache Möglichkeit, den Status über st.session_state zu handhaben, ein spezielles Objekt, das Werte während der Sitzung eines Benutzers speichert. Dieses Objekt funktioniert wie ein Wörterbuch, in dem Sie Werte in verschiedenen Teilen Ihrer App speichern, aktualisieren und abrufen können. Durch die Verwendung des Sitzungsstatus können Sie:

* Behalten Sie Benutzereingabewerte bei, wenn Sie durch verschiedene Komponenten Ihrer App navigieren.
* Speichern Sie Berechnungsergebnisse oder Benutzerauswahlen, um sie in nachfolgenden Interaktionen zu verwenden oder zu ändern.
* Erstellen Sie komplexere Apps, die mehrere Schritte, Datenverarbeitung und Interaktivität umfassen.

## Die Leistungsfähigkeit von Streamlit State: Ein Beispiel für einen Kreditrechner
In diesem Modul untersuchen wir die Zustandsverwaltung anhand eines Kredittilgungsrechners als praktisches Beispiel. Diese App ermöglicht es Benutzern, verschiedene Kreditparameter einzugeben, Berechnungen durchzuführen und die Ergebnisse im Sitzungsstatus zu speichern, um sie einfach vergleichen zu können. Durch die Nutzung der Zustandsverwaltung ermöglicht die App Benutzern, verschiedene Kreditszenarien zu untersuchen, ohne ihre vorherigen Berechnungen zu verlieren, und bietet so ein umfassenderes, interaktiveres Erlebnis.

Bevor wir uns mit den Einzelheiten des Kreditrechnerbeispiels befassen, behandeln wir zunächst die Grundlagen der effektiven Verwendung von st.session_state in Streamlit-Anwendungen. Diese Grundlage vermittelt das erforderliche Wissen, um erweiterte Funktionen zu implementieren und Ihre Apps wirklich dynamisch zu gestalten.

Beginnen wir damit, zu verstehen, wie st.session_state funktioniert und wie es genutzt werden kann, um Informationen über verschiedene Teile einer Streamlit-App hinweg beizubehalten.


In [None]:
%%writefile app.py

import streamlit as st
import pandas as pd

# Funktion zur Berechnung der Kreditamortisierung
def calculate_amortization(loan_amount, annual_rate, years):
    monthly_rate = annual_rate / 12 / 100
    num_payments = years * 12
    monthly_payment = loan_amount * (monthly_rate * (1 + monthly_rate) ** num_payments) / ((1 + monthly_rate) ** num_payments - 1)

    # Tilgungsplan erstellen
    amortization_data = []
    balance = loan_amount
    total_interest = 0
    for i in range(1, num_payments + 1):
        interest_payment = balance * monthly_rate
        principal_payment = monthly_payment - interest_payment
        balance -= principal_payment
        total_interest += interest_payment
        amortization_data.append([i, monthly_payment, principal_payment, interest_payment, max(balance, 0)])

    # DataFrame erstellen
    df = pd.DataFrame(amortization_data, columns=['Month', 'Payment', 'Principal', 'Interest', 'Balance'])
    return df, monthly_payment, total_interest

# Initialisieren Sie den Sitzungsstatus, um Berechnungen zu speichern
if 'calculations' not in st.session_state:
    st.session_state['calculations'] = []

# Streamlit App
st.title('Loan Amortization Calculator')

# Eingabefelder
loan_amount = st.number_input('Loan Amount', value=300000.0, min_value=0.0, step=1000.0)
annual_rate = st.number_input('Annual Interest Rate (%)', value=7.5, min_value=0.0, step=0.1)
years = st.number_input('Loan Term (years)', value=30, min_value=1, step=1)

# Tilgungsplan berechnen
if st.button('Calculate Amortization Table'):
    amortization_df, monthly_payment, total_interest = calculate_amortization(loan_amount, annual_rate, years)
    st.write(f'Monthly Payment: ${monthly_payment:,.2f}')
    st.write(f'Total Interest Paid: ${total_interest:,.2f}')
    st.dataframe(amortization_df)

    # Aktuelle Berechnung im Sitzungsstatus speichern
    st.session_state['calculations'].append({
        'Loan Amount': loan_amount,
        'Annual Rate (%)': annual_rate,
        'Years': years,
        'Monthly Payment': monthly_payment,
        'Total Interest': total_interest
    })

# Gespeicherte Berechnungen anzeigen
if st.session_state['calculations']:
    st.subheader('Saved Loan Calculations')
    comparison_df = pd.DataFrame(st.session_state['calculations'])
    st.dataframe(comparison_df)

    # Herunterladbare CSV aller gespeicherten Berechnungen
    csv = comparison_df.to_csv(index=False)
    st.download_button(label="Download Comparison Table as CSV", data=csv, file_name='loan_comparisons.csv', mime='text/csv')

    # Alle Berechnungen löschen
    if st.button('Clear All Calculations'):
        st.session_state['calculations'].clear()



Der bereitgestellte Code zeigt, wie Sie mithilfe des Sitzungsstatus von Streamlit einen interaktiven Tilgungsrechner erstellen, mit dem Benutzer mehrere Kreditszenarien vergleichen können. Die App definiert zunächst eine Funktion zur Berechnung des Tilgungsplans für einen bestimmten Kreditbetrag, Zinssatz und eine bestimmte Kreditlaufzeit. Der Hauptteil der App initialisiert den Sitzungsstatus und erstellt eine Liste zum Speichern von Kreditberechnungen. Diese Liste ist entscheidend, damit Benutzerdaten während der gesamten Interaktion mit der App gespeichert bleiben.

Wenn der Benutzer die Kreditparameter eingibt und auf die Schaltfläche „Tilgungstabelle berechnen“ klickt, berechnet die App die monatliche Zahlung und die Gesamtzinsen anhand der angegebenen Werte. Diese Ergebnisse werden dann in der Sitzungsstatusliste als Wörterbuch gespeichert, das den Kreditbetrag, den Zinssatz, die Kreditlaufzeit, die monatliche Zahlung und die Gesamtzinsen enthält. Dadurch kann die App jede neue Berechnung speichern, ohne zuvor eingegebene Daten zu verlieren.

Die App prüft, ob im Sitzungsstatus gespeicherte Berechnungen vorhanden sind. Falls vorhanden, wird eine Vergleichstabelle mit allen gespeicherten Kreditszenarien angezeigt, einschließlich Kreditbetrag, Zinssatz, Laufzeit, monatlicher Zahlung und Gesamtzinsen. Darüber hinaus bietet sie eine Schaltfläche „Vergleichstabelle als CSV herunterladen“, mit der Benutzer ihre Vergleichsdaten zur weiteren Analyse herunterladen können. Außerdem ist eine Schaltfläche „Alle Berechnungen löschen“ enthalten, die den Sitzungsstatus löscht und die App auf ihren ursprünglichen Zustand zurücksetzt. Dieser Code unterstreicht die Leistungsfähigkeit von st.session_state beim Erstellen einer interaktiveren und benutzerfreundlicheren App, indem Informationen über mehrere Benutzerinteraktionen hinweg beibehalten werden.

Als Nächstes erhalten wir das Passwort für unseren StreamLit-Server, den wir gerade starten.


In [None]:
!curl https://loca.lt/mytunnelpassword


Wir starten den StreamLit-Server und erhalten seine URL. Sie benötigen das obige Passwort, wenn Sie auf die angegebene URL zugreifen.

In [None]:
!streamlit run app.py server1 &>/content/logs.txt &
!npx --yes localtunnel --port 8501

# Teil 10.4: Erstellen einer Chat-Anwendung

In diesem Modul führen wir Sie durch den Prozess der Erstellung einer StreamLit-basierten LLM-Chat-Anwendung. Um alles zugänglich und unkompliziert zu halten, führen wir unsere App mit Google Colab aus. Darüber hinaus stellen wir Ihnen llm_util.py vor, ein Hilfsskript, das die Arbeit mit LangChain-kompatiblen großen Sprachmodellen (Large Language Models, LLMs) erleichtern soll. In diesem Beispiel verwenden wir OpenAIs LLM, um unsere Chat-Anwendung zu betreiben. Am Ende dieses Moduls verfügen Sie über eine funktionsfähige, interaktive Chat-App und ein solides Verständnis dafür, wie Sie LLMs mit StreamLit in Ihre Projekte integrieren können.

Wir werden nun drei Dateien erstellen:

* **app.py** – Die wichtigste StreamLit-Chatanwendung.
* **llm_util.py** – Das LLM-Dienstprogramm, das es uns ermöglicht, jedes LangChain LLM für unsere Chat-Anwendung zu nutzen.
* **llms.yaml** – Eine Konfigurationsdatei, um zu definieren, welche LLMs wir verwenden werden; in diesem Beispiel ist es OpenAI.

## Chat-Anwendung

Der folgende Code richtet eine einfache Chatbot-Anwendung mithilfe der OpenAI-API und Streamlit ein, einer Python-Bibliothek, mit der sich Web-Apps ganz einfach erstellen lassen. Das Skript mit dem Namen app.py importiert zunächst verschiedene Module, die für seine Funktionalität erforderlich sind. Es verwendet „openai.OpenAI“ zur Interaktion mit dem OpenAI-Sprachmodell, „streamlit“ zur Erstellung der Benutzeroberfläche und „sys“ zur Verarbeitung von Befehlszeilenargumenten. Darüber hinaus importiert es benutzerdefinierte Dienstprogramme aus „llm_util“ sowie bestimmte Komponenten aus der LangChain-Bibliothek, darunter „ConversationSummaryMemory“, „PromptTemplate“ und „ConversationChain“. Diese Tools sind entscheidend für die Verwaltung des Konversationskontexts, die Erstellung von Eingabevorlagen und die Erleichterung von Konversationsinteraktionen.

Das Skript prüft zunächst, ob die erforderlichen Befehlszeilenargumente angegeben sind. Es erwartet ein Sprachmodellprofil als Argument. Wenn dies nicht angegeben ist, wird die Ausführung angehalten und der Benutzer aufgefordert, die erforderlichen Eingaben zu machen. Dieser Mechanismus stellt sicher, dass vor dem Starten des Chatbots das entsprechende Sprachmodell ausgewählt wird.

Das Herzstück der Chatbot-Einrichtung ist die Funktion create_chatbot. Diese Funktion richtet den Chatbot mithilfe des angegebenen Sprachmodells ein und enthält eine Speicherkomponente, „ConversationSummaryMemory“, die den Kontext der laufenden Konversation verfolgt. Durch die Nutzung dieses Speichers kann der Chatbot im Laufe der Zeit kohärentere und kontextbezogenere Antworten generieren. Darüber hinaus definiert die Funktion mithilfe von LangChains PromptTemplate eine einfache Vorlage, die formatiert, wie der Konversationsverlauf und die Benutzereingabe kombiniert werden. Anschließend gibt sie ein ConversationChain-Objekt zurück, das diese Konversationen verarbeitet und sicherstellt, dass die Antworten vom gesamten Chatverlauf beeinflusst werden.

Um eine interaktive Schnittstelle zu erstellen, verwendet das Skript Streamlit. Es beginnt mit der Festlegung eines Titels, „Chat“, für die Anwendung. Um den Status des Chatbots zu verwalten und den Überblick über die Konversation zu behalten, verwendet das Skript den Sitzungsstatusmechanismus von Streamlit. Es prüft, ob bereits eine Chatbot-Instanz (st.session_state.chat) vorhanden ist. Wenn nicht, initialisiert es eine neue mit dem über die Befehlszeile bereitgestellten LLM-Profil. Ebenso richtet es eine Liste zum Speichern der Konversationsnachrichten (st.session_state.messages) ein, falls diese noch nicht vorhanden ist.

Der Gesprächsverlauf wird dann durchlaufen und mithilfe der chatspezifischen Funktionen von Streamlit angezeigt. Jede Nachricht, egal ob vom Benutzer oder vom Assistenten, wird in der Chat-Oberfläche wiedergegeben. Dadurch wird ein fortlaufendes Protokoll des Gesprächs erstellt, das dem Benutzer eine fortlaufende Ansicht seiner Interaktion mit dem Chatbot bietet.

Die Benutzerinteraktion erfolgt über ein Chat-Eingabefeld, das von st.chat_input bereitgestellt wird. Wenn der Benutzer eine Eingabe macht, hängt das Skript die Nachricht an das Konversationsprotokoll an und zeigt sie in der Benutzeroberfläche an. Der Chatbot verarbeitet diese Eingabe dann mithilfe der Vorhersagemethode von ConversationChain und generiert eine Antwort basierend auf dem Kontext der Konversation. Diese Antwort wird im Chatfenster angezeigt und dem Sitzungsstatus hinzugefügt, wodurch sichergestellt wird, dass der gesamte Dialog gespeichert und für nachfolgende Interaktionen verwendet wird.

Im Wesentlichen nutzt dieses Skript die Speicherverwaltungs- und Vorlagenfunktionen von LangChain, um einen dynamischen Chatbot zu erstellen, während Streamlit eine benutzerfreundliche Schnittstelle für Echtzeitinteraktionen bietet. Die Kombination dieser Tools ermöglicht es dem Chatbot, den Kontext während der gesamten Konversation beizubehalten, was zu aussagekräftigeren und kohärenteren Austauschen führt. Da außerdem ein Sprachmodellprofil als Befehlszeilenargument erforderlich ist, ist das Skript flexibel und an verschiedene LLM-Konfigurationen anpassbar, sodass der Benutzer das Verhalten des Chatbots je nach seinen spezifischen Anforderungen anpassen kann.

In [None]:
%%writefile app.py
from openai import OpenAI
import streamlit as st
from llm_util import *
from langchain.memory import ConversationSummaryMemory
from langchain.prompts.prompt import PromptTemplate
from langchain.chains import ConversationChain
import sys

# Dies ruft alle Kommandozeilenargumente als Liste ab
arguments = sys.argv
if len(sys.argv) != 2:
    print("Please specify the llm to use as the first argument")
    st.stop()
else:
    profile = sys.argv[1]


def create_chatbot(llm):
    memory = ConversationSummaryMemory(llm=llm)

    template = """{history}\n{input}\n\n
    """
    PROMPT = PromptTemplate(input_variables=["history", "input"], template=template)
    return ConversationChain(llm=llm, prompt=PROMPT, memory=memory, verbose=False)


st.title("Chat")

if "chat" not in st.session_state:
    client = open_llm(profile)
    st.session_state.chat = create_chatbot(client)

if "messages" not in st.session_state:
    st.session_state.messages = []

for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(
            message["content"],
        )

if prompt := st.chat_input("What is up?"):
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        st.markdown(
            prompt,
        )

    with st.chat_message("assistant"):
        response = st.session_state.chat.predict(input=prompt)
        st.markdown(
            response,
        )
    st.session_state.messages.append({"role": "assistant", "content": response})

Writing app.py


## LLM-Dienstprogramm


Der folgende Code ermöglicht der Chat-Anwendung, verschiedene von LangChain unterstützte Sprachmodelle basierend auf einer Konfigurationsdatei zu verwenden. Das Skript llm_util.py dient als Dienstprogramm, das verschiedene Sprachmodelle dynamisch lädt und initialisiert, indem es Konfigurationen verwendet, die in einer YAML-Datei (llms.yaml) angegeben sind. Dieser Ansatz bietet eine flexible Möglichkeit, das Sprachmodell zu ändern, ohne den Hauptanwendungscode zu ändern, und ermöglicht so einfaches Experimentieren und Anpassen.

In [None]:
%%writefile llm_util.py
import yaml

# Laden Sie die YAML-Datei
def load_yaml(file_path):
    with open(file_path, "r") as file:
        return yaml.safe_load(file)


# Funktion zum dynamischen Importieren einer Klasse basierend auf einem Stringpfad (z. B. „langchain_community.chat_models.ChatOllama“)
def get_class(class_path):
    module_path, class_name = class_path.rsplit(".", 1)
    module = __import__(module_path, fromlist=[class_name])
    return getattr(module, class_name)


# Open Language Model Server-Funktion
def open_llm(server_name):
    config = load_yaml("llms.yaml")
    for server in config["servers"]:
        if server["name"] == server_name:
            class_path = server["class"]
            clazz = get_class(class_path)
            # Entfernen Sie „Klasse“ und „Name“ aus den Parametern, da sie für die Initialisierung nicht benötigt werden.
            params = {k: v for k, v in server.items() if k not in ["class", "name"]}

            return clazz(**params)
    raise ValueError(f"Server '{server_name}' not found")

Writing llm_util.py


In [None]:
%%writefile llms.yaml

servers:
  - name: server1
    class: langchain_openai.ChatOpenAI
    model: gpt-4o-mini
    temperature: 0



Writing llms.yaml


Als Nächstes erhalten wir das Passwort für unseren StreamLit-Server, den wir gerade starten.

In [None]:
!curl https://loca.lt/mytunnelpassword

34.138.208.107

Wir starten den StreamLit-Server und erhalten seine URL. Sie benötigen das obige Passwort, wenn Sie auf die angegebene URL zugreifen.

In [None]:
!streamlit run app.py server1 &>/content/logs.txt &
!npx --yes localtunnel --port 8501

[K[?25hyour url is: https://lucky-colts-reply.loca.lt
^C


Die folgende Konfigurationsdatei zeigt, wie andere LLM-Server genutzt werden:

* server1 - Ollama
* server2 - OpenAI
* Server3 – Bedrock (AWS)
* server4 - LMStudio

```
servers:
  - name: server1
    class: langchain_community.chat_models.ChatOllama
    base_url: http://localhost:11434
    model: llama2
    temperature: 0
  - name: server2
    class: langchain_openai.ChatOpenAI
    model: gpt-4o-mini
    temperature: 0
  - name: server3
    class: langchain_aws.ChatBedrock
    model_id: amazon.titan-text-express-v1
    model_kwargs:
      temperature: 0.1
  - name: server4
    class: langchain_openai.ChatOpenAI
    base_url: http://localhost:1234/v1/
    model: TheBloke/Mistral-7B-Instruct-v0.1-GGUF
    openai_api_key: None
    temperature: 0
  ```

# Teil 10.5: Multimodale Chat-Anwendung

In diesem Modul führen wir Sie durch den Prozess der Erstellung einer multimodalen StreamLit-basierten LLM-Chat-Anwendung. Um alles zugänglich und unkompliziert zu halten, führen wir unsere App mit Google Colab aus. Darüber hinaus stellen wir Ihnen llm_util.py vor, ein Hilfsskript, das die Arbeit mit LangChain-kompatiblen großen Sprachmodellen (Large Language Models, LLMs) erleichtern soll. In diesem Beispiel verwenden wir OpenAIs LLM, um unsere Chat-Anwendung zu betreiben. Am Ende dieses Moduls verfügen Sie über eine funktionsfähige, interaktive Chat-App und ein solides Verständnis dafür, wie Sie LLMs mit StreamLit in Ihre Projekte integrieren können.

Wir werden nun drei Dateien erstellen:

* **app.py** – Die wichtigste StreamLit-Chatanwendung.
* **llm_util.py** – Das LLM-Dienstprogramm, das es uns ermöglicht, jedes LangChain LLM für unsere Chat-Anwendung zu nutzen.
* **llms.yaml** – Eine Konfigurationsdatei, um zu definieren, welche LLMs wir verwenden werden; in diesem Beispiel ist es OpenAI.

Diese Chat-Anwendung ermöglicht das Anhängen von Bildern an die Konversation.

## Chat-Anwendung

Um Ihren Chatbot mit multimodalen Funktionen zu erweitern, müssen Sie Ihre Streamlit-Anwendung so ändern, dass sie sowohl Text- als auch Bildeingaben von Benutzern akzeptiert. Ersetzen Sie zunächst die einfache Texteingabe durch ein Formular, das ein Textfeld und einen Bild-Uploader enthält. So können Benutzer Nachrichten eingeben und optional Bilder anhängen.

Wenn ein Benutzer das Formular absendet, verarbeiten Sie die Eingaben, indem Sie eine Nachrichteninhaltsstruktur erstellen, die sowohl den Text als auch die Bilddaten enthält. Lesen Sie für das Bild die hochgeladene Datei, kodieren Sie sie in Base64 und formatieren Sie sie in eine Daten-URL. Dadurch werden die Bilddaten für die Übermittlung an das Sprachmodell in einem kompatiblen Format vorbereitet.

Verwenden Sie statt einer einfachen Konversationskette eine Sprachmodellschnittstelle wie ChatOpenAI, die Nachrichten mit Text und Bildern verarbeiten kann. Rufen Sie das Sprachmodell mit der richtig formatierten Nachricht auf, die den Text des Benutzers und die codierten Bilddaten enthält.

Verwalten Sie den Konversationsverlauf mithilfe des Sitzungsstatus, um den Kontext über Interaktionen hinweg beizubehalten. Aktualisieren Sie die Chat-Oberfläche, um sowohl die Eingaben des Benutzers (Text und Bilder) als auch die Antworten des Assistenten anzuzeigen. Stellen Sie sicher, dass die Antworten des Assistenten in der Oberfläche entsprechend wiedergegeben werden.

Durch die Implementierung dieser Änderungen unterstützt Ihr Chatbot multimodale Interaktionen und ermöglicht Benutzern die Teilnahme an ausführlicheren Gesprächen, die Text- und Bildinformationen kombinieren. Dieses Setup nutzt Streamlit für die Benutzeroberfläche und LangChain zusammen mit den Sprachmodellen von OpenAI für die Verarbeitung, sodass der Chatbot von Benutzern angehängte Bilder interpretieren und darauf reagieren kann.

In [None]:
%%writefile app.py
import streamlit as st
from openai import OpenAI
from llm_util import *
import base64
from langchain_core.messages import HumanMessage
from langchain_openai import ChatOpenAI
import sys

# Dies ruft alle Kommandozeilenargumente als Liste ab
arguments = sys.argv
if len(sys.argv) != 2:
    print("Please specify the llm to use as the first argument")
    st.stop()
else:
    profile = sys.argv[1]

st.title("Chat with Image Support")

if "chat" not in st.session_state:
    client = open_llm(profile)
    st.session_state.chat = client  # Angenommen, dies gibt eine ChatOpenAI-Instanz zurück

if "messages" not in st.session_state:
    st.session_state.messages = []

# Vorhandene Nachrichten anzeigen
for message in st.session_state.messages:
    with st.chat_message(message["role"]):
        st.markdown(message["content"])

# Erstellen eines Formulars für Benutzereingaben
with st.form("chat_form"):
    prompt = st.text_input("Enter your message:")
    uploaded_file = st.file_uploader("Upload an image (optional)", type=["jpg", "jpeg", "png"])
    submit_button = st.form_submit_button("Send")

if submit_button:
    # Erstellen des Inhalts der Benutzernachricht
    message_content = []
    if prompt:
        message_content.append({"type": "text", "text": prompt})
    if uploaded_file is not None:
        # Lesen Sie die Bilddaten und kodieren Sie sie in Base64
        image_bytes = uploaded_file.read()
        image_type = uploaded_file.type  # z. B. „image/jpeg“
        image_data = base64.b64encode(image_bytes).decode("utf-8")
        # Binden Sie die Bilddaten in den Nachrichteninhalt ein
        message_content.append(
            {"type": "image_url", "image_url": {"url": f"data:{image_type};base64,{image_data}"}}
        )
    # Erstellen Sie die HumanMessage
    message = HumanMessage(content=message_content)
    # Benutzernachricht an Sitzungsstatus anhängen
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"):
        if prompt:
            st.markdown(prompt)
        if uploaded_file is not None:
            st.image(uploaded_file)
    # Erhalten Sie eine Antwort vom LLM
    response = st.session_state.chat.invoke([message])
    # Antwort des Assistenten an Nachrichten anhängen
    st.session_state.messages.append({"role": "assistant", "content": response.content})
    with st.chat_message("assistant"):
        st.markdown(response.content)



## LLM-Dienstprogramm


Der folgende Code ermöglicht der Chat-Anwendung, verschiedene von LangChain unterstützte Sprachmodelle basierend auf einer Konfigurationsdatei zu verwenden. Das Skript llm_util.py dient als Dienstprogramm, das verschiedene Sprachmodelle dynamisch lädt und initialisiert, indem es Konfigurationen verwendet, die in einer YAML-Datei (llms.yaml) angegeben sind. Dieser Ansatz bietet eine flexible Möglichkeit, das Sprachmodell zu ändern, ohne den Hauptanwendungscode zu ändern, und ermöglicht so einfaches Experimentieren und Anpassen.

In [None]:
%%writefile llm_util.py
import yaml

# Laden Sie die YAML-Datei
def load_yaml(file_path):
    with open(file_path, "r") as file:
        return yaml.safe_load(file)


# Funktion zum dynamischen Importieren einer Klasse basierend auf einem Stringpfad (z. B. „langchain_community.chat_models.ChatOllama“)
def get_class(class_path):
    module_path, class_name = class_path.rsplit(".", 1)
    module = __import__(module_path, fromlist=[class_name])
    return getattr(module, class_name)


# Open Language Model Server-Funktion
def open_llm(server_name):
    config = load_yaml("llms.yaml")
    for server in config["servers"]:
        if server["name"] == server_name:
            class_path = server["class"]
            clazz = get_class(class_path)
            # Entfernen Sie „Klasse“ und „Name“ aus den Parametern, da sie für die Initialisierung nicht benötigt werden.
            params = {k: v for k, v in server.items() if k not in ["class", "name"]}

            return clazz(**params)
    raise ValueError(f"Server '{server_name}' not found")

In [None]:
%%writefile llms.yaml

servers:
  - name: server1
    class: langchain_openai.ChatOpenAI
    model: gpt-4o-mini
    temperature: 0



Als Nächstes erhalten wir das Passwort für unseren StreamLit-Server, den wir gerade starten.

In [None]:
!curl https://loca.lt/mytunnelpassword

Wir starten den StreamLit-Server und erhalten seine URL. Sie benötigen das obige Passwort, wenn Sie auf die angegebene URL zugreifen.

In [None]:
!streamlit run app.py server1 &>/content/logs.txt &
!npx --yes localtunnel --port 8501