# Bereitstellen auf einem Onlineendpunkt

Um ein Modell in einer Anwendung zu nutzen, können Sie das Modell auf einem Onlineendpunkt bereitstellen. Sie erstellen ein MLflow-Modell aus lokalen Dateien und testen den Endpunkt.

## Vorbereitung

Sie benötigen die neueste Version des Pakets **azureml-ai-ml**, um den Code in diesem Notebook auszuführen. Führen Sie die folgende Zelle aus, um zu überprüfen, ob das Paket installiert ist.

> **Hinweis**:
> Wenn das Paket **azure-ai-ml** nicht installiert ist, führen Sie `pip install azure-ai-ml` aus, um es zu installieren.

In [None]:
## Herstellen einer Verbindung mit Ihrem Arbeitsbereich

Sie können nun eine Verbindung mit Ihrem Arbeitsbereich herstellen, nachdem Sie die erforderlichen SDK-Pakete installiert haben.

Um eine Verbindung mit einem Arbeitsbereich herzustellen, benötigen Sie Bezeichnerparameter: eine Abonnement-ID, einen Ressourcengruppennamen und einen Arbeitsbereichsnamen. Der Ressourcengruppenname und Arbeitsbereichsname sind bereits für Sie ausgefüllt. Sie müssen lediglich die Abonnement-ID angeben, um den Befehl zu vervollständigen.

Um die erforderlichen Parameter zu finden, klicken Sie rechts oben in Studio auf das Abonnement und den Namen des Arbeitsbereichs. Rechts wird ein Bereich geöffnet.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> Kopieren Sie die Abonnement-ID, und ersetzen Sie **YOUR-SUBSCRIPTION-ID** durch den Wert, den Sie kopiert haben. </p>

## Definieren und Erstellen eines Endpunkts

Letztendlich besteht das Ziel darin, ein Modell auf einem Endpunkt bereitzustellen. Daher müssen Sie zunächst einen Endpunkt erstellen. Der Endpunkt ist ein HTTPS-Endpunkt, den eine Anwendung aufrufen kann, um Vorhersagen vom Modell zu empfangen. Eine Anwendung kann einen Endpunkt mithilfe von dessen URI nutzen und sich mit einem Schlüssel oder Token authentifizieren.

Führen Sie die folgende Zelle aus, um den Endpunkt zu definieren. Beachten Sie, dass der Name des Endpunkts eindeutig sein muss. Sie verwenden die Funktion `datetime`, um einen eindeutigen Namen zu generieren.

In [None]:
Als Nächstes erstellen Sie den Endpunkt, indem Sie die folgende Zelle ausführen. Dieser Vorgang kann einige Minuten dauern. Während Ihr Endpunkt erstellt wird, können Sie erfahren, [was Azure Machine Learning-Endpunkte sind](https://learn.microsoft.com/azure/machine-learning/concept-endpoints).

In [None]:
<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> WICHTIG! Warten Sie, bis der Endpunkt erfolgreich erstellt wurde, ehe Sie fortfahren! In Studio sollte eine grüne Benachrichtigung eingeblendet werden. </p>

## Konfigurieren der Bereitstellung

Sie können mehrere Modelle auf einem Endpunkt bereitstellen. Dies ist hauptsächlich nützlich, wenn Sie das bereitgestellte Modell aktualisieren möchten, während das aktuelle Modell in der Produktion verbleibt. Sie müssen die Bereitstellung so konfigurieren, dass angegeben wird, welches Modell für einen Endpunkt bereitgestellt werden muss. In der folgenden Zelle verweisen Sie auf das Modell, das trainiert und im lokalen Ordner `model` (im selben Ordner wie dieses Notebook) gespeichert wurde. Beachten Sie, dass Sie, da Sie mit einem MLflow-Modell arbeiten, die Umgebung oder das Bewertungsskript nicht angeben müssen.

Außerdem geben Sie die Infrastruktur an, die für das bereitzustellende Modell erforderlich ist.

## Erstellen der Bereitstellung

Schließlich können Sie das Modell tatsächlich auf dem Endpunkt bereitstellen, indem Sie die folgende Zelle ausführen:

In [None]:
Die Bereitstellung des Modells kann 10–15 Minuten dauern. Während Sie auf die Bereitstellung des Modells warten, können Sie [in diesem Video mehr über verwaltete Endpunkte](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper) erfahren.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> WICHTIG! Warten Sie, bis die Bereitstellung abgeschlossen ist, ehe Sie fortfahren! In Studio sollte eine grüne Benachrichtigung eingeblendet werden.</p>

Da Sie nur ein Modell auf dem Endpunkt bereitgestellt haben, soll diese Bereitstellung 100 % des Datenverkehrs übernehmen. Wenn Sie auf dem Endpunkt mehrere Modelle bereitstellen, können Sie denselben Ansatz befolgen, um Datenverkehr auf die bereitgestellten Modelle zu verteilen.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> WICHTIG! Warten Sie, bis die blaue Bereitstellung konfiguriert ist, ehe Sie fortfahren! In Studio sollte eine grüne Benachrichtigung eingeblendet werden. </p> 

## Testen der Bereitstellung

Testen Sie das bereitgestellte Modell, indem Sie den Endpunkt aufrufen. Eine JSON-Datei mit Beispieldaten dient als Eingabe. Das trainierte Modell sagt basierend auf medizinischen Daten wie Alter, BMI und Anzahl der Schwangerschaften voraus, ob ein Patient an Diabetes leidet oder nicht. `[0]` gibt an, dass ein Patient keine Diabetes hat. `[1]` bedeutet, dass ein Patient Diabetes hat.

In [None]:
Optional können Sie die Werte in der Datei `sample-data.json` ändern, um ggf. eine andere Vorhersage zu erhalten.

## Auflisten von Endpunkten

Obwohl Sie alle Endpunkte in Studio anzeigen können, können Sie auch alle Endpunkte mithilfe des SDK auflisten:

In [None]:
## Abrufen von Endpunktdetails

Wenn Sie weitere Informationen zu einem bestimmten Endpunkt benötigen, können Sie die Details auch mithilfe des SDK erkunden.

## Löschen des Endpunkts und der Bereitstellung

Da ein Endpunkt stets verfügbar ist, kann er nicht angehalten werden, um Kosten zu sparen. Sie müssen den Endpunkt löschen, um unnötige Kosten zu vermeiden.

In [None]:
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

The deployment of the model may take 10-15 minutes. While waiting for the model to be deployed, you can learn more about [managed endpoints in this video](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the deployment is completed before continuing! A green notification should appear in the studio.</p>

Since you only have one model deployed to the endpoint, you want this deployment to take 100% of the traffic. If you deploy multiple models to the endpoint, you could use the same approach to distribute traffic across the deployed models.

In [None]:
# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.begin_create_or_update(endpoint).result()

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the blue deployment is configured before continuing! A green notification should appear in the studio. </p> 

## Test the deployment

Let's test the deployed model by invoking the endpoint. A JSON file with sample data is used as input. The trained model predicts whether a patient has diabetes or not, based on medical data like age, BMI, and the number of pregnancies. A `[0]` indicates a patient doesn't have diabetes. A `[1]` means a patient does have diabetes.

In [None]:
# test the blue deployment with some sample data
response = ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="sample-data.json",
)

if response[1]=='1':
    print("Diabetic")
else:
    print ("Not diabetic")

Optionally, you can change the values in the `sample-data.json` file to try and get a different prediction.

## List endpoints

Although you can view all endpoints in the Studio, you can also list all endpoints using the SDK:

In [None]:
endpoints = ml_client.online_endpoints.list()
for endp in endpoints:
    print(endp.name)

## Get endpoint details

If you want more information about a specific endpoint, you can explore the details using the SDK too.

In [None]:
# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

## Delete the endpoint and deployment

As an endpoint is always available, it can't be paused to save costs. To avoid unnecessary costs, delete the endpoint.

In [None]:
ml_client.online_endpoints.begin_delete(name=online_endpoint_name)