# Menyebarkan ke titik akhir online

Untuk menggunakan model dari aplikasi, Anda dapat menyebarkan model ke titik akhir online. Anda akan membuat model MLflow dari file lokal dan menguji titik akhir.

## Sebelum Anda memulai

Anda akan memerlukan versi terbaru paket  **azureml-ai-ml** untuk menjalankan kode di notebook ini. Jalankan sel di bawah ini untuk memverifikasi bahwa sel diinstal.

> **Catatan:**
> Jika paket **azure-ai-ml** tidak diinstal, jalankan `pip install azure-ai-ml` untuk menginstalnya.

In [None]:
## Menyambungkan ke ruang kerja Anda

Dengan paket SDK yang diperlukan terinstal, sekarang Anda siap untuk terhubung ke ruang kerja Anda.

Untuk menyambungkan ke ruang kerja, kita memerlukan parameter pengidentifikasi - ID langganan, nama grup sumber daya, dan nama ruang kerja. Nama grup sumber daya dan nama ruang kerja sudah diisi untuk Anda. Anda hanya memerlukan ID langganan untuk menyelesaikan perintah.

Untuk menemukan parameter yang diperlukan, klik nama langganan dan ruang kerja di kanan atas Studio. Panel akan terbuka di sebelah kanan.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> Salin ID langganan dan ganti **YOUR-SUBSCRIPTION-ID** dengan nilai yang Anda salin. </p>

## Menentukan dan membuat titik akhir

Pada akhirnya, tujuannya adalah untuk menyebarkan model ke titik akhir. Oleh karena itu, Pertama-tama Anda perlu membuat titik akhir. Titik akhir akan menjadi titik akhir HTTPS yang dapat dipanggil aplikasi untuk menerima prediksi dari model. Aplikasi dapat menggunakan titik akhir dengan menggunakan URI-nya, dan mengautentikasi dengan kunci atau token.

Jalankan sel berikut untuk menentukan titik akhir. Perhatikan bahwa nama titik akhir harus unik. Anda akan menggunakan `datetime` fungsi untuk menghasilkan nama yang unik.

In [None]:
Selanjutnya, Anda akan membuat titik akhir dengan menjalankan sel berikut. Hal ini mungkin berlangsung selama beberapa menit. Saat titik akhir Anda sedang dibuat, Anda dapat membaca tentang [apa itu titik akhir Azure Machine Learning](https://learn.microsoft.com/azure/machine-learning/concept-endpoints).

In [None]:
<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> PENTING! Tunggu hingga titik akhir berhasil dibuat sebelum melanjutkan! Pemberitahuan hijau akan muncul di studio. </p>

## Konfigurasikan penyebaran

Anda dapat menyebarkan beberapa model ke titik akhir. Ini sebagian besar berguna ketika Anda ingin memperbarui model yang disebarkan sambil mempertahankan model saat ini dalam produksi. Anda harus mengonfigurasi penyebaran untuk menentukan model mana yang perlu disebarkan ke titik akhir. Dalam sel berikut, Anda akan merujuk ke model yang dilatih dan disimpan di folder lokal `model` (disimpan dalam folder yang sama dengan buku catatan ini). Perhatikan bahwa karena Anda bekerja dengan model MLflow, Anda tidak perlu menentukan lingkungan atau skrip penilaian.

Anda juga akan menentukan infrastruktur yang diperlukan agar model dapat disebarkan.

## Membuat penyebaran

Terakhir, Anda benar-benar dapat menyebarkan model ke titik akhir dengan menjalankan sel berikut:

In [None]:
Penyebaran model mungkin memakan waktu 10-15 menit. Sambil menunggu model disebarkan, Anda dapat mempelajari selengkapnya tentang [titik akhir terkelola dalam video ini](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> PENTING! Tunggu hingga penyebaran selesai sebelum melanjutkan! Pemberitahuan hijau akan muncul di studio.</p>

Karena Anda hanya memiliki satu model yang disebarkan ke titik akhir, Anda ingin penyebaran ini mengambil 100% dari lalu lintas. Jika Anda menyebarkan beberapa model ke titik akhir, Anda dapat menggunakan pendekatan yang sama untuk mendistribusikan lalu lintas di seluruh model yang disebarkan.

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> PENTING! Tunggu hingga penyebaran biru dikonfigurasi sebelum melanjutkan! Pemberitahuan hijau akan muncul di studio. </p> 

## Menguji penyebaran

Mari kita uji model yang disebarkan dengan memanggil titik akhir. File JSON dengan data sampel digunakan sebagai input. Model terlatih memprediksi apakah pasien memiliki diabetes atau tidak, berdasarkan data medis seperti usia, BMI, dan jumlah kehamilan. A `[0]` menunjukkan pasien tidak memiliki diabetes. Berarti `[1]` pasien memang memiliki diabetes.

In [None]:
Secara opsional, Anda dapat mengubah nilai dalam `sample-data.json` file untuk mencoba dan mendapatkan prediksi yang berbeda.

## Mencantumkan titik akhir

Meskipun Anda dapat melihat semua titik akhir di Studio, Anda juga dapat mencantumkan semua titik akhir menggunakan SDK:

In [None]:
## Mendapatkan detail titik akhir

Jika Anda ingin informasi selengkapnya tentang titik akhir tertentu, Anda juga dapat menjelajahi detail menggunakan SDK.

## Menghapus titik akhir dan penyebaran

Karena titik akhir selalu tersedia, titik akhir tidak dapat dijeda untuk menghemat biaya. Untuk menghindari biaya yang tidak perlu, hapus titik akhir.

In [None]:
ml_client.online_deployments.begin_create_or_update(blue_deployment).result()

The deployment of the model may take 10-15 minutes. While waiting for the model to be deployed, you can learn more about [managed endpoints in this video](https://www.youtube.com/watch?v=SxFGw_OBxNM&ab_channel=MicrosoftDeveloper).

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the deployment is completed before continuing! A green notification should appear in the studio.</p>

Since you only have one model deployed to the endpoint, you want this deployment to take 100% of the traffic. If you deploy multiple models to the endpoint, you could use the same approach to distribute traffic across the deployed models.

In [None]:
# blue deployment takes 100 traffic
endpoint.traffic = {"blue": 100}
ml_client.begin_create_or_update(endpoint).result()

<p style="color:red;font-size:120%;background-color:yellow;font-weight:bold"> IMPORTANT! Wait until the blue deployment is configured before continuing! A green notification should appear in the studio. </p> 

## Test the deployment

Let's test the deployed model by invoking the endpoint. A JSON file with sample data is used as input. The trained model predicts whether a patient has diabetes or not, based on medical data like age, BMI, and the number of pregnancies. A `[0]` indicates a patient doesn't have diabetes. A `[1]` means a patient does have diabetes.

In [None]:
# test the blue deployment with some sample data
response = ml_client.online_endpoints.invoke(
    endpoint_name=online_endpoint_name,
    deployment_name="blue",
    request_file="sample-data.json",
)

if response[1]=='1':
    print("Diabetic")
else:
    print ("Not diabetic")

Optionally, you can change the values in the `sample-data.json` file to try and get a different prediction.

## List endpoints

Although you can view all endpoints in the Studio, you can also list all endpoints using the SDK:

In [None]:
endpoints = ml_client.online_endpoints.list()
for endp in endpoints:
    print(endp.name)

## Get endpoint details

If you want more information about a specific endpoint, you can explore the details using the SDK too.

In [None]:
# Get the details for online endpoint
endpoint = ml_client.online_endpoints.get(name=online_endpoint_name)

# existing traffic details
print(endpoint.traffic)

# Get the scoring URI
print(endpoint.scoring_uri)

## Delete the endpoint and deployment

As an endpoint is always available, it can't be paused to save costs. To avoid unnecessary costs, delete the endpoint.

In [None]:
ml_client.online_endpoints.begin_delete(name=online_endpoint_name)