In [1]:
! pip install transformers gradio -q

[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.8/6.8 MB[0m [31m28.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m15.8/15.8 MB[0m [31m31.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m199.8/199.8 KB[0m [31m11.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.6/7.6 MB[0m [31m27.1 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m50.5/50.5 KB[0m [31m3.6 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m106.5/106.5 KB[0m [31m4.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m18.5 MB/s[0m eta [36m0:00:00[0m
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m45.7/45.7 KB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ..

Kode di atas menginstal dua package yaitu Transformers dan Gradio pada lingkungan Python yang sedang digunakan.

Transformers adalah library Python yang dibuat oleh Hugging Face yang menyediakan antarmuka umum untuk pemrosesan bahasa alami (natural language processing - NLP) seperti melakukan pemrosesan teks dan melakukan tugas-tugas seperti klasifikasi teks, pembuatan kalimat dan penerjemahan bahasa.

Gradio adalah library Python untuk membuat antarmuka pengguna (user interface - UI) untuk model ML. Gradio memungkinkan pengguna untuk membuat antarmuka pengguna yang interaktif dan menguji model mereka secara cepat dan mudah, tanpa perlu menulis banyak kode.

In [2]:
from transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import torch

tokenizer = AutoTokenizer.from_pretrained("microsoft/GODEL-v1_1-base-seq2seq")
model = AutoModelForSeq2SeqLM.from_pretrained("microsoft/GODEL-v1_1-base-seq2seq")

Downloading (…)okenizer_config.json:   0%|          | 0.00/2.36k [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/2.42M [00:00<?, ?B/s]

Downloading (…)in/added_tokens.json:   0%|          | 0.00/37.0 [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/2.20k [00:00<?, ?B/s]

Downloading (…)lve/main/config.json:   0%|          | 0.00/1.49k [00:00<?, ?B/s]

Downloading pytorch_model.bin:   0%|          | 0.00/892M [00:00<?, ?B/s]

Downloading (…)neration_config.json:   0%|          | 0.00/147 [00:00<?, ?B/s]

Kode di atas melakukan beberapa hal sebagai berikut:

* Mengimpor library transformers, torch, dan AutoTokenizer, AutoModelForSeq2SeqLM dari library transformers.
* Menginisialisasi tokenizer dengan model AutoTokenizer dan memuat model GPT-2 yang telah dilatih sebelumnya dari direktori "microsoft/GODEL-v1_1-base-seq2seq".
* Memuat model AutoModelForSeq2SeqLM dari direktori yang sama.
* Setelah menjalankan kode ini, tokenizer dan model akan siap digunakan untuk pemrosesan bahasa alami seperti membuat ringkasan teks atau melakukan penerjemahan bahasa secara otomatis.

In [3]:
def predict(knowledge, input, history=[]):

    instruction = 'Instruction: given a dialog context and related knowledge, you need to response safely  only based on the supplied knowledge.'

    if knowledge != '':
      knowledge = '[KNOWLEDGE] ' + knowledge

    dialog = ' EOS ' .join([input])


    query = f"{instruction} [CONTEXT] {dialog} {knowledge}"

    top_p = 0.9
    min_length = 8
    max_length = 64


    # tokenize the new input sentence
    user_input_ids = tokenizer.encode(f"{query}", return_tensors='pt')


    output = model.generate(user_input_ids, min_length=int(
        min_length), max_length=int(max_length), top_p=top_p, do_sample=True).tolist()
    
  
    response = tokenizer.decode(output[0], skip_special_tokens=True)

    #print(response)
    history.append((input, response))

    return history, history

Kode di atas mendefinisikan sebuah fungsi bernama "predict" dengan tiga parameter input: "knowledge", "input", dan "history". Fungsi ini akan menghasilkan output berupa variabel "history" yang berisi sejarah dialog antara pengguna dan sistem.

Proses yang dilakukan oleh fungsi ini adalah sebagai berikut:

* Memeriksa apakah ada input "knowledge" yang diberikan. Jika ada, maka input "knowledge" akan ditambahkan dengan label "[KNOWLEDGE]" dan dijadikan satu dengan input "dialog".
* Menggabungkan input "dialog" dan "knowledge" menjadi sebuah query.
* Menentukan beberapa parameter seperti "top_p" (probabilitas tertinggi yang diizinkan), "min_length" (jumlah minimal token pada output), dan "max_length" (jumlah maksimal token pada output).
* Melakukan tokenisasi pada kalimat yang akan di-generate menggunakan tokenizer.encode() dan menyimpan hasilnya dalam variabel "user_input_ids".
* Melakukan generate pada model dengan memasukkan "user_input_ids" dan beberapa parameter lainnya menggunakan model.generate() dan menyimpan hasilnya dalam variabel "output".
* Mengubah output menjadi kalimat menggunakan tokenizer.decode() dan menyimpan hasilnya dalam variabel "response".
* Menambahkan pasangan input dan response dalam variabel "history" dan mengembalikan variabel "history" sebagai output dari fungsi.

In [None]:
import gradio as gr


gr.Interface(fn=predict,
             inputs=[gr.Text(label = 'knowledge'),"text",'state'],
             outputs=["chatbot",'state']).launch(debug = True, share = True)


Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
Running on public URL: https://0e5c4ddce573ca3d9a.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades (NEW!), check out Spaces: https://huggingface.co/spaces


Kode di atas menggunakan Gradio untuk membuat antarmuka pengguna (user interface) untuk memanggil fungsi "predict". Setelah dijalankan, kode ini akan meluncurkan antarmuka pengguna di jendela web.

Adapun beberapa hal yang dilakukan oleh kode di atas adalah sebagai berikut:

* Mengimpor library Gradio dan menjadikan alias "gr".
* Memanggil fungsi "Interface" dari Gradio dan menyediakan beberapa argumen sebagai berikut:
fn: mengacu pada fungsi yang akan dipanggil (dalam hal ini, fungsi "predict" yang telah didefinisikan sebelumnya).
inputs: menyediakan input untuk fungsi. Dalam hal ini, ada tiga input: "knowledge" (teks yang menjelaskan pengetahuan tambahan yang ingin dihubungkan dengan pertanyaan), "text" (teks yang diinput oleh pengguna), dan "state" (sebuah variabel yang digunakan untuk menyimpan sejarah percakapan).
outputs: menyediakan output dari fungsi. Dalam hal ini, ada dua output: "chatbot" (teks yang dihasilkan oleh model) dan "state" (sebuah variabel yang berisi sejarah percakapan).
* Menggunakan metode "launch" dari objek Interface yang telah dibuat untuk meluncurkan antarmuka pengguna di jendela web.
* Debug dan share masing-masing mengatur apakah antarmuka pengguna harus dijalankan dalam mode debug dan apakah harus memungkinkan untuk berbagi antarmuka pengguna ke publik.