# **IMPORT**

In [None]:
# Menonaktifkan semua peringatan yang dihasilkan oleh kode Python
import warnings
warnings.filterwarnings('ignore')

In [None]:
# Instalasi library transformers versi 4.18.0
!pip install transformers==4.18.0

# Mengimpor modul yang diperlukan
import json # Untuk bekerja dengan file JSON
import numpy as np # Untuk operasi numerik
import pandas as pd # Untuk manipulasi data
import random # Untuk operasi acak
from matplotlib import pyplot as plt # Untuk visualisasi data
import seaborn as sns # Untuk visualisasi data yang lebih cantik
from wordcloud import WordCloud, STOPWORDS # Untuk membuat word cloud
import missingno as msno # Untuk visualisasi missing values

# Mengimpor modul dari scikit-learn untuk pemrosesan teks dan evaluasi model
from sklearn.feature_extraction.text import CountVectorizer # Untuk konversi teks ke vektor frekuensi kata
from sklearn.model_selection import train_test_split # Untuk membagi data menjadi set pelatihan dan pengujian
from sklearn.metrics import accuracy_score, precision_recall_fscore_support # Untuk evaluasi performa model

# Mengimpor modul dari TensorFlow Keras untuk membangun dan melatih model neural network
from tensorflow.keras.preprocessing import text # Untuk preprocessing teks
from tensorflow.keras.models import Sequential # Untuk membangun model sekuensial
from tensorflow.keras.layers import Dense, Embedding, LSTM, Dropout # Lapisan-lapisan untuk model
from tensorflow.keras.callbacks import ReduceLROnPlateau # Callback untuk mengurangi learning rate saat terjadi plateau
from tensorflow.keras.preprocessing.sequence import pad_sequences # Mengimpor modul dari TensorFlow untuk preprocessing dan padding sequence

import nltk # Natural Language Toolkit, digunakan untuk NLP
from nltk import word_tokenize # Untuk tokenisasi kata
from nltk.stem import PorterStemmer # Untuk stemming kata

# Mengimpor modul dari PyTorch untuk dataset handling
import torch
from torch.utils.data import Dataset

# Mengimpor modul dari transformers untuk penggunaan model pra-terlatih dari huggingface
from transformers import AutoTokenizer, TFAutoModelForSequenceClassification
from transformers import pipeline
from transformers import DistilBertTokenizerFast
from transformers import BertForSequenceClassification, BertTokenizerFast
from transformers import TFDistilBertForSequenceClassification, TFTrainingArguments
from transformers import BertTokenizer, TFBertForSequenceClassification, BertConfig
from transformers import TrainingArguments, Trainer
from transformers.trainer_tf import TFTrainer

Collecting transformers==4.18.0
  Downloading transformers-4.18.0-py3-none-any.whl.metadata (70 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/70.3 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m70.3/70.3 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
Collecting sacremoses (from transformers==4.18.0)
  Downloading sacremoses-0.1.1-py3-none-any.whl.metadata (8.3 kB)
Collecting tokenizers!=0.11.3,<0.13,>=0.11.1 (from transformers==4.18.0)
  Downloading tokenizers-0.12.1-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl.metadata (6.5 kB)
Downloading transformers-4.18.0-py3-none-any.whl (4.0 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.0/4.0 MB[0m [31m83.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading tokenizers-0.12.1-cp310-cp310-manylinux_2_12_x86_64.manylinux2010_x86_64.whl (6.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.6/6.6 MB[0m [31m92.0 MB

# **DATASET**

In [None]:
# Mount Google Drive untuk mengakses file di Colab
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
# Fungsi untuk memuat file JSON
def load_json_file(filename):
    with open(filename) as f:
        file = json.load(f)
    return file

# Memuat dataset dari Google Drive
filename = '/content/drive/MyDrive/Program/dataset/intents_LAA.json'
intents = load_json_file(filename)

In [None]:
# Fungsi untuk membuat DataFrame dan mengekstrak informasi dari file JSON
def create_and_extract_info(json_file):
    # Membuat DataFrame kosong
    df = pd.DataFrame({
        'Pattern': [],
        'Tag': []
    })

    # Mengisi DataFrame dengan informasi dari JSON
    for intent in json_file['intents']:
        for pattern in intent['patterns']:
            sentence_tag = [pattern, intent['tag']]
            df.loc[len(df.index)] = sentence_tag

    return df

# Menggunakan fungsi untuk membuat dan mengisi DataFrame
df = create_and_extract_info(intents)
df.head() # Menampilkan lima baris pertama dari DataFrame

Unnamed: 0,Pattern,Tag
0,Halo!,Greetings
1,Hai!,Greetings
2,assamualaikaum,Greetings
3,Hola,Greetings
4,Permisi,Greetings


# **DATA PREPROCESSING**

In [None]:
labels = df['Tag'].unique().tolist() # Mendapatkan daftar unik dari 'Tag' di DataFrame
labels = [s.strip() for s in labels] # Menghapus spasi di awal dan akhir setiap label
num_labels = len(labels) # Menghitung jumlah label
id2label = {id:label for id, label in enumerate(labels)} # Membuat kamus yang memetakan id ke label
label2id = {label:id for id, label in enumerate(labels)} # Membuat kamus yang memetakan label ke id

In [None]:
id2label # Menampilkan kamus id ke label

{0: 'Greetings',
 1: 'name',
 2: 'Yudisium',
 3: 'Persyaratan Yudisium',
 4: 'Predikat Cumlaude',
 5: 'Kehadiran Yudisium',
 6: 'Hasil Sidang Yudisium',
 7: 'Waktu Pendaftaran Yudisium',
 8: 'Yudisium Pending',
 9: 'Pengajuan Similarity',
 10: 'Hasil Cek Similarity',
 11: 'Batas Maksimum Similarity',
 12: 'Similarity Score Lebih dari 20%',
 13: 'Status Similarity Rejected',
 14: 'Kerja Praktek',
 15: 'Surat Pengantar Kerja Praktek',
 16: 'Waktu Pelaksanaan Kerja Praktek',
 17: 'Dosen Pembimbing Kerja Praktek',
 18: 'Pelaksanaan KP Tidak Sesuai Timeline',
 19: 'Syarat SK Bimbingan TA',
 20: 'Mendapatkan SK Bimbingan TA',
 21: 'Masa Berlaku SK Bimbingan Habis',
 22: 'SK Bimbingan Tidak Bisa Diperpanjang',
 23: 'Perubahan Dosen Pembimbing TA',
 24: 'Perubahan Judul TA',
 25: 'Waktu Sidang TA',
 26: 'Pendaftaran Sidang TA',
 27: 'Jadwal Seminar Internal',
 28: 'Sertifikat Seminar Internal',
 29: 'Aktivasi Mahasiswa',
 30: 'Dispensasi',
 31: 'Transkrip Sementara',
 32: 'SKL',
 33: 'Keringan

In [None]:
label2id # Menampilkan kamus label ke id

{'Greetings': 0,
 'name': 1,
 'Yudisium': 2,
 'Persyaratan Yudisium': 3,
 'Predikat Cumlaude': 4,
 'Kehadiran Yudisium': 5,
 'Hasil Sidang Yudisium': 6,
 'Waktu Pendaftaran Yudisium': 7,
 'Yudisium Pending': 8,
 'Pengajuan Similarity': 9,
 'Hasil Cek Similarity': 10,
 'Batas Maksimum Similarity': 11,
 'Similarity Score Lebih dari 20%': 12,
 'Status Similarity Rejected': 13,
 'Kerja Praktek': 14,
 'Surat Pengantar Kerja Praktek': 15,
 'Waktu Pelaksanaan Kerja Praktek': 16,
 'Dosen Pembimbing Kerja Praktek': 17,
 'Pelaksanaan KP Tidak Sesuai Timeline': 18,
 'Syarat SK Bimbingan TA': 19,
 'Mendapatkan SK Bimbingan TA': 20,
 'Masa Berlaku SK Bimbingan Habis': 21,
 'SK Bimbingan Tidak Bisa Diperpanjang': 22,
 'Perubahan Dosen Pembimbing TA': 23,
 'Perubahan Judul TA': 24,
 'Waktu Sidang TA': 25,
 'Pendaftaran Sidang TA': 26,
 'Jadwal Seminar Internal': 27,
 'Sertifikat Seminar Internal': 28,
 'Aktivasi Mahasiswa': 29,
 'Dispensasi': 30,
 'Transkrip Sementara': 31,
 'SKL': 32,
 'Keringanan B

In [None]:
# Menambahkan kolom 'labels' ke DataFrame dengan memetakan 'Tag' ke id menggunakan kamus label2id
df['labels'] = df['Tag'].map(lambda x: label2id[x.strip()])
df.head() # Menampilkan lima baris pertama dari DataFrame

Unnamed: 0,Pattern,Tag,labels
0,Halo!,Greetings,0
1,Hai!,Greetings,0
2,assamualaikaum,Greetings,0
3,Hola,Greetings,0
4,Permisi,Greetings,0


# **DATA SPLITING**

In [None]:
# Memisahkan kolom 'Pattern' sebagai X dan kolom 'labels' sebagai y
X = list(df['Pattern'])
y = list(df['labels'])

In [None]:
# Membagi data menjadi set pelatihan dan pengujian dengan rasio default 75:25
X_train,X_test,y_train,y_test = train_test_split(X,y,random_state = 123)

# **LOAD PRETRAINED MODEL**

In [None]:
# Menentukan model pra-terlatih yang akan digunakan dan panjang maksimum token yang akan diproses oleh tokenizer
model_name = "indolem/indobert-base-uncased"
max_len = 256

# Menginisialisasi tokenizer dari model pra-terlatih
tokenizer = BertTokenizer.from_pretrained(model_name, max_length=max_len)
# Menginisialisasi model untuk klasifikasi urutan dari model pra-terlatih
model = BertForSequenceClassification.from_pretrained(model_name, num_labels=num_labels, id2label=id2label, label2id = label2id)

loading file https://huggingface.co/indolem/indobert-base-uncased/resolve/main/vocab.txt from cache at /root/.cache/huggingface/transformers/1d33cf470eba828af00e33ad5f9d280ed9f1ef28c0f8a886b49f8a778661013a.78d60bed074ad53c1044b4481681aafbb100ec81c498799208c4cc60a45f14dc
loading file https://huggingface.co/indolem/indobert-base-uncased/resolve/main/added_tokens.json from cache at /root/.cache/huggingface/transformers/ea32075c8c275776d6b53124b24e1498a7cb38b8220a0fbe7d7bb438bd4cc660.5cc6e825eb228a7a5cfd27cb4d7151e97a79fb962b31aaf1813aa102e746584b
loading file https://huggingface.co/indolem/indobert-base-uncased/resolve/main/special_tokens_map.json from cache at /root/.cache/huggingface/transformers/0d67a06ab0513afc9134e37589e146c1ca823a21a00c36d3fc0c1646a69ce972.dd8bd9bfd3664b530ea4e645105f557769387b3da9f79bdb55ed556bdd80611d
loading file https://huggingface.co/indolem/indobert-base-uncased/resolve/main/tokenizer_config.json from cache at /root/.cache/huggingface/transformers/39a14375770c

# **TOKENIZATION**

In [None]:
train_encoding = tokenizer(X_train, truncation=True, padding=True) # Mengkodekan data pelatihan dengan tokenizer BERT
test_encoding = tokenizer(X_test, truncation=True, padding=True) # Mengkodekan data pengujian dengan tokenizer BERT

Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.


In [None]:
full_data = tokenizer(X, truncation=True, padding=True) # Mengkodekan seluruh data dengan tokenizer BERT

# **DATA LOADER**

In [None]:
# Kelas DataLoader yang merupakan subclass dari Dataset PyTorch
class DataLoader(Dataset):
    # Inisialisasi kelas dengan encoding dan label
    def __init__(self, encodings, labels):
        self.encodings = encodings
        self.labels = labels

    # Mengambil item dari dataset pada indeks tertentu
    def __getitem__(self, idx):
        # Membuat dictionary item dengan mengubah encoding menjadi tensor
        item = {key: torch.tensor(val[idx]) for key, val in self.encodings.items()}
        # Menambahkan label ke dalam item
        item['labels'] = torch.tensor(self.labels[idx])
        return item

    # Mengembalikan panjang dari dataset
    def __len__(self):
        return len(self.labels)

In [None]:
train_dataloader = DataLoader(train_encoding, y_train) # Membuat DataLoader untuk data pelatihan
test_dataloader = DataLoader(test_encoding, y_test) # Membuat DataLoader untuk data pengujian

In [None]:
# Membuat DataLoader untuk seluruh data (y_test digunakan hanya sebagai placeholder)
fullDataLoader = DataLoader(full_data, y_test)

# **EVALUATION METRICS**

In [None]:
# Fungsi untuk menghitung metrik evaluasi
def compute_metrics(pred):
    labels = pred.label_ids # Mengambil label dari prediksi
    preds = pred.predictions.argmax(-1)  # Mengambil prediksi dengan nilai tertinggi
    precision, recall, f1, _ = precision_recall_fscore_support(labels, preds, average='macro') # Menghitung precision, recall, dan f1-score
    acc = accuracy_score(labels, preds)  # Menghitung akurasi

    return {
        'Accuracy': acc,
        'F1': f1,
        'Precision': precision,
        'Recall': recall
    }

# **TRAINING ARGS**

In [None]:
# Mengatur argumen untuk pelatihan model
training_args = TrainingArguments(
    output_dir='/content/drive/MyDrive/Program/e125/output',  # Direktori output untuk menyimpan model dan checkpoint
    num_train_epochs=125,  # Jumlah epoch untuk pelatihan
    per_device_train_batch_size=128,  # Ukuran batch per perangkat untuk pelatihan
    per_device_eval_batch_size=128,  # Ukuran batch per perangkat untuk evaluasi
    warmup_steps=125,
    weight_decay=0.05, # Menambahkan L2 regularization dengan nilai weight decay 0.01 untuk membantu mencegah overfitting.
    logging_strategy='steps',  # Strategi untuk mencatat log ('steps' atau 'epoch')
    logging_steps=50,  # Frekuensi mencatat log dalam langkah
    evaluation_strategy="steps",  # Strategi untuk evaluasi ('no', 'steps', 'epoch')
    eval_steps=50,  # Frekuensi evaluasi dalam langkah
    save_strategy="steps",  # Strategi untuk menyimpan model ('no', 'epoch', 'steps')
    load_best_model_at_end=False # Menonaktifkan load best model at end
)

PyTorch: setting up devices
The default value for the training argument `--report_to` will change in v5 (from all installed integrations to none). In v5, you will need to use `--report_to all` to get the same behavior as now. You should start updating your code and make this info disappear :-).


# **TRAINING**

In [None]:
# Membuat Trainer untuk melatih model
trainer = Trainer(
    model=model,  # Model yang akan dilatih
    args=training_args,  # Argumen pelatihan
    train_dataset=train_dataloader,  # Data pelatihan
    eval_dataset=test_dataloader,  # Data evaluasi
    compute_metrics=compute_metrics  # Fungsi untuk menghitung metrik evaluasi
)

In [None]:
# Melatih model
trainer.train()

***** Running training *****
  Num examples = 945
  Num Epochs = 125
  Instantaneous batch size per device = 128
  Total train batch size (w. parallel, distributed & accumulation) = 128
  Gradient Accumulation steps = 1
  Total optimization steps = 1000


Step,Training Loss,Validation Loss,Accuracy,F1,Precision,Recall
50,3.9173,3.677256,0.234177,0.186758,0.220386,0.279937
100,2.9168,1.544987,0.816456,0.786305,0.834814,0.82094
150,0.8222,0.203126,0.968354,0.950882,0.950298,0.958654
200,0.1223,0.106947,0.974684,0.964007,0.966003,0.967308
250,0.0508,0.11158,0.971519,0.958178,0.960508,0.960211
300,0.0276,0.100973,0.971519,0.953144,0.952724,0.956548
350,0.0213,0.101064,0.968354,0.951113,0.952495,0.954144
400,0.0155,0.106257,0.971519,0.957972,0.960508,0.960554
450,0.0132,0.115865,0.974684,0.964299,0.966918,0.966964
500,0.0116,0.128532,0.974684,0.964299,0.966918,0.966964


***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
***** Running Evaluation *****
  Num examples = 316
  Batch size = 128
Saving model checkpoint to /content/drive/MyDrive/Program/e125/output/checkpoint-500
Configuration saved in /content/drive/MyDrive/Program/e125/output/checkpoint-500/config.json
Model weights saved in /content/drive/MyDrive/Program/e125/output/checkpoint-500/pytorch_model.bin
***** Running

TrainOutput(global_step=1000, training_loss=0.40028360709547994, metrics={'train_runtime': 285.1196, 'train_samples_per_second': 414.3, 'train_steps_per_second': 3.507, 'total_flos': 1943371634400000.0, 'train_loss': 0.40028360709547994, 'epoch': 125.0})

# **EVALUATE MODEL**

In [None]:
# Evaluasi model pada dataset pelatihan dan pengujian
q=[trainer.evaluate(eval_dataset=df2) for df2 in [train_dataloader, test_dataloader]]
# Membuat DataFrame untuk hasil evaluasi dan menampilkannya
pd.DataFrame(q, index=["train","test"]).iloc[:,:5]

***** Running Evaluation *****
  Num examples = 945
  Batch size = 128


***** Running Evaluation *****
  Num examples = 316
  Batch size = 128


Unnamed: 0,eval_loss,eval_Accuracy,eval_F1,eval_Precision,eval_Recall
train,0.006424,0.996825,0.997239,0.997596,0.997253
test,0.134758,0.974684,0.964299,0.966918,0.966964


In [None]:
def predict(text):
    # Tokenisasi teks input dengan padding dan truncation, dan konversi ke tensor PyTorch
    inputs = tokenizer(text, padding=True, truncation=True, max_length=512, return_tensors="pt").to("cuda")
    # Dapatkan output dari model dengan memberikan input yang sudah di-tokenisasi
    outputs = model(**inputs)
    # Hitung probabilitas dengan menerapkan fungsi softmax pada output
    probs = outputs[0].softmax(1)
    # Temukan indeks label dengan probabilitas tertinggi
    pred_label_idx = probs.argmax()
    # Konversi indeks label menjadi label sebenarnya menggunakan konfigurasi model
    pred_label = model.config.id2label[pred_label_idx.item()]
    # Kembalikan probabilitas, indeks label prediksi, dan label prediksi
    return probs, pred_label_idx, pred_label

In [None]:
text = "hai"
predict(text)

(tensor([[9.9748e-01, 2.5941e-04, 2.5195e-05, 1.4726e-05, 6.2204e-05, 8.3975e-05,
          3.0365e-05, 1.4091e-05, 1.5357e-05, 2.1666e-05, 2.0408e-05, 1.4431e-05,
          1.8675e-05, 1.3900e-04, 2.8063e-05, 3.5687e-05, 3.5877e-05, 3.2741e-05,
          2.3465e-05, 2.6930e-05, 4.8251e-05, 1.6679e-05, 3.2297e-05, 2.1842e-05,
          8.2645e-05, 8.4218e-05, 3.3765e-05, 5.9415e-05, 1.4534e-05, 1.3666e-05,
          2.7018e-05, 1.7065e-05, 4.0482e-05, 3.5175e-05, 4.2519e-05, 1.2021e-05,
          4.2650e-05, 1.4117e-05, 2.6696e-05, 6.4185e-05, 1.4624e-05, 1.6088e-05,
          3.0218e-05, 1.9052e-05, 3.6098e-05, 2.2431e-05, 3.9046e-05, 4.0897e-05,
          6.1888e-05, 2.4899e-05, 8.5847e-05, 5.0039e-04]], device='cuda:0',
        grad_fn=<SoftmaxBackward0>),
 tensor(0, device='cuda:0'),
 'Greetings')

# **SAVE MODEL**

In [None]:
# Menyimpan model yang telah dilatih ke path yang ditentukan
model_path = "/content/drive/MyDrive/Program/e125/chatbot"
trainer.save_model(model_path)
# Menyimpan tokenizer ke path yang sama dengan model
tokenizer.save_pretrained(model_path)

Saving model checkpoint to /content/drive/MyDrive/Program/e125/chatbot
Configuration saved in /content/drive/MyDrive/Program/e125/chatbot/config.json
Model weights saved in /content/drive/MyDrive/Program/e125/chatbot/pytorch_model.bin
tokenizer config file saved in /content/drive/MyDrive/Program/e125/chatbot/tokenizer_config.json
Special tokens file saved in /content/drive/MyDrive/Program/e125/chatbot/special_tokens_map.json


('/content/drive/MyDrive/Program/e125/chatbot/tokenizer_config.json',
 '/content/drive/MyDrive/Program/e125/chatbot/special_tokens_map.json',
 '/content/drive/MyDrive/Program/e125/chatbot/vocab.txt',
 '/content/drive/MyDrive/Program/e125/chatbot/added_tokens.json')

# **LOAD MODEL**

In [None]:
model_path = "/content/drive/MyDrive/Program/e125/chatbot"
# Memuat kembali model dan tokenizer dari path yang telah disimpan
model = BertForSequenceClassification.from_pretrained(model_path)
tokenizer= BertTokenizerFast.from_pretrained(model_path)
# Membuat pipeline untuk analisis sentimen menggunakan model dan tokenizer yang telah dilatih
chatbot= pipeline("sentiment-analysis", model=model, tokenizer=tokenizer)

# **CHAT WITH BOT**

In [None]:
# Fungsi untuk interaksi dengan chatbot
def chat(chatbot):
    # Menampilkan pesan sambutan dari chatbot
    print("Chatbot: Halo! Saya asisten virtual layanan akademik kampus Anda. Jangan ragu untuk bertanya, saya siap membantu Anda dengan informasi dan layanan akademik yang Anda butuhkan")
    print("Ketik 'quit' untuk mengakhiri pembicaraan\n")

    # Membaca input dari pengguna
    text = input("User: ").strip().lower()

    # Loop untuk terus berinteraksi sampai pengguna mengetik 'quit'
    while(text != 'quit'):
        # Mendapatkan skor prediksi dari chatbot
        score = chatbot(text)[0]['score']
        # Jika skor kurang dari 0.8, chatbot memberikan pesan bahwa tidak memahami input pengguna
        if score < 0.8 :
            print("Chatbot: Maaf saya tidak bisa memahami apa yang anda maksud\n", score, "\n")
            text = input("User: ").strip().lower()  # Membaca input selanjutnya dari pengguna
            continue

        # Mendapatkan label dari prediksi chatbot
        label = label2id[chatbot(text)[0]['label']]
        # Memilih respon acak dari intent yang sesuai dengan label
        response = random.choice(intents['intents'][label]['responses'])
         # Menampilkan respon dari chatbot
        print(f"Chatbot: {response}\n", score, "\n")

         # Membaca input selanjutnya dari pengguna
        text = input("User: ").strip().lower()

In [None]:
# Memulai interaksi dengan chatbot
chat(chatbot)

Chatbot: Halo! Saya asisten virtual layanan akademik kampus Anda. Jangan ragu untuk bertanya, saya siap membantu Anda dengan informasi dan layanan akademik yang Anda butuhkan
Ketik 'quit' untuk mengakhiri pembicaraan

User: halo
Chatbot: Selamat datang! Apa yang bisa saya lakukan untukmu?
 0.9972735047340393 

User: hai
Chatbot: Hai! Senang bertemu denganmu. Ada yang bisa saya bantu?
 0.997477114200592 

User: selamat pagi
Chatbot: Halo, bagaimana keadaan hari ini?
 0.9948082566261292 

User: selamat siang
Chatbot: Selamat datang! Apa yang bisa saya lakukan untukmu?
 0.9978113770484924 

User: selamat sore
Chatbot: Hai! Senang bertemu denganmu. Ada yang bisa saya bantu?
 0.9971519708633423 

User: selamat malam
Chatbot: Halo, apa yang bisa saya lakukan untukmu?
 0.9970353841781616 

User: cara daftar sidang
Chatbot: Pendaftaran Sidang Tugas Akhir dapat dilakukan melalui link berikut: <a href="https://bit.ly/FIFPendaftaranSidangV2" target="_blank">https://bit.ly/FIFPendaftaranSidangV2</