# Set up

In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
!pip install transformers sentence-transformers torchmetrics gradio

Collecting transformers
  Downloading transformers-4.31.0-py3-none-any.whl (7.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.4/7.4 MB[0m [31m50.1 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting sentence-transformers
  Downloading sentence-transformers-2.2.2.tar.gz (85 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m86.0/86.0 kB[0m [31m8.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting torchmetrics
  Downloading torchmetrics-1.0.3-py3-none-any.whl (731 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m731.6/731.6 kB[0m [31m28.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting gradio
  Downloading gradio-3.40.1-py3-none-any.whl (20.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m20.0/20.0 MB[0m [31m50.8 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub<1.0,>=0.14.1 (from transformers)
  Downloading huggingface_hub-0.16.4-py3-none-any.whl (268

In [None]:
import warnings
warnings.filterwarnings("ignore")

# Import

In [None]:
import pandas as pd
import numpy as np
from tqdm import tqdm
from copy import deepcopy
from torchmetrics import Precision
import torch
import json
from numpy.linalg import norm
from sentence_transformers import SentenceTransformer, SentencesDataset, InputExample, losses
from torch.utils.data import DataLoader
from sentence_transformers.evaluation import EmbeddingSimilarityEvaluator

# Change label matching

In [None]:
def process(text):
    return text.strip()

In [None]:
with open("/content/drive/MyDrive/Achatbot/data/new2oldmatch.json", 'r') as f:
    new2oldmatch = json.load(f)
    new2oldmatch = {process(u.lower()): process(v) for u, v in new2oldmatch.items()}
    old2newmatch = {u: v for v, u in new2oldmatch.items()}

# Dataset

In [None]:
train_data = pd.read_csv("/content/drive/MyDrive/Achatbot/data/train_valid_test_4/train.csv")
train_data.rename(columns={'Unnamed: 0': "ID"}, inplace=True)
train_data['Câu lệnh có sẵn']= train_data['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
train_data.head()

Unnamed: 0,ID,Câu lệnh sinh ra,Câu lệnh có sẵn
0,1587,đọc kỹ các hd sử dụng,mở hướng dẫn sử dụng
1,526,xin mở cảnh báo nhập kế hoạch trong năm để có ...,mở cảnh báo nhập kế hoạch năm
2,2718,xin hãy mở màn hình trình diễn để hiển thị báo...,mở màn hình trình chiếu báo cáo tháng
3,144,mở danh mục tổng quan sẵn sàng và không để chậ...,mở danh mục chung
4,921,mở kết quả thống kê liên ngành tháng trước,mở kết quả liên ngành (tháng n-1)


In [None]:
train_false_data = pd.read_csv("/content/drive/MyDrive/Achatbot/data/train_valid_test_4/train_false.csv")
train_false_data.rename(columns={'Unnamed: 0': "ID"}, inplace=True)
train_false_data['Câu lệnh có sẵn'] = train_false_data['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
train_false_data.head()

Unnamed: 0,ID,Câu lệnh sinh ra,Câu lệnh có sẵn
0,0,đọc kỹ các hd sử dụng,mở quản lý menu
1,1,xin mở cảnh báo nhập kế hoạch trong năm để có ...,mở báo cáo văn phòng tập đoàn
2,2,xin hãy mở màn hình trình diễn để hiển thị báo...,mở danh mục chung
3,3,mở danh mục tổng quan sẵn sàng và không để chậ...,mở dữ liệu kế hoạch năm
4,4,mở kết quả thống kê liên ngành tháng trước,mở dữ liệu thực hiện ngày


In [None]:
valid_data = pd.read_csv("/content/drive/MyDrive/Achatbot/data/train_valid_test_4/valid.csv")
valid_data.rename(columns={'Unnamed: 0': "ID"}, inplace=True)
valid_data['Câu lệnh có sẵn'] = valid_data['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
valid_data.head()

Unnamed: 0,ID,Câu lệnh sinh ra,Câu lệnh có sẵn
0,1663,xin mở dashboard,mở dashboard
1,886,hãy xem công thức ct kỹ thuật,mở công thức chỉ tiêu
2,868,có báo cáo công thức chỉ tiêu nào không?,mở công thức chỉ tiêu
3,2402,vui lòng mở tra cứu để biết tần suất sử dụng h...,mở tra cứu tần suất sử dụng hệ thống
4,2057,đảm bảo rằng quản lý đa ngôn ngữ đã được bật,mở quản lý đa ngôn ngữ


In [None]:
test_data = pd.read_csv("/content/drive/MyDrive/Achatbot/data/train_valid_test_4/test.csv")
test_data.rename(columns={'Unnamed: 0': "ID"}, inplace=True)
test_data['Câu lệnh có sẵn'] = test_data['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
test_data.head()

Unnamed: 0,ID,Câu lệnh sinh ra,Câu lệnh có sẵn
0,578,bạn hãy mở lên báo cáo dl kế hoạch tháng,mở dữ liệu kế hoạch tháng
1,2181,bắt đầu cài đặt quyền quản lý người nhận cb ng...,mở quản lý cấu hình người nhận cảnh báo
2,2020,truy cập vào cài đặt quản lý cấu hình truy vấn,mở quản lý cấu hình truy vấn
3,333,hãy mở quá trình quản lý chu kỳ nhập tài chính...,"mở quản lý chu kỳ import tài chính, kinh doanh"
4,1515,mong bạn mở bc kpi cđ để đưa ra biện pháp,mở báo cáo kpi chấm điểm


In [None]:
testcase_data = pd.read_csv("/content/drive/MyDrive/Achatbot/data/test_case/processed_test_case.csv")
testcase_data['Câu lệnh nhập vào'] = testcase_data['Câu lệnh nhập vào'].apply(lambda x: x.lower())
testcase_data.rename(columns={'Câu lệnh nhập vào': 'Câu lệnh sinh ra'}, inplace=True)
testcase_data['Câu lệnh có sẵn'] = testcase_data['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
testcase_data.drop(columns=['Unnamed: 0', 'Output', 'Dự đoán'], inplace=True)
testcase_data

Unnamed: 0,Câu lệnh sinh ra,Câu lệnh có sẵn
0,mở cảnh báo nhập kh tháng,mở cảnh báo nhập kế hoạch tháng
1,cảnh báo nhập kh tháng,mở cảnh báo nhập kế hoạch tháng
2,cảnh báo kh tháng,mở cảnh báo nhập kế hoạch tháng
3,cảnh báo tháng,mở cảnh báo nhập kế hoạch tháng
4,cảnh báo kế hoạch tháng,mở cảnh báo nhập kế hoạch tháng
...,...,...
285,bc kpi,mở báo cáo kpi chấm điểm
286,bc kpi,mở báo cáo kpi chấm điểm
287,bc kpi cđ,mở báo cáo kpi chấm điểm
288,mở báo cáo kpi chấm điểm,mở báo cáo kpi chấm điểm


In [None]:
testcase_data_false = pd.read_csv("/content/drive/MyDrive/Achatbot/data/test_case/testcase_false.csv")
testcase_data_false['Câu lệnh nhập vào'] = testcase_data_false['Câu lệnh nhập vào'].apply(lambda x: x.lower())
testcase_data_false.rename(columns={'Câu lệnh nhập vào': 'Câu lệnh sinh ra'}, inplace=True)
testcase_data_false['Câu lệnh có sẵn'] = testcase_data_false['Câu lệnh có sẵn'].apply(lambda x: old2newmatch[process(x)])
testcase_data_false.drop(columns=['Unnamed: 0', 'Unnamed: 0.1', 'Output', 'Dự đoán'], inplace=True)
testcase_data_false

Unnamed: 0,Câu lệnh sinh ra,Câu lệnh có sẵn
0,mở cảnh báo nhập kh tháng,"mở quản lý chu kỳ import tài chính, kinh doanh"
1,cảnh báo nhập kh tháng,mở quản lý nhóm đơn vị
2,cảnh báo kh tháng,mở báo cáo chốt năm
3,cảnh báo tháng,mở quản lý hướng dẫn sử dụng
4,cảnh báo kế hoạch tháng,mở quản lý chu kỳ mặc định
...,...,...
285,bc kpi,mở báo cáo chốt quý
286,bc kpi,mở quản lý cấu hình trình chiếu
287,bc kpi cđ,mở dữ liệu thực hiện tháng
288,mở báo cáo kpi chấm điểm,mở chỉ tiêu import


# Model

In [None]:
# model = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v2',
#                             cache_folder="/content/drive/MyDrive/Achatbot/model_dir")

In [None]:
# model.save("/content/drive/MyDrive/Achatbot/output/model")

In [None]:
# model.load("/content/drive/MyDrive/Achatbot/output/model")

In [None]:
def cosinesimilarity(vector1, vector2):
    cosine = np.dot(vector1, vector2)/(norm(vector1)*norm(vector2))
    return cosine

def encode_all_and_match(input, db_in):
    print("Input:", input)
    embedding = model.encode(input)
    df = pd.DataFrame(list(zip(db_in, [0]*len(db_in))), columns=["Câu lệnh có sẵn", "Điểm"])
    for i, func in tqdm(enumerate(db_in)):
        embedding2 = model.encode(func)
        df['Điểm'].loc[i] = cosinesimilarity(embedding, embedding2)
    df.sort_values(by=['Điểm'], inplace=True, ascending=False)
    return df

def encode_database(db_in, show_text=True):
    df = pd.DataFrame(list(zip(db_in, [[]]*len(db_in))), columns=["Câu lệnh có sẵn", "Embedding"])
    for i, func in enumerate(db_in):
        embedding2 = model.encode(func)
        df['Embedding'].loc[i] = embedding2
    else:
        if show_text:
            print()
            print("Encode database successfully")
    return df

def encode_input_and_match(input_in, db_dff):
    print("Input:", input_in)
    embedding = model.encode(input_in)
    scores = []
    db_df_in = deepcopy(db_dff)
    db_in = list(set(db_df_in['Câu lệnh có sẵn'].tolist()))
    for i, func in tqdm(enumerate(db_in)):
        embedding2 = db_df_in['Embedding'].loc[i]
        scores.append(cosinesimilarity(embedding, embedding2))
    else:
        print()
        print("Matching process finished.")
    db_df_in["Điểm"] = scores
    db_df_in.sort_values(by=['Điểm'], inplace=True, ascending=False)
    return db_df_in[["Câu lệnh có sẵn", "Điểm"]]

def encode_input_and_return_output(input_in, db_dff):
    embed1 = model.encode(input_in)
    scores = []
    db_df_in = deepcopy(db_dff)
    db_in = list(set(db_df_in['Câu lệnh có sẵn'].tolist()))
    for i, func in enumerate(db_in):
        embed2 = db_df_in['Embedding'].loc[i]
        scores.append(cosinesimilarity(embed1, embed2))
    db_df_in["Điểm"] = scores
    return db_df_in["Câu lệnh có sẵn"].loc[db_df_in['Điểm'].idxmax()]

def encode_input_and_return_top_n(input_in, db_dff, top_k):
    embed1 = model.encode(input_in)
    scores = []
    db_df_in = deepcopy(db_dff)
    db_in = list(set(db_df_in['Câu lệnh có sẵn'].tolist()))
    for i, func in enumerate(db_in):
        embed2 = db_df_in['Embedding'].loc[i]
        scores.append(round(cosinesimilarity(embed1, embed2), 3))
    db_df_in["Điểm"] = scores
    db_df_in.sort_values(by=['Điểm'], inplace=True, ascending=False)
    ids = db_df_in[:top_k].index.tolist()
    output = {db_df_in['Câu lệnh có sẵn'][i]: round(db_df_in['Điểm'][i].item(), 2) for i in ids}
    return output

# Finetune

In [None]:
CSKH_data = []
for i in range(len(train_data)):
    k = train_data["Câu lệnh có sẵn"].loc[i]
    if "CSKH" in k:
        CSKH_data.append(i)

CSKH_data[:5]

[]

# Necessary def

In [None]:
from sentence_transformers import SentenceTransformer, SentencesDataset, InputExample, losses
from torch.utils.data import DataLoader

model = SentenceTransformer('sentence-transformers/distiluse-base-multilingual-cased-v2',
                            cache_folder="/content/drive/MyDrive/Achatbot/model_dir")
train_examples = []
for i in range(len(testcase_data)):
    train_examples.append(InputExample(texts=[
        testcase_data["Câu lệnh sinh ra"].loc[i],
        testcase_data["Câu lệnh có sẵn"].loc[i]
    ], label=1.0))

for i in range(len(testcase_data_false)):
    train_examples.append(InputExample(texts=[
        testcase_data_false["Câu lệnh sinh ra"].loc[i],
        testcase_data_false["Câu lệnh có sẵn"].loc[i]
    ], label=0.0))
"""
train_dataset = SentencesDataset(train_examples, model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=128)
train_loss = losses.CosineSimilarityLoss(model=model)
evaluator = EmbeddingSimilarityEvaluator(sentences1=valid_data["Câu lệnh sinh ra"],
                                         sentences2=valid_data["Câu lệnh có sẵn"],
                                         scores=len(valid_data)*[1],
                                         write_csv=True)
"""

'\ntrain_dataset = SentencesDataset(train_examples, model)\ntrain_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=128)\ntrain_loss = losses.CosineSimilarityLoss(model=model)\nevaluator = EmbeddingSimilarityEvaluator(sentences1=valid_data["Câu lệnh sinh ra"],\n                                         sentences2=valid_data["Câu lệnh có sẵn"],\n                                         scores=len(valid_data)*[1],\n                                         write_csv=True)\n'

In [None]:
for i in range(len(valid_data)):
    k = valid_data["Câu lệnh có sẵn"].loc[i]
    if "chăm sóc" in k:
        print(k)
        hi = i
        break

mở báo cáo chăm sóc khách hàng


In [None]:
input = valid_data["Câu lệnh sinh ra"].loc[hi]
input

'xin mở bc chăm sóc khách hàng'

In [None]:
compared = valid_data["Câu lệnh có sẵn"].loc[hi]
compared

'mở báo cáo chăm sóc khách hàng'

In [None]:
def cosinesimilarity(vector1, vector2):
    cosine = np.dot(vector1, vector2)/(norm(vector1)*norm(vector2))
    return cosine

model = SentenceTransformer("/content/drive/MyDrive/Achatbot/output/model_v2")
model.eval()
embedding = model.encode(input)
embedding2 = model.encode(compared)
print(cosinesimilarity(embedding, embedding2))

0.89993626


In [None]:
# model = SentenceTransformer("/content/drive/MyDrive/Achatbot/output/model")
# model.load("/content/drive/MyDrive/Achatbot/model_dir/sentence-transformers_distiluse-base-multilingual-cased-v2")

In [None]:
# model.save("/content/drive/MyDrive/Achatbot/output/model")

In [None]:
database = [cmd for cmd in new2oldmatch.keys()]

def evaluate(modell, datata, epoch, db):
    db_df = encode_database(db, show_text=False)
    diction = {k: v for v, k in enumerate(db)}
    resultsss = deepcopy(datata)
    resultsss['Dự đoán myself'] = [0]*len(resultsss)
    for i, ints in enumerate(resultsss['Câu lệnh sinh ra']):
        output = encode_input_and_return_output(ints, db_df)
        resultsss['Dự đoán myself'].loc[i] = output
    preds = torch.tensor(resultsss['Dự đoán myself'].apply(lambda x: diction[process(x)]).tolist())
    tags = torch.tensor(resultsss['Câu lệnh có sẵn'].apply(lambda x: diction[process(x)]).tolist())
    precision = Precision(task="multiclass", average='micro', num_classes=len(diction))
    result = round(precision(preds, tags).item()*100, 2)
    print(f"Epoch {epoch}: Độ chính xác (Precision) của mô hình: {result}")
    return result

In [None]:
def cosinesimilarity(vector1, vector2):
    cosine = np.dot(vector1, vector2)/(norm(vector1)*norm(vector2))
    return cosine

model = SentenceTransformer("/content/drive/MyDrive/Achatbot/output/model_temp")
train_dataset = SentencesDataset(train_examples, model)
train_dataloader = DataLoader(train_dataset, shuffle=True, batch_size=128)
train_loss = losses.CosineSimilarityLoss(model=model)
device = torch.device("cuda") if torch.cuda.is_available() else torch.device("cpu")
model = model.to(device)
"""
for i in tqdm(range(1000)):
    model.train()
    model.fit(
        train_objectives=[(train_dataloader, train_loss)],
        show_progress_bar=False
    )
    if i % 50 == 49:
        model.train(False)
        result = evaluate(model, testcase_data, i, database)
"""
# model.save("/content/drive/MyDrive/Achatbot/output/model_v2")

'\nfor i in tqdm(range(1000)):\n    model.train()\n    model.fit(\n        train_objectives=[(train_dataloader, train_loss)],\n        show_progress_bar=False\n    )\n    if i % 50 == 49:\n        model.train(False)\n        result = evaluate(model, testcase_data, i, database)\n'

In [None]:
# model.save("/content/drive/MyDrive/Achatbot/output/model_temp")

In [None]:
model = SentenceTransformer("/content/drive/MyDrive/Achatbot/output/model_v2")
model.train(False)
result = evaluate(model, test_data, 0, database)

Epoch 0: Độ chính xác (Precision) của mô hình: 80.26


In [None]:
# model.save("/content/drive/MyDrive/Achatbot/output/model")

# Function Database (List of function commands)

# Test similarity

In [None]:
input = "Một con vịt"
embedding = model.encode(input)
compared = "Hai con lợn"
embedding2 = model.encode(compared)
cosinesimilarity(embedding, embedding2)

0.53127

# Matching a input with database

## Encode database

In [None]:
db_df = encode_database(database)


Encode database successfully


## Encode input and compare embedding with database

In [None]:
df = encode_input_and_match(input, db_df)
df[:5]

Input: Một con vịt


55it [00:00, 11525.12it/s]


Matching process finished.





Unnamed: 0,Câu lệnh có sẵn,Điểm
0,mở báo cáo kpi chấm điểm,0.574968
40,mở báo cáo động,0.412663
9,mở báo cáo chăm sóc khách hàng,0.41125
29,mở báo cáo văn phòng tập đoàn,0.406905
44,mở công thức chỉ tiêu,0.371093


# Dự đoán trên tập dữ liệu

In [None]:
datadata = testcase_data
# datadata = pd.read_csv("/content/drive/MyDrive/Achatbot/data/train_valid_test/train.csv")
datadata

Unnamed: 0,Câu lệnh sinh ra,Câu lệnh có sẵn
0,mở cảnh báo nhập kh tháng,mở cảnh báo nhập kế hoạch tháng
1,cảnh báo nhập kh tháng,mở cảnh báo nhập kế hoạch tháng
2,cảnh báo kh tháng,mở cảnh báo nhập kế hoạch tháng
3,cảnh báo tháng,mở cảnh báo nhập kế hoạch tháng
4,cảnh báo kế hoạch tháng,mở cảnh báo nhập kế hoạch tháng
...,...,...
285,bc kpi,mở báo cáo kpi chấm điểm
286,bc kpi,mở báo cáo kpi chấm điểm
287,bc kpi cđ,mở báo cáo kpi chấm điểm
288,mở báo cáo kpi chấm điểm,mở báo cáo kpi chấm điểm


In [None]:
results = deepcopy(datadata)
results['Dự đoán'] = [0]*len(results)
for i, ints in tqdm(enumerate(results['Câu lệnh sinh ra'])):
    output = encode_input_and_return_output(ints, db_df)
    results['Dự đoán'].loc[i] = output

290it [00:02, 102.09it/s]


In [None]:
# results.to_csv("/content/drive/MyDrive/Achatbot/output/train_prediction_3.csv")

In [None]:
errors = results[results['Câu lệnh có sẵn']!=results['Dự đoán']]
errors['Câu lệnh có sẵn'].value_counts()

mở cảnh báo nhập kế hoạch tháng    6
mở cảnh báo nhập khách hàng quý    6
mở cảnh báo nhập kế hoạch năm      6
mở báo cáo chăm sóc khách hàng     3
mở dữ liệu thực hiện tháng         2
Name: Câu lệnh có sẵn, dtype: int64

In [None]:
errors

Unnamed: 0,Câu lệnh sinh ra,Câu lệnh có sẵn,Dự đoán
5,kế hoạch tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
6,nhập kế hoạch tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
7,nhập kh tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
13,nhập kh tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
16,cb kh tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
17,cb tháng,mở cảnh báo nhập kế hoạch tháng,mở dữ liệu kế hoạch tháng
23,nhập kế hoạch quý,mở cảnh báo nhập khách hàng quý,mở dữ liệu kế hoạch quý
24,nhập kh quý,mở cảnh báo nhập khách hàng quý,mở dữ liệu kế hoạch quý
32,nhập kh quý,mở cảnh báo nhập khách hàng quý,mở dữ liệu kế hoạch quý
33,nhập kế hoạch quý,mở cảnh báo nhập khách hàng quý,mở dữ liệu kế hoạch quý


In [None]:
# errors = results[results['Câu lệnh có sẵn']=="Mở dữ liệu KH tháng "]
# TH_error = errors[errors['Câu lệnh có sẵn']!=errors['Dự đoán']]
# TH_correct = errors[errors['Câu lệnh có sẵn']==errors['Dự đoán']]
# errors['Câu lệnh có sẵn'].value_counts()

In [None]:
# TH_error.to_csv("/content/drive/MyDrive/Achatbot/output/KH_error.csv")

In [None]:
# TH_correct.to_csv("/content/drive/MyDrive/Achatbot/output/KH_correct.csv")

In [None]:
# errors.to_csv("/content/drive/MyDrive/Achatbot/output/train_prediction_error_3.csv")

# Đánh giá với độ chính xác Precision (Tổng số dự đoán đúng / Tổng số dự đoán)

In [None]:
dictionary = {k: v for v, k in enumerate(database)}
preds = torch.tensor(results['Dự đoán'].apply(lambda x: dictionary[x]).tolist())
tags = torch.tensor(results['Câu lệnh có sẵn'].apply(lambda x: dictionary[x]).tolist())
precision = Precision(task="multiclass", average='micro', num_classes=55)
print(f"Độ chính xác (Precision) của mô hình: {round(precision(preds, tags).item()*100, 2)}")

Độ chính xác (Precision) của mô hình: 92.07


In [None]:
dictionary = {k: v for v, k in enumerate(database)}
tags = torch.tensor(results['Câu lệnh có sẵn'].apply(lambda x: dictionary[x]).tolist())
count = 0
for i, inpu in tqdm(enumerate(results['Câu lệnh sinh ra'].tolist())):
    outpu = encode_input_and_return_top_n(inpu, db_df, 1).keys()
    if results['Câu lệnh có sẵn'].loc[i] in outpu:
        count += 1
print(count/(i+1))

290it [00:03, 92.62it/s]

0.9206896551724137





# Demo

In [None]:
inputt = "Bạn hãy mở lên dữ liệu kế hoạch tháng"
outputt = encode_input_and_return_top_n(inputt, db_df, 3)
outputt

{'mở dữ liệu kế hoạch tháng': 0.8,
 'mở dữ liệu thực hiện tháng': 0.77,
 'mở màn hình trình chiếu báo cáo tháng': 0.62}

In [None]:
import json
with open("/content/drive/MyDrive/Achatbot/output/result.json", "w") as outfile:
    json.dump(outputt, outfile, indent=4)

In [None]:
import gradio as gr

def image_classifier(Input):
    return encode_input_and_return_top_n(Input, db_df, 3)

demo = gr.Interface(fn=image_classifier, inputs="text", outputs="label")
# demo.launch(share=True)