In [1]:
# !pip install --upgrade torch==2.0.1 --index-url https://download.pytorch.org/whl/cu118
# !pip install -U sentence-transformers
# !pip install rouge bitsandbytes accelerate einops huggingface_hub
# !pip install -q -U trl transformers==4.35.0 git+https://github.com/huggingface/peft.git

Looking in indexes: https://download.pytorch.org/whl/cu118
Collecting torch==2.0.1
  Downloading https://download.pytorch.org/whl/cu118/torch-2.0.1%2Bcu118-cp310-cp310-linux_x86_64.whl (2267.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.3/2.3 GB[0m [31m?[0m eta [36m0:00:00[0ma [36m0:00:01[0m00:01[0m
Collecting triton==2.0.0 (from torch==2.0.1)
  Downloading https://download.pytorch.org/whl/triton-2.0.0-1-cp310-cp310-manylinux2014_x86_64.manylinux_2_17_x86_64.whl (63.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m63.3/63.3 MB[0m [31m20.1 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hCollecting cmake (from triton==2.0.0->torch==2.0.1)
  Downloading https://download.pytorch.org/whl/cmake-3.25.0-py2.py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (23.7 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m23.7/23.7 MB[0m [31m56.1 MB/s[0m eta [36m0:00:00[0m00:01[0m00:01[0m
[?25hCollecting lit (f

In [13]:
import re
import pandas as pd

from tqdm import tqdm
from glob import glob
from pathlib import Path
from string import punctuation
from sentence_transformers import SentenceTransformer

from src.preprocess import hybrid_search_topn_diseases, preprocess_corpus_files, preprocess_option, merge_options
from src.index import split_and_embed_corpus
from src.retrieval import retrieve_context
from src.llm import load_llm, predict, is_the_answer_correct, instruct_prompt

corpus_path = Path('/kaggle/input/kalapa-vietmedqa/corpus')
corpus_preproc_path = Path('/kaggle/working/output')
test_path = Path('/kaggle/input/kalapa-vietmedqa/public_test.csv')

# 0. Preprocessing steps.
preprocess_corpus_files(corpus_path, corpus_preproc_path)

test = pd.read_csv(test_path)
for i in range(1, 7):
    test[f'option_{i}_pp'] = test[f'option_{i}'].apply(preprocess_option)
    assert len(test[test[f'option_{i}'] == '']) == 0, i
    test.drop(columns=[f'option_{i}'], inplace=True)
test['options'] = test.apply(merge_options, axis=1)

# 1. Indexing (split and embed texts).
corpus_glob = str(corpus_preproc_path/'*')
disease_files = glob(corpus_glob)
diseases = [Path(p).stem.lower().replace('hội chứng', '').replace(
    'bệnh', '').strip().split(' ') for p in glob(corpus_glob)]
questions = [re.sub(f"[{punctuation}]", "", q).lower().split()
             for q in test['question'].tolist()]
answers = [re.sub(f"[{punctuation}]", "", q).lower().split()
           for q in test['options'].tolist()]
ids = test['id'].tolist()

# Text => chunks of text => embeddings.
doc_chunks, doc_chunks_emb = split_and_embed_corpus(
    disease_files,
    model='distiluse-base-multilingual-cased-v2'
)

# 2. Retrieval steps.
# Reduce the number of disease files to look at for each question.
topn_diseases_dict = hybrid_search_topn_diseases(
    disease_files, diseases, questions, answers, ids, n=5
)

# Start retrieving.
embedding_model = SentenceTransformer(
    'distiluse-base-multilingual-cased-v2')
retrieved_context_dict = {}
for index, row in tqdm(test.iterrows(), total=test.shape[0]):
    doc_id = row.id
    query = row.question + '\n' + row.options

    files_to_look_at = topn_diseases_dict[doc_id]['topn_disease']

    # print('index=', doc_id)
    # print(query, '\n')
    # print(files_to_look_at, '\n')
    # print('#' * 5)
    retrieved_context = retrieve_context(
        query, files_to_look_at, doc_chunks, doc_chunks_emb, embedding_model)
    retrieved_context_dict[doc_id] = retrieved_context

# 3. Augmented LLM.
llm, tokenizer = load_llm()

# Testing on only 1 document.
print(predict(test.iloc[0], llm, tokenizer,
      retrieved_context_dict, correct_str='1', incorrect_str='0'))

# You can run the rest here if you want.



  soup = BeautifulSoup(split)
Token indices sequence length is longer than the specified maximum sequence length for this model (945 > 512). Running this sequence through the model will result in indexing errors
100%|██████████| 603/603 [01:39<00:00,  6.06it/s]


Total chunks: 19083


  1%|          | 1/100 [00:00<00:12,  7.98it/s]

Question: hương đang mang thai và lo lắng mình có thể gặp phải rau tiền đạo hương có thể kiểm tra phát hiện bệnh này từ tuần thứ mấy của thai kỳ
Top-n from question: ['Rau tiền đạo', 'Nhau tiền đạo', 'Thai lưu', 'Mang thai ngoài tử cung', 'Tăng huyết áp thai kỳ']




  2%|▏         | 2/100 [00:00<00:12,  7.86it/s]

Question: hương đang mang thai tuần thứ 5 và lo lắng mình có thể gặp phải rau tiền đạo hương có thể kiểm tra phát hiện bệnh này sau bao nhiêu tuần nữa
Top-n from question: ['Rau tiền đạo', 'Nhau tiền đạo', 'Thai lưu', 'Ốm nghén khi mang thai', 'Mang thai ngoài tử cung']


Question: có bao nhiêu loại rau tiền đạo biết rằng trong bóng đá thường mỗi đội có tối đa 3 tiền đạo trên sân
Top-n from question: ['Rau tiền đạo', 'Nhau tiền đạo', 'Viêm đa xoang', 'Viêm âm đạo', 'Chàm đồng tiền']




  4%|▍         | 4/100 [00:00<00:10,  8.81it/s]

Question: bệnh nhân dũng được chuẩn đoán bị viêm gan kéo dài khoảng 4 tháng hỏi bệnh nhân dũng có phải bị viêm gan mãn tính hay không
Top-n from question: ['Bệnh viêm gan', 'Viêm gan mạn tính', 'Viêm gan C', 'Viêm gan A', 'Viêm gan B']




  5%|▌         | 5/100 [00:00<00:12,  7.85it/s]

Question: một bệnh nhân bị đau tinh hoàn sau khi được hỏi thì tinh hoàn bên phải bệnh nhân hoàn toàn bình thường bên còn lại có hiện tượng đau nguyên nhân chủ yếu của hiện tượng này là do
Top-n from question: ['Đau tinh hoàn bên phải', 'Đau tinh hoàn', 'Đau tinh hoàn bên trái', 'Sa tinh hoàn', 'Tinh trùng yếu']


Question: an bị viêm cột sống còn nam bị tiêu chảy hỏi bệnh của nam thuộc nhóm bệnh lý nào
Top-n from question: ['Tiêu chảy', 'Gai cột sống', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: việc sử dụng thuốc kháng sinh một cách tự tiện quá liều lượng không theo đơn có thể gây ra vấn đề nào
Top-n from question: ['Không có tinh trùng', 'Sinh non', 'Bệnh tự miễn', 'Vô sinh', 'Bệnh tim bẩm sinh không tím']




  9%|▉         | 9/100 [00:01<00:11,  7.97it/s]

Question: đàn ông có thể bị mắc ung thư vú không
Top-n from question: ['Ung thư vú', 'Ung thư thận', 'Ung thư xương', 'Ung thư gan', 'Ung thư da']


Question: ung thư buồng trứng là khối u ác tính có xuất phát từ một hoặc cả hai buồng trứng theo thống kê tỷ lệ mắc bệnh ung thư buồng trứng khoảng 46100000 phụ nữ bác sĩ dùng cách nào để chẩn đoán căn bệnh này
Top-n from question: ['Ung thư buồng trứng', 'U nang buồng trứng', 'Ung thư vú', 'Ung thư thận', 'Ung thư da']




 11%|█         | 11/100 [00:01<00:12,  7.25it/s]

Question: một người khỏe mạnh ăn mào gà không bị xuất hiện các triệu chứng bất thường ở vùng bụng đùi bên trong hậu môn người đó có phải đã mắc bệnh sùi mào gà không
Top-n from question: ['Sùi mào gà', 'Viêm hậu môn', 'Ăn không tiêu', 'Bệnh rò hậu môn', 'Polyp hậu môn']


Question: ông thận muốn kiểm tra hình ảnh tim và phổi của mình ông có thể sử dụng các phương pháp nào dưới đây
Top-n from question: ['Viêm phổi', 'Sỏi thận', 'Bệnh van tim', 'Bệnh xơ phổi', 'Suy tim']




 12%|█▏        | 12/100 [00:01<00:12,  7.13it/s]

Question: bác sĩ chuẩn đoán lan bị mắc bệnh u não sau khi kiểm tra thì bác sĩ kết luận đây không phải là u não ác tính vậy lan có bị bệnh ung thư hay không
Top-n from question: ['U não', 'U não lành tính', 'Ung thư vú', 'Ung thư thận', 'Ung thư xương']


Question: quỳnh là một người mẫu nổi tiếng ở việt nam với nghề người mẫu việc chăm sóc tốt da là điều cực kỳ quan trọng đâu là giải pháp giúp quỳnh chăm sóc da từ bên trong
Top-n from question: ['Nám da', 'Tái cực sớm', 'Ung thư da', 'Khàn tiếng (khàn giọng)', 'Rối loạn lưỡng cực']




 16%|█▌        | 16/100 [00:02<00:10,  8.26it/s]

Question: niệu đạo là một bộ phận sinh dục khá quan trọng giữ vai trò như một ống dẫn nước tiểu đi từ bàng quang ra bên ngoài cơ thể triệu chứng nào có thể dùng để nhận biết sớm bệnh viêm bộ phận này
Top-n from question: ['Viêm bàng quang', 'Viêm niệu đạo', 'Sỏi bàng quang', 'Bệnh Herpes sinh dục', 'Tắc ống dẫn tinh']


Question: cúm là một trong những bệnh phổ biến nhất trên thế giới định nghĩa bệnh này thế nào cho đúng
Top-n from question: ['Bệnh cúm', 'Cúm A H5N1', 'Dị vật trong mắt', 'Viêm bờ mi trên mắt', 'Bụi phổi (bụi trong phổi)']


Question: triệu chứng viêm niệu đạo bao gồm những gì
Top-n from question: ['Viêm niệu đạo', 'Viêm âm đạo', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: khi nào cần đến bác sĩ nếu nghi ngờ mắc hội chứng klinefelter
Top-n from question: ['Hội chứng Klinefelter', 'Hội chứng ngưng thở khi ngủ', 'Ốm nghén khi mang thai', 'Tứ chứng Fallot (Fallot 4)', 'Sa tử cung khi mang thai']




 20%|██        | 20/100 [00:02<00:06, 12.13it/s]

Question: xuất huyết tử cung bất thường là gì
Top-n from question: ['Xuất huyết tử cung bất thường', 'Sốt xuất huyết', 'Vỡ tử cung', 'Xuất huyết tiêu hóa', 'Viêm bàng quang xuất huyết']


Question: viêm bao hoạt dịch khớp gối là gì
Top-n from question: ['Viêm bao hoạt dịch khớp gối', 'Viêm khớp', 'Viêm bao hoạt dịch khớp háng', 'Viêm bao hoạt dịch khớp vai', 'Viêm bao hoạt dịch khớp cổ chân']


Question: triệu chứng nào là báo hiệu có sự xuất hiện của khối u tuyến tùng
Top-n from question: ['U tuyến tùng', 'U tuyến giáp', 'U máu', 'U não', 'U xương']


Question: bác sĩ có thể chỉ định người bệnh thực hiện một số chẩn đoán hình ảnh như
Top-n from question: ['Omicron tàng hình', 'Ngộ độc thực phẩm', 'Bệnh giác mạc hình chóp', 'Ung thư thực quản', 'Không có tinh trùng']




 24%|██▍       | 24/100 [00:02<00:05, 12.85it/s]

Question: các triệu chứng bệnh viêm gân gấp ngón cái là gì
Top-n from question: ['Viêm gân gấp ngón tay cái', 'Viêm bao gân ngón tay', 'Bệnh viêm gan', 'Viêm tai', 'Viêm khớp']


Question: đối tượng nào có nguy cơ mắc bệnh viêm thanh quản
Top-n from question: ['Viêm thanh quản', 'Viêm phế quản phổi', 'Viêm tai', 'Bệnh nhược cơ', 'Viêm tụy']


Question: làm thế nào để chẩn đoán bệnh viêm gan
Top-n from question: ['Bệnh viêm gan', 'Viêm gan A', 'Viêm gan C', 'Viêm gan B', 'Viêm khớp']


Question: hội chứng klinefelter là gì
Top-n from question: ['Hội chứng Klinefelter', 'Tứ chứng Fallot (Fallot 4)', 'Phế cầu khuẩn gây bệnh gì', 'Sỏi mật', 'Nhồi máu não']




 28%|██▊       | 28/100 [00:02<00:05, 13.33it/s]

Question: bác sĩ có thể sử dụng phương pháp tiêm corticosteroid để điều trị viêm bao hoạt dịch khớp gối đúng hay sai
Top-n from question: ['Viêm bao hoạt dịch khớp gối', 'Viêm khớp', 'Viêm bao hoạt dịch khớp háng', 'Viêm bao hoạt dịch khớp vai', 'Viêm bao hoạt dịch khớp cổ chân']


Question: việc nghỉ ngơi và uống nhiều nước có tác dụng gì trong việc điều trị bệnh cúm
Top-n from question: ['Bệnh cúm', 'Cúm A H5N1', 'Bệnh cườm nước (Glaucoma)', 'Dị vật trong mắt', 'Không có tinh trùng']


Question: các triệu chứng của viêm niệu đạo bao gồm những gì
Top-n from question: ['Viêm niệu đạo', 'Viêm âm đạo', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: ung thư biểu mô ống tuyến vú tại chỗ là gì
Top-n from question: ['Ung thư vú', 'Ung thư biểu mô ống tuyến vú tại chỗ (DCIS)', 'Ung thư tuyến giáp', 'Ung thư da', 'Ung thư thận']




 32%|███▏      | 32/100 [00:03<00:05, 13.51it/s]

Question: thủ thuật cryotheraphy liệu pháp lạnh được sử dụng để loại bỏ nốt sùi mào gà bằng cách gì
Top-n from question: ['Sùi mào gà', 'Sùi mào gà ở nữ', 'Nốt ruồi', 'Viêm mào tinh hoàn', 'Phế cầu khuẩn gây bệnh gì']


Question: các nguyên nhân gây xuất huyết tử cung bất thường được hệ thống hóa như thế nào
Top-n from question: ['Xuất huyết tử cung bất thường', 'Xuất huyết tiêu hóa', 'Sốt xuất huyết', 'Vỡ tử cung', 'Viêm bàng quang xuất huyết']


Question: triệu chứng nào thường gặp ở trẻ sơ sinh và trẻ em mắc hội chứng klinefelter
Top-n from question: ['Hội chứng Klinefelter', 'Sinh non', 'Vô sinh', 'Yếu sinh lý', 'Vô sinh nữ']




 34%|███▍      | 34/100 [00:03<00:04, 14.97it/s]

Question: viêm niệu đạo có thể gây ra những bệnh gì
Top-n from question: ['Viêm niệu đạo', 'Viêm âm đạo', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: nguyên nhân gây viêm thanh quản cấp tính
Top-n from question: ['Viêm thanh quản', 'Viêm xoang cấp tính', 'Viêm khớp cấp', 'Viêm họng cấp', 'Viêm tụy cấp']


Question: phương pháp phòng ngừa bệnh viêm cầu thận cấp tính nào được khuyến khích thực hiện
Top-n from question: ['Viêm cầu thận', 'Viêm cầu thận cấp', 'Viêm cầu thận mạn tính', 'Viêm xoang cấp tính', 'Viêm cầu thận Lupus']


Question: sự lây lan của vi khuẩn gây bệnh ỉa chảy có thể được tránh như thế nào
Top-n from question: ['Nhiễm vi khuẩn Salmonella', 'Tiêu chảy', 'Phế cầu khuẩn gây bệnh gì', 'Nhiễm khuẩn H.p (Helicobacter pylori)', 'Sốt siêu vi']




 40%|████      | 40/100 [00:03<00:04, 12.92it/s]

Question: hội chứng klinefelter ở nam giới có tỷ lệ mắc bệnh là bao nhiêu
Top-n from question: ['Hội chứng Klinefelter', 'Viêm bàng quang ở nữ giới', 'Không có tinh trùng', 'Hẹp bao quy đầu', 'Viêm bao quy đầu']


Question: các biện pháp phòng tránh bệnh tiêu chảy là gì
Top-n from question: ['Tiêu chảy', 'Ăn không tiêu', 'Rối loạn tiêu hóa', 'Xuất huyết tiêu hóa', 'Phế cầu khuẩn gây bệnh gì']


Question: các đối tượng có nguy cơ cao mắc bệnh cúm là ai
Top-n from question: ['Bệnh cúm', 'Bệnh nhược cơ', 'Bệnh viêm cơ tim', 'Men gan cao', 'Mỡ máu cao']


Question: công nghệ cao nào được sử dụng để trị mụn nội tiết
Top-n from question: ['Mụn nội tiết', 'Nám nội tiết', 'Mụn cóc', 'Mụn bọc', 'Rối loạn nội tiết']




 44%|████▍     | 44/100 [00:04<00:03, 15.23it/s]

Question: nguyên nhân gây viêm cầu thận cấp tính là gì
Top-n from question: ['Viêm cầu thận', 'Viêm cầu thận cấp', 'Viêm cầu thận mạn tính', 'Viêm xoang cấp tính', 'Viêm cầu thận Lupus']


Question: làm thế nào để cải thiện bệnh viêm thanh quản
Top-n from question: ['Viêm thanh quản', 'Bệnh viêm gan', 'Viêm tai', 'Viêm phế quản phổi', 'Viêm tụy']


Question: làm thế nào để chăm sóc và bảo vệ da khỏi mụn nội tiết
Top-n from question: ['Mụn nội tiết', 'Nám nội tiết', 'Rối loạn nội tiết', 'Mụn cóc', 'Nám da']


Question: nguyên nhân gây bệnh klinefelter là gì
Top-n from question: ['Hội chứng Klinefelter', 'Phế cầu khuẩn gây bệnh gì', 'Bệnh nhân tuyến giáp', 'Vô sinh nguyên phát', 'Bướu giáp đa nhân']




 46%|████▌     | 46/100 [00:04<00:03, 15.67it/s]

Question: các biến chứng của suy tim phải bao gồm những gì
Top-n from question: ['Suy tim phải', 'Suy tim', 'Suy tim trái', 'Bệnh van tim', 'Suy gan']


Question: vì sao mụn trứng cá có thể ảnh hưởng đến tâm lý
Top-n from question: ['Mụn trứng cá', 'Mụn trứng cá ở cằm', 'Mụn trứng cá ở lưng', 'Mụn bọc', 'Mụn ẩn']


Question: nguyên nhân gây viêm gân ngón cái là gì
Top-n from question: ['Viêm gân gấp ngón tay cái', 'Viêm bao gân ngón tay', 'Bệnh viêm gan', 'Viêm tai', 'Viêm khớp']




 50%|█████     | 50/100 [00:04<00:03, 15.22it/s]

Question: triệu chứng sùi mào gà gây cảm giác khó chịu ngứa ngáy chảy máu sau khi quan hệ tình dục là đúng hay sai
Top-n from question: ['Sùi mào gà', 'Sùi mào gà ở nữ', 'Trầm cảm', 'Ngủ ngáy', 'U máu']


Question: có bao nhiêu loại cúm ảnh hưởng tới con người
Top-n from question: ['Bệnh cúm', 'Cúm A H5N1', 'Hẹp bao quy đầu', 'Không có tinh trùng', 'Viêm bao quy đầu']


Question: các loại thuốc kháng vi rút được khuyên dùng trong điều trị cúm là gì
Top-n from question: ['Bệnh cúm', 'Sốt siêu vi', 'Cúm A H5N1', 'Dị vật trong mắt', 'Nhiễm vi khuẩn Salmonella']


Question: ung thư vú giai đoạn 0 có thể tái phát không
Top-n from question: ['Ung thư vú giai đoạn 0', 'Ung thư vú tái phát', 'Ung thư vú', 'Ung thư vú giai đoạn 3', 'Ung thư vú giai đoạn 4']




 54%|█████▍    | 54/100 [00:04<00:02, 16.58it/s]

Question: ung thư buồng trứng giai đoạn i là gì
Top-n from question: ['Ung thư buồng trứng', 'Ung thư buồng trứng giai đoạn 4', 'Ung thư buồng trứng giai đoạn 1', 'Ung thư vú giai đoạn 4', 'Ung thư vú']


Question: viêm niệu đạo do tác nhân nào gây ra
Top-n from question: ['Viêm niệu đạo', 'Viêm âm đạo', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: các biện pháp phòng ngừa viêm niệu đạo bao gồm những gì
Top-n from question: ['Viêm niệu đạo', 'Viêm âm đạo', 'Bệnh viêm gan', 'Viêm khớp', 'Viêm tai']


Question: virus cúm lây lan như thế nào
Top-n from question: ['Bệnh cúm', 'Cúm A H5N1', 'Bướu giáp lan tỏa', 'Rối loạn lo âu lan tỏa (GAD)', 'Sỏi mật']


Question: suy tim phải là gì
Top-n from question: ['Suy tim phải', 'Suy tim', 'Suy tim trái', 'Bệnh van tim', 'Suy gan']




 59%|█████▉    | 59/100 [00:04<00:02, 17.70it/s]

Question: nguyên nhân chính dẫn đến tiêu chảy cấp tính là gì
Top-n from question: ['Tiêu chảy', 'Bệnh gout cấp tính', 'Viêm xoang cấp tính', 'Viêm tụy cấp', 'Ăn không tiêu']


Question: u tuyến tùng hỗn hợp là sự kết hợp của những loại tế bào nào
Top-n from question: ['U tuyến tùng', 'U tuyến giáp', 'U não', 'U máu', 'U xương']


Question: làm thế nào để phòng ngừa bệnh viêm thanh quản
Top-n from question: ['Viêm thanh quản', 'Bệnh viêm gan', 'Viêm tai', 'Viêm phế quản phổi', 'Viêm tụy']


Question: rau tiền đạo có thể gây ra những biến chứng gì đối với thai phụ
Top-n from question: ['Rau tiền đạo', 'Nhau tiền đạo', 'Thai lưu', 'Phế cầu khuẩn gây bệnh gì', 'Viêm âm đạo']




 61%|██████    | 61/100 [00:05<00:02, 16.69it/s]

Question: phương pháp chẩn đoán ung thư vú giai đoạn 0 bao gồm những gì
Top-n from question: ['Ung thư vú', 'Ung thư vú giai đoạn 0', 'Ung thư vú giai đoạn 3', 'Ung thư vú giai đoạn 4', 'Ung thư vú giai đoạn 1']


Question: thuốc kháng giáp có tác dụng gì
Top-n from question: ['Cường giáp', 'U tuyến giáp', 'Bướu giáp keo', 'Viêm tuyến giáp', 'Bệnh nhân tuyến giáp']




 65%|██████▌   | 65/100 [00:05<00:02, 12.90it/s]

Question: để phòng ngừa tình trạng viêm bao hoạt dịch khớp gối người bệnh nên làm gì
Top-n from question: ['Viêm bao hoạt dịch khớp gối', 'Viêm khớp', 'Viêm bao hoạt dịch khớp háng', 'Viêm bao hoạt dịch khớp vai', 'Viêm bao hoạt dịch khớp cổ chân']


Question: triệu chứng của hẹp van hai lá có thể tăng mức độ khi nào
Top-n from question: ['Hẹp van hai lá', 'Hở van 3 lá', 'Hở van 2 lá', 'Bệnh van tim', 'Hẹp van động mạch chủ']


Question: phương pháp điều trị nào được sử dụng cho bệnh nhân mắc ung thư biểu mô ống tuyến vú tại chỗ
Top-n from question: ['Ung thư vú', 'Ung thư biểu mô ống tuyến vú tại chỗ (DCIS)', 'Ung thư tuyến giáp', 'Ung thư da', 'Ung thư thận']


Question: viêm gan có triệu chứng gì
Top-n from question: ['Bệnh viêm gan', 'Viêm gan A', 'Viêm gan C', 'Viêm gan B', 'Viêm khớp']




 70%|███████   | 70/100 [00:05<00:01, 15.70it/s]

Question: cách phòng ngừa cúm hiệu quả nhất là gì
Top-n from question: ['Bệnh cúm', 'Cúm A H5N1', 'Phế cầu khuẩn gây bệnh gì', 'Sỏi mật', 'Nhồi máu não']


Question: triệu chứng của bệnh viêm thanh quản
Top-n from question: ['Viêm thanh quản', 'Bệnh viêm gan', 'Viêm tai', 'Viêm phế quản phổi', 'Viêm tụy']


Question: hẹp van hai lá là bệnh gì
Top-n from question: ['Hẹp van hai lá', 'Bệnh van tim', 'Hở van 2 lá', 'Hở van 3 lá', 'Hẹp van động mạch chủ']


Question: triệu chứng sùi mào gà có thể xuất hiện ở những vị trí nào ở nữ giới
Top-n from question: ['Sùi mào gà', 'Sùi mào gà ở nữ', 'Viêm bàng quang ở nữ giới', 'Yếu sinh lý ở nữ', 'Bệnh thoát vị bẹn']




 72%|███████▏  | 72/100 [00:05<00:01, 14.75it/s]

Question: viêm tai ngoài và mất thính lực một bên tai đều có thể được điều trị bằng những loại thuốc nào
Top-n from question: ['Viêm tai ngoài', 'Viêm tai', 'Viêm tai giữa', 'Bệnh viêm gan', 'Nấm ống tai ngoài']


Question: viêm họng cấp tính và viêm họng mạn tính có điểm gì giống nhau
Top-n from question: ['Bệnh viêm họng', 'Viêm họng cấp', 'Viêm gan mạn tính', 'Viêm xoang mạn tính', 'Viêm xoang cấp tính']


Question: làm thế nào để phân biệt viêm họng cấp tính và viêm họng mạn tính
Top-n from question: ['Bệnh viêm họng', 'Viêm họng cấp', 'Viêm gan mạn tính', 'Viêm xoang mạn tính', 'Viêm xoang cấp tính']




 76%|███████▌  | 76/100 [00:06<00:01, 13.89it/s]

Question: đâu là biện pháp để ngăn ngừa các bệnh lây qua đường tình dục như lậu herpes sinh dục chlamydia
Top-n from question: ['Bệnh lậu', 'Bệnh Herpes sinh dục', 'Bệnh Chlamydia', 'herpes', 'Sinh non']


Question: thời gian ủ bệnh của bênh nào lâu nhất trong các bệnh sau
Top-n from question: ['Bệnh trĩ sau sinh', 'Mất ngủ sau sinh', 'Dị vật trong mắt', 'Đau nửa đầu sau', 'Trầm cảm sau sinh']


Question: phương pháp chẩn đoán chlamydia và viêm gan b là gì
Top-n from question: ['Bệnh Chlamydia', 'Bệnh viêm gan', 'Viêm gan B', 'Viêm gan C', 'Viêm gan A']




 78%|███████▊  | 78/100 [00:06<00:01, 13.79it/s]

Question: điểm giống nhau chung giữa polyp dạ dày và viêm loét dạ dày tá tràng là gì
Top-n from question: ['Viêm loét dạ dày tá tràng', 'Polyp dạ dày', 'Bệnh viêm loét dạ dày', 'Viêm dạ dày tá tràng', 'Viêm dạ dày']


Question: người ta phân loại mức độ cận thị và loạn thị bằng độ đo gì
Top-n from question: ['Mắt loạn thị', 'Mắt cận thị', 'Rối loạn lipid', 'Mắt viễn thị', 'Rối loạn sàn chậu']


Question: bệnh cận thị loạn thị và viễn thị có những cách điều trị chung nào
Top-n from question: ['Mắt loạn thị', 'Mắt cận thị', 'Mắt viễn thị', 'Rối loạn lipid', 'Không có tinh trùng']




 80%|████████  | 80/100 [00:06<00:01, 14.10it/s]

Question: mụn trứng cá và mụn cóc phẳng có những điểm gì giống nhau
Top-n from question: ['Mụn cóc', 'Mụn trứng cá', 'Mụn cóc phẳng', 'Mụn trứng cá ở lưng', 'Mụn trứng cá ở cằm']


Question: mụn cóc phẳng và mụn nội tiết gây ra các triệu chứng gì trên da
Top-n from question: ['Mụn cóc phẳng', 'Mụn nội tiết', 'Mụn cóc', 'Nám nội tiết', 'Rối loạn nội tiết']


Question: những biện pháp nào giúp phòng ngừa và giảm thiểu nguy cơ mắc các căn bệnh về mụn
Top-n from question: ['Mụn bọc', 'Bệnh nhược cơ', 'Mụn ẩn', 'Mụn cám', 'Mụn cóc']




 84%|████████▍ | 84/100 [00:06<00:01, 11.78it/s]

Question: đâu là khẳng định đúng về đối tượng mắc ung thư thận và ung thư tuyến giáp
Top-n from question: ['Ung thư thận', 'Ung thư tuyến giáp', 'U tuyến giáp', 'Ung thư da', 'Ung thư xương']


Question: làm thế nào để phòng ngừa viêm tai giữa ứ dịch và viêm tai ngoài
Top-n from question: ['Viêm tai', 'Viêm tai giữa', 'Viêm tai giữa ứ dịch', 'Viêm tai ngoài', 'Viêm tai giữa ứ mủ']


Question: bệnh nào trong 3 bệnh sau xuất hiện hầu hết ở trẻ em
Top-n from question: ['Bệnh bạch hầu', 'Sốt xuất huyết', 'Bệnh trĩ sau sinh', 'Lõm ngực bẩm sinh ở trẻ', 'Xuất tinh sớm']




 86%|████████▌ | 86/100 [00:07<00:01, 11.56it/s]

Question: đâu là triệu chứng chung của viêm gan a viêm gan b viêm gan c
Top-n from question: ['Bệnh viêm gan', 'Viêm gan A', 'Viêm gan C', 'Viêm gan B', 'Viêm khớp']


Question: việc ăn sống các loại động vật có vỏ từ nguồn nước bị ô nhiễm là nguyên nhân gây ra căn bệnh nào
Top-n from question: ['Bệnh quai bị', 'Bệnh động kinh', 'Gan nhiễm mỡ', 'Ăn không tiêu', 'Bệnh cườm nước (Glaucoma)']




 88%|████████▊ | 88/100 [00:07<00:01, 10.69it/s]

Question: đâu là những biến chứng mà viêm gan b và viêm gan c có thể gây ra
Top-n from question: ['Viêm gan C', 'Bệnh viêm gan', 'Viêm gan B', 'Viêm gan A', 'Viêm khớp']


Question: những bệnh nào dưới đây đã có vắc xin phòng ngừa
Top-n from question: ['Không có tinh trùng', 'Viêm đường hô hấp dưới', 'Suy giãn tĩnh mạch chi dưới', 'Suy giãn tĩnh mạch sâu chi dưới', 'Sỏi mật']




 92%|█████████▏| 92/100 [00:07<00:00,  9.34it/s]

Question: vắc xin là chế phẩm có tính kháng nguyên có nguồn gốc từ vi sinh vật gây bệnh hoặc vi sinh vật có cấu trúc kháng nguyên giống vi sinh vật gây bệnh đã được bào chế đảm bảo độ an toàn cần thiết làm cho cơ thể tự tạo ra tình trạng miễn dịch chống lại tác nhân gây bệnh vắc xin có thể phòng ngừa được bệnh nào dưới đây
Top-n from question: ['Bệnh tự miễn', 'Sinh non', 'Vô sinh', 'Chống mặt', 'Vô sinh nguyên phát']


Question: những bệnh nào sau đây không lây nhiễm
Top-n from question: ['Ăn không tiêu', 'Nhiễm khuẩn H.p (Helicobacter pylori)', 'Bệnh nhiễm sán chó', 'Bệnh trĩ sau sinh', 'Gan nhiễm mỡ']


Question: ngộ độc thực phẩm đau dạ dày rối loạn tiêu hóa nên tránh
Top-n from question: ['Rối loạn tiêu hóa', 'Ngộ độc thực phẩm', 'Ngộ độc Botulinum', 'Viêm dạ dày', 'Polyp dạ dày']




 94%|█████████▍| 94/100 [00:07<00:00, 10.56it/s]

Question: triệu chứng chung của suy tim suy hô hấp suy thận
Top-n from question: ['Bệnh suy thận', 'Suy tim', 'Suy hô hấp (cấp)', 'Suy thận cấp', 'Suy thận mạn']


Question: người bị mỡ máu cao mất ngủ rối loạn tiền đình nên làm gì
Top-n from question: ['Rối loạn tiền đình', 'Mất ngủ', 'Mỡ máu cao', 'Rối loạn lipid', 'Rối loạn sàn chậu']


Question: các nguyên nhân gây sốt
Top-n from question: ['Sốt rét', 'Bệnh nhân tuyến giáp', 'Sốt xuất huyết', 'Sốt siêu vi', 'Vô sinh nguyên phát']




 96%|█████████▌| 96/100 [00:08<00:00,  9.28it/s]

Question: tiểu đường là nữ ca sĩ nổi tiếng ở trung quốc thời gian gần đây giọng hát của cô đi xuống trầm trọng do những triệu chứng khó chịu như đau họng rát họng và khó nuốt tiểu đường có thể đã mắc căn bệnh gì
Top-n from question: ['Đau họng', 'Tiểu đêm', 'Són tiểu', 'Đau mắt', 'Tiểu buốt']


Question: mai hiện mang thai tháng thứ 9 có rất nhiều bệnh truyền nhiễm có thể lây từ mẹ sang con trong quá trình mang thai hoặc sinh thường những bệnh nào dưới đây có thể lây như vậy
Top-n from question: ['Truyền máu song thai', 'Sinh non', 'Thai lưu', 'Nhiễm ký sinh trùng', 'Vô sinh']




 98%|█████████▊| 98/100 [00:08<00:00,  7.02it/s]

Question: ông biền năm nay 73 tuổi trong một bữa cơm gia đình ông đột nhiên bị méo lệch một bên miệng và mặt 3 tháng sau ông qua đời ông biền có thể đã mắc những căn bệnh nào dưới đây
Top-n from question: ['Chống mặt', 'Liệt mặt', 'Bệnh quai bị', 'Đột quỵ', 'Nằm xuống bị chóng mặt']




 99%|█████████▉| 99/100 [00:08<00:00,  7.01it/s]

Question: u não là tình trạng các khối u hình thành trong sọ não đe dọa tính mạng người bệnh u não thường có 2 loại là lành tính và ác tính đâu là điểm chung của chúng
Top-n from question: ['U não', 'U não lành tính', 'U thận lành tính', 'Bướu cổ lành tính', 'U xương']




100%|██████████| 100/100 [00:09<00:00, 10.97it/s]

Question: vắc xin là chế phẩm có tính kháng nguyên có nguồn gốc từ vi sinh vật gây bệnh hoặc vi sinh vật có cấu trúc kháng nguyên giống vi sinh vật gây bệnh đã được bào chế đảm bảo độ an toàn cần thiết làm cho cơ thể tự tạo ra tình trạng miễn dịch chống lại tác nhân gây bệnh vắc xin có thể phòng ngừa được bệnh nào dưới đây
Top-n from question: ['Bệnh tự miễn', 'Sinh non', 'Vô sinh', 'Chống mặt', 'Vô sinh nguyên phát']





100%|██████████| 100/100 [00:01<00:00, 86.31it/s]


Iteration #1
Bối cảnh: Bao nhiêu tuần thì biết được rau tiền đạo? Bác sĩ Nguyễn Đức Hinh cho biết, hầu hết các trường hợp rau tiền đạo có thể được phát hiện sớm từ tuần 20 của thai kỳ nhờ vào phương pháp siêu âm thai. Trong quá trình siêu âm, với sự hỗ trợ của nhiều thiết bị hiện đại, bác sĩ có thể quan sát được bánh rau bám vào vị trí nào ở tử cung ( thân, đáy, mặt trước, mặt sau, bên trái, bên phải, bám thấp, bán trung tâm hoặc trung tâm ). Chẩn đoán rau tiền đạo.mổ lấy thai khẩn cấp để cứu sống cả thai phụ lẫn thai nhi. Nếu thai nhi chưa đủ ngày đủ tháng sẽ bị sinh non, nguy cơ bị suy hô hấp sau sinh nếu không được can thiệp hỗ trợ. Thêm vào đó, bánh rau nằm ở vị trí dưới phần tử cung sẽ khiến thai nhi khó xoay đầu xuống, gây bất lợi cho đường ra của thai nhi lúc sinh nở. Thai phụ có thể phải sinh ngôi thai ngược ( ngôi ngang hoặc ngôi mông )..Phòng ngừa rau tiền đạo Rau tiền đạo là một trong những biến chứng thai kỳ nguy hiểm, đe dọa tính mạng thai phụ lẫn thai nhi. Chính vì thế, b

**You could see that if we change the `choice`, the model answer differently**
* "0" means the `choice` is not correct and "1" means otherwise.

In [16]:
is_the_answer_correct(
    llm,
    tokenizer,
    instruct_prompt.format(
        # Eng sub: "Diarrhea can be cured by taking medicine."
        context='Tiêu chảy thì uống thuốc là hết.',
        # Eng sub: "What do we do when we got diarrhea?"
        question='Tiêu chảy thì làm gì?',
        choice='Uống nước.'  # Eng sub: "Dink water."
    ))

('0', array([0.8620035 , 0.13799646], dtype=float32))

In [17]:
is_the_answer_correct(
    llm,
    tokenizer,
    instruct_prompt.format(
        context='Tiêu chảy thì uống thuốc là hết.',
        question='Tiêu chảy thì làm gì?',
        choice='Uống thuốc.'))  # Eng sub: "Taking medicine."

('1', array([0.36026397, 0.63973606], dtype=float32))