## Chuẩn đoán

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyDkIcBxpkno0XHjOgZ-pwpJn9kgnoGC83E")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_diagnosis.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","icd_10", "icd_10/title", "question", "symptom", "diagnosis",
    "document/title",  "document/description",
    "cme/title", "cme/description"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.
Dựa vào đoạn văn sau:
"{dental_text}"
Hãy sinh ra một **DANH SÁCH GỒM 3 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.
**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
- Có giá trị hướng dẫn, giải thích rõ ràng, có thể dùng để **tư vấn lâm sàng cho người dùng cuối**.
**Yêu cầu đặc biệt**:
- Nếu đoạn văn có đề cập đến các **chỉ số lâm sàng** như độ sâu túi lợi, chỉ số mảng bám, số răng tổn thương, mức độ đau... thì **phải đưa các con số và dữ liệu đó vào `symptom` và `diagnosis`** để tăng độ chính xác cho chatbot.
- `symptom` và `diagnosis` phải viết theo ngôn ngữ chuyên môn, **khoa học, cụ thể, không chung chung**, đủ để một bác sĩ hoặc chatbot sử dụng để diễn giải cho người bệnh.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "icd_10": Mã bệnh ICD-10 của Bộ Y tế Việt Nam phù hợp nhất với đoạn văn (ví dụ: "A01.1", "P27.0") nhưng nếu không xác định được thì gán mã bệnh gần đúng nhất(Không được để trống).
- "icd_10/title": Tên mã bệnh ICD-10 tương ứng với mã ở trên đúng chuẩn Bộ y tế (ví dụ: "Bệnh lao phổi", "Viêm phổi do virus").
- "question": Một câu hỏi y khoa phù hợp với **nội dung bài viết và câu trả lời**, tập trung vào chẩn đoán hoặc điều trị y khoa (giống như người dùng hay bác sỹ trẻ hỏi chatbot).
- "symptom": Các triệu chứng hoặc dấu hiệu lâm sàng được nêu trong bài, hoặc suy luận có cơ sở khoa học. **Bao gồm cả các chỉ số định lượng nếu có** như: túi nha chu 6mm, PI=2.2, v.v.
- "diagnosis": Chẩn đoán nha khoa chi tiết, có thể phân loại theo mức độ bệnh hoặc giai đoạn nếu phù hợp. **Phải có cơ sở y khoa vững chắc** và dùng thông số hỗ trợ chẩn đoán nếu có.
- "document/title": Tiêu đề tài liệu y khoa liên quan đến nội dung đoạn văn.
- "document/description": Mô tả ngắn gọn tài liệu tham khảo, nêu rõ mục đích hoặc giá trị ứng dụng.
- "cme/title": Tiêu đề khóa học đào tạo y khoa liên tục (CME) liên quan đến chủ đề trong đoạn văn.
- "cme/description": Mô tả ngắn về khóa học CME, giúp chatbot hiểu và phản hồi như một trợ lý học thuật chuyên ngành.
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "icd_10": data.get("icd_10", ""),
                "icd_10/title": data.get("icd_10/title", ""),
                "question": data.get("question", ""),
                "symptom": data.get("symptom", ""),
                "diagnosis": data.get("diagnosis", ""),
                "document/title": data.get("document/title", ""),
                "document/description": data.get("document/description", ""),
                "cme/title": data.get("cme/title", ""),
                "cme/description": data.get("cme/description", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


Đã đọc file Excel với 310294 dòng văn bản.


  0%|          | 1/310294 [00:37<3194:02:55, 37.06s/it]

## Small talk

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyDACh169FpAdWuCzw6r181Wx7tlEdXlcdU")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_smalltalk.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Dữ liệu cho các tác vụ chung như chào hỏi, giải thích, tư vấn,...
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
**Yêu cầu đặc biệt**:
- Dữ liệu cho các tác vụ chung của chatbot như chào hỏi, giải thích, tư vấn... để chatbot có thể phản hồi người dùng một cách tự nhiên và thân thiện.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa hãy tư vấn và chào hỏi thân thiện."
- "question": Câu hỏi y khoa mà các bác sỹ sẽ hỏi đơn giản hay người dùng hỏi chatbot.
- "answer": Câu trả lời thân thiện cho người dùng (ví dụ: Người dùng xin chào thì chat bot sẽ chào lại và hỏi bạn cần giúp gì).
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


## Medicaltalk

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyBHJ3cOKxhsO-OyN8nzrmWAuw9QODnvTJw")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_medicaltalk.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Dữ liệu cho các tác vụ về y tế, bệnh học, nghiên cứu, dược học, ....
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình y khoa).
**Yêu cầu đặc biệt**:
- Dữ liệu cho các tác vụ về y tế, bệnh học, nghiên cứu, dược học, y học, y khoa....
- Trong 5 đối tượng JSON, có 3 đối tường trình bày trả lời như bình thường bằng text, 2 đối tượng còn lại sẽ trả ra câu trả lời dưới dạng bảng (table) chuẩn dạng markdown với các cột và hàng rõ ràng, có tiêu đề bảng, tiêu đề cột, tiêu đề hàng, và các ô dữ liệu bên trong.
- Trong 2 đối tượng trả lời dưới dạng bảng thì một dạng bảng trả ra nội dung và một trả ra nội dung cùng số liệu, thông số, thông tin. Câu trả lời phải trình bày chi tiết rồi mời đưa ra bảng dạng markdown cho dẫn chứng.
- Với 3 câu trình bày dạng text như thường thì trình bày đa dạng nhiều kiểu như list có bullet points, số thứ tự, một đoạn trả lời chi tiết, một bản trình bày tóm tắt, v.v.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot về y khoa, bệnh học, nghiên cứu, dược học, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "question": Câu hỏi của bác sỹ hoặc sinh viên y khoa hỏi chatbot về bệnh học, y học, nghiên cứu, dược học, ....
- "answer": Câu trả lời chuyên sâu, chi tiết, có cơ sở y khoa vững chắc, không chung chung, dựa trên các thông số thực tế trong đoạn văn và kiến thức y khoa chính thống.
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
      - "answer" khi trình bày bảng thì các cột, hàng phải đặt tên phù hợp với y khoa, bệnh học, nghiên cứu, dược học, y học,... Đồng thời trong câu trả lời có bảng không được nói là bảng markdown mà nói bảng, tổng hợp, ...
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


Đã đọc file Excel với 310294 dòng văn bản.


  0%|          | 1/307137 [01:22<7045:25:27, 82.58s/it]


Lỗi xử lý response: Unterminated string starting at: line 25 column 15 (char 10710)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh truyền nhiễm thần kinh, hỗ trợ nhận diện và tư vấn về các di chứng có thể gặp.",
    "question": "Những di chứng thần kinh và thể chất nà...
Retry dòng 3158 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 491 (char 5988)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học truyền nhiễm, cung cấp thông tin chẩn đoán, điều trị và tiên lượng dựa trên tiêu chuẩn y khoa và ICD-10 (ví dụ: Viêm màng não do List...
Retry dòng 3158 - Lần 2

Lỗi xử lý response: Invalid \escape: line 25 column 1975 (char 11031)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh truyền nhiễm, cung cấp thông tin chẩn đoán, nguyên nhân và điều trị theo chuẩn ICD-10.",
    "question": "Trình bày các yếu tố nguy cơ, d...
Retry dòng 3158 - Lần 3


  0%|          | 2/307137 [04:53<13469:33:56, 157.88s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 449 (char 4552)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Co thắt tâm vị là bệnh gì? Đặc điểm lâm sàng và d...
Retry dòng 3159 - Lần 1

Lỗi xử lý response: Invalid control character at: line 10 column 426 (char 2445)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tiêu hóa, cung cấp thông tin chi tiết và đáng tin cậy về các rối loạn vận động thực quản theo chuẩn ICD-10.",
    "question": "Xin ch...
Retry dòng 3159 - Lần 2


  0%|          | 3/307137 [08:30<15790:04:22, 185.08s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 697 (char 2598)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về các bệnh lý thực quản, đặc biệt là rối loạn nhu động thực quản, hỗ trợ chẩn đoán và phân loại theo tiêu chuẩn hiện hành.",
    "question":...
Retry dòng 3160 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 920 (char 7732)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học thực quản, cung cấp thông tin và phân tích lâm sàng theo chuẩn y khoa.",
    "question": "Dựa vào kết quả nghiên cứu, hãy mô tả đặc đ...
Retry dòng 3160 - Lần 2


  0%|          | 5/307137 [14:44<14665:53:34, 171.90s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 559 (char 6959)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.",
    "question": "Bác sĩ có thể giải t...
Retry dòng 3162 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 1405 (char 7124)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh tiêu hóa, cung cấp thông tin chi tiết về chẩn đoán và điều trị dựa trên ICD-10.",
    "question": "Xin hãy cung cấp thông tin chi tiết về...
Retry dòng 3162 - Lần 2

Lỗi xử lý response: Invalid control character at: line 15 column 983 (char 4505)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các khuyến cáo y khoa cập nhật.",
    "question": "Xin vui lòng giải thích ...
Retry dòng 3162 - Lần 3


  0%|          | 6/307137 [18:03<15454:53:58, 181.15s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 739 (char 4549)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh truyền nhiễm, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Những yếu tố nguy cơ nào có thể dẫn đến tiên lượn...
Retry dòng 3163 - Lần 1


  0%|          | 9/307137 [23:20<10771:27:19, 126.26s/it]


Lỗi xử lý response: Invalid control character at: line 5 column 814 (char 1090)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin cho biết Co thắt tâm vị (Achalasia - CTTV) là gì và là...
Retry dòng 3166 - Lần 1

Lỗi xử lý response: Invalid control character at: line 5 column 848 (char 1221)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tiêu hóa, cung cấp thông tin lâm sàng và chẩn đoán theo tiêu chuẩn y khoa và ICD-10 (K22.0 cho Co thắt tâm vị).",
    "question": "Mô...
Retry dòng 3166 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 922 (char 8540)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học thực quản, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin hãy giải thích chi tiết về các thể co thắt t...
Retry dòng 3166 - Lần 3


  0%|          | 10/307137 [27:00<13254:11:40, 155.36s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 611 (char 5644)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin chi tiết về các phương pháp điều trị và tiên lượng bệnh lý dựa trên phân loại lâm sàng theo ICD-10.",
    "questi...
Retry dòng 3167 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 459 (char 6020)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các nghiên cứu khoa học hiện hành.",
    "question": "Xin hãy trình bày về ...
Retry dòng 3167 - Lần 2


  0%|          | 11/307137 [33:46<19799:38:59, 232.08s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 555 (char 7212)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và phẫu thuật, cung cấp thông tin và tư vấn lâm sàng dựa trên các tiêu chuẩn y tế hiện hành và khuyến cáo của Bộ Y tế.",
    "questio...
Retry dòng 3168 - Lần 1


  0%|          | 13/307137 [37:54<14795:31:08, 173.43s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 552 (char 3786)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y học nội khoa, cung cấp thông tin và phân tích dữ liệu nghiên cứu lâm sàng dựa trên ICD-10.",
    "question": "Xin vui lòng tóm tắt các đặc đ...
Retry dòng 3170 - Lần 1


  0%|          | 14/307137 [39:50<13318:47:57, 156.12s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 213 (char 2467)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiết niệu và sỏi thận, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu và chuẩn ICD-10 của Bộ Y tế Việt Nam.",
    "question": "...
Retry dòng 3171 - Lần 1


  0%|          | 17/307137 [45:32<10468:37:59, 122.71s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 928 (char 8083)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý tiết niệu, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Sỏi tiết niệu là gì và các biến chứng thường gặp ...
Retry dòng 3174 - Lần 1


  0%|          | 23/307137 [53:28<6769:37:28, 79.35s/it]  


Lỗi xử lý response: Invalid \escape: line 20 column 1126 (char 5250)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tổng quát, đặc biệt trong lĩnh vực thoát vị bẹn, cung cấp thông tin lâm sàng và số liệu nghiên cứu đáng tin cậy.",
    "question": ...
Retry dòng 3180 - Lần 1


  0%|          | 24/307137 [55:17<7510:59:45, 88.04s/it]

Lỗi, thử lại sau 5s... (Lần 1)


  0%|          | 27/307137 [1:09:18<14693:10:08, 172.24s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 291 (char 5508)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật thoát vị bẹn, cung cấp thông tin và kết quả nghiên cứu y học dựa trên tiêu chuẩn ICD-10.",
    "question": "Nghiên cứu được trình b...
Retry dòng 3184 - Lần 1


  0%|          | 28/307137 [1:11:40<13922:52:30, 163.21s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 511 (char 5421)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và phẫu thuật, cung cấp thông tin lâm sàng và kết quả nghiên cứu dựa trên các tiêu chuẩn y tế.",
    "question": "Dựa trên dữ liệu ng...
Retry dòng 3185 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 587 (char 4705)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 của Bộ Y tế Việt Nam.",
    "question": "Một bệnh nhân vừa phẫu thuật thoát vị...
Retry dòng 3185 - Lần 2


  0%|          | 33/307137 [1:20:32<8820:17:49, 103.40s/it] 


Lỗi xử lý response: Invalid control character at: line 10 column 480 (char 2019)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về bệnh lao, cung cấp thông tin và dữ liệu nghiên cứu y tế chính xác, khoa học và đáng tin cậy theo chuẩn Bộ Y tế Việt Nam.",
    "question": "T...
Retry dòng 3190 - Lần 1

Lỗi xử lý response: Invalid \escape: line 20 column 1374 (char 6481)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên nghiên cứu và chuẩn ICD-10.",
    "question": "Nghiên cứu này tập trung vào những loại ...
Retry dòng 3190 - Lần 2

Lỗi xử lý response: Expecting ',' delimiter: line 25 column 3165 (char 8856)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về bệnh học và dịch tễ học, cung cấp thông tin lâm sàng và thống kê dựa trên chuẩn ICD-10.",
    "question": "Dựa trên nghiên cứu này, anh/chị c...
Retry dòng 3190 - Lần 3


  0%|          | 34/307137 [1:23:27<10651:31:08, 124.86s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 644 (char 4018)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu chi phí y tế và quản lý bệnh lý, cung cấp thông tin dựa trên ICD-10 và dữ liệu khoa học.",
    "question": "Dựa trên nghiên cứu, an...
Retry dòng 3191 - Lần 1


  0%|          | 35/307137 [1:25:45<10966:23:02, 128.55s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1090 (char 7616)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và dịch tễ học, cung cấp thông tin chính xác và khoa học về bệnh lao phổi dựa trên ICD-10 và các nghiên cứu y tế.",
    "question": "...
Retry dòng 3192 - Lần 1


  0%|          | 38/307137 [1:32:30<12078:29:03, 141.59s/it]


Lỗi xử lý response: Invalid \escape: line 20 column 5579 (char 10911)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học, cung cấp thông tin tổng quan về các yếu tố ảnh hưởng đến chi phí điều trị lao phổi nội trú.",
    "question": "Theo nghiên cứu được ...
Retry dòng 3195 - Lần 1


  0%|          | 44/307137 [1:40:34<6983:27:04, 81.87s/it]  


Lỗi xử lý response: Invalid control character at: line 5 column 1873 (char 2265)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán lâm sàng theo chuẩn ICD-10.",
    "question": "Một bệnh nhân 35 tuổi bị đau bụng cấp vùng hố chậu phải. Kết quả chụp cắt...
Retry dòng 3201 - Lần 1


  0%|          | 45/307137 [1:43:17<9062:42:14, 106.24s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 595 (char 5216)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý thần kinh nhi, cung cấp thông tin và tư vấn lâm sàng dựa trên các tài liệu y học và chuẩn ICD-10.",
    "question": "Tổng quan về xuất...
Retry dòng 3202 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 397 (char 6340)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học truyền nhiễm và xét nghiệm phân tử, cung cấp thông tin chẩn đoán, điều trị và phòng ngừa dựa trên ICD-10 và các nghiên cứu khoa học c...
Retry dòng 3202 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 481 (char 8763)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý sơ sinh, cung cấp thông tin và chẩn đoán phân biệt dựa trên ICD-10.",
    "question": "Bác sĩ có thể giải thích về xuất huyết nội sọ ở...
Retry dòng 3202 - Lần 3


  0%|          | 47/307137 [1:50:10<12565:59:25, 147.31s/it]


Lỗi xử lý response: Invalid control character at: line 5 column 1152 (char 1525)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về sinh học phân tử và chẩn đoán virus, cung cấp phân tích chuyên sâu về kỹ thuật RT-qPCR theo tiêu chuẩn ISO 15189:2012.",
    "question": "Tôi ...
Retry dòng 3204 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 528 (char 6213)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu và tối ưu hóa kỹ thuật xét nghiệm sinh học phân tử, cung cấp thông tin chi tiết và phân tích kết quả liên quan đến phản ứng RT-qPCR...
Retry dòng 3204 - Lần 2


  0%|          | 48/307137 [1:53:07<13325:05:38, 156.21s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 490 (char 5483)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về các phương pháp xét nghiệm chẩn đoán phân tử và nghiên cứu dược học.",
    "question": "Xin vui lòng giải thích chi tiết về nghiên cứu tiết k...
Retry dòng 3205 - Lần 1


  0%|          | 51/307137 [1:58:15<9813:13:34, 115.04s/it] 


Lỗi xử lý response: Invalid \escape: line 20 column 1017 (char 5415)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và tái tạo xương.",
    "question": "Mô tả chi tiết quy trình phẫu thuật tái tạo xương hàm dưới trong nghiên cứu này, bao g...
Retry dòng 3208 - Lần 1


  0%|          | 56/307137 [2:08:39<10955:32:59, 128.44s/it]


Lỗi xử lý response: Invalid \escape: line 15 column 2284 (char 7000)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và tái tạo xương hàm, cung cấp thông tin lâm sàng và nghiên cứu liên quan đến xương hàm dưới.",
    "question": "Dựa trên c...
Retry dòng 3213 - Lần 1


  0%|          | 59/307137 [2:14:06<9645:22:45, 113.08s/it] 


Lỗi xử lý response: Invalid \escape: line 20 column 864 (char 6860)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và dịch tễ học thần kinh, cung cấp thông tin và tư vấn lâm sàng dựa trên các bằng chứng khoa học mới nhất.",
    "question": "Dựa vào...
Retry dòng 3216 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 475 (char 7279)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y học phục hồi, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các bằng chứng nghiên cứu.",
    "question": "Xin chào, tôi muốn tìm ...
Retry dòng 3216 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 464 (char 7651)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về đột quỵ não, cung cấp thông tin dịch tễ học và các di chứng lâm sàng theo chuẩn y khoa.",
    "question": "Xin cho biết về tình hình dịch tễ c...
Retry dòng 3216 - Lần 3


  0%|          | 61/307137 [2:20:05<11643:35:34, 136.50s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 717 (char 5833)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phục hồi chức năng thần kinh, cung cấp thông tin và tư vấn lâm sàng dựa trên phân loại bệnh tật quốc tế ICD-10.",
    "question": "Em hãy giải...
Retry dòng 3218 - Lần 1


  0%|          | 63/307137 [2:24:33<11341:41:48, 132.97s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 607 (char 7616)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phục hồi chức năng sau đột quỵ, cung cấp thông tin và phương pháp điều trị dựa trên ICD-10.",
    "question": "Bác sĩ có thể giải thích về các...
Retry dòng 3220 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 709 (char 7903)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phục hồi chức năng thần kinh, hỗ trợ thông tin lâm sàng và hướng dẫn điều trị theo chuẩn y khoa, đặc biệt cho các bệnh nhân đột quỵ.",
    "qu...
Retry dòng 3220 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 564 (char 7642)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phục hồi chức năng thần kinh, cung cấp thông tin và tư vấn lâm sàng dựa trên các bằng chứng khoa học mới nhất và chuẩn ICD-10.",
    "question...
Retry dòng 3220 - Lần 3


  0%|          | 64/307137 [2:30:29<17044:40:20, 199.82s/it]


Lỗi xử lý response: Invalid \escape: line 5 column 1857 (char 2288)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về thần kinh và phục hồi chức năng, cung cấp thông tin y học chính xác về bệnh lý đột quỵ não, các di chứng và tầm quan trọng của phục hồi chức n...
Retry dòng 3221 - Lần 1


  0%|          | 65/307137 [2:32:46<15444:59:04, 181.07s/it]


Lỗi xử lý response: Invalid control character at: line 25 column 181256 (char 189755)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về thần kinh, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin chào, tôi muốn tìm hiểu về đột quỵ não, nguyên nhân t...
Retry dòng 3222 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 1885 (char 5524)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y học lâm sàng và phục hồi chức năng, hỗ trợ tư vấn và cung cấp thông tin dựa trên ICD-10 của Bộ Y tế Việt Nam.",
    "question": "Xin hãy tóm...
Retry dòng 3222 - Lần 2

Lỗi xử lý response: Invalid control character at: line 10 column 556 (char 2946)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học thần kinh và phục hồi chức năng, cung cấp thông tin dịch tễ học và các phương pháp trị liệu theo chuẩn ICD-10.",
    "question": "Xin...
Retry dòng 3222 - Lần 3


  0%|          | 68/307137 [2:39:42<11761:45:29, 137.89s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 953 (char 6251)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về phục hồi chức năng sau đột quỵ, cung cấp thông tin và tư vấn lâm sàng dựa trên phân loại bệnh quốc tế ICD-10.",
    "question": "Phương pháp ...
Retry dòng 3225 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 859 (char 6238)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phục hồi chức năng sau đột quỵ, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Phương pháp gương trị liệu có hiệu q...
Retry dòng 3225 - Lần 2


  0%|          | 69/307137 [2:42:43<12872:45:09, 150.92s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 446 (char 5694)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học, nghiên cứu và dược học, cung cấp thông tin dựa trên ICD-10 và kiến thức y khoa chuyên sâu.",
    "question": "Tôi muốn tìm hiểu về v...
Retry dòng 3226 - Lần 1

Lỗi xử lý response: Expecting ',' delimiter: line 28 column 1 (char 83028)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu sinh học phân tử và ung thư, cung cấp thông tin khoa học và cơ sở dữ liệu liên quan.",
    "question": "Bác sĩ có thể cho biết vai ...
Retry dòng 3226 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 840 (char 7992)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và sinh học phân tử, cung cấp thông tin y khoa chính xác và đáng tin cậy về cơ chế bệnh sinh của ung thư và vai trò của các nhân tố s...
Retry dòng 3226 - Lần 3


  0%|          | 70/307137 [2:46:31<14850:33:04, 174.11s/it]


Lỗi xử lý response: Invalid \escape: line 25 column 1075 (char 9101)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và khớp thái dương hàm, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin chào. Tôi đang nghiên...
Retry dòng 3227 - Lần 1


  0%|          | 72/307137 [2:50:15<11901:29:08, 139.53s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 485 (char 7246)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nha khoa và phẫu thuật hàm mặt, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Mô tả chi tiết quy trình tái tạo xươ...
Retry dòng 3229 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 460 (char 5814)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin vui lòng mô tả chi tiết quy trình chuẩn bị m...
Retry dòng 3229 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 1025 (char 6788)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt, cung cấp thông tin chi tiết về quy trình tái tạo xương hàm dưới.",
    "question": "Hãy mô tả chi tiết quy trình chuẩn bị ...
Retry dòng 3229 - Lần 3


  0%|          | 73/307137 [2:53:36<13460:31:07, 157.81s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 802 (char 4296)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về chẩn đoán rối loạn khớp thái dương hàm (TMJ), hỗ trợ thông tin chi tiết về quy trình thăm khám lâm sàng và đánh giá mức độ đau theo chuẩn y kh...
Retry dòng 3230 - Lần 1


  0%|          | 74/307137 [2:56:54<14507:38:22, 170.09s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 563 (char 6526)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và tái tạo xương hàm, cung cấp thông tin lâm sàng và kết quả nghiên cứu. (ICD-10: K07.6 - Rối loạn khớp thái dương hàm; M26...
Retry dòng 3231 - Lần 1


  0%|          | 75/307137 [2:59:19<13862:30:15, 162.52s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 610 (char 5178)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu lâm sàng hàm mặt, cung cấp thông tin và phân tích kết quả dựa trên ICD-10.",
    "question": "Xin vui lòng giải thích các chỉ số về...
Retry dòng 3232 - Lần 1

Lỗi xử lý response: Invalid \escape: line 5 column 2213 (char 2638)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên sâu về phục hồi chức năng hàm mặt, tư vấn về đánh giá kết quả điều trị các rối loạn khớp thái dương hàm (TMD) theo chuẩn ICD-10.",
    "question...
Retry dòng 3232 - Lần 2

Lỗi xử lý response: Invalid control character at: line 15 column 613 (char 5746)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về phục hồi chức năng hàm mặt và phân tích hiệu quả can thiệp phẫu thuật.",
    "question": "Xin vui lòng phân tích ý nghĩa lâm sàng của việc...
Retry dòng 3232 - Lần 3


  0%|          | 76/307137 [3:02:59<15336:11:04, 179.80s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 616 (char 2612)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và tái tạo, cung cấp thông tin lâm sàng và hậu phẫu theo chuẩn ICD-10.",
    "question": "Bác sĩ có thể cho tôi biết về cá...
Retry dòng 3233 - Lần 1


  0%|          | 78/307137 [3:08:12<13643:15:39, 159.96s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 505 (char 7064)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật hàm mặt và nha khoa phục hình, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin chào chatbot, bạn có t...
Retry dòng 3235 - Lần 1


  0%|          | 79/307137 [3:11:54<15238:18:00, 178.66s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 916 (char 9809)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý thận di truyền và các yếu tố tiên lượng bệnh. Nắm vững phân loại ICD-10.",
    "question": "Vui lòng cung cấp thông tin chi tiết về bệ...
Retry dòng 3236 - Lần 1


  0%|          | 80/307137 [3:15:15<15812:03:49, 185.38s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 706 (char 6576)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu, cung cấp thông tin và phân tích dữ liệu nghiên cứu khoa học, tuân thủ các nguyên tắc y đức và chuẩn mực chuyên môn.",
    "questio...
Retry dòng 3237 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 694 (char 6567)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về dịch tễ học và đánh giá kiến thức cộng đồng, cung cấp thông tin tổng quan và phân tích kết quả nghiên cứu y học.",
    "question": "Xin vui lò...
Retry dòng 3237 - Lần 2


  0%|          | 82/307137 [3:22:32<16164:00:36, 189.51s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1165 (char 5520)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về kiến thức tiêm chủng vaccine COVID-19, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu khoa học.",
    "question": "Dựa trên ngh...
Retry dòng 3239 - Lần 1


  0%|          | 84/307137 [3:25:38<11710:57:51, 137.30s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 20 column 3244 (char 8112)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý thận, cung cấp thông tin dựa trên các nghiên cứu khoa học và chuẩn ICD-10.",
    "question": "Những yếu tố nào được xác định là có khả...
Retry dòng 3241 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 501 (char 7981)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về bệnh lý thận, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Bệnh thận đa nang trội nhiễm sắc thể thường (ADPKD) c...
Retry dòng 3241 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 766 (char 7825)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học thận, cung cấp thông tin chi tiết về các bệnh lý thận di truyền theo chuẩn ICD-10 và các yếu tố ảnh hưởng đến tiến triển bệnh.",
    ...
Retry dòng 3241 - Lần 3


  0%|          | 85/307137 [3:29:25<14016:10:45, 164.33s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1961 (char 7779)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phân tích kết quả nghiên cứu y học, cung cấp thông tin tóm tắt và đánh giá tổng quan.",
    "question": "Xin hãy tóm tắt kết luận chính và các...
Retry dòng 3242 - Lần 1


  0%|          | 86/307137 [3:31:38<13212:17:58, 154.91s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 465 (char 6543)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phòng bệnh truyền nhiễm, cung cấp thông tin và tư vấn lâm sàng về các loại vaccine và phản ứng sau tiêm chủng theo hướng dẫn y khoa chính thốn...
Retry dòng 3243 - Lần 1


  0%|          | 88/307137 [3:35:02<10525:09:41, 123.40s/it]


Lỗi xử lý response: Invalid \escape: line 20 column 1467 (char 7972)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin về bệnh lý và điều trị loét dạ dày tá tràng dựa trên nghiên cứu và chuẩn ICD-10.",
    "question": "Anh/chị có th...
Retry dòng 3245 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 1290 (char 7509)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin về bệnh lý và phương pháp điều trị loét dạ dày tá tràng dựa trên các nghiên cứu lâm sàng.",
    "question": "Tôi ...
Retry dòng 3245 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 446 (char 5502)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tiêu hóa, cung cấp thông tin về các yếu tố dịch tễ và điều trị loét dạ dày tá tràng.",
    "question": "Tôi là sinh viên y khoa. Bạn ...
Retry dòng 3245 - Lần 3


  0%|          | 89/307137 [3:38:21<12445:21:59, 145.92s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 460 (char 5077)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về da liễu, cung cấp thông tin về hội chứng da nhạy cảm và các biểu hiện lâm sàng.",
    "question": "Theo nghiên cứu mới nhất, những triệu chứng...
Retry dòng 3246 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 457 (char 5475)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về da liễu, hỗ trợ phân tích triệu chứng lâm sàng và các chỉ số sinh lý da ở bệnh nhân.",
    "question": "Bác sĩ có thể giải thích chi tiết về h...
Retry dòng 3246 - Lần 2


  0%|          | 93/307137 [3:46:34<10075:27:45, 118.13s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 476 (char 3727)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên sâu về da liễu, cung cấp thông tin về các triệu chứng lâm sàng của da nhạy cảm dựa trên các nghiên cứu khoa học và chuẩn ICD-10.",
    "question...
Retry dòng 3250 - Lần 1


  0%|          | 97/307137 [3:53:21<8270:49:23, 96.97s/it]  


Lỗi xử lý response: Invalid control character at: line 20 column 461 (char 7194)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về da liễu, cung cấp thông tin tổng quan về các tình trạng da và cơ sở khoa học.",
    "question": "Xin hãy trình bày một tổng quan chi tiết về t...
Retry dòng 3254 - Lần 1


  0%|          | 100/307137 [3:59:34<9460:59:27, 110.93s/it]


Lỗi xử lý response: Invalid control character at: line 5 column 1027 (char 1282)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý tiêu hóa, cung cấp thông tin chi tiết và cơ sở về túi thừa Meckel.",
    "question": "Xin hãy giải thích túi thừa Meckel là gì, các đặ...
Retry dòng 3257 - Lần 1


  0%|          | 101/307137 [4:04:38<14388:52:27, 168.71s/it]


Lỗi xử lý response: Invalid control character at: line 5 column 505 (char 815)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin chi tiết về bệnh lý, chẩn đoán và hướng xử trí theo chuẩn y tế hiện hành.",
    "question": "Xin cho b...
Retry dòng 3258 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 366 (char 6249)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin về các bệnh lý đường ruột và các biến chứng ngoại khoa liên quan đến phân loại ICD-10.",
    "question": "Túi thừ...
Retry dòng 3258 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 547 (char 6244)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán phẫu thuật tiêu hóa, cung cấp thông tin lâm sàng và cận lâm sàng theo ICD-10.",
    "question": "Tôi muốn tìm hiểu về ch...
Retry dòng 3258 - Lần 3


  0%|          | 102/307137 [4:07:57<15176:39:29, 177.95s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 747 (char 2485)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Hãy mô tả về túi thừa Meckel, các đặc điểm lâm sà...
Retry dòng 3259 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 1342 (char 7298)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán, hỗ trợ thông tin về các trường hợp lâm sàng hiếm gặp theo ICD-10.",
    "question": "Mô tả chi tiết về trường hợp thủng...
Retry dòng 3259 - Lần 2

Lỗi xử lý response: Invalid control character at: line 25 column 455 (char 7075)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu sinh học phân tử và tối ưu hóa quy trình xét nghiệm chẩn đoán, cung cấp thông tin chi tiết và đáng tin cậy.",
    "question": "Xin ...
Retry dòng 3259 - Lần 3


  0%|          | 106/307137 [4:16:57<12456:53:16, 146.06s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 147012 (char 151812)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về da liễu, cung cấp thông tin về đặc điểm lâm sàng của các tình trạng da theo chuẩn y khoa.",
    "question": "Theo nghiên cứu, những triệu chứ...
Retry dòng 3263 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid \escape: line 25 column 2189 (char 9764)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý da liễu, cung cấp thông tin và tư vấn lâm sàng dựa trên nghiên cứu và phân loại ICD-10.",
    "question": "Xin hãy mô tả hội chứng da ...
Retry dòng 3263 - Lần 2


  0%|          | 108/307137 [4:24:35<15176:26:37, 177.95s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 20 column 4081 (char 8153)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu da liễu, cung cấp thông tin về các nghiên cứu lâm sàng và đặc điểm bệnh học da.",
    "question": "Xin hãy tóm tắt mục tiêu chính c...
Retry dòng 3265 - Lần 1


  0%|          | 112/307137 [4:31:35<9679:20:16, 113.49s/it] 


Lỗi xử lý response: Invalid control character at: line 10 column 678 (char 2231)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về da liễu, cung cấp thông tin chi tiết về các đặc điểm lâm sàng của da nhạy cảm.",
    "question": "Xin chào, tôi muốn tìm hiểu về các triệu chứ...
Retry dòng 3269 - Lần 1

Lỗi xử lý response: Invalid \escape: line 20 column 879 (char 8062)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học da liễu, cung cấp thông tin về các đặc điểm lâm sàng và sinh lý của da nhạy cảm.",
    "question": "Bác sĩ có thể mô tả các đặc điểm ...
Retry dòng 3269 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 1162 (char 6342)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về y học lâm sàng, cung cấp thông tin và tư vấn chuyên sâu về bệnh học da liễu theo chuẩn ICD-10.",
    "question": "Xin hãy phân tích chi tiết ...
Retry dòng 3269 - Lần 3


  0%|          | 113/307137 [4:37:35<15967:46:28, 187.23s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 25 column 3737 (char 12085)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các tài liệu y khoa chính thống.",
    "question": "Xin vui lòng mô tả đặc đi...
Retry dòng 3270 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 309 (char 5884)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về da liễu, cung cấp thông tin và tư vấn lâm sàng về các đặc điểm của da nhạy cảm theo chuẩn y khoa.",
    "question": "Dựa trên nghiên cứu, xin ...
Retry dòng 3270 - Lần 2


  0%|          | 114/307137 [4:41:56<17872:21:41, 209.56s/it]

Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid control character at: line 10 column 473 (char 2389)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về da liễu, cung cấp thông tin và tài liệu nghiên cứu cập nhật.",
    "question": "Xin chào, tôi đang tìm hiểu về làn da nhạy cảm. Bạn có thể...
Retry dòng 3271 - Lần 1


  0%|          | 115/307137 [4:57:14<35996:56:27, 422.08s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 142355 (char 146945)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về các chỉ dấu sinh học và bệnh lý gan mật, cung cấp thông tin y học dựa trên các nghiên cứu khoa học chính xác.",
    "question": "Xin hãy phân ...
Retry dòng 3272 - Lần 1


  0%|          | 116/307137 [5:07:13<40517:50:56, 475.10s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 2688 (char 8447)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về bệnh học và tiên lượng trên bệnh nhân hồi sức tích cực, cung cấp thông tin và tư vấn lâm sàng đáng tin cậy.",
    "question": "Xin vui lòng g...
Retry dòng 3273 - Lần 1


  0%|          | 118/307137 [5:14:22<29598:15:18, 347.06s/it]


Lỗi xử lý response: Invalid \escape: line 20 column 1748 (char 8222)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu lâm sàng và hồi sức cấp cứu, cung cấp thông tin về đặc điểm bệnh nhân và kết cục lâm sàng dựa trên các dữ liệu nghiên cứu.",
    "q...
Retry dòng 3275 - Lần 1

Lỗi xử lý response: Invalid \escape: line 25 column 1023 (char 8427)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu lâm sàng và bệnh học, cung cấp thông tin dựa trên dữ liệu nghiên cứu và chuẩn y khoa ICD-10.",
    "question": "Dựa trên dữ liệu ng...
Retry dòng 3275 - Lần 2
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please

  0%|          | 119/307137 [5:20:48<30581:32:30, 358.59s/it]

Lỗi, thử lại sau 5s... (Lần 1)


  0%|          | 120/307137 [5:22:36<24168:16:07, 283.39s/it]

Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid control character at: line 20 column 597 (char 5826)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về các yếu tố nguy cơ và tiên lượng trong bệnh lý tăng bilirubin.",
    "question": "Dựa trên nghiên cứu này, anh/chị có thể cho biết những yếu t...
Retry dòng 3277 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 58.209957282s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quot

  0%|          | 121/307137 [5:24:20<19588:22:39, 229.69s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 20.407139536s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 20
}
]
Retry dòng 3278 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 122/307137 [5:25:17<15160:43:05, 177.77s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 23.724622545s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 23
}
]
Retry dòng 3279 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 123/307137 [5:26:13<12063:25:16, 141.45s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 27.02634912s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 27
}
]
Retry dòng 3280 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You excee

  0%|          | 124/307137 [5:27:10<9895:55:25, 116.04s/it] 

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 30.24889224s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 30
}
]
Retry dòng 3281 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You excee

  0%|          | 125/307137 [5:28:07<8378:42:22, 98.25s/it] 

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 33.622006256s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 33
}
]
Retry dòng 3282 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 126/307137 [5:29:03<7311:27:29, 85.73s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 37.080308836s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 37
}
]
Retry dòng 3283 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 127/307137 [5:30:00<6564:17:15, 76.97s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 40.484849545s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 40
}
]
Retry dòng 3284 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 128/307137 [5:30:57<6044:33:23, 70.88s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 43.849379393s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 43
}
]
Retry dòng 3285 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 129/307137 [5:31:53<5680:02:07, 66.60s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 47.269312792s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 47
}
]
Retry dòng 3286 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 130/307137 [5:32:50<5421:25:31, 63.57s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 50.708645895s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 50
}
]
Retry dòng 3287 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 131/307137 [5:33:46<5243:44:39, 61.49s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 54.101738656s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 54
}
]
Retry dòng 3288 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 132/307137 [5:36:08<7303:50:20, 85.65s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 26.527743739s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 26
}
]
Retry dòng 3289 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 133/307137 [5:37:10<6702:24:15, 78.59s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits.
* Quota exceeded for metric: generativelanguage.googleapis.com/generate_content_free_tier_requests, limit: 250
Please retry in 29.911993694s. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 29
}
]
Retry dòng 3290 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exce

  0%|          | 134/307137 [5:38:07<6142:35:59, 72.03s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)


## expection talk

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyA99lJZAqngGBqXwg__S18VPWq2KRW9Vhc")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Các cuộc hội thoại sai, hoặc kém hay không có nghĩa như: "asdasd","ê","sđs",... thì chỉ rõ ra là câu hỏi người dùng chưa rõ ràng.
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
**Yêu cầu đặc biệt**:
- Chỉ rõ chỗ hỏi chưa rõ ràng và hướng dẫn cách hỏi rõ ràng hơn.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa hãy kiểm tra xem câu hỏi có nghĩa không và hãy chỉ tôi cách hỏi."
- "question": Câu hỏi sai, khó hiểu, lung tung, không có nghĩa hay sai.
- "answer": Chỉ ra lỗi hoặc hướng dẫn người dùng cách hỏi rõ ràng hơn, ví dụ: "Câu hỏi của bạn chưa rõ ràng, vui lòng cung cấp thêm thông tin để tôi có thể giúp bạn tốt hơn."
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


## Tư vấn khóa học, tài liệu

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyA99lJZAqngGBqXwg__S18VPWq2KRW9Vhc")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer",
    "document/title", "document/tool", "document/description",
    "cme/title", "cme/tool", "cme/description"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 3 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
- Có giá trị hướng dẫn, giải thích rõ ràng, có thể dùng để **tư vấn lâm sàng cho người dùng cuối**.
**Yêu cầu đặc biệt**:
- `answer` phải viết theo ngôn ngữ chuyên môn, **khoa học, cụ thể, không chung chung**, đủ để một bác sĩ hoặc chatbot sử dụng để diễn giải cho người bệnh.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "question": Một câu hỏi y khoa phù hợp với **nội dung bài viết và câu trả lời**, tập trung vào tư vấn, chỉ dạy cho các bác sỹ trẻ.
- "answer": Câu trả lời chi tiết, có thể bao gồm hướng dẫn, giải thích hoặc thông tin bổ sung liên quan đến câu hỏi cho các bác sỹ trẻ về cách thực hành y khoa, đến diễn giải lý thuyết, hoặc các khuyến nghị lâm sàng.
- "document/title": Tiêu đề tài liệu y khoa liên quan đến nội dung đoạn văn.
- "document/tool": Luôn là "call_references"
- "document/description": Mô tả ngắn gọn tài liệu tham khảo cho người dùng học tập, nêu rõ mục đích hoặc giá trị ứng dụng.
- "cme/title": Tiêu đề khóa học đào tạo y khoa liên tục (CME) liên quan đến chủ đề trong đoạn văn.
- "cme/tool": Luôn là "call_cme"
- "cme/description": Mô tả ngắn về khóa học CME , giúp chatbot hiểu và phản hồi như một trợ lý học thuật chuyên ngành cho người dùng hoc tập.

Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", ""),
                "document/title": data.get("document/title", ""),
                "document/tool": data.get("document/tool", ""),
                "document/description": data.get("document/description", ""),
                "cme/title": data.get("cme/title", ""),
                "cme/tool": data.get("cme/tool", ""),
                "cme/description": data.get("cme/description", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")
