## Chuẩn đoán

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyDkIcBxpkno0XHjOgZ-pwpJn9kgnoGC83E")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_diagnosis.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","icd_10", "icd_10/title", "question", "symptom", "diagnosis",
    "document/title",  "document/description",
    "cme/title", "cme/description"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.
Dựa vào đoạn văn sau:
"{dental_text}"
Hãy sinh ra một **DANH SÁCH GỒM 3 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.
**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
- Có giá trị hướng dẫn, giải thích rõ ràng, có thể dùng để **tư vấn lâm sàng cho người dùng cuối**.
**Yêu cầu đặc biệt**:
- Nếu đoạn văn có đề cập đến các **chỉ số lâm sàng** như độ sâu túi lợi, chỉ số mảng bám, số răng tổn thương, mức độ đau... thì **phải đưa các con số và dữ liệu đó vào `symptom` và `diagnosis`** để tăng độ chính xác cho chatbot.
- `symptom` và `diagnosis` phải viết theo ngôn ngữ chuyên môn, **khoa học, cụ thể, không chung chung**, đủ để một bác sĩ hoặc chatbot sử dụng để diễn giải cho người bệnh.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "icd_10": Mã bệnh ICD-10 của Bộ Y tế Việt Nam phù hợp nhất với đoạn văn (ví dụ: "A01.1", "P27.0") nhưng nếu không xác định được thì gán mã bệnh gần đúng nhất(Không được để trống).
- "icd_10/title": Tên mã bệnh ICD-10 tương ứng với mã ở trên đúng chuẩn Bộ y tế (ví dụ: "Bệnh lao phổi", "Viêm phổi do virus").
- "question": Một câu hỏi y khoa phù hợp với **nội dung bài viết và câu trả lời**, tập trung vào chẩn đoán hoặc điều trị y khoa (giống như người dùng hay bác sỹ trẻ hỏi chatbot).
- "symptom": Các triệu chứng hoặc dấu hiệu lâm sàng được nêu trong bài, hoặc suy luận có cơ sở khoa học. **Bao gồm cả các chỉ số định lượng nếu có** như: túi nha chu 6mm, PI=2.2, v.v.
- "diagnosis": Chẩn đoán nha khoa chi tiết, có thể phân loại theo mức độ bệnh hoặc giai đoạn nếu phù hợp. **Phải có cơ sở y khoa vững chắc** và dùng thông số hỗ trợ chẩn đoán nếu có.
- "document/title": Tiêu đề tài liệu y khoa liên quan đến nội dung đoạn văn.
- "document/description": Mô tả ngắn gọn tài liệu tham khảo, nêu rõ mục đích hoặc giá trị ứng dụng.
- "cme/title": Tiêu đề khóa học đào tạo y khoa liên tục (CME) liên quan đến chủ đề trong đoạn văn.
- "cme/description": Mô tả ngắn về khóa học CME, giúp chatbot hiểu và phản hồi như một trợ lý học thuật chuyên ngành.
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "icd_10": data.get("icd_10", ""),
                "icd_10/title": data.get("icd_10/title", ""),
                "question": data.get("question", ""),
                "symptom": data.get("symptom", ""),
                "diagnosis": data.get("diagnosis", ""),
                "document/title": data.get("document/title", ""),
                "document/description": data.get("document/description", ""),
                "cme/title": data.get("cme/title", ""),
                "cme/description": data.get("cme/description", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


Đã đọc file Excel với 310294 dòng văn bản.


  0%|          | 1/310294 [00:37<3194:02:55, 37.06s/it]

## Small talk

In [1]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyDACh169FpAdWuCzw6r181Wx7tlEdXlcdU")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_smalltalk.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Dữ liệu cho các tác vụ chung như chào hỏi, giải thích, tư vấn,...
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
**Yêu cầu đặc biệt**:
- Dữ liệu cho các tác vụ chung của chatbot như chào hỏi, giải thích, tư vấn... để chatbot có thể phản hồi người dùng một cách tự nhiên và thân thiện.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa hãy tư vấn và chào hỏi thân thiện."
- "question": Câu hỏi y khoa mà các bác sỹ sẽ hỏi đơn giản hay người dùng hỏi chatbot.
- "answer": Câu trả lời thân thiện cho người dùng (ví dụ: Người dùng xin chào thì chat bot sẽ chào lại và hỏi bạn cần giúp gì).
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


Đã đọc file Excel với 310294 dòng văn bản.


  0%|          | 3/310294 [00:58<1678:11:17, 19.47s/it]


KeyboardInterrupt: 

## Medicaltalk

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyBHJ3cOKxhsO-OyN8nzrmWAuw9QODnvTJw")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset_medicaltalk.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Dữ liệu cho các tác vụ về y tế, bệnh học, nghiên cứu, dược học, ....
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình y khoa).
**Yêu cầu đặc biệt**:
- Dữ liệu cho các tác vụ về y tế, bệnh học, nghiên cứu, dược học, y học, y khoa....
- Trong 5 đối tượng JSON, có 3 đối tường trình bày trả lời như bình thường bằng text, 2 đối tượng còn lại sẽ trả ra câu trả lời dưới dạng bảng (table) chuẩn dạng markdown với các cột và hàng rõ ràng, có tiêu đề bảng, tiêu đề cột, tiêu đề hàng, và các ô dữ liệu bên trong.
- Trong 2 đối tượng trả lời dưới dạng bảng thì một dạng bảng trả ra nội dung và một trả ra nội dung cùng số liệu, thông số, thông tin. Câu trả lời phải trình bày chi tiết rồi mời đưa ra bảng dạng markdown cho dẫn chứng.
- Với 3 câu trình bày dạng text như thường thì trình bày đa dạng nhiều kiểu như list có bullet points, số thứ tự, một đoạn trả lời chi tiết, một bản trình bày tóm tắt, v.v.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot về y khoa, bệnh học, nghiên cứu, dược học, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "question": Câu hỏi của bác sỹ hoặc sinh viên y khoa hỏi chatbot về bệnh học, y học, nghiên cứu, dược học, ....
- "answer": Câu trả lời chuyên sâu, chi tiết, có cơ sở y khoa vững chắc, không chung chung, dựa trên các thông số thực tế trong đoạn văn và kiến thức y khoa chính thống.
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
      - "answer" khi trình bày bảng thì các cột, hàng phải đặt tên phù hợp với y khoa, bệnh học, nghiên cứu, dược học, y học,... Đồng thời trong câu trả lời có bảng không được nói là bảng markdown mà nói bảng, tổng hợp, ...
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


Đã đọc file Excel với 310294 dòng văn bản.


  0%|          | 0/308904 [00:00<?, ?it/s]


Lỗi xử lý response: Invalid control character at: line 20 column 839 (char 7491)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu, dược học và các khía cạnh lâm sàng, cung cấp thông tin và giải thích chuyên sâu dựa trên các tiêu chuẩn khoa học và dữ liệu thực t...
Retry dòng 1390 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 678 (char 9706)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phương pháp nghiên cứu, hỗ trợ giải đáp các thắc mắc về thiết kế nghiên cứu và thu thập dữ liệu trong y học.",
    "question": "Xin vui lòng m...
Retry dòng 1390 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 59892 (char 70907)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về nghiên cứu, cung cấp thông tin về phương pháp thu thập dữ liệu trong các nghiên cứu sức khỏe trẻ em.",
    "question": "Trong nghiên cứu về g...
Retry dòng 1390 - Lần 3


  0%|          | 1/308904 [06:16<32328:45:47, 376.76s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 449 (char 5315)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu nhi khoa và dinh dưỡng, cung cấp thông tin và phân tích dữ liệu lâm sàng.",
    "question": "Xin vui lòng tóm tắt các đặc điểm dân ...
Retry dòng 1391 - Lần 1


  0%|          | 4/308904 [09:56<9150:14:58, 106.64s/it] 


Lỗi xử lý response: Expecting ',' delimiter: line 20 column 3250 (char 8622)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về giấc ngủ trẻ em, các yếu tố ảnh hưởng và phương pháp nghiên cứu, cung cấp thông tin dựa trên y học thực chứng và chuẩn ICD-10.",
    "question...
Retry dòng 1394 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 805 (char 6664)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về giấc ngủ trẻ em, cung cấp thông tin và phân tích nghiên cứu dựa trên chuẩn y khoa Việt Nam.",
    "question": "Theo nghiên cứu này, việc sử d...
Retry dòng 1394 - Lần 2


  0%|          | 7/308904 [15:02<8308:02:52, 96.83s/it]  


Lỗi xử lý response: Expecting ',' delimiter: line 26 column 1 (char 11183)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nhi khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các khuyến nghị y tế.",
    "question": "Tổ chức Y tế Thế giới (WHO) có khu...
Retry dòng 1397 - Lần 1


  0%|          | 9/308904 [18:59<9394:34:19, 109.49s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 282 (char 5408)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về nghiên cứu nhi khoa, cung cấp thông tin về đặc điểm đối tượng nghiên cứu và tình trạng sức khỏe tổng quát của trẻ em.",
    "question": "Xin ...
Retry dòng 1399 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 420 (char 5717)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu nhi khoa, cung cấp thông tin về đặc điểm dân số và tình trạng dinh dưỡng của nhóm đối tượng nghiên cứu.",
    "question": "Xin hãy ...
Retry dòng 1399 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 473 (char 5822)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu nhi khoa và sức khỏe trẻ em, cung cấp thông tin phân tích dữ liệu lâm sàng dựa trên các tiêu chuẩn y tế quốc tế và Bộ Y tế Việt Nam...
Retry dòng 1399 - Lần 3


  0%|          | 11/308904 [21:54<8091:07:09, 94.30s/it] 


Lỗi xử lý response: Invalid control character at: line 20 column 392 (char 7138)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nhi khoa, cung cấp thông tin và tư vấn về các đặc điểm giấc ngủ ở trẻ em Việt Nam.",
    "question": "Dựa trên nghiên cứu được cung cấp, hãy m...
Retry dòng 1401 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 686 (char 7153)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nghiên cứu giấc ngủ trẻ em, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng khoa học.",
    "question": "Có mối liên hệ nào giữa việ...
Retry dòng 1401 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 609 (char 5362)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về rối loạn giấc ngủ ở trẻ em, cung cấp thông tin và phân tích dữ liệu nghiên cứu về giấc ngủ theo tiêu chuẩn y khoa.",
    "question": "Dựa trên...
Retry dòng 1401 - Lần 3


  0%|          | 12/308904 [25:50<11791:53:23, 137.43s/it]

Lỗi, thử lại sau 5s... (Lần 1)


  0%|          | 13/308904 [28:46<12779:41:44, 148.94s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 738 (char 3872)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nhi khoa, cung cấp thông tin và phân tích nghiên cứu về giấc ngủ ở trẻ em dựa trên các công trình khoa học đã được công bố và chuẩn y khoa.",
...
Retry dòng 1403 - Lần 1


  0%|          | 15/308904 [32:56<11896:28:47, 138.65s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 547 (char 7764)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý ung thư niệu khoa, cung cấp thông tin chi tiết về đặc điểm lâm sàng và dịch tễ học của các khối u đường tiết niệu trên theo chuẩn ICD-...
Retry dòng 1405 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 999 (char 5919)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư biểu mô đường niệu trên, cung cấp định nghĩa và dịch tễ học bệnh lý.",
    "question": "Ung thư biểu mô đường niệu trên (UTBMĐNT) là g...
Retry dòng 1405 - Lần 2


  0%|          | 17/308904 [36:32<10029:07:54, 116.89s/it]


Lỗi xử lý response: Invalid \escape: line 25 column 1400 (char 7760)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý ung thư đường niệu trên (UTBMĐNT), cung cấp thông tin về đặc điểm lâm sàng và mức độ xâm lấn dựa trên chẩn đoán hình ảnh và phân loại ...
Retry dòng 1407 - Lần 1

Lỗi xử lý response: Invalid \escape: line 15 column 828 (char 5533)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư đường niệu trên (UTBMĐNT), cung cấp thông tin chi tiết về đặc điểm bệnh học và chẩn đoán theo chuẩn y khoa của Bộ Y tế Việt Nam.",
   ...
Retry dòng 1407 - Lần 2


  0%|          | 20/308904 [40:45<7339:32:56, 85.54s/it]  


Lỗi xử lý response: Invalid control character at: line 25 column 772 (char 8297)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư biểu mô đường niệu trên (UTBMĐNT), cung cấp thông tin và tư vấn lâm sàng dựa trên các bằng chứng nghiên cứu và chuẩn ICD-10.",
    "qu...
Retry dòng 1410 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 680 (char 5004)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư học và chẩn đoán hình ảnh, cung cấp thông tin chi tiết về đặc điểm bệnh học và hình ảnh của ung thư biểu mô đường niệu trên.",
    "qu...
Retry dòng 1410 - Lần 2


  0%|          | 26/308904 [46:29<4282:47:21, 49.92s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 872 (char 6502)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư học và chẩn đoán hình ảnh, cung cấp thông tin lâm sàng và nghiên cứu dựa trên các hướng dẫn y tế của Bộ Y tế Việt Nam.",
    "question...
Retry dòng 1416 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 1552 (char 5764)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học ung thư đường tiết niệu và các yếu tố tiên lượng, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu khoa học.",
    "ques...
Retry dòng 1416 - Lần 2


  0%|          | 28/308904 [48:53<4881:57:47, 56.90s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 911 (char 7152)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học cấp cứu ngoại khoa và chẩn đoán hình ảnh.",
    "question": "Xin chào chatbot. Tôi là sinh viên y khoa, có thể cho tôi biết viêm túi ...
Retry dòng 1418 - Lần 1

Lỗi xử lý response: Expecting ',' delimiter: line 20 column 2655 (char 9130)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về chẩn đoán hình ảnh và bệnh lý tiêu hóa, cung cấp thông tin lâm sàng và nghiên cứu dựa trên ICD-10.",
    "question": "Xin vui lòng tóm tắt cá...
Retry dòng 1418 - Lần 2


  0%|          | 29/308904 [50:59<6658:51:54, 77.61s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 866 (char 8327)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý ngoại khoa tiêu hóa, cung cấp thông tin chi tiết về các biến chứng của viêm túi mật cấp.",
    "question": "Những biến chứng thường gặ...
Retry dòng 1419 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 535 (char 6507)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các tiêu chuẩn y tế hiện hành.",
    "question": "Viêm túi mật cấp là gì, nhữ...
Retry dòng 1419 - Lần 2


  0%|          | 30/308904 [53:04<7888:35:22, 91.94s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 21 column 3 (char 120781)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về phương pháp nghiên cứu và bệnh học đường mật, cung cấp thông tin y khoa chính xác và đáng tin cậy.",
    "question": "Mục tiêu chính và thiết...
Retry dòng 1420 - Lần 1

Lỗi xử lý response: Expecting ',' delimiter: line 20 column 2007 (char 6314)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về tổng quan nghiên cứu và mục tiêu khoa học, hỗ trợ hiểu rõ định hướng của các công trình y tế.",
    "question": "Xin vui lòng cho biết mục đí...
Retry dòng 1420 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 822 (char 9141)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về tiêu chí lựa chọn đối tượng trong nghiên cứu lâm sàng về bệnh lý ngoại khoa.",
    "question": "Trong một nghiên cứu về giá trị cắt lớp vi tí...
Retry dòng 1420 - Lần 3


  0%|          | 31/308904 [56:46<11243:21:21, 131.04s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1955 (char 7407)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý tiêu hóa, nghiên cứu lâm sàng và phương pháp nghiên cứu.",
    "question": "Xin hãy mô tả tổng quan về nghiên cứu viêm túi mật cấp (VT...
Retry dòng 1421 - Lần 1


  0%|          | 35/308904 [1:00:55<6393:28:08, 74.52s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 21 column 3 (char 7882)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về chẩn đoán hình ảnh và bệnh lý tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Viêm túi mật cấp là gì và va...
Retry dòng 1425 - Lần 1


  0%|          | 36/308904 [1:02:11<6416:45:03, 74.79s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1980 (char 8710)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán hình ảnh, cung cấp thông tin lâm sàng và cận lâm sàng dựa trên ICD-10.",
    "question": "Viêm túi mật cấp có biến chứng...
Retry dòng 1426 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 628 (char 7382)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý tiêu hóa và phẫu thuật, hỗ trợ các chuyên gia y tế với thông tin lâm sàng và nghiên cứu cập nhật về viêm túi mật cấp và biến chứng.",
...
Retry dòng 1426 - Lần 2

Lỗi xử lý response: Invalid control character at: line 25 column 765 (char 10136)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 của Bộ Y tế Việt Nam.",
    "question": "Viêm túi mật cấp là gì, những biến chứn...
Retry dòng 1426 - Lần 3


  0%|          | 39/308904 [1:05:54<5605:46:32, 65.34s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1683 (char 9190)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý đường mật, cung cấp thông tin chi tiết về viêm túi mật cấp (VTMC) và các dấu hiệu chẩn đoán bằng hình ảnh theo chuẩn ICD-10.",
    "qu...
Retry dòng 1429 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 761 (char 3738)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán hình ảnh, cung cấp thông tin lâm sàng và tiêu chuẩn dựa trên nghiên cứu và ICD-10.",
    "question": "Xin hãy tóm tắt va...
Retry dòng 1429 - Lần 2


  0%|          | 41/308904 [1:08:49<6281:12:09, 73.21s/it]


Lỗi xử lý response: Expecting ',' delimiter: line 15 column 2146 (char 6214)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và chẩn đoán hình ảnh, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Xin hãy trình bày tổng quan về viêm ...
Retry dòng 1431 - Lần 1

Lỗi xử lý response: Expecting ',' delimiter: line 20 column 2697 (char 10588)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về y học nội khoa và chẩn đoán hình ảnh, cung cấp thông tin và hỗ trợ nghiên cứu lâm sàng dựa trên ICD-10.",
    "question": "Xin hãy trình bày ...
Retry dòng 1431 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 1174 (char 8154)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý đường mật, cung cấp thông tin chẩn đoán, phân loại và nghiên cứu dựa trên các tiêu chuẩn y khoa quốc tế.",
    "question": "Xin vui lò...
Retry dòng 1431 - Lần 3


  0%|          | 42/308904 [1:11:13<8103:36:42, 94.45s/it]

Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid control character at: line 10 column 968 (char 3078)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học da liễu và chuyển hóa, hỗ trợ sinh viên y khoa tìm hiểu mối liên hệ giữa các bệnh lý.",
    "question": "Xin vui lòng giải thích mối ...
Retry dòng 1432 - Lần 1


  0%|          | 44/308904 [1:19:04<14324:08:27, 166.96s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 608 (char 4972)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học da liễu và gan mật, cung cấp thông tin lâm sàng và hướng dẫn chẩn đoán dựa trên ICD-10.",
    "question": "Tại sao bệnh nhân vảy nến ...
Retry dòng 1434 - Lần 1


  0%|          | 46/308904 [1:21:00<9400:07:12, 109.57s/it] 


Lỗi xử lý response: Invalid control character at: line 10 column 843 (char 3346)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học da liễu và bệnh chuyển hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu khoa học và chuẩn ICD-10.",
    "question":...
Retry dòng 1436 - Lần 1

Lỗi xử lý response: Invalid \escape: line 25 column 3085 (char 13513)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về y khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Mối liên hệ giữa bệnh vảy nến và Gan nhiễm mỡ liên quan đến...
Retry dòng 1436 - Lần 2


  0%|          | 47/308904 [1:23:32<10479:37:26, 122.15s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 561 (char 8175)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về cơ chế bệnh sinh và mối liên hệ đa cơ quan trong bệnh lý da liễu và chuyển hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng kho...
Retry dòng 1437 - Lần 1


  0%|          | 50/308904 [1:27:59<8302:43:28, 96.78s/it]  


Lỗi xử lý response: Expecting ',' delimiter: line 20 column 6616 (char 14825)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về các bệnh chuyển hóa và da liễu, đặc biệt là mối liên hệ bệnh sinh giữa chúng.",
    "question": "Mối liên hệ giữa bệnh vảy nến (Psoriasis)...
Retry dòng 1440 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid control character at: line 15 column 2727 (char 7858)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên cung cấp thông tin và tư vấn về bệnh lý da liễu và các bệnh chuyển hóa liên quan, theo chuẩn y khoa.",
    "question": "Bác sĩ có thể cho tôi biế...
Retry dòng 1440 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 711 (char 6471)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh da liễu và các bệnh lý chuyển hóa liên quan, cung cấp thông tin dựa trên y học chứng cứ.",
    "question": "Xin chào Chatbot, tôi muốn tì...
Retry dòng 1440 - Lần 3

  0%|          | 51/308904 [1:35:20<17182:22:52, 200.28s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 146579 (char 151646)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về chẩn đoán hình ảnh và các phương pháp đánh giá bệnh lý gan.",
    "question": "Xin vui lòng giải thích vai trò của phương pháp FibroScan (Tra...
Retry dòng 1441 - Lần 1

Lỗi xử lý response: Invalid \escape: line 25 column 1545 (char 9884)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học, chẩn đoán không xâm lấn và nghiên cứu trong lĩnh vực gan mật. Cung cấp thông tin dựa trên các nghiên cứu khoa học và tiêu chuẩn y tế...
Retry dòng 1441 - Lần 2


  0%|          | 52/308904 [1:39:58<19170:49:30, 223.46s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 282 (char 2739)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về y học nội khoa và chuyển hóa, cung cấp thông tin chi tiết về bệnh lý gan và các yếu tố liên quan dựa trên các hướng dẫn chẩn đoán hiện hành."...
Retry dòng 1442 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 504 (char 7206)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và mối liên hệ giữa các bệnh lý hệ thống, cung cấp thông tin chi tiết và cập nhật về cơ chế bệnh sinh, biểu hiện lâm sàng và các bệnh...
Retry dòng 1442 - Lần 2


  0%|          | 53/308904 [1:42:32<17385:55:54, 202.65s/it]


Lỗi xử lý response: Invalid \escape: line 25 column 1274 (char 9639)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên sâu về các bệnh lý da liễu và bệnh đồng mắc, cung cấp thông tin và cơ sở khoa học để hỗ trợ chẩn đoán và điều trị.",
    "question": "Xin cho bi...
Retry dòng 1443 - Lần 1


  0%|          | 55/308904 [1:44:36<11090:15:19, 129.27s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 557 (char 7430)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về bệnh lý gan, đặc biệt là đánh giá xơ hóa gan và các phương pháp chẩn đoán theo chuẩn y khoa. Thông tin được cung cấp nhằm hỗ trợ chẩn đoán và...
Retry dòng 1445 - Lần 1

Lỗi xử lý response: Invalid \escape: line 20 column 1708 (char 8088)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý gan, cung cấp thông tin chẩn đoán và tiêu chuẩn lâm sàng dựa trên ICD-10 và các khuyến nghị y tế.",
    "question": "Bác sĩ có thể giả...
Retry dòng 1445 - Lần 2


  0%|          | 57/308904 [1:47:10<8557:17:23, 99.75s/it]  


Lỗi xử lý response: Invalid control character at: line 20 column 966 (char 6995)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và cơ chế bệnh sinh, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 của Bộ Y tế Việt Nam.",
    "question": "Xin hãy giải thíc...
Retry dòng 1447 - Lần 1


  0%|          | 59/308904 [1:51:51<9831:21:35, 114.60s/it] 


Lỗi xử lý response: Invalid control character at: line 10 column 470 (char 2438)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa hỗ trợ tra cứu các ca lâm sàng và hướng dẫn chẩn đoán bệnh lý nội khoa.",
    "question": "Dựa vào thông tin từ bài báo 'Ca lâm sàng 2' của Nguyễn Việt...
Retry dòng 1449 - Lần 1


  0%|          | 61/308904 [1:55:03<9015:28:38, 105.09s/it]


Lỗi xử lý response: Invalid control character at: line 25 column 2769 (char 10337)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý gan mật, hỗ trợ chẩn đoán và theo dõi các bệnh gan nhiễm mỡ theo chuẩn ICD-10.",
    "question": "FibroScan và các thông số đi kèm có ...
Retry dòng 1451 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 721 (char 6919)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tiêu hóa, cung cấp thông tin chi tiết về các phương pháp chẩn đoán gan nhiễm mỡ.",
    "question": "Bác sĩ có thể giải thích chi tiết về vai t...
Retry dòng 1451 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 654 (char 7166)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về chẩn đoán hình ảnh và bệnh lý gan, cung cấp thông tin và tư vấn lâm sàng dựa trên các phương pháp hiện đại.",
    "question": "Xin vui lòng gi...
Retry dòng 1451 - Lần 3


  0%|          | 62/308904 [1:56:54<9181:23:26, 107.02s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 657 (char 6248)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật ung thư tiêu hóa, cung cấp thông tin chi tiết về các kỹ thuật điều trị tiên tiến và quản lý bệnh nhân theo hướng dẫn lâm sàng.",
  ...
Retry dòng 1452 - Lần 1

Lỗi xử lý response: Invalid \escape: line 25 column 1514 (char 7395)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư dạ dày và các phương pháp phẫu thuật, hỗ trợ các bác sĩ và nghiên cứu viên.",
    "question": "Xin vui lòng giải thích mục tiêu chính ...
Retry dòng 1452 - Lần 2

Lỗi xử lý response: Invalid \escape: line 20 column 881 (char 6886)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về ung thư học và phẫu thuật tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng khoa học.",
    "question": "Xin chào chatbo...
Retry dòng 1452 - Lần 3


  0%|          | 64/308904 [2:00:53<9125:03:16, 106.37s/it] 


Lỗi xử lý response: Invalid control character at: line 25 column 684 (char 6493)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về chăm sóc hậu phẫu và dinh dưỡng, cung cấp thông tin dựa trên hướng dẫn y tế hiện hành và tiêu chuẩn ICD-10.",
    "question": "Dựa vào nghiên ...
Retry dòng 1454 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 397 (char 4148)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phác đồ chăm sóc hậu phẫu và dinh dưỡng lâm sàng, cung cấp thông tin dựa trên các khuyến nghị y tế và nghiên cứu khoa học.",
    "question": "...
Retry dòng 1454 - Lần 2


  0%|          | 67/308904 [2:04:12<6407:30:44, 74.69s/it] 


Lỗi xử lý response: Invalid control character at: line 20 column 944 (char 8060)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về dinh dưỡng lâm sàng, cung cấp thông tin và khuyến nghị dựa trên các hướng dẫn y tế và nghiên cứu lâm sàng.",
    "question": "Nêu vai trò của ...
Retry dòng 1457 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 898 (char 9224)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin và đánh giá rủi ro biến chứng sau phẫu thuật theo chuẩn ICD-10.",
    "question": "Bác sĩ có thể giải ...
Retry dòng 1457 - Lần 2

Lỗi xử lý response: Invalid control character at: line 10 column 276 (char 3343)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về dinh dưỡng lâm sàng, cung cấp thông tin và tư vấn về các phác đồ chăm sóc hậu phẫu dạ dày theo chuẩn y khoa.",
    "question": "Xin hãy giải ...
Retry dòng 1457 - Lần 3


  0%|          | 69/308904 [2:13:40<13614:43:04, 158.70s/it]


Lỗi xử lý response: Invalid \escape: line 20 column 2255 (char 10297)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các khuyến nghị y tế mới nhất.",
    "question": "Các yếu tố tiề...
Retry dòng 1459 - Lần 1


  0%|          | 70/308904 [2:15:14<11963:06:28, 139.45s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1275 (char 6977)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về chiến lược hồi phục sớm sau phẫu thuật (ERAS) trong lĩnh vực ung thư đường tiêu hóa.",
    "question": "Xin chào chatbot, tôi đang tìm hiể...
Retry dòng 1460 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 510 (char 4149)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên các phác đồ điều trị và chuẩn y tế hiện hành.",
    "question": "Mục tiêu ...
Retry dòng 1460 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 1105 (char 7854)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về tổng quan nghiên cứu y học, phẫu thuật tiêu hóa và chiến lược hồi phục sớm.",
    "question": "Vui lòng cung cấp một bản tóm tắt chi tiết về n...
Retry dòng 1460 - Lần 3


  0%|          | 71/308904 [2:17:14<11456:03:45, 133.54s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 326 (char 6327)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y học ung thư và phẫu thuật, hỗ trợ thông tin chi tiết về các bệnh lý và phương pháp điều trị theo ICD-10 và chuẩn mực y khoa.",
    "question...
Retry dòng 1461 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 432 (char 9099)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu về ung thư dạ dày và các phương pháp phục hồi sau phẫu thuật, đặc biệt là chương trình ERAS.",
    "question": "Bác sĩ có thể giải thích chi ...
Retry dòng 1461 - Lần 2


  0%|          | 72/308904 [2:19:29<11499:13:51, 134.04s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1308 (char 6453)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên các giao thức phục hồi tăng cường sau mổ (ERAS).",
    "question": "Xin vu...
Retry dòng 1462 - Lần 1


  0%|          | 73/308904 [2:21:00<10385:40:42, 121.06s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 817 (char 6877)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng khoa học và chuẩn ICD-10 của Bộ Y tế Việt Nam.",
    "question...
Retry dòng 1463 - Lần 1


  0%|          | 75/308904 [2:23:48<8779:07:48, 102.34s/it] 

Lỗi, thử lại sau 5s... (Lần 1)


  0%|          | 76/308904 [2:31:49<18517:04:46, 215.85s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 534 (char 4794)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa, cung cấp thông tin về các biến chứng sau phẫu thuật cắt dạ dày.",
    "question": "Các biến chứng thường gặp nào có thể ...
Retry dòng 1466 - Lần 1


  0%|          | 77/308904 [2:33:19<15287:06:18, 178.20s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 648 (char 7992)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về phẫu thuật tiêu hóa và ung thư, cung cấp thông tin về các yếu tố ảnh hưởng đến quá trình hồi phục sau phẫu thuật.",
    "question": "Những yếu...
Retry dòng 1467 - Lần 1


  0%|          | 79/308904 [2:35:52<10663:02:22, 124.30s/it]


Lỗi xử lý response: Invalid control character at: line 10 column 416 (char 2478)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về thính học, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các tiêu chuẩn y tế hiện hành.",
    "question": "Xin vui lòng cho biết đị...
Retry dòng 1469 - Lần 1

Lỗi xử lý response: Invalid control character at: line 5 column 772 (char 1086)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tai mũi họng, cung cấp thông tin lâm sàng về định nghĩa, nguyên nhân và phân loại nghe kém theo chuẩn y tế.",
    "question": "Theo c...
Retry dòng 1469 - Lần 2


  0%|          | 82/308904 [2:39:53<7456:48:05, 86.93s/it]  


Lỗi xử lý response: Invalid control character at: line 20 column 656 (char 5374)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học ung thư tuyến giáp, cung cấp thông tin tổng quan và yếu tố dịch tễ.",
    "question": "Xin cho biết thông tin tổng quan và các đặc đi...
Retry dòng 1472 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 163751 (char 168259)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về ung thư học và phẫu thuật nội tiết, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu khoa học và chuẩn ICD-10.",
    "question": ...
Retry dòng 1472 - Lần 2


  0%|          | 83/308904 [2:42:38<9476:05:40, 110.47s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 505 (char 6571)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về các kỹ thuật can thiệp giảm đau cột sống, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Bác sĩ có thể cho tôi biế...
Retry dòng 1473 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 359 (char 5598)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về điều trị đau, tư vấn kỹ thuật can thiệp giảm đau và đánh giá hiệu quả lâm sàng.",
    "question": "Bác sĩ có thể cho tôi biết về hiệu quả và t...
Retry dòng 1473 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 582 (char 5345)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên sâu, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10, các hướng dẫn y tế và nghiên cứu khoa học.",
    "question": "Một sinh viên y khoa hỏ...
Retry dòng 1473 - Lần 3


  0%|          | 84/308904 [2:44:51<10058:26:29, 117.25s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 891 (char 7816)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về thính học, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Định nghĩa, phân loại và các nguyên nhân gây nghe kém là ...
Retry dòng 1474 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 457813 (char 465337)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về Thính học và các bệnh lý nghe kém, cung cấp thông tin chuyên sâu và hướng dẫn chẩn đoán, điều trị theo chuẩn y khoa.",
    "question": "Theo đ...
Retry dòng 1474 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 977 (char 6471)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học tai mũi họng, cung cấp thông tin và tư vấn lâm sàng dựa trên các hướng dẫn của Bộ Y tế Việt Nam và phân loại bệnh quốc tế ICD-10.",
 ...
Retry dòng 1474 - Lần 3


  0%|          | 90/308904 [2:55:45<7293:02:11, 85.02s/it]  


Lỗi xử lý response: Invalid control character at: line 20 column 392 (char 8401)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về chẩn đoán hình ảnh trong ung thư và các bệnh lý mô mềm, cung cấp thông tin chi tiết dựa trên các nghiên cứu y khoa.",
    "question": "Bạn có ...
Retry dòng 1480 - Lần 1


  0%|          | 91/308904 [2:57:24<7668:02:59, 89.39s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 1007 (char 10422)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về vi sinh lâm sàng, bệnh truyền nhiễm và quản lý kháng sinh, cung cấp thông tin dựa trên các tiêu chuẩn chẩn đoán và điều trị của Bộ Y tế Việt N...
Retry dòng 1481 - Lần 1

Lỗi xử lý response: Invalid control character at: line 5 column 574 (char 997)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về vi sinh lâm sàng và dược lý, hỗ trợ thông tin về tình hình kháng kháng sinh và chiến lược điều trị cho nhiễm khuẩn đường tiết niệu.",
    "qu...
Retry dòng 1481 - Lần 2


  0%|          | 92/308904 [3:00:26<10049:46:29, 117.16s/it]


Lỗi xử lý response: Invalid \escape: line 25 column 1376 (char 13703)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên sâu về nội tiết và chuyển hóa, hỗ trợ phân tích khái niệm bệnh lý và biến chứng liên quan đến đái tháo đường.",
    "question": "Theo nghiên cứu...
Retry dòng 1482 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)


  0%|          | 93/308904 [3:07:48<18405:39:06, 214.57s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 464 (char 7791)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nội tiết và lão khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên chuẩn ICD-10 của Bộ Y tế Việt Nam và y học chứng cứ.",
    "question": "X...
Retry dòng 1483 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 475 (char 5736)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và các biến chứng của đái tháo đường, cung cấp thông tin và tư vấn lâm sàng dựa trên kiến thức y khoa hiện hành.",
    "question": "B...
Retry dòng 1483 - Lần 2

Lỗi xử lý response: Invalid control character at: line 10 column 1760 (char 4365)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về lão khoa và nội tiết, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Đái tháo đường có thể gây ra những biến chứng...
Retry dòng 1483 - Lần 3


  0%|          | 95/308904 [3:10:20<12071:06:30, 140.72s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 855 (char 6386)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và y học nội khoa, cung cấp thông tin chính xác và đáng tin cậy về các tình trạng lâm sàng, đặc biệt là suy giảm nhận thức theo chuẩn...
Retry dòng 1485 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 1050 (char 4847)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và lão khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10.",
    "question": "Bác sĩ có thể cho biết suy giảm nhận thức là g...
Retry dòng 1485 - Lần 2

Lỗi xử lý response: Extra data: line 23 column 1 (char 84960)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và yếu tố nguy cơ, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10 và các nghiên cứu y khoa cập nhật.",
    "question": "Xin bá...
Retry dòng 1485 - Lần 3


  0%|          | 96/308904 [3:12:19<11510:10:33, 134.18s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 785 (char 6573)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và lão khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên các nghiên cứu khoa học và chuẩn ICD-10.",
    "question": "Chào chatbot,...
Retry dòng 1486 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 512 (char 6745)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học nội tiết và lão khoa, cung cấp thông tin chi tiết về các biến chứng của bệnh đái tháo đường và suy giảm nhận thức ở người cao tuổi.",...
Retry dòng 1486 - Lần 2

Lỗi xử lý response: Expecting ',' delimiter: line 25 column 3498 (char 15265)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về lão khoa, cung cấp thông tin về suy giảm nhận thức ở người cao tuổi.",
    "question": "Xin chào, tôi muốn tìm hiểu về khái niệm suy giảm nhận...
Retry dòng 1486 - Lần 3


  0%|          | 98/308904 [3:14:58<8806:51:32, 102.67s/it] 


Lỗi xử lý response: Invalid control character at: line 15 column 377 (char 5724)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về lão khoa, hỗ trợ các bác sĩ và sinh viên y khoa tìm hiểu sâu về hội chứng dễ tổn thương (Frailty) và các biến thể của nó theo chuẩn ICD-10.",
...
Retry dòng 1488 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 376 (char 5908)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về y học lão khoa, cung cấp thông tin và tổng hợp nghiên cứu về hội chứng suy yếu và suy giảm nhận thức dựa trên các bằng chứng khoa học.",
    "...
Retry dòng 1488 - Lần 2


  0%|          | 99/308904 [3:16:44<8914:26:48, 103.92s/it]


Lỗi xử lý response: Invalid control character at: line 20 column 618 (char 8132)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và biến chứng nội tiết, cung cấp thông tin chi tiết về suy giảm nhận thức ở bệnh nhân đái tháo đường.",
    "question": "Bác sĩ có th...
Retry dòng 1489 - Lần 1

Lỗi xử lý response: Invalid \escape: line 25 column 838 (char 7996)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nội tiết và thần kinh, cung cấp thông tin lâm sàng và nghiên cứu về các biến chứng đái tháo đường theo chuẩn ICD-10.",
    "question": "Vấn đề...
Retry dòng 1489 - Lần 2

Lỗi xử lý response: Invalid control character at: line 20 column 2122 (char 10857)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về nội tiết và lão khoa, hỗ trợ cung cấp thông tin chi tiết về biến chứng và quản lý đái tháo đường theo chuẩn y khoa.",
    "question": "Xin vui...
Retry dòng 1489 - Lần 3


  0%|          | 100/308904 [3:23:51<17228:51:04, 200.85s/it]

Lỗi, thử lại sau 5s... (Lần 1)

Lỗi xử lý response: Invalid control character at: line 20 column 1010 (char 6666)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh học và y học nội khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên các bằng chứng khoa học và chuẩn ICD-10 của Bộ Y tế Việt Nam.",
   ...
Retry dòng 1490 - Lần 1


  0%|          | 102/308904 [3:27:53<13071:47:22, 152.39s/it]


Lỗi xử lý response: Invalid control character at: line 15 column 424 (char 5035)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên sâu về nội khoa và lão khoa, hỗ trợ xác định các yếu tố nguy cơ và hậu quả của suy giảm nhận thức theo chuẩn ICD-10 của Bộ Y tế Việt Nam.",
    ...
Retry dòng 1492 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 912 (char 7438)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh lý nội tiết và lão khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng khoa học và chuẩn ICD-10 của Bộ Y tế Việt Nam.",
    "...
Retry dòng 1492 - Lần 2


  0%|          | 104/308904 [3:30:40<9748:56:38, 113.65s/it] 


Lỗi xử lý response: Invalid control character at: line 25 column 36599 (char 47776)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về lão khoa và bệnh lý chuyển hóa, cung cấp thông tin và tư vấn lâm sàng dựa trên bằng chứng khoa học.",
    "question": "Phân tích mối liên hệ g...
Retry dòng 1494 - Lần 1


  0%|          | 105/308904 [3:33:53<11788:27:55, 137.43s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 41
}
]
Retry dòng 1495 - Lần 1

Lỗi xử lý response: Invalid control character at: line 20 column 372 (char 6538)
Response gốc: ```json
[
  {
    "instruction": "Chatbot y khoa chuyên về lão khoa, cung cấp thông tin và phân tích nghiên cứu y học dựa trên bằng chứng kh

  0%|          | 106/308904 [3:37:16<13492:17:23, 157.29s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 47
}
]
Retry dòng 1496 - Lần 1

Lỗi xử lý response: Invalid control character at: line 15 column 612 (char 4919)
Response gốc: ```json
[
  {
    "intruction": "Chatbot y khoa chuyên về bệnh võng mạc đái tháo đường (Mã ICD-10: H36.03), cung cấp thông tin chi tiết về c

  0%|          | 107/308904 [3:38:46<11744:41:28, 136.92s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 18
}
]
Retry dòng 1497 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 108/308904 [3:39:42<9681:02:07, 112.86s/it] 

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 21
}
]
Retry dòng 1498 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 109/308904 [3:40:39<8235:13:38, 96.01s/it] 

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 25
}
]
Retry dòng 1499 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 110/308904 [3:41:36<7222:49:39, 84.21s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 28
}
]
Retry dòng 1500 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 111/308904 [3:42:32<6512:11:23, 75.92s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 31
}
]
Retry dòng 1501 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 112/308904 [3:43:29<6015:10:36, 70.13s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 35
}
]
Retry dòng 1502 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 113/308904 [3:44:25<5666:02:06, 66.06s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 38
}
]
Retry dòng 1503 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 114/308904 [3:45:22<5432:26:53, 63.33s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 41
}
]
Retry dòng 1504 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 115/308904 [3:46:19<5259:04:04, 61.31s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 44
}
]
Retry dòng 1505 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 116/308904 [3:47:16<5145:21:35, 59.99s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 48
}
]
Retry dòng 1506 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 117/308904 [3:48:13<5059:41:38, 58.99s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 51
}
]
Retry dòng 1507 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 118/308904 [3:49:09<5005:12:06, 58.35s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 54
}
]
Retry dòng 1508 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 119/308904 [3:50:06<4963:28:48, 57.87s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 57
}
]
Retry dòng 1509 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 120/308904 [3:51:03<4932:48:08, 57.51s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 1
}
]
Retry dòng 1510 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-

  0%|          | 121/308904 [3:52:00<4915:58:17, 57.31s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 4
}
]
Retry dòng 1511 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-

  0%|          | 122/308904 [3:52:56<4900:52:03, 57.14s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 7
}
]
Retry dòng 1512 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-

  0%|          | 123/308904 [3:53:53<4887:04:52, 56.98s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 10
}
]
Retry dòng 1513 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 124/308904 [3:54:50<4882:53:06, 56.93s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 14
}
]
Retry dòng 1514 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 125/308904 [3:55:46<4874:39:14, 56.83s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 17
}
]
Retry dòng 1515 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 126/308904 [3:56:43<4871:00:57, 56.79s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 20
}
]
Retry dòng 1516 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 127/308904 [3:57:40<4869:14:41, 56.77s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 24
}
]
Retry dòng 1517 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 128/308904 [3:58:37<4870:09:08, 56.78s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 27
}
]
Retry dòng 1518 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 129/308904 [3:59:34<4872:23:57, 56.81s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 30
}
]
Retry dòng 1519 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 130/308904 [4:00:30<4874:44:50, 56.83s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 33
}
]
Retry dòng 1520 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 132/308904 [4:02:44<5103:26:58, 59.50s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
  quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
  quota_id: "GenerateRequestsPerDayPerProjectPerModel-FreeTier"
  quota_dimensions {
    key: "model"
    value: "gemini-2.5-flash"
  }
  quota_dimensions {
    key: "location"
    value: "global"
  }
  quota_value: 250
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 20
}
]
Retry dòng 1522 - Lần 1
Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)
Lỗi sau 3 lần thử: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini

  0%|          | 133/308904 [4:03:40<5030:17:23, 58.65s/it]

Lỗi, thử lại sau 5s... (Lần 1)
Lỗi, thử lại sau 10s... (Lần 2)


## expection talk

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyA99lJZAqngGBqXwg__S18VPWq2KRW9Vhc")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 5 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Các cuộc hội thoại sai, hoặc kém hay không có nghĩa như: "asdasd","ê","sđs",... thì chỉ rõ ra là câu hỏi người dùng chưa rõ ràng.
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
**Yêu cầu đặc biệt**:
- Chỉ rõ chỗ hỏi chưa rõ ràng và hướng dẫn cách hỏi rõ ràng hơn.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa hãy kiểm tra xem câu hỏi có nghĩa không và hãy chỉ tôi cách hỏi."
- "question": Câu hỏi sai, khó hiểu, lung tung, không có nghĩa hay sai.
- "answer": Chỉ ra lỗi hoặc hướng dẫn người dùng cách hỏi rõ ràng hơn, ví dụ: "Câu hỏi của bạn chưa rõ ràng, vui lòng cung cấp thêm thông tin để tôi có thể giúp bạn tốt hơn."
Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")


## Tư vấn khóa học, tài liệu

In [None]:
import pandas as pd
import google.generativeai as genai
import time
import os
from tqdm import tqdm
import json
# Cấu hình API Key
genai.configure(api_key="AIzaSyA99lJZAqngGBqXwg__S18VPWq2KRW9Vhc")  # <-- Nhớ điền API key ở đây

# Khởi tạo model
model = genai.GenerativeModel(model_name='models/gemini-2.5-flash')

# File input và output
input_file = "../document_dataset/document_chunk_dataset.xlsx"
output_file = "SVYKHOA_dataset.xlsx"

# Đọc dữ liệu đầu vào
try:
    df_input = pd.read_excel(input_file)
    df_input = df_input[['Text']].dropna().reset_index(drop=True)
    print(f"Đã đọc file Excel với {len(df_input)} dòng văn bản.")
except Exception as e:
    print(f"Lỗi khi đọc file Excel: {str(e)}")
    exit()

# Tạo DataFrame kết quả
result_columns = [
    "intruction","question", "answer",
    "document/title", "document/tool", "document/description",
    "cme/title", "cme/tool", "cme/description"
]
if os.path.exists(output_file):
    df_result = pd.read_excel(output_file)
else:
    df_result = pd.DataFrame(columns=result_columns)

# Prompt Template mới
prompt_template = """
Bạn là một chuyên gia y tế chuyên về y khoa. Nhiệm vụ của bạn là tạo dữ liệu huấn luyện dành cho một **chatbot y khoa chuyên về y khoa** nhằm giúp chatbot phản hồi người dùng một cách chính xác, khoa học và đáng tin cậy theo chuẩn ICD-10 của Bộ Y tế Việt Nam.

Dựa vào đoạn văn sau:

"{dental_text}"

Hãy sinh ra một **DANH SÁCH GỒM 3 ĐỐI TƯỢNG JSON** chứa đầy đủ TẤT CẢ các trường dưới đây. Tuyệt đối không được bỏ trống bất kỳ trường nào. Nếu đoạn văn không nêu rõ thông tin, bạn được phép **bổ sung hợp lý dựa trên kiến thức y khoa chính thống**, nhưng KHÔNG được bịa đặt hoặc sử dụng thông tin sai sự thật.

**Mục tiêu**: Dữ liệu được tạo ra sẽ được dùng để huấn luyện một **mô hình chatbot y tế**, vì vậy tất cả thông tin cần:
- Chính xác về mặt y học.
- Bám sát nội dung đoạn văn hoặc kiến thức y khoa nha khoa phổ biến đã được xác thực (ví dụ: WHO, Bộ Y tế, giáo trình nha khoa).
- Có giá trị hướng dẫn, giải thích rõ ràng, có thể dùng để **tư vấn lâm sàng cho người dùng cuối**.
**Yêu cầu đặc biệt**:
- `answer` phải viết theo ngôn ngữ chuyên môn, **khoa học, cụ thể, không chung chung**, đủ để một bác sĩ hoặc chatbot sử dụng để diễn giải cho người bệnh.
Các trường cần điền:
- "intruction": Mô tả ngắn gọn về nhiệm vụ của chatbot, ví dụ: "Chatbot y khoa chuyên về nha khoa, cung cấp thông tin và tư vấn lâm sàng dựa trên ICD-10."
- "question": Một câu hỏi y khoa phù hợp với **nội dung bài viết và câu trả lời**, tập trung vào tư vấn, chỉ dạy cho các bác sỹ trẻ.
- "answer": Câu trả lời chi tiết, có thể bao gồm hướng dẫn, giải thích hoặc thông tin bổ sung liên quan đến câu hỏi cho các bác sỹ trẻ về cách thực hành y khoa, đến diễn giải lý thuyết, hoặc các khuyến nghị lâm sàng.
- "document/title": Tiêu đề tài liệu y khoa liên quan đến nội dung đoạn văn.
- "document/tool": Luôn là "call_references"
- "document/description": Mô tả ngắn gọn tài liệu tham khảo cho người dùng học tập, nêu rõ mục đích hoặc giá trị ứng dụng.
- "cme/title": Tiêu đề khóa học đào tạo y khoa liên tục (CME) liên quan đến chủ đề trong đoạn văn.
- "cme/tool": Luôn là "call_cme"
- "cme/description": Mô tả ngắn về khóa học CME , giúp chatbot hiểu và phản hồi như một trợ lý học thuật chuyên ngành cho người dùng hoc tập.

Lưu ý:- Chỉ xuất đầu ra dưới dạng đối tượng JSON hợp lệ. KHÔNG thêm bất kỳ mô tả, lời giải thích hoặc đoạn văn nào khác bên ngoài JSON.
      - Không được bổ trống bất kỳ trường nào trong đối tượng JSON.
"""



# Hàm sinh dữ liệu
def generate_with_retry(prompt, max_retries=3):
    for attempt in range(max_retries):
        try:
            response = model.generate_content(prompt)
            if response.text:
                return response
        except Exception as e:
            if attempt < max_retries - 1:
                wait_time = (attempt + 1) * 5
                print(f"Lỗi, thử lại sau {wait_time}s... (Lần {attempt + 1})")
                time.sleep(wait_time)
            else:
                print(f"Lỗi sau {max_retries} lần thử: {str(e)}")
                return None
    return None

# Hàm xử lý và lưu
def process_and_save(response):
    try:
        cleaned = response.text.replace('```json', '').replace('```', '').strip()
        data_list = json.loads(cleaned)

        if not isinstance(data_list, list):
            raise ValueError("Kết quả không phải là danh sách JSON.")

        global df_result
        for data in data_list:
            new_row = {
                "intruction": data.get("intruction", ""),
                "question": data.get("question", ""),
                "answer": data.get("answer", ""),
                "document/title": data.get("document/title", ""),
                "document/tool": data.get("document/tool", ""),
                "document/description": data.get("document/description", ""),
                "cme/title": data.get("cme/title", ""),
                "cme/tool": data.get("cme/tool", ""),
                "cme/description": data.get("cme/description", "")
            }
            df_result.loc[len(df_result)] = new_row
        return True
    except Exception as e:
        print(f"\nLỗi xử lý response: {str(e)}")
        print(f"Response gốc: {response.text[:200]}...")
        return False

# Thiết lập số dòng xử lý
start_row = len(df_result)
end_row = len(df_input)
processed_count = 0
start_time = time.time()

# Vòng lặp xử lý
for index in tqdm(range(start_row, end_row)):
    row = df_input.iloc[index]
    retries = 0

    while retries < 3:
        try:
            dental_text = row['Text'].strip()
            prompt = prompt_template.format(dental_text=dental_text)
            response = generate_with_retry(prompt)

            if response and process_and_save(response):
                processed_count += 1
                df_result.to_excel(output_file, index=False)
                time.sleep(2)
                break
            else:
                retries += 1
                print(f"Retry dòng {index} - Lần {retries}")
                time.sleep(3)

        except Exception as e:
            print(f"\nLỗi dòng {index}: {str(e)}")
            retries += 1
            time.sleep(3)

# Lưu cuối
df_result.to_excel(output_file, index=False)
total_time = (time.time() - start_time) / 60
print(f"\nHoàn thành! Đã xử lý {processed_count} dòng.")
print(f"Thời gian chạy: {total_time:.2f} phút")
print(f"File kết quả: {output_file}")
