In [None]:
import polars as pl
import os
import time
import json
# import logging
from copy import deepcopy

from typing import List, Dict, Tuple, Union, Any

from concurrent.futures import ThreadPoolExecutor
import concurrent

from PIL import Image
from google.genai import types
from google import genai

from google.colab import files

# from IPython.display import clear_output
from tqdm.notebook import tqdm

import warnings
warnings.filterwarnings("ignore")

In [None]:
from google.genai.client import Client
from google.genai.types import GenerateContentResponse
from dotenv import load_dotenv
load_dotenv()

GOOGLE_API_KEYS=os.getenv("GOOGLE_API_KEYS").split(",")

model_name = "gemini-2.5-pro"

sys_instruct = '''
**CONFIGURATION**

`[DOMAIN_NAME]`: {domain}
`[API_FUNCTIONALITY_SUGGESTION]`: {api_functionality}
`[BUSINESS_DESCRIPTION_FORMAT]`: {api_documentation_structure}
`[API_DETAIL_FORMAT]`: {api_detail_structure}
`[BEHAVIOR_RULE_FORMAT]`: {behaviour_rule_structure}
`[TEST_DATA_FORMAT]`: {data_test_structure}
`[BUSINESS_DESCRIPTION_ITEM_COUNT]`: {api_documentation_num}
`[REQUEST_BODY_FIELD_COUNT]`: {request_body_field_num}
`[BEHAVIOR_RULE_COUNT]`: {behaviour_rule_num}
`[TEST_DATA_COUNT]`: {data_test_num}
`[TEST_DATA_COMPLETENESS]`: {data_test_full_fill}
`[BIZ_CODE_FORMAT]`: {biz_code_type}
`[RESPONSE_STRUCTURE]`: {response_structure}
`[LANGUAGE]`: English

---

**Role:** You are a Senior Business Analyst and Quality Assurance (QA) Engineer, specializing in API design and behavioral testing.

**Context:** You are working on a software development project related to the **`[DOMAIN_NAME]`** domain and need to design APIs to support specific business functionalities. The data you generate will typically be extracted from business documentation (SRS, BRD, ...), client requirements, or data used for testing in QA scenarios.

**Task:** Generate a detailed API specification for one (1) specific business function belonging to the **`[DOMAIN_NAME]`** domain. Then, assemble this information based on the available template to form a complete API specification, including business description, endpoint details, behavior rules, and sample data, sufficient for developers and QA teams to use directly.

**Requirements:**

1.  **DO NOT INTRODUCE**; start directly with the content.
2.  Focus on the function: **`[API_FUNCTIONALITY_SUGGESTION]`**. (e.g., Money Transfer, Add to Cart, Reset Password, ...).
3.  **ABSOLUTELY** adhere to the template structure below but be flexible in content presentation, including the use of tables, lists, paragraphs, etc.
4.  Ensure `BEHAVIOR RULES` (both success and failure) are logical and tightly linked to `TEST_DATA`.
5.  Business error codes (Biz Code) must be meaningful (e.g., `E_INSUFFICIENT_FUNDS`, `E_USER_NOT_FOUND`).
6.  Do not use phrases like "example", "for instance", "assume", "could be", etc. in the business description, API details, behavior rules, and test data. All information must be presented as factual and accurate.
7.  Ensure that the number of fields in the request body, the number of behavior rules, and the quantity of test data adhere to the limits defined in the configuration above.
8.  Do not mention information from the **`CONFIGURATION`** section in the final output (e.g., do not say "according to the defined configuration", "per configuration requirements", or "based on the configuration", etc.).

**REQUIRED OUTPUT STRUCTURE:**

*   Domain: **`[DOMAIN_NAME]`**
*   Function: **`[API_FUNCTIONALITY_SUGGESTION]`**
*   Description: [Brief description of the API function, e.g., "This API allows customers to transfer money between accounts within the same system."]

---

### API BUSINESS DESCRIPTION

*   This information is usually extracted from business documentation (SRS) or client requirements (BRD). There is no rigid format; you may flexibly present it according to **`[BUSINESS_DESCRIPTION_FORMAT]`**.
*   Format: may include:
    *   **File Name**: [Name of the file containing information, e.g., "Specification_SRS_v1.2.pdf"]
    *   **API Name:** [Clear name, e.g., "Create Internal Transfer Transaction"]
    *   **Business Goal:** [Describe the purpose of this API, e.g., "Allows customers to transfer money from their payment account to another account within the same system."]
    *   **Context:** [Prerequisites, e.g., "User is logged in (authenticated) and has transaction privileges."]

### API DETAILED DESCRIPTION

*   This information is typically extracted from technical documentation, API docs, Swagger, or OpenAPI Specifications. There is no rigid format; you may flexibly present it according to the structure of **`[API_DETAIL_FORMAT]`** defined above.
*   **Requirements:**
    *   Input (request body) should only have the number of fields specified in **`[REQUEST_BODY_FIELD_COUNT]`** to ensure clarity and simplicity.
    *   Mandatory fields (Required) must be provided. Details regarding the mandatory nature of each field will be defined in the table.
    *   Output (response body) must include necessary information for the user or system to understand the result of the request.
    *   Input and output must not be overly complex and should not contain lists/arrays.

*   Example:
    *   **File Name:** [API_Specification_v1.2.pdf]
    *   **HTTP Method:** [POST, GET, PUT, etc.]
    *   **Endpoint:** [/api/v1/...]

*   **Input Requirements (Request Body Example):**

```json
{request_body_example}
```

| Field | Data Type | Required | Constraints |
|---|---|---|---|
| `fromAccountId` (example) | String | YES | UUID format or account number |
| `toAccountId` (example) | String | YES | Must be an existing account in the system |
| `amount` (example) | Number | YES | Must be greater than 0 and max 2 decimal places |
| `currency` (example) | String | YES | Only accepts "VND" or "USD" |
| `note` (example) | String | NO | Max 255 characters |

**Success Response (200 OK):**
*   *Note: The response structure will follow the value of **`[RESPONSE_STRUCTURE]`**.*

*Example for "Flat Data":*
```json
{flat_data_example}
```

*Example for "Nested Data in 'data'":*
```json
{nested_data_example}
```

**Error Response (4xx/5xx):**

```json
{error_response_example}
```

### BEHAVIOR RULES

*   Information regarding API behavior rules, including both success and failure scenarios, can be taken from business or technical documentation.

*   **Requirements:**
    *   Business codes (Biz Code) must have clear meaning, follow **`[BIZ_CODE_FORMAT]`**, and relate directly to each rule, e.g.:
        *   `E_INSUFFICIENT_FUNDS`, `E_USER_NOT_FOUND`, ...
        *   `0001`, `1002`, ...
    *   The description can be flexibly presented as a table or list according to **`[BEHAVIOR_RULE_FORMAT]`**, but must be clear and easy to understand.
    *   Rules must cover both success and failure scenarios.
    *   Rules should be arranged in a logical order, e.g., Happy Path first, followed by Validation rules, then Business Logic.
    *   Adhere to the number of rules in **`[BEHAVIOR_RULE_COUNT]`** to ensure clarity and simplicity.

Example of behavior rules:
**Text + List Format:**

*   **Rule 1 (Happy Path):** Transfer successful when all information is valid and available balance is sufficient.
    *   **Expected Result:** HTTP 200, Response body as described above.
*   **Rule 2 (Validation):** `amount` must be a positive number.
    *   **Expected Result on Violation:** HTTP 400 (Bad Request), Business Code (Biz Code): `E_INVALID_AMOUNT`.
*   **Rule 3 (Business Logic):** Daily transaction limit exceeded.
    *   **Expected Result on Violation:** HTTP 422 (Unprocessable Entity), Business Code (Biz Code): `E_DAILY_LIMIT_EXCEEDED`.

**Number + Table Format:**

| Rule | Description | HTTP Code | Biz Code | Expected Result |
|---|---|---|---|---|
| 1 (Happy Path) | Transfer successful when all information is valid and available balance is sufficient | 200 | 0000 | Response body as described above |
| 2 (Validation) | `amount` must be a positive number | 400 | 1001 | Bad Request |
| 3 (Validation) | `currency` not supported | 400 | 1002 | Bad Request |
| 4 (Business Logic) | Daily transaction limit exceeded | 422 | 5001 | Unprocessable Entity |

### TEST DATA

*   Sample data generated to serve the testing of the **`BEHAVIOR RULES`** mentioned above.
*   **Requirements:**
    *   The description can be flexibly presented as a table or list according to **`[TEST_DATA_COMPLETENESS]`**, but must be clear and easy to understand.

*   Example:

| Account | Status | Balance | Daily Limit |
|---|---|---|---|
| `acc_source_001` | Valid | 50,000,000 VND | 100,000,000 VND |
| `acc_source_002` | Insufficient Funds | 500,000 VND | 100,000,000 VND |
| `acc_source_003` | Locked | 0 VND | 0 VND |
| `acc_source_004` | Limit Exceeded | 50,000,000 VND | 1,000,000 VND |

or

*   List of accounts with corresponding status and balance:
    1.  Account `acc_source_001`: Status: Valid, Balance: 50,000,000 VND, Daily Limit: 100,000,000 VND.
    2.  Account `acc_source_002`: Status: Insufficient Funds, Balance: 500,000 VND, Daily Limit: 100,000,000 VND.
    3.  Account `acc_source_003`: Status: Locked, Balance: 0 VND, Daily Limit: 0 VND.
    4.  Account `acc_source_004`: Status: Limit Exceeded, Balance: 50,000,000 VND, Daily Limit: 1,000,000 VND.

'''

# sys_instruct = '''
# **CẤU HÌNH**

# `[TÊN_DOMAIN]`: {domain}
# `[GỢI_Ý_CHỨC_NĂNG_API]`: {api_functionality}
# `[ĐỊNH_DẠNG_MÔ_TẢ_NGHIỆP_VỤ]`: {api_documentation_structure}
# `[ĐỊNH_DẠNG_MÔ_TẢ_CHI_TIẾT_API]`: {api_detail_structure}
# `[ĐỊNH_DẠNG_QUY_TẮC_HÀNH_VI]`: {behaviour_rule_structure}
# `[ĐỊNH_DẠNG_DỮ_LIỆU_KIỂM_THỬ]`: {data_test_structure}
# `[SỐ_LƯỢNG_MỤC_MÔ_TẢ_NGHIỆP_VỤ]`: {api_documentation_num}
# `[SỐ_LƯỢNG_TRƯỜNG_REQUEST_BODY]`: {request_body_field_num}
# `[SỐ_LƯỢNG_QUY_TẮC_HÀNH_VI]`: {behaviour_rule_num}
# `[SỐ_LƯỢNG_DỮ_LIỆU_KIỂM_THỬ]`: {data_test_num}
# `[TÍNH_ĐẦY_ĐỦ_DỮ_LIỆU_CHO_KIỂM_THỬ]`: {data_test_full_fill}
# `[ĐỊNH_DẠNG_BIZ_CODE]`: {biz_code_type}
# `[CẤU_TRÚC_RESPONSE]`: {response_structure}
# `[NGÔN_NGỮ_OUTPUT]`: English

# ---

# **Vai trò:** Bạn là một Chuyên gia Phân tích Nghiệp vụ (Business Analyst) và Kỹ sư Đảm bảo Chất lượng (QA Engineer) cao cấp, chuyên về thiết kế API và kiểm thử hành vi.

# **Bối cảnh:** Bạn đang làm việc trong một dự án phát triển phần mềm liên quan đến domain **`[TÊN_DOMAIN]`** và cần thiết kế các API để hỗ trợ các chức năng nghiệp vụ cụ thể. Dữ liệu bạn tạo ra thông thường sẽ được trích xuất từ tài liệu nghiệp vụ (SRS, BRD, ...), các yêu cầu của khách hàng hoặc là dữ liệu dùng để kiểm thử trong các kịch bản QA.

# **Nhiệm vụ:** Sinh ra một bộ đặc tả API chi tiết cho một (1) chức năng nghiệp vụ cụ thể thuộc domain **`[TÊN_DOMAIN]`**. Sau đó bạn sẽ ráp lại các thông tin này dựa trên template có sẵn để tạo thành một đặc tả API hoàn chỉnh, bao gồm mô tả nghiệp vụ, chi tiết endpoint, quy tắc hành vi và dữ liệu mẫu, đủ để các nhà phát triển và đội ngũ QA có thể sử dụng trực tiếp.

# **Yêu cầu:**

# 1. **KHÔNG GIỚI THIỆU** mà bắt đầu trực tiếp với phần nội dung.
# 2. Tập trung vào chức năng: **`[GỢI_Ý_CHỨC_NĂNG_API]`**. (Ví dụ: Chuyển tiền, Thêm vào giỏ hàng, Đặt lại mật khẩu, ...).
# 3. Tuân thủ **TUYỆT ĐỐI** cấu trúc template dưới đây nhưng phải linh hoat trong cách trình bày nội dung bao gồm cả việc sử dụng bảng, danh sách, đoạn văn, v.v.
# 4. Đảm bảo các `QUY TẮC HÀNH VI` (cả thành công và thất bại) phải logic và liên kết chặt chẽ với `DỮ_LIỆU_CHO_KIỂM_THỬ`.
# 5. Các mã lỗi nghiệp vụ (Biz Code) phải có ý nghĩa (ví dụ: `E_INSUFFICIENT_FUNDS`, `E_USER_NOT_FOUND`).
# 6. Không sử dụng các cụm từ như "ví dụ", "chẳng hạn", "giả sử", "có thể là", v.v. trong phần mô tả nghiệp vụ, chi tiết API, quy tắc hành vi và dữ liệu kiểm thử. Mọi thông tin phải được trình bày như là thực tế và chính xác.
# 7. Đảm bảo rằng số lượng trường trong request body, số lượng quy tắc hành vi và số lượng dữ liệu kiểm thử tuân theo các giới hạn đã được định nghĩa trong cấu hình ở trên.
# 8. Không được đề cập đến thông tin phần **`CÂU HÌNH`** trong output cuối cùng, ví dụ: không nói "theo cấu hình đã định nghĩa", "theo yêu cầu cấu hình", hay "dựa trên cấu hình", v.v.

# **CẤU TRÚC OUTPUT BẮT BUỘC:**

# * Domain: **`[TÊN_DOMAIN]`**
# * Chức năng: **`[GỢI_Ý_CHỨC_NĂNG_API]`**
# * Mô tả: [Mô tả ngắn gọn về chức năng API, ví dụ: "API này cho phép khách hàng chuyển tiền giữa các tài khoản trong cùng hệ thống."]

# ---

# ### MÔ TẢ NGHIỆP VỤ API

# * Thông tin này thường được trích ra từ trong tài liệu nghiệp vụ (SRS) hoặc yêu cầu của khách hàng (BRD), không có định dạng cứng nhắc mà bạn có thể linh hoạt trình bày theo **`[ĐỊNH_DẠNG_MÔ_TẢ_NGHIỆP_VỤ]`**.
# * Định dạng: có thể bao gồm:
#   * **Tên File**: [Tên file chứa thông tin, ví dụ: "Specification_SRS_v1.2.pdf"]
#   * **Tên API:** [Tên rõ ràng, ví dụ: "Tạo Giao dịch Chuyển khoản Nội bộ"]
#   * **Mục tiêu nghiệp vụ:** [Mô tả mục đích của API này, ví dụ: "Cho phép khách hàng chuyển tiền từ tài khoản thanh toán của họ sang một tài khoản khác trong cùng hệ thống."]
#   * **Bối cảnh:** [Điều kiện tiên quyết, ví dụ: "Người dùng đã đăng nhập (authenticated) và có quyền thực hiện giao dịch."]

# ### MÔ TẢ CHI TIẾT API

# * Thông tin này thông thường được trích ra từ trong tài liệu kỹ thuật, tài liệu API, Swagger hoặc OpenAPI Specification. Không có định dạng cứng nhắc mà bạn có thể linh hoạt trình bày, theo cấu trúc của **`[ĐỊNH_DẠNG_MÔ_TẢ_CHI_TIẾT_API]`** đã được định nghĩa.
# * **Yêu cầu:**
#   * Đầu vào (request body) chỉ nên có số lượng trường theo phần **`[SỐ_LƯỢNG_TRƯỜNG_REQUEST_BODY]`** để đảm bảo tính rõ ràng và dễ hiểu.
#   * Các trường bắt buộc (Required) phải được cung cấp. Chi tiết về tính bắt buộc của từng trường sẽ được định nghĩa trong bảng.
#   * Đầu ra (response body) phải bao gồm các thông tin cần thiết để người dùng hoặc hệ thống có thể hiểu được kết quả của yêu cầu.
#   * Đầu vào và đầu ra không được quá phức tạp, không chứa list/array.

# * Ví dụ:
#   * **Tên File:** [API_Specification_v1.2.pdf]
#   * **Phương thức HTTP:** [POST, GET, PUT, v.v.]
#   * **Endpoint:** [/api/v1/...]

# * **Yêu cầu Đầu vào (Request Body Example):**

# ```json
# {request_body_example}
# ```

# | Trường | Kiểu dữ liệu | Bắt buộc | Ràng buộc |
# |---|---|---|---|
# |`fromAccountId` (ví dụ)| String | CÓ | Định dạng UUID hoặc số tài khoản |
# | `toAccountId` (ví dụ) | String | CÓ | Phải là tài khoản tồn tại trong hệ thống |
# | `amount` (ví dụ) | Number | CÓ | Phải lớn hơn 0 và tối đa 2 số thập phân |
# | `currency` (ví dụ) | String | CÓ | Chỉ chấp nhận "VND" hoặc "USD" |
# | `note` (ví dụ) | String | KHÔNG | Tối đa 255 ký tự |

# **Phản hồi Thành công (Success Response - 200 OK):**
# *   *Lưu ý: Cấu trúc response sẽ tuân theo giá trị của **`[CẤU_TRÚC_RESPONSE]`**.*

# *Ví dụ cho "Dữ liệu phẳng":*
# ```json
# {flat_data_example}
# ```

# *Ví dụ cho "Dữ liệu lồng trong 'data'":*
# ```json
# {nested_data_example}
# ```

# **Phản hồi Lỗi (Error Response - 4xx/5xx):**

# ```json
# {error_response_example}
# ```

# ### QUY TẮC HÀNH VI (BEHAVIOR RULES)

# * Các thông tin về quy tắc hành vi (behavior rules) của API, bao gồm cả kịch bản thành công và thất bại có thể lấy từ tài liệu nghiệp vụ hoặc tài liệu kỹ thuật.

# * **Yêu cầu:**
#   * Các mã nghiệp vụ (Biz Code) phải có ý nghĩa rõ ràng, tuân theo **`[ĐỊNH_DẠNG_BIZ_CODE]`** và liên quan trực tiếp đến từng quy tắc, ví dụ:
#     * `E_INSUFFICIENT_FUNDS`, `E_USER_NOT_FOUND`, ...
#     * `0001`, `1002`, ...
#   * Phần mô tả có thể linh hoạt trình bày dưới dạng bảng hoặc danh sách theo **`[ĐỊNH_DẠNG_QUY_TẮC_HÀNH_VI]`**, nhưng phải rõ ràng và dễ hiểu.
#   * Các quy tắc phải bao gồm cả kịch bản thành công và thất bại.
#   * Các quy tắc nên được sắp xếp theo thứ tự logic, ví dụ: Happy Path trước, sau đó là các quy tắc Validation, rồi đến Business Logic.
#   * Tuân thủ số lượng quy tắc của phần **`[SỐ_LƯỢNG_QUY_TẮC_HÀNH_VI]`** để đảm bảo tính rõ ràng và dễ hiểu.

# Ví dụ về các quy tắc hành vi:
# **Dạng chữ + danh sách:**

# * **Quy tắc 1 (Happy Path):** Chuyển khoản thành công khi mọi thông tin hợp lệ và số dư khả dụng.
#   * **Kết quả mong đợi:** HTTP 200, Response body như mô tả ở trên.
# * **Quy tắc 2 (Validation):** `amount` phải là số dương.
#   * **Kết quả mong đợi khi vi phạm:** HTTP 400 (Bad Request), Mã nghiệp vụ (Biz Code): `E_INVALID_AMOUNT`.
# * **Quy tắc 3 (Business Logic):** Vượt quá hạn mức giao dịch hàng ngày.
#   * **Kết quả mong đợi khi vi phạm:** HTTP 422 (Unprocessable Entity), Mã nghiệp vụ (Biz Code): `E_DAILY_LIMIT_EXCEEDED`.

# **Dạng số + bảng:**

# | Quy tắc | Mô tả | HTTP Code | Biz Code | Kết quả mong đợi |
# |---|---|---|---|---|
# | 1 (Happy Path) | Chuyển khoản thành công khi mọi thông tin hợp lệ và số dư khả dụng | 200 | 0000 | Response body như mô tả ở trên |
# | 2 (Validation) | `amount` phải là số dương | 400 | 1001 | Bad Request |
# | 3 (Validation) | `currency` không được hỗ trợ | 400 | 1002 | Bad Request |
# | 4 (Business Logic) | Vượt quá hạn mức giao dịch hàng ngày | 422 | 5001 | Unprocessable Entity |

# ### DỮ LIỆU CHO KIỂM THỬ (TEST DATA)

# * Dữ liệu mẫu được tạo ra để phục vụ cho việc kiểm thử các **`QUY TẮC HÀNH VI`** đã nêu ở trên.
# * **Yêu cầu:**
#   * Phần mô tả có thể linh hoạt trình bày dưới dạng bảng hoặc danh sách theo **`[TÍNH_ĐẦY_ĐỦ_DỮ_LIỆU_CHO_KIỂM_THỬ]`**, nhưng phải rõ ràng và dễ hiểu.

# * Ví dụ:

# | Tài khoản | Trạng thái | Số dư | Hạn mức hàng ngày |
# |---|---|---|---|
# | `acc_source_001` | Hợp lệ | 50.000.000 VND | 100.000.000 VND |
# | `acc_source_002` | Không đủ tiền | 500.000 VND | 100.000.000 VND |
# | `acc_source_003` | Bị khóa | 0 VND | 0 VND |
# | `acc_source_004` | Đã hết hạn mức | 50.000.000 VND | 1.000.000 VND |

# hoặc

# * Danh sách tài khoản với trạng thái và số dư tương ứng:
#   1. Tài khoản `acc_source_001`: Trạng thái: Hợp lệ, Số dư: 50.000.000 VND, Hạn mức hàng ngày: 100.000.000 VND.
#   2. Tài khoản `acc_source_002`: Trạng thái: Không đủ tiền, Số dư: 500.000 VND, Hạn mức hàng ngày: 100.000.000 VND.
#   3. Tài khoản `acc_source_003`: Trạng thái: Bị khóa, Số dư: 0 VND, Hạn mức hàng ngày: 0 VND.
#   4. Tài khoản `acc_source_004`: Trạng thái: Đã hết hạn mức, Số dư: 50.000.000 VND, Hạn mức hàng ngày: 1.000.000 VND.

# '''

request_body_example = '''
  {
    "fromAccountId": "string",
    "toAccountId": "string",
    "amount": 0,
    "currency": "string",
    "note": "string"
  }
'''

flat_data_example = '''
{
  "transactionId": "txn_123abc456def",
  "status": "PROCESSING",
  "timestamp": "2025-10-30T13:00:00Z",
  "fromAccountId": "...",
  "toAccountId": "...",
  "amount": 1500000,
  "currency": "VND"
}
'''

nested_data_example = '''
{
  "code": "0000",
  "message": "Transaction created successfully",
  "data": {
    "status": "PROCESSING"
  }
}
'''

error_response_example = '''
{
  "code": "1001",
  "message": "Invalid amount provided",
  "details": "Amount must be a positive number."
}
'''

In [None]:
import itertools

api_documentation_structures = ["table", "list", "plain text"]
api_detail_structures = ["table", "list", "plain text"]
behaviour_rule_structures = ["table", "list"]
data_test_structures = ["table", "list"]
data_test_full_fills = ["full", "partial", "empty"]
biz_code_types = ["number (1001)", "string (E_INVALID_AMOUNT)"]
response_structures = ["Flat data" , "Data nested within 'data'"]

all_combinations = list(itertools.product(
    api_documentation_structures,
    api_detail_structures,
    behaviour_rule_structures,
    data_test_structures,
    data_test_full_fills,
    biz_code_types,
    response_structures
))

all_combinations_df = pl.DataFrame({
    "api_documentation_structure": [x[0] for x in all_combinations],
    "api_detail_structure": [x[1] for x in all_combinations],
    "behaviour_rule_structure": [x[2] for x in all_combinations],
    "data_test_structure": [x[3] for x in all_combinations],
    "data_test_full_fill": [x[4] for x in all_combinations],
    "biz_code_type": [x[5] for x in all_combinations],
    "response_structure": [x[6] for x in all_combinations]
})
all_combinations_df

api_documentation_structure,api_detail_structure,behaviour_rule_structure,data_test_structure,data_test_full_fill,biz_code_type,response_structure
str,str,str,str,str,str,str
"""table""","""table""","""table""","""table""","""full""","""number (1001)""","""Flat data"""
"""table""","""table""","""table""","""table""","""full""","""number (1001)""","""Data nested within 'data'"""
"""table""","""table""","""table""","""table""","""full""","""string (E_INVALID_AMOUNT)""","""Flat data"""
"""table""","""table""","""table""","""table""","""full""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'"""
"""table""","""table""","""table""","""table""","""partial""","""number (1001)""","""Flat data"""
…,…,…,…,…,…,…
"""plain text""","""plain text""","""list""","""list""","""partial""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'"""
"""plain text""","""plain text""","""list""","""list""","""empty""","""number (1001)""","""Flat data"""
"""plain text""","""plain text""","""list""","""list""","""empty""","""number (1001)""","""Data nested within 'data'"""
"""plain text""","""plain text""","""list""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data"""


In [None]:
class APIKeys():
    def __init__(self, api_keys: list[str]):
        self.api_keys = api_keys
        self.index = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.index < len(self.api_keys):
            key = self.api_keys[self.index]
            self.index += 1
            return key

        raise StopIteration

    def __get_item__(self, index):
        return self.api_keys[index]

    def __len__(self):
        return len(self.api_keys)

    def __contains__(self, key):
        return key in self.api_keys

    def get_next_key(self):
        self.index = (self.index + 1) % len(self.api_keys)
        return self.api_keys[self.index]

In [None]:
api_keys = APIKeys(GOOGLE_API_KEYS)

current_key = api_keys.get_next_key()
print(current_key)

AIzaSyCGxr8yw402znCF1zlX6xa558mie-771Og


In [None]:
# !gdown 1GN0S7pHycuSkhDhYhCD_W2TydNsNiryI

In [None]:
test_data = [
    {
        "domain": "Ngân hàng",
        "api_functionality" : "Chuyển tiền"
    },
    {
        "domain": "Ngân hàng",
        "api_functionality": "Thanh toán"
    },
    {
        "domain": "Ngân hàng",
        "api_functionality": "Nạp tiền"
    },
    {
        "domain": "Ngân hàng",
        "api_functionality": "Rút tiền"
    },
    {
        "domain": "Ngân hàng",
        "api_functionality": "Lịch sử giao dịch"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xem giỏ hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Thêm vào giỏ hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Thanh toán"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Lịch sử giao dịch"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Đặt lại mật khẩu"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Đăng ký tài khoản"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Đăng nhập"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Quên mật khẩu"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Thay đổi mật khẩu"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xóa tài khoản"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xem sản phẩm"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Tìm kiếm sản phẩm"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Thêm vào yêu thích"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xem yêu thích"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xóa khỏi yêu thích"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Thêm sản phẩm (Chủ hàng)"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Sửa sản phẩm (Chủ hàng)"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xóa sản phẩm (Chủ hàng)"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xem đơn hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Tạo đơn hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Cập nhật đơn hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xóa đơn hàng"
    },
    {
        "domain": "Bán lẻ",
        "api_functionality": "Xem lịch sử đơn hàng"
    }
]

In [None]:
# all_combinations_df.to_dicts()

In [None]:
# with open('/content/API_testcase_v2.json') as f:
#     data = json.load(f)
# print(data)

In [None]:
import random

total_list = []

random.seed(0)
_id = 701

for row in test_data:
    domain = row["domain"]
    api_functionality = row["api_functionality"]
    for _ in range(25):
        combination = random.choice(all_combinations_df.to_dicts())
        _api_documentation_structure = combination["api_documentation_structure"]
        _api_detail_structure = combination["api_detail_structure"]
        _behaviour_rule_structure = combination["behaviour_rule_structure"]
        _data_test_structure = combination["data_test_structure"]
        _data_test_full_fill = combination["data_test_full_fill"]
        _biz_code_type = combination["biz_code_type"]
        _response_structure = combination["response_structure"]
        _api_documentation_num = random.randint(3, 5)
        _request_body_field_num = random.randint(3, 5)
        _behaviour_rule_num = random.randint(3, 5)
        _data_test_num = random.randint(3, 5)
        _language = "English"

        total_list.append({
            "id": _id,
            "domain": domain,
            "api_functionality": api_functionality,
            "api_documentation_structure": _api_documentation_structure,
            "api_detail_structure": _api_detail_structure,
            "behaviour_rule_structure": _behaviour_rule_structure,
            "data_test_structure": _data_test_structure,
            "data_test_full_fill": _data_test_full_fill,
            "biz_code_type": _biz_code_type,
            "response_structure": _response_structure,
            "api_documentation_num": _api_documentation_num,
            "request_body_field_num": _request_body_field_num,
            "behaviour_rule_num": _behaviour_rule_num,
            "data_test_num": _data_test_num,
            "language": _language
        })

        _id += 1

total_df = pl.DataFrame(total_list)
total_df.write_csv("/content/total_domain.csv")
total_df

id,domain,api_functionality,api_documentation_structure,api_detail_structure,behaviour_rule_structure,data_test_structure,data_test_full_fill,biz_code_type,response_structure,api_documentation_num,request_body_field_num,behaviour_rule_num,data_test_num,language
i64,str,str,str,str,str,str,str,str,str,i64,i64,i64,i64,str
701,"""Ngân hàng""","""Chuyển tiền""","""list""","""list""","""table""","""table""","""partial""","""number (1001)""","""Data nested within 'data'""",4,3,4,5,"""English"""
702,"""Ngân hàng""","""Chuyển tiền""","""list""","""plain text""","""table""","""table""","""empty""","""number (1001)""","""Flat data""",4,4,4,4,"""English"""
703,"""Ngân hàng""","""Chuyển tiền""","""plain text""","""table""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data""",3,5,3,4,"""English"""
704,"""Ngân hàng""","""Chuyển tiền""","""table""","""list""","""table""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,5,4,5,"""English"""
705,"""Ngân hàng""","""Chuyển tiền""","""plain text""","""list""","""list""","""table""","""full""","""number (1001)""","""Data nested within 'data'""",5,3,4,3,"""English"""
…,…,…,…,…,…,…,…,…,…,…,…,…,…,…
1396,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""plain text""","""plain text""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",5,5,5,3,"""English"""
1397,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""list""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data""",4,3,3,5,"""English"""
1398,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""table""","""list""","""partial""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,3,3,4,"""English"""
1399,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""list""","""plain text""","""table""","""list""","""full""","""number (1001)""","""Data nested within 'data'""",4,3,5,5,"""English"""


In [None]:
from itertools import batched

def get_instruction(_sys_instruct: str, row_data):
    domain = row_data["domain"]
    api_functionality = row_data["api_functionality"]
    api_documentation_structure = row_data["api_documentation_structure"]
    api_detail_structure = row_data["api_detail_structure"]
    behaviour_rule_structure = row_data["behaviour_rule_structure"]
    data_test_structure = row_data["data_test_structure"]
    data_test_full_fill = row_data["data_test_full_fill"]
    biz_code_type = row_data["biz_code_type"]
    response_structure = row_data["response_structure"]
    api_documentation_num = row_data["api_documentation_num"]
    request_body_field_num = row_data["request_body_field_num"]
    behaviour_rule_num = row_data["behaviour_rule_num"]
    data_test_num = row_data["data_test_num"]

    __sys_instruct = _sys_instruct.format(
        request_body_example=request_body_example,
        flat_data_example=flat_data_example,
        nested_data_example=nested_data_example,
        error_response_example=error_response_example,
        domain=domain,
        api_functionality=api_functionality,
        api_documentation_structure=api_documentation_structure,
        api_detail_structure=api_detail_structure,
        behaviour_rule_structure=behaviour_rule_structure,
        data_test_structure=data_test_structure,
        data_test_full_fill=data_test_full_fill,
        biz_code_type=biz_code_type,
        response_structure=response_structure,
        api_documentation_num=api_documentation_num,
        request_body_field_num=request_body_field_num,
        behaviour_rule_num=behaviour_rule_num,
        data_test_num=data_test_num
    )

    return __sys_instruct

def create_df_with_instruction(df: pl.DataFrame):
    instruction_df = pl.DataFrame({
        "instruction": [get_instruction(sys_instruct, row_data) for row_data in df.rows(named=True)]
    })
    return pl.concat([df, instruction_df], how="horizontal")

def get_inline_request_batches(df: pl.DataFrame, batch_size: int = 100):
    df = create_df_with_instruction(df)

    preprocessed_requests = [
        {
            'contents': [{
                'parts': [{'text': instruction}],
                'role': 'user'
            }],
            'config': {'temperature': 0.1}
        } for instruction in df["instruction"].to_list()
    ]

    return list(batched(preprocessed_requests, batch_size))

In [None]:
from pprint import pprint

for batch in get_inline_request_batches(total_df):
    pprint(batch)
    break

({'config': {'temperature': 0.1},
  'contents': [{'parts': [{'text': '\n'
                                   '**CẤU HÌNH**\n'
                                   '\n'
                                   '`[TÊN_DOMAIN]`: Ngân hàng\n'
                                   '`[GỢI_Ý_CHỨC_NĂNG_API]`: Chuyển tiền\n'
                                   '`[ĐỊNH_DẠNG_MÔ_TẢ_NGHIỆP_VỤ]`: list\n'
                                   '`[ĐỊNH_DẠNG_MÔ_TẢ_CHI_TIẾT_API]`: list\n'
                                   '`[ĐỊNH_DẠNG_QUY_TẮC_HÀNH_VI]`: table\n'
                                   '`[ĐỊNH_DẠNG_DỮ_LIỆU_KIỂM_THỬ]`: table\n'
                                   '`[SỐ_LƯỢNG_MỤC_MÔ_TẢ_NGHIỆP_VỤ]`: 4\n'
                                   '`[SỐ_LƯỢNG_TRƯỜNG_REQUEST_BODY]`: 3\n'
                                   '`[SỐ_LƯỢNG_QUY_TẮC_HÀNH_VI]`: 4\n'
                                   '`[SỐ_LƯỢNG_DỮ_LIỆU_KIỂM_THỬ]`: 5\n'
                                   '`[TÍNH_ĐẦY_ĐỦ_DỮ_LIỆU_CHO_KIỂM_THỬ]`: '
                  

In [None]:
from google.genai.types import BatchJob

def send_request(index, batch, client: Client) -> str|None:
    inline_batch_job = client.batches.create(
        model=f"models/{model_name}",
        src=batch,
        config={
            'display_name': f"inlined-requests-{i}",
        },
    )
    return inline_batch_job.name

def check_batch_status(batch_job_name: str, client: Client):
    batch_job = client.batches.get(name=batch_job_name)
    return batch_job.state.name

def get_inline_responses(batch_job_name: str, client: Client):
    inline_responses = []
    batch_job = client.batches.get(name=batch_job_name)
    if batch_job.dest and batch_job.dest.inlined_responses:
        for i, inline_response in enumerate(batch_job.dest.inlined_responses):
            if inline_response.response:
                # Accessing response, structure may vary.
                try:
                    inline_responses.append(inline_response.response.text)
                except AttributeError:
                    print(inline_response.response) # Fallback
                    inline_responses.append(None)
            elif inline_response.error:
                print(f"Error: {inline_response.error}")
                inline_responses.append(None)
    else:
        print("No results found (neither file nor inline).")
    return inline_responses



In [None]:
# from openai import OpenAI

# def get_response(api_key: str,
#                  row_data):
#     client = Client(api_key=api_key)

#     domain = row_data["domain"]
#     api_functionality = row_data["api_functionality"]
#     api_documentation_structure = row_data["api_documentation_structure"]
#     api_detail_structure = row_data["api_detail_structure"]
#     behaviour_rule_structure = row_data["behaviour_rule_structure"]
#     data_test_structure = row_data["data_test_structure"]
#     data_test_full_fill = row_data["data_test_full_fill"]
#     biz_code_type = row_data["biz_code_type"]
#     response_structure = row_data["response_structure"]
#     api_documentation_num = row_data["api_documentation_num"]
#     request_body_field_num = row_data["request_body_field_num"]
#     behaviour_rule_num = row_data["behaviour_rule_num"]
#     data_test_num = row_data["data_test_num"]

#     _sys_instruct = sys_instruct.format(
#         request_body_example=request_body_example,
#         flat_data_example=flat_data_example,
#         nested_data_example=nested_data_example,
#         error_response_example=error_response_example,
#         domain=domain,
#         api_functionality=api_functionality,
#         api_documentation_structure=api_documentation_structure,
#         api_detail_structure=api_detail_structure,
#         behaviour_rule_structure=behaviour_rule_structure,
#         data_test_structure=data_test_structure,
#         data_test_full_fill=data_test_full_fill,
#         biz_code_type=biz_code_type,
#         response_structure=response_structure,
#         api_documentation_num=api_documentation_num,
#         request_body_field_num=request_body_field_num,
#         behaviour_rule_num=behaviour_rule_num,
#         data_test_num=data_test_num
#     )
#     response = client.models.generate_content(
#         model=model_name,
#         config=types.GenerateContentConfig(
#             system_instruction=_sys_instruct,
#             # Moved max_output_tokens and temperature inside config
#             temperature=0.3
#         ),
#         contents=['']
#     )
#     return response.text

# # def get_response(api_key: str,
# #                  row_data):
# #     client = OpenAI(
# #         base_url="https://ai.megallm.io/v1",
# #         api_key=api_key
# #     )

# #     domain = row_data["domain"]
# #     api_functionality = row_data["api_functionality"]
# #     api_documentation_structure = row_data["api_documentation_structure"]
# #     api_detail_structure = row_data["api_detail_structure"]
# #     behaviour_rule_structure = row_data["behaviour_rule_structure"]
# #     data_test_structure = row_data["data_test_structure"]
# #     data_test_full_fill = row_data["data_test_full_fill"]
# #     biz_code_type = row_data["biz_code_type"]
# #     response_structure = row_data["response_structure"]
# #     api_documentation_num = row_data["api_documentation_num"]
# #     request_body_field_num = row_data["request_body_field_num"]
# #     behaviour_rule_num = row_data["behaviour_rule_num"]
# #     data_test_num = row_data["data_test_num"]

# #     _sys_instruct = sys_instruct.format(
# #         request_body_example=request_body_example,
# #         flat_data_example=flat_data_example,
# #         nested_data_example=nested_data_example,
# #         error_response_example=error_response_example,
# #         domain=domain,
# #         api_functionality=api_functionality,
# #         api_documentation_structure=api_documentation_structure,
# #         api_detail_structure=api_detail_structure,
# #         behaviour_rule_structure=behaviour_rule_structure,
# #         data_test_structure=data_test_structure,
# #         data_test_full_fill=data_test_full_fill,
# #         biz_code_type=biz_code_type,
# #         response_structure=response_structure,
# #         api_documentation_num=api_documentation_num,
# #         request_body_field_num=request_body_field_num,
# #         behaviour_rule_num=behaviour_rule_num,
# #         data_test_num=data_test_num
# #     )

# #     response = client.chat.completions.create(
# #         model="openai-gpt-oss-120b",
# #         temperature=0,
# #         messages=[
# #             {"role": "user", "content": _sys_instruct}
# #         ]
# #     )

# #     return response.choices[0].message.content

In [None]:
# from pprint import pprint

# def test_get_response():
#     api_key = current_key
#     row_data = total_df[0].to_dicts()[0]
#     response = get_response(api_key, row_data)
#     return response

In [None]:
# test_response = test_get_response()
# test_response

'*   Domain: **Ngân hàng**\n*   Chức năng: **Chuyển tiền**\n*   Mô tả: API này cho phép khách hàng thực hiện giao dịch chuyển tiền từ tài khoản của họ sang một tài khoản khác trong cùng hệ thống ngân hàng.\n\n---\n\n### MÔ TẢ NGHIỆP VỤ API\n\n| Thuộc tính | Mô tả |\n| :--- | :--- |\n| **Tên File** | BRD\\_Internal\\_Fund\\_Transfer\\_v2.1.docx |\n| **Tên API** | Tạo Giao dịch Chuyển khoản Nội bộ |\n| **Mục tiêu nghiệp vụ** | Cung cấp một phương thức an toàn và nhanh chóng để khách hàng chuyển tiền giữa các tài khoản thanh toán trong hệ thống, đáp ứng nhu cầu giao dịch hàng ngày. |\n| **Bối cảnh** | Người dùng đã được xác thực (authenticated) và phiên làm việc (session) còn hiệu lực. API được gọi khi người dùng xác nhận giao dịch trên ứng dụng Mobile Banking hoặc Internet Banking. |\n| **Điều kiện sau** | Giao dịch được ghi nhận vào hệ thống với trạng thái "Đang xử lý". Hệ thống sẽ thực hiện trừ tiền tài khoản nguồn và cộng tiền vào tài khoản đích. Một thông báo về giao dịch sẽ được gửi

In [None]:
# with open("/content/test_response.txt", "w") as f:
#     f.write(test_response)

In [None]:
# processed_list = []

# unprocessed_df = total_df.filter(~pl.col("id").is_in(processed_list))
# unprocessed_df

In [None]:
# --- Load final_data (CSV) ---
final_data_path = "/content/final_data.csv"
if os.path.exists(final_data_path):
    try:
        final_data_df = pl.read_csv(final_data_path)
        final_data = final_data_df.to_dicts() # Keep as list of dicts for easy appending
        processed_id = final_data_df.get_column('id').to_list()
        print(f"Loaded {len(final_data)} samples from {final_data_path}")
    except Exception as e:
        print(f"Error loading final_data.csv: {e}. Initializing empty list.")
        processed_id= []
else:
    final_data_df = total_df.clear()
    final_data_df = final_data_df.with_columns([
        pl.col("domain").alias("input")
    ])
    processed_id = []
    print(f"No sample found in {final_data_path}")

Loaded 100 samples from /content/final_data.csv


In [None]:
unprocessed_df = total_df.filter(~pl.col("id").is_in(processed_id))


unprocessed_df

id,domain,api_functionality,api_documentation_structure,api_detail_structure,behaviour_rule_structure,data_test_structure,data_test_full_fill,biz_code_type,response_structure,api_documentation_num,request_body_field_num,behaviour_rule_num,data_test_num,language
i64,str,str,str,str,str,str,str,str,str,i64,i64,i64,i64,str
801,"""Ngân hàng""","""Lịch sử giao dịch""","""list""","""list""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",4,3,5,3,"""English"""
802,"""Ngân hàng""","""Lịch sử giao dịch""","""plain text""","""plain text""","""list""","""table""","""full""","""number (1001)""","""Flat data""",3,5,3,3,"""English"""
803,"""Ngân hàng""","""Lịch sử giao dịch""","""table""","""plain text""","""table""","""table""","""partial""","""number (1001)""","""Data nested within 'data'""",4,4,4,5,"""English"""
804,"""Ngân hàng""","""Lịch sử giao dịch""","""plain text""","""plain text""","""list""","""list""","""full""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,3,5,4,"""English"""
805,"""Ngân hàng""","""Lịch sử giao dịch""","""table""","""list""","""list""","""table""","""full""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",5,4,5,5,"""English"""
…,…,…,…,…,…,…,…,…,…,…,…,…,…,…
1396,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""plain text""","""plain text""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",5,5,5,3,"""English"""
1397,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""list""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data""",4,3,3,5,"""English"""
1398,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""table""","""list""","""partial""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,3,3,4,"""English"""
1399,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""list""","""plain text""","""table""","""list""","""full""","""number (1001)""","""Data nested within 'data'""",4,3,5,5,"""English"""


In [None]:
from google.colab import files

batch_size = 100
batches = get_inline_request_batches(unprocessed_df, batch_size)

sleep_time = 120

client = Client(api_key=current_key)

try:
    for i, batch in tqdm(enumerate(batches), total=len(batches)):
        batch_job_name = send_request(i, list(batch), client)
        batch_job = client.batches.get(name=batch_job_name)

        completed_states = set([
            'JOB_STATE_SUCCEEDED',
            'JOB_STATE_FAILED',
            'JOB_STATE_CANCELLED',
            'JOB_STATE_EXPIRED',
        ])

        print(f"Polling status for job: {batch_job_name}")
        while check_batch_status(batch_job_name, client) not in completed_states:
            print(f"Current state: {check_batch_status(batch_job_name, client)} - Waiting for {sleep_time} seconds for the next polling.")
            time.sleep(sleep_time)

        print(f"Job finished with state: {check_batch_status(batch_job_name, client)}")
        if check_batch_status(batch_job_name, client) == 'JOB_STATE_FAILED':
            print(f"Error: {batch_job.error}")


        if check_batch_status(batch_job_name, client) == 'JOB_STATE_SUCCEEDED':
            responses = get_inline_responses(batch_job_name, client)
            responses_df = pl.DataFrame(
                {"input": responses}
            )
            responses_df = pl.concat([unprocessed_df[(i*batch_size):(i*batch_size+len(batch))], responses_df], how='horizontal')
            final_data_df = pl.concat([final_data_df, responses_df], how='vertical')
            final_data_df.write_csv("/content/final_data.csv")

        else:
            print(f"Job did not succeed. Final state: {batch_job.state.name}")
            if batch_job.error:
                print(f"Error: {batch_job.error}")
except Exception as e:
    print(f"Error: {e}")
finally:
    files.download("/content/final_data.csv")

  0%|          | 0/6 [00:00<?, ?it/s]

Polling status for job: batches/176ziomr400cj2rye5ynist1su7sma2a87sy
Current state: JOB_STATE_PENDING - Waiting for 120 seconds for the next polling.
Current state: JOB_STATE_RUNNING - Waiting for 120 seconds for the next polling.
Current state: JOB_STATE_RUNNING - Waiting for 120 seconds for the next polling.
Job finished with state: JOB_STATE_SUCCEEDED
Polling status for job: batches/9dby1wfx5cnaadvkxpeunms5nwyz1zpcbrvf
Current state: JOB_STATE_PENDING - Waiting for 120 seconds for the next polling.
Current state: JOB_STATE_RUNNING - Waiting for 120 seconds for the next polling.
Job finished with state: JOB_STATE_SUCCEEDED
Polling status for job: batches/ou2737eat54wv4bothpzva4ndt6qd1yt07jg
Current state: JOB_STATE_PENDING - Waiting for 120 seconds for the next polling.
Current state: JOB_STATE_PENDING - Waiting for 120 seconds for the next polling.
Job finished with state: JOB_STATE_SUCCEEDED
Polling status for job: batches/vudbkr5lk765rwksum998w2ba1a1e7papuji
Current state: JOB_STA

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

In [None]:
final_data_df

id,domain,api_functionality,api_documentation_structure,api_detail_structure,behaviour_rule_structure,data_test_structure,data_test_full_fill,biz_code_type,response_structure,api_documentation_num,request_body_field_num,behaviour_rule_num,data_test_num,language,input
i64,str,str,str,str,str,str,str,str,str,i64,i64,i64,i64,str,str
701,"""Ngân hàng""","""Chuyển tiền""","""list""","""list""","""table""","""table""","""partial""","""number (1001)""","""Data nested within 'data'""",4,3,4,5,"""English""","""Domain: Banking Function: Mone…"
702,"""Ngân hàng""","""Chuyển tiền""","""list""","""plain text""","""table""","""table""","""empty""","""number (1001)""","""Flat data""",4,4,4,4,"""English""","""Domain: Ngân hàng Function: Ch…"
703,"""Ngân hàng""","""Chuyển tiền""","""plain text""","""table""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data""",3,5,3,4,"""English""","""Domain: **Ngân hàng** Function…"
704,"""Ngân hàng""","""Chuyển tiền""","""table""","""list""","""table""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,5,4,5,"""English""","""Domain: **Ngân hàng** Function…"
705,"""Ngân hàng""","""Chuyển tiền""","""plain text""","""list""","""list""","""table""","""full""","""number (1001)""","""Data nested within 'data'""",5,3,4,3,"""English""","""Domain: **Ngân hàng** Function…"
…,…,…,…,…,…,…,…,…,…,…,…,…,…,…,…
1396,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""plain text""","""plain text""","""table""","""table""","""empty""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",5,5,5,3,"""English""","""Domain: **Bán lẻ** Function: *…"
1397,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""list""","""list""","""empty""","""string (E_INVALID_AMOUNT)""","""Flat data""",4,3,3,5,"""English""","""Domain: Bán lẻ Function: Xem l…"
1398,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""table""","""list""","""partial""","""string (E_INVALID_AMOUNT)""","""Data nested within 'data'""",3,3,3,4,"""English""","""Domain: **Retail** Function: *…"
1399,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""list""","""plain text""","""table""","""list""","""full""","""number (1001)""","""Data nested within 'data'""",4,3,5,5,"""English""","""* Domain: **Bán lẻ** * Fun…"


In [None]:
replace_dict = {
    "Ngân hàng": "Banking",
    "Bán lẻ": "Retail",
    "Chuyển tiền": "Money Transfer",
    "Thanh toán": "Payment",
    "Nạp tiền": "Deposit",
    "Rút tiền": "Withdraw",
    "Lịch sử giao dịch": "Transaction History",
    "Xem giỏ hàng": "View Cart",
    "Thêm vào giỏ hàng": "Add to Cart",
    "Đặt lại mật khẩu": "Reset Password",
    "Đăng ký tài khoản": "Sign Up",
    "Đăng nhập": "Login",
    "Quên mật khẩu": "Forgot Password",
    "Thay đổi mật khẩu": "Change Password",
    "Xóa tài khoản": "Delete Account",
    "Xem sản phẩm": "View Product",
    "Tìm kiếm sản phẩm": "Search Product",
    "Thêm vào yêu thích": "Add to Wishlist",
    "Xem yêu thích": "View Wishlist",
    "Xóa khỏi yêu thích": "Remove from Wishlist",
    "Thêm sản phẩm (Chủ hàng)": "Add Product (Owner)",
    "Sửa sản phẩm (Chủ hàng)": "Edit Product (Owner)",
    "Xóa sản phẩm (Chủ hàng)": "Delete Product",
    "Xem đơn hàng": "View Order",
    "Tạo đơn hàng": "Create Order",
    "Cập nhật đơn hàng": "Update Order",
    "Xóa đơn hàng": "Delete Order",
    "Xem lịch sử đơn hàng": "View Order History"
}

input_list: list[str] = final_data_df.get_column('input').to_list()
processed_input_list = []
for item in input_list:
    current_item = item
    for key, value in replace_dict.items():
        current_item = current_item.replace(key, value)
    processed_input_list.append(current_item)
processed_input_list_df = pl.DataFrame(
    {"input": processed_input_list}
)
final_data_df = final_data_df.drop("input")
final_data_df = pl.concat([final_data_df, processed_input_list_df], how='horizontal')
final_data_df.write_csv("/content/final_data.csv")
final_data_df[-1]

id,domain,api_functionality,api_documentation_structure,api_detail_structure,behaviour_rule_structure,data_test_structure,data_test_full_fill,biz_code_type,response_structure,api_documentation_num,request_body_field_num,behaviour_rule_num,data_test_num,language,input
i64,str,str,str,str,str,str,str,str,str,i64,i64,i64,i64,str,str
1400,"""Bán lẻ""","""Xem lịch sử đơn hàng""","""table""","""plain text""","""list""","""list""","""partial""","""string (E_INVALID_AMOUNT)""","""Flat data""",3,3,3,5,"""English""","""Domain: Retail Function: View …"


In [None]:
sample_list = ['*   Domain: **Bán lẻ**\n*   Function: **Xem lịch sử đơn hàng**\n*   Description: This API allows an authenticated customer to retrieve a paginated list of their past orders.\n\n---\n\n### API BUSINESS DESCRIPTION\n\n*   **File Name**: BRD_CustomerPortal_v3.1.docx\n*   **API Name**: GetCustomerOrderHistory\n*   **Business Goal**: To provide customers with a self-service option to view their complete order history, including essential details like order date, status, and total amount. This enhances customer satisfaction and reduces the load on customer support channels.\n*   **Context**: The user must be authenticated via a valid session token. The API will automatically fetch orders associated with the authenticated user\'s account.\n\n### API DETAILED DESCRIPTION\n\n**File Name**: API_Specification_Retail_v1.5.pdf\n**HTTP Method**: GET\n**Endpoint**: /api/v1/orders\n\n**Input Requirements (Request Query Parameters):**\n\n| Field | Data Type | Required | Constraints |\n|---|---|---|---|\n| `page` | Integer | NO | Must be a positive integer. Default is 1. |\n| `pageSize` | Integer | NO | Must be a positive integer. Max value is 100. Default is 10. |\n| `status` | String | NO | Must be one of: \'PENDING\', \'PROCESSING\', \'SHIPPED\', \'DELIVERED\', \'CANCELLED\'. |\n\n**Success Response (200 OK):**\n\n```json\n{\n  "code": "0000",\n  "message": "Order history retrieved successfully.",\n  "data": {\n    "pagination": {\n      "page": 1,\n      "pageSize": 10,\n      "totalItems": 1,\n      "totalPages": 1\n    },\n    "orders": [\n      {\n        "orderId": "ORD-20240521-98765",\n        "orderDate": "2024-05-21T10:30:00Z",\n        "status": "DELIVERED",\n        "totalAmount": 2550.75,\n        "currency": "USD"\n      }\n    ]\n  }\n}\n```\n\n**Error Response (4xx/5xx):**\n\n```json\n{\n  "code": "1001",\n  "message": "Invalid pagination parameters.",\n  "details": "The \'page\' parameter must be a positive integer."\n}\n```\n\n### BEHAVIOR RULES\n\n| Rule | Description | HTTP Code | Biz Code | Expected Result |\n|---|---|---|---|---|\n| 1 (Happy Path) | An authenticated user requests their order history with valid parameters and has existing orders. | 200 | 0000 | A paginated list of orders is returned in the response body. |\n| 2 (Happy Path) | An authenticated user requests their order history but has no previous orders. | 200 | 0000 | An empty \'orders\' array is returned with pagination details showing zero total items. |\n| 3 (Validation) | The request contains an invalid `page` or `pageSize` value (e.g., zero, negative, non-integer). | 400 | 1001 | The API returns a Bad Request error with a message indicating invalid pagination. |\n| 4 (Validation) | The request includes a `status` filter with a value that is not in the allowed set. | 400 | 1002 | The API returns a Bad Request error with a message indicating the invalid status value. |\n| 5 (Authentication) | The request is made without a valid authentication token. | 401 | 9001 | The API returns an Unauthorized error, denying access to the resource. |\n\n### TEST DATA\n\n*   **Test Case 1: Successful retrieval of order history**\n    *   **User Context**: Authenticated as `user_123` who has multiple past orders.\n    *   **Request**: `GET /api/v1/orders?page=1&pageSize=10`\n    *   **Expected Behavior**: Corresponds to Rule #1. The system returns HTTP 200 with the first page of 10 orders for `user_123`.\n\n*   **Test Case 2: Retrieval for a user with no orders**\n    *   **User Context**: Authenticated as `user_456` who has never placed an order.\n    *   **Request**: `GET /api/v1/orders?page=1&pageSize=10`\n    *   **Expected Behavior**: Corresponds to Rule #2. The system returns HTTP 200 with an empty `orders` array and `totalItems: 0`.\n\n*   **Test Case 3: Request with invalid pagination parameters**\n    *   **User Context**: Authenticated as `user_123`.\n    *   **Request**: `GET /api/v1/orders?page=0&pageSize=20`\n    *   **Expected Behavior**: Corresponds to Rule #3. The system returns HTTP 400 with Biz Code `1001`.\n\n*   **Test Case 4: Request with an unsupported status filter**\n    *   **User Context**: Authenticated as `user_123`.\n    *   **Request**: `GET /api/v1/orders?status=RETURNED&page=1`\n    *   **Expected Behavior**: Corresponds to Rule #4. The system returns HTTP 400 with Biz Code `1002`.\n\n*   **Test Case 5: Request without authentication**\n    *   **User Context**: No authentication token provided.\n    *   **Request**: `GET /api/v1/orders`\n    *   **Expected Behavior**: Corresponds to Rule #5. The system returns HTTP 401 with Biz Code `9001`.','Domain: Bán lẻ\nFunction: Xem lịch sử đơn hàng\nDescription: This API allows an authenticated customer to retrieve their past order history, with options for filtering and pagination.\n\n---\n\n### API BUSINESS DESCRIPTION\n\n| Item | Description |\n|---|---|\n| **API Name** | Get Order History |\n| **Business Goal** | To allow authenticated customers to retrieve a list of their past orders, enabling them to track purchases, review order details, and manage their shopping activities. |\n| **Context** | The user must be logged in and authenticated. The request must include a valid session token to identify the customer whose order history is being requested. |\n\n### API DETAILED DESCRIPTION\n\n**File Name:** API_Specification_Retail_v1.0.pdf\n**HTTP Method:** GET\n**Endpoint:** /api/v1/orders/history\n\n**Input Requirements (Query Parameters):**\n\n| Field | Data Type | Required | Constraints |\n|---|---|---|---|\n| `page` | Integer | NO | Must be a positive integer. Defaults to 1. |\n| `pageSize` | Integer | NO | Must be between 1 and 100. Defaults to 10. |\n| `status` | String | NO | Allowed values: \'COMPLETED\', \'SHIPPING\', \'CANCELLED\'. |\n\n**Success Response (200 OK):**\n```json\n[\n  {\n    "orderId": "ORD-20240520-001",\n    "orderDate": "2024-05-20T10:30:00Z",\n    "totalAmount": 150.75,\n    "currency": "USD",\n    "status": "COMPLETED"\n  },\n  {\n    "orderId": "ORD-20240518-005",\n    "orderDate": "2024-05-18T15:00:00Z",\n    "totalAmount": 89.99,\n    "currency": "USD",\n    "status": "SHIPPING"\n  }\n]\n```\n\n**Error Response (4xx/5xx):**\n```json\n{\n  "code": "E_VALIDATION_ERROR",\n  "message": "Invalid parameter provided.",\n  "details": "pageSize must be a positive integer."\n}\n```\n\n### BEHAVIOR RULES\n\n*   **Rule 1 (Happy Path):** A user with a valid session token requests their order history without any query parameters.\n    *   **Expected Result:** HTTP 200 (OK). The response body contains the first 10 orders for that user, sorted by the most recent `orderDate`.\n*   **Rule 2 (Validation):** A user requests their order history with an invalid `pageSize` value (e.g., 0 or "abc").\n    *   **Expected Result on Violation:** HTTP 400 (Bad Request). The response body contains the business code `E_INVALID_PAGESIZE`.\n*   **Rule 3 (Business Logic):** A newly registered user who has not placed any orders requests their order history.\n    *   **Expected Result:** HTTP 200 (OK). The response body is an empty array `[]`.\n\n### TEST DATA\n\n*   Order `ORD-20240915-001`: status=\'COMPLETED\', orderDate=\'2024-09-15T11:00:00Z\', totalAmount=250.00\n*   Order `ORD-20240912-003`: status=\'SHIPPING\', orderDate=\'2024-09-12T18:20:00Z\', totalAmount=75.50\n*   Order `ORD-20240910-002`: status=\'CANCELLED\', orderDate=\'2024-09-10T09:05:00Z\', totalAmount=120.00\n*   Order `ORD-20240825-007`: status=\'COMPLETED\', orderDate=\'2024-08-25T14:45:00Z\', totalAmount=49.99\n*   User `customer_456`: A new user with no order history.']
for item in sample_list:
    for key, value in replace_dict.items():
        item = item.replace(key, value)
sample_list

Bán lẻ
Xem lịch sử đơn hàng
Bán lẻ
Xem lịch sử đơn hàng


['*   Domain: **Bán lẻ**\n*   Function: **Xem lịch sử đơn hàng**\n*   Description: This API allows an authenticated customer to retrieve a paginated list of their past orders.\n\n---\n\n### API BUSINESS DESCRIPTION\n\n*   **File Name**: BRD_CustomerPortal_v3.1.docx\n*   **API Name**: GetCustomerOrderHistory\n*   **Business Goal**: To provide customers with a self-service option to view their complete order history, including essential details like order date, status, and total amount. This enhances customer satisfaction and reduces the load on customer support channels.\n*   **Context**: The user must be authenticated via a valid session token. The API will automatically fetch orders associated with the authenticated user\'s account.\n\n### API DETAILED DESCRIPTION\n\n**File Name**: API_Specification_Retail_v1.5.pdf\n**HTTP Method**: GET\n**Endpoint**: /api/v1/orders\n\n**Input Requirements (Request Query Parameters):**\n\n| Field | Data Type | Required | Constraints |\n|---|---|---|--

In [None]:
str.replace

In [None]:
final_data_df