```markdown
# Summary TASKS - README

## Overview
This Jupyter Notebook is designed to generate detailed communication scenarios for various job positions. The scenarios are created using OpenAI's GPT model and are structured to reflect real-world communication challenges in different professional roles.

## Workflow
1. **Import Necessary Libraries**: Import essential libraries such as `os`, `openai`, `json`, `pandas`, and `typing.List`.
2. **Define Functions**:
    - `get_completion(prompt, model="gpt-4o", temperature=0)`: Generates a response from the GPT model based on the provided prompt.
    - `gen_situation_groups_AND_situation_SHORTVER2(job_position)`: Creates communication situation groups for a given job position.
    - `gen_detail_situations_SHORTVER_aigender(job_position, situation_group_name, situation, ai_gender)`: Generates detailed communication scenarios for a specific situation within a group.
    - `gen_situation_group_AND_detail_situation(job_position: str) -> pd.DataFrame`: Combines the above functions to generate detailed scenarios and returns a DataFrame.
    - `generate_multi_job_situations(job_positions: List[str], filename_output: str) -> str`: Generates scenarios for multiple job positions and saves them to an Excel file.

3. **Job Positions**: A list of job positions is defined, including roles such as Student, Accountant, Software Engineer, Sales Manager, Teacher, etc.

4. **Execution**: The notebook is designed to generate scenarios for subsets of job positions, allowing for parallel processing and easier verification of outputs.

## Usage
- **Single Job Position**: Use the function `gen_situation_group_AND_detail_situation(job_position)` to generate scenarios for a single job position.
- **Multiple Job Positions**: Use the function `generate_multi_job_situations(job_positions, filename_output)` to generate scenarios for multiple job positions and save them to an Excel file.

## Output
- The output is an Excel file with each job position having its own sheet. Each sheet contains detailed communication scenarios, including the situation name, details, characters involved, AI gender, AI greeting, and a list of questions asked by the AI.

## Notes
- The notebook includes print statements to monitor progress and verify the correctness of the generated data.
- The job positions are processed in smaller subsets to facilitate parallel processing and easier verification of outputs.

## Example
To generate scenarios for the job position "Teacher Assistant, Teaching Related (Trợ giảng, Giáo vụ)" and save them to an Excel file:

```python
job_positions = ["Teacher Assistant, Teaching Rel"]
excel_file = generate_multi_job_situations(job_positions, "Teacher_Assistant.xlsx")
print(f"Final Excel file: {excel_file}")
```
```

In [1]:
import os
from openai import OpenAI
import json
import pandas as pd
from typing import List

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def get_completion(prompt, model="gpt-4o", temperature=0):
    messages = [{"role": "user", "content": prompt}]
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature, # this is the degree of randomness of the model's output
    )
    return response.choices[0].message.content

def gen_situation_groups_AND_situation_SHORTVER2(job_position):
    prompt = f"""
    Bạn là chuyên gia về giao tiếp trong môi trường làm việc, đặc biệt là trong lĩnh vực bán hàng.
    
    Nhiệm vụ: Tạo ra 7 nhóm tình huống GIAO TIẾP liên quan đến vị trí công việc "{job_position}",
    bao gồm cả khía cạnh chuyên môn và cá nhân.

    Hướng dẫn:
    1. Yêu cầu bắt buộc về các tình huống 
      - Đúng thể loại: TÌNH HUỐNG GIAO TIẾP 
    2. Các nhóm tình huống GIAO TIẾP: phải bằng tiếng Việt, ngắn gọn, và xoay quanh vị trí công việc của "{job_position}".
    3. Mỗi nhóm tình huống có 7 tình huống cụ thể hơn, nhưng vẫn ngắn gọn, và đảm bảo:
      - Tính tương tác cao: Tập trung vào các tình huống GIAO TIẾP TRỰC TIẾP: gặp mặt trực tiếp, cuộc gọi thoại, video call, <<Tuyệt đối không gồm tình huống "GIAO TIẾP QUA EMAIL">>
      - Tính ứng dụng thực tế: Phản ánh thực tế công việc, sử dụng ngôn ngữ gần gũi và dễ hiểu , kết hợp với thuật ngữ chuyên ngành của vị trí {job_position}.
      - Tính tình huống và kỹ năng xử lý: Tạo ra các tình huống thách thức, đa chiều và phức tạp, đòi hỏi sự kết hợp nhiều kỹ năng, đảm bảo cân đối để bao quát toàn diện công việc.
      - Tính cụ thể: Thêm chi tiết cụ thể hoặc bối cảnh để làm sống động tình huống GIAO TIẾP ở vị trí {job_position}.
      - Yếu tố văn hóa: Bao gồm tình huống liên quan đến giao tiếp đa văn hóa khi làm việc với khách hàng hoặc đối tác quốc tế.
      - Cập nhật xu hướng mới: Đưa vào các xu hướng mới nhất trong công việc và ngành của vị trí {job_position}, tạo ra các tình huống sáng tạo và thử thách để phát triển kỹ năng toàn diện.

    3'. Gợi ý các nhóm tình huống (không giới hạn ở các gợi ý này): <<Tuyệt đối không gồm tình huống "GIAO TIẾP QUA EMAIL">>
    - Tương tác với đồng nghiệp
    - Báo cáo và đề xuất với cấp trên
    - Hỗ trợ và chăm sóc khách hàng
    - Đàm phán và thỏa thuận
    - Quản lý khủng hoảng và xử lý tình huống khó
    - Đào tạo và phát triển bản thân/đồng nghiệp
    - Tham gia hội nghị và sự kiện ngành
    - Xây dựng mạng lưới quan hệ
    - Áp dụng công nghệ mới trong bán hàng
    - Thích ứng với thay đổi thị trường
    - Đánh giá hiệu suất và đề xuất cải tiến
    - Tuyển dụng và phỏng vấn
    - Quảng bá và marketing, Đảm bảo chất lượng, Phát triển sản phẩm, Quản lý tài chính

    Trả về một đối tượng JSON có cấu trúc sau:
    {{
      "job_position": "{job_position}",
      "situation_groups": {{
        "situation_group1": {{
          "situation_group_name": "Tên nhóm tình huống 1",
          "situation1": "Tình huống 1",
          "situation2": "Tình huống 2",
          "situation3": "Tình huống 3", 
          "situation4": "Tình huống 4", 
          "situation5": "Tình huống 5", 
          "situation6": "Tình huống 6", 
          "situation7": "Tình huống 7"
          ...
        }},
        "situation_group2": {{
          "situation_group_name": "Tên nhóm tình huống 2",
          "situation1": "Tình huống 1",
          "situation2": "Tình huống 2"
          ...
          <5-7 situation>
        }},
        ...
      }}
    }}


    Example 
      {{
        "job_position": "Đại diện bán hàng (sales representative)",
        "situation_groups": [
          {{
            "situation_group_name": "Hỗ trợ khách hàng",
            "situation1": "Giải đáp thắc mắc của khách hàng về sản phẩm.",
            "situation2": "Xử lý khiếu nại của khách hàng một cách chuyên nghiệp.",
            "situation3": "Hướng dẫn khách hàng sử dụng sản phẩm mới.",
            "situation4": "Theo dõi và đảm bảo khách hàng hài lòng sau khi mua hàng.",
            "situation5": "Đề xuất giải pháp phù hợp với nhu cầu của khách hàng.",
            "situation6": "Gửi thông tin khuyến mãi và ưu đãi đặc biệt cho khách hàng.",
            "situation7": "Tạo mối quan hệ lâu dài với khách hàng qua các cuộc gọi chăm sóc định kỳ."
          }},
          {{
            "situation_group_name": "Kỹ năng bán hàng",
            "situation1": "Thuyết phục khách hàng mua sản phẩm.",
            "situation2": "Giới thiệu sản phẩm một cách hấp dẫn và thuyết phục.",
            "situation3": "Đàm phán giá cả và điều kiện bán hàng.",
            "situation4": "Xây dựng chiến lược bán hàng hiệu quả.",
            "situation5": "Nắm bắt và phân tích nhu cầu của khách hàng.",
            "situation6": "Đưa ra các giải pháp sáng tạo để tăng doanh số.",
            "situation7": "Theo dõi và đánh giá kết quả bán hàng."
          }}
        ]
      }}

    Đảm bảo đầu ra là một đối tượng JSON hợp lệ không có bất kỳ định dạng hoặc từ khóa bổ sung nào(chẳng hạn ```json).
    """

    # Assuming you have a function called get_completion to generate the response
    response = get_completion(prompt)
    
    # Parse the JSON response
    try:
        topics_dict = json.loads(response)
        return json.dumps(topics_dict, ensure_ascii=False, indent=2)
    except json.JSONDecodeError:
        print("Error: The generated response is not valid JSON. Please check the output.")
        return None



def gen_detail_situations_SHORTVER_aigender(job_position, situation_group_name, situation, ai_gender):
    """
    
    Truyền trực tiếp giới tính AI 
    """
    prompt = f"""
    Bạn là chuyên gia về phát triển nghề nghiệp và tình huống công việc cho vị trí {job_position}.
    
    Nhiệm vụ: Tạo ra chi tiết cho tình huống GIAO TIẾP "{situation}" liên quan đến chủ đề "{situation_group_name}" cho vị trí {job_position}.
    
    Hướng dẫn:
    1. Các đặc điểm của 1 tình huống 
      - Tính tương tác cao: Tập trung vào các tình huống giao tiếp trực tiếp như cuộc gọi điện thoại, video call, hoặc gặp mặt trực tiếp <<tuyệt đối không gồm việc gửi email>>.
      - Tính ứng dụng thực tế: Phản ánh thực tế công việc, sử dụng ngôn ngữ gần gũi và dễ hiểu , kết hợp với thuật ngữ chuyên ngành của vị trí {job_position}.
      - Tính tình huống và kỹ năng xử lý: Tạo ra các tình huống thách thức, đa chiều và phức tạp, đòi hỏi sự kết hợp nhiều kỹ năng, đảm bảo cân đối để bao quát toàn diện công việc.
      - Tính cụ thể: Thêm chi tiết cụ thể hoặc bối cảnh để làm sống động tình huống GIAO TIẾP ở vị trí {job_position}.
      - Yếu tố văn hóa: Bao gồm tình huống liên quan đến giao tiếp đa văn hóa khi làm việc với khách hàng hoặc đối tác quốc tế.
      - Cập nhật xu hướng mới: Đưa vào các xu hướng mới nhất trong công việc và ngành của vị trí {job_position}, tạo ra các tình huống sáng tạo và thử thách để phát triển kỹ năng toàn diện.

    2. Chi tiết tình huống phải bao gồm:
       - Tên tình huống (tiếng Việt): {situation}
       - Chi tiết tình huống GIAO TIẾP (tiếng Việt): Mô tả chi tiết bối cảnh, các bên liên quan, và vấn đề cụ thể cần giải quyết. Đảm bảo tình huống đủ phức tạp để tạo ra thử thách thực tế cho vị trí {job_position}. 
       - Nhân vật của tôi (character_me) (tiếng Việt): Mô tả ngắn gọn trong 25 ký tự hoặc ít hơn, phản ánh vị trí {job_position}.
       - Nhân vật AI (character_ai) (tiếng Việt): Mô tả ngắn gọn trong 25 ký tự hoặc ít hơn, phù hợp với tình huống và vị trí {job_position}.
       - Giới tính của AI: {ai_gender}
       - Danh sách 7 câu hỏi DO NHÂN VẬT AI HỎI liên quan đến tình huống (bằng tiếng Anh): Đảm bảo các câu hỏi đa dạng, từ cơ bản đến phức tạp, và bao quát nhiều khía cạnh của tình huống liên quan đến vị trí {job_position}.
       - Lời chào của AI (bằng tiếng Anh): Bao gồm thông tin cá nhân, chào hỏi cơ bản, nêu rõ bối cảnh tình huống và BẮT BUỘC SẼ HỎI LUÔN "Câu hỏi 1" từ danh sách 7 câu hỏi bên trên <bắt buộc có câu hỏi 1 nhé>.

    Trả về một đối tượng JSON với cấu trúc sau:
    {{
      "job_position": "{job_position}",
      "situation_group_name": "{situation_group_name}",
      "situation": {{
        "situation_name": "{situation}",
        "situation_details": "Chi tiết tình huống",
        "character_me": "Vai trò của người dùng",
        "character_ai": "Vai trò của AI",
        "ai_gender": "{ai_gender}",
        "AI_greeting": "Lời chào của AI bằng tiếng Anh",
        "questions_list": [
          "Câu hỏi 1",
          "Câu hỏi 2",
          "Câu hỏi 3",
          "Câu hỏi 4",
          "Câu hỏi 5",
          "Câu hỏi 6",
          "Câu hỏi 7"
        ]
      }}
    }}
    
    Đảm bảo đầu ra là một đối tượng JSON hợp lệ không có bất kỳ định dạng hoặc từ khóa bổ sung nào.

    

    """

    print(f"Generating details for situation: {situation}")
    response = get_completion(prompt)
    
    try:
        situation_dict = json.loads(response)
        return json.dumps(situation_dict, ensure_ascii=False, indent=2)
    except json.JSONDecodeError:
        print("Error: The generated response is not valid JSON. Please check the output.")
        return None


In [2]:
import json
import pandas as pd

def gen_situation_group_AND_detail_situation(job_position: str) -> pd.DataFrame:
    """
    - (1 tham số duy nhất)
    - Output: Trả về Output 1 file excel với các cột 
        CÔNG VIỆC	TOPIC	TÊN TÌNH HUỐNG	CHI TIẾT TÌNH HUỐNG	NHÂN VẬT TÔI	NHÂN VẬT AI	Giới tính AI 	Câu mở đầu của AI	"LIST CÂU HỎI do AI hỏi"
    - Thêm các print để kiểm tra tiến độ và fix được lỗi (các print quan trọng, vừa đủ, không quá thừa)

    Output: Vừa có print ra console vừa có output là file excel, return nên là định dạng dễ sử dụng về sau (ĐÓ LÀ: DUYỆT TỪNG job_position ở đâu đó, sử dụng cái hàm gen_situation_group_AND_detail_situation(job_position) để tạo hàng loạt cho job_position, sau đó output gộp lại được thành 1 file với mỗi job_position là 1 sheet)
    - Sau khi tạo các nhóm tình huống, hãy in ra các nhóm tình huống đó trước đã nhé 
    - Tức là thêm các index ở đầu lúc lưu data từng câu hỏi ở cột "LIST CÂU HỎI do AI hỏi"
    - Làm sao để check được data in ra đúng chưa, thay vì phải đợi chạy xong toàn bộ => In ra dữ liệu từng tình huống để kiểm tra
    """
    # Bắt đầu quá trình với vị trí công việc được cung cấp
    print(f"Starting process for job position: {job_position}")
    
    # Bước 1: Tạo nhóm tình huống
    situation_groups_json = gen_situation_groups_AND_situation_SHORTVER2(job_position)
    print(situation_groups_json) # In các nhóm tình huống tạo được
    situation_groups = json.loads(situation_groups_json)
    
    # Sau khi tạo các nhóm tình huống, hãy in ra các nhóm tình huống đó trước đã nhé 
    
    print("\nGenerated Situation Groups:")
    for group_key, group in situation_groups["situation_groups"].items():
        print(f"Group: {group['situation_group_name']}")
        for situation_key, situation_value in group.items():
            if situation_key.startswith("situation") and situation_key != "situation_group_name":
                print(f"  - Situation: {situation_value}")

    # Bước 2: Tạo chi tiết tình huống cho từng nhóm và tình huống
    data = []
    processed_situations = set()  # Để theo dõi các tình huống đã xử lý
    situation_number = 1  # Thêm biến đếm này ĐỂ GEN GIỚI TÍNH
    print(f"Tạo tình huống số {situation_number}")

    # Duyệt qua các nhóm tình huống
    for group_key, group in situation_groups["situation_groups"].items():
        print(f"Processing group: {group['situation_group_name']}")
        # Duyệt qua từng tình huống trong nhóm
        for situation_key, situation_value in group.items():
            # Kiểm tra nếu key bắt đầu với "situation" và tình huống chưa được xử lý
            if situation_key.startswith("situation") and situation_key != "situation_group_name" and situation_value not in processed_situations:
                print(f"Generating details for : {situation_value}")
                # Gọi hàm để tạo chi tiết tình huống
                ai_gender = 'Nữ' if situation_number % 2 != 0 else 'Nam' # Tạo giới tính AI FIX CỨNG NHƯ NÀY ĐỂ TẠO CÂN BẰNG GIỚI

                detailed_situation_json = gen_detail_situations_SHORTVER_aigender(
                    job_position, 
                    group["situation_group_name"], 
                    situation_value, 
                    ai_gender
                )
                detailed_situation = json.loads(detailed_situation_json)
                
                # Lấy dữ liệu chi tiết từ tình huống
                situation_data = detailed_situation["situation"]
                
                # Thêm dữ liệu vào danh sách
                questions_list = situation_data["questions_list"]
                indexed_questions_list = [f"{i+1}. {question}" for i, question in enumerate(questions_list)]
                
                situation_dict = {
                    "CÔNG VIỆC": job_position,
                    "TOPIC": group["situation_group_name"],
                    "TÊN TÌNH HUỐNG": situation_data["situation_name"],
                    "CHI TIẾT TÌNH HUỐNG": situation_data["situation_details"],
                    "NHÂN VẬT TÔI": situation_data["character_me"],
                    "NHÂN VẬT AI": situation_data["character_ai"],
                    "Giới tính AI": situation_data["ai_gender"],
                    "Câu mở đầu của AI": situation_data["AI_greeting"],
                    "LIST CÂU HỎI do AI hỏi": "\n".join(indexed_questions_list)
                }
                
                # Làm sao để check được data in ra đúng chưa, thay vì phải đợi chạy xong toàn bộ => In ra dữ liệu từng tình huống để kiểm tra
                # In ra dữ liệu của tình huống để kiểm tra
                print("\nGenerated Detailed Situation Data:")
                for key, value in situation_dict.items():
                    print(f"{key}: {value}")
                
                data.append(situation_dict)
                
                # Đánh dấu tình huống này đã được xử lý
                processed_situations.add(situation_value)
                situation_number += 1  # Tăng số thứ tự lên sau mỗi tình huống, CHỈ ĐỂ KIỂM SOÁT GIỚI TÍNH AI
                

    # Tạo DataFrame từ danh sách dữ liệu
    df = pd.DataFrame(data)
    print(f"Completed processing for job position: {job_position}")
    print(f"Total situations generated: {len(df)}")
    return df




```
các nhóm công việc sau
Student/Sinh viên: 9.23%
Accountant/Kế toán: 8.46%
IT/Developer/Software Engineer/Engineer/Kỹ sư: 14.62%
Construction/Contruction Engineer: 1.54%"
Sales/Sale Manager: 6.92%
Marketing: 3.08%
"Teacher/Giáo viên: 6.15%
Teacher Assistant/Teaching Related: 2.31%"
Manager/Quản lý: 5.38%
Logistics: 4.62%
"Doctor/Bác sĩ: 3.08%
Pharmacist/Dược sĩ: 2.31%"
Freelancer: 3.08%
HR/Human Resources: 3.08%
Project Manager: 2.31%
Business: 2.31%
Customer Service: 1.54%
Designer: 1.54%
Business Analyst: 1.54%
```

- 5-6 phút/1 job_position => 120 phút. 
- Thay vì 1 phát 20 jobs => Chia nhỏ. 
1. Chia nhỏ để chạy song song nhiều nơi 
2. Chia nhỏ để check được output từng phần trong quá trình đợi gen tiếp các mẻ. <Thay vì xong hết rồi mới check 20 sheet>, thì có thể gen 3 sheet 1 lần, trong lúc đang gen 3 sheet thì check 3 sheet khác. 

In [4]:
def generate_multi_job_situations(job_positions: List[str], filename_output: str) -> str:
    print("Starting multi-job situation generation process...")
    
    # Create a Pandas Excel writer using XlsxWriter as the engine
    with pd.ExcelWriter(filename_output, engine='xlsxwriter') as writer:
        for job_position in job_positions:
            print(f"\nProcessing job position: {job_position}")
            df = gen_situation_group_AND_detail_situation(job_position)
            
            # Write each DataFrame to a different worksheet
            sheet_name = job_position[:31]  # Excel sheet names have a 31 character limit
            df.to_excel(writer, sheet_name=sheet_name, index=False)
            print(f"Sheet '{sheet_name}' added to Excel file")

    print(f"\nExcel file generated: {filename_output}")
    return filename_output



job_list = [
    "Student (Sinh viên)",
    "Accountant (Kế toán)",
    "Software Engineer Engineer (Kỹ sư)",
    "Construction Engineer (Kỹ sư xây dựng)",
    "Sales Manager (Đại diện bán hàng)",
    "Marketing (Marketing)",
    "Teacher (Giáo viên)",
    "Teacher Assistant, Teaching Related (Trợ giảng, Giáo vụ)",
    "Manager (Quản lý)",
    "Logistics (Logistics)",
    "Doctor (Bác sĩ)",
    "Pharmacist (Dược sĩ)",
    "Freelancer (Freelancer)",
    "HR Human Resources (Nhân sự)",
    "Project Manager (Quản lý dự án)",
    "Business (Kinh doanh)",
    "Customer Service (Chăm sóc khách hàng)",
    "Designer (Thiết kế)",
    "Business Analyst (Phân tích kinh doanh)"
]

sublist_1 = job_list[:3]
sublist_2 = job_list[3:6]
sublist_3 = job_list[6:9]
sublist_4 = job_list[9:12]
sublist_5 = job_list[12:15]
sublist_6 = job_list[15:18]
sublist_7 = job_list[18:]

sublist_1, sublist_2, sublist_3, sublist_4, sublist_5, sublist_6, sublist_7


# Example usage
print(sublist_1)
if __name__ == "__main__":
    job_positions = ["Teacher Assistant, Teaching Rel"]
    excel_file = generate_multi_job_situations(job_positions, "Teacher_Assistant.xlsx")
    print(f"Final Excel file: {excel_file}")

['Student (Sinh viên)', 'Accountant (Kế toán)', 'Software Engineer Engineer (Kỹ sư)']
Starting multi-job situation generation process...

Processing job position: Teacher Assistant, Teaching Rel
Starting process for job position: Teacher Assistant, Teaching Rel
{
  "job_position": "Teacher Assistant, Teaching Rel",
  "situation_groups": {
    "situation_group1": {
      "situation_group_name": "Tương tác với đồng nghiệp",
      "situation1": "Thảo luận với giáo viên chính về kế hoạch giảng dạy hàng tuần.",
      "situation2": "Hỗ trợ đồng nghiệp trong việc chuẩn bị tài liệu giảng dạy.",
      "situation3": "Tham gia cuộc họp nhóm để chia sẻ kinh nghiệm và ý tưởng giảng dạy.",
      "situation4": "Giải quyết mâu thuẫn với đồng nghiệp về phương pháp giảng dạy.",
      "situation5": "Hỗ trợ đồng nghiệp mới trong việc làm quen với môi trường làm việc.",
      "situation6": "Thảo luận với đồng nghiệp về cách cải thiện chất lượng giảng dạy.",
      "situation7": "Phối hợp với đồng nghiệp để 