In [1]:
import os
from openai import OpenAI
import json
import pandas as pd
from typing import List

client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

def get_completion(prompt, model="gpt-4o", temperature=0):
    messages = [{"role": "user", "content": prompt}]
    response = client.chat.completions.create(
        model=model,
        messages=messages,
        temperature=temperature, # this is the degree of randomness of the model's output
    )
    return response.choices[0].message.content

def gen_situation_groups_AND_situation_SHORTVER2(job_position):
    prompt = f"""
    Bạn là chuyên gia về giao tiếp trong môi trường học đường và phát triển kỹ năng cho học sinh.
    
    Nhiệm vụ: Tạo ra 7 nhóm tình huống GIAO TIẾP liên quan đến vai trò "{job_position}",
    bao gồm cả khía cạnh học tập và cá nhân.

    Hướng dẫn:
    1. Yêu cầu bắt buộc về các tình huống 
      - Đúng thể loại: TÌNH HUỐNG GIAO TIẾP 
    2. Các nhóm tình huống GIAO TIẾP: phải bằng tiếng Việt, ngắn gọn, và xoay quanh vai trò của "{job_position}".
    3. Mỗi nhóm tình huống có 7 tình huống cụ thể hơn, nhưng vẫn ngắn gọn, và đảm bảo:
      - Tính tương tác cao: Tập trung vào các tình huống GIAO TIẾP TRỰC TIẾP: gặp mặt trực tiếp, cuộc gọi thoại, video call. <<Tuyệt đối không gồm tình huống "GIAO TIẾP QUA EMAIL">>
      - Tính ứng dụng thực tế: Phản ánh thực tế học đường, sử dụng ngôn ngữ gần gũi và dễ hiểu, phù hợp với lứa tuổi học sinh.
      - Tính tình huống và kỹ năng xử lý: Tạo ra các tình huống thách thức, đa chiều và phức tạp, đòi hỏi sự kết hợp nhiều kỹ năng, đảm bảo cân đối để bao quát toàn diện các khía cạnh trong cuộc sống học đường.
      - Tính cụ thể: Thêm chi tiết cụ thể hoặc bối cảnh để làm sống động tình huống GIAO TIẾP của {job_position}.
      - Yếu tố văn hóa: Bao gồm tình huống liên quan đến giao tiếp đa văn hóa khi tương tác với bạn bè hoặc giáo viên từ các nền văn hóa khác nhau.
      - Cập nhật xu hướng mới: Đưa vào các xu hướng mới nhất trong giáo dục và phát triển kỹ năng cho học sinh, tạo ra các tình huống sáng tạo và thử thách để phát triển kỹ năng toàn diện.
      - Vai vế trong giao tiếp: Đảm bảo có sự cân bằng giữa các tình huống giao tiếp với:
        a) Người bằng tuổi (bạn bè, bạn cùng lớp)
        b) Người kém tuổi (em nhỏ, học sinh lớp dưới)
        c) Người lớn tuổi hơn (thầy cô giáo, phụ huynh, người lớn trong trường)

    3'. Gợi ý các nhóm tình huống (không giới hạn ở các gợi ý này): <<Tuyệt đối không gồm tình huống "GIAO TIẾP QUA EMAIL">>
    - Tương tác với bạn bè cùng lớp
    - Giao tiếp với thầy cô giáo
    - Tham gia hoạt động ngoại khóa
    - Giải quyết xung đột và bất đồng
    - Hỗ trợ và giúp đỡ bạn bè
    - Tham gia các cuộc thi học thuật
    - Giao tiếp trong nhóm học tập
    - Tương tác với học sinh khóa dưới
    - Tham gia các hoạt động tình nguyện
    - Giao tiếp với phụ huynh về vấn đề học tập
    - Thích ứng với môi trường học tập mới
    - Tham gia các câu lạc bộ trong trường
    - Giao tiếp trong các sự kiện của trường

    Trả về một đối tượng JSON có cấu trúc sau:
    {
      "job_position": "{job_position}",
      "situation_groups": {
        "situation_group1": {
          "situation_group_name": "Tên nhóm tình huống 1",
          "situation1": "Tình huống 1",
          "situation2": "Tình huống 2",
          "situation3": "Tình huống 3", 
          "situation4": "Tình huống 4", 
          "situation5": "Tình huống 5", 
          "situation6": "Tình huống 6", 
          "situation7": "Tình huống 7"
        },
        "situation_group2": {
          "situation_group_name": "Tên nhóm tình huống 2",
          "situation1": "Tình huống 1",
          "situation2": "Tình huống 2"
          ...
          <5-7 situation>
        },
        ...
      }
    }

    Example 
      {
        "job_position": "HỌC SINH",
        "situation_groups": [
          {
            "situation_group_name": "Tương tác với bạn bè cùng lớp",
            "situation1": "Thảo luận về bài tập nhóm với bạn cùng lớp.",
            "situation2": "Giải quyết mâu thuẫn với bạn trong giờ ra chơi.",
            "situation3": "Chia sẻ ý tưởng cho dự án khoa học với nhóm bạn.",
            "situation4": "Động viên bạn cùng lớp trước kỳ thi quan trọng.",
            "situation5": "Tổ chức sinh nhật bất ngờ cho bạn thân trong lớp.",
            "situation6": "Thuyết phục bạn bè tham gia hoạt động tình nguyện.",
            "situation7": "Hòa giải cuộc cãi vã giữa hai người bạn trong lớp."
          },
          {
            "situation_group_name": "Giao tiếp với thầy cô giáo",
            "situation1": "Đặt câu hỏi về bài giảng trong giờ học.",
            "situation2": "Xin phép thầy cô để tham gia một cuộc thi học thuật.",
            "situation3": "Giải thích lý do đến muộn với giáo viên chủ nhiệm.",
            "situation4": "Đề xuất ý tưởng cho hoạt động ngoại khóa với giáo viên.",
            "situation5": "Xin lỗi thầy cô vì quên làm bài tập về nhà.",
            "situation6": "Thảo luận về kế hoạch học tập cá nhân với giáo viên tư vấn.",
            "situation7": "Báo cáo tình hình học tập của lớp với giáo viên chủ nhiệm."
          }
        ]
      }

    Đảm bảo đầu ra là một đối tượng JSON hợp lệ không có bất kỳ định dạng hoặc từ khóa bổ sung nào(chẳng hạn ```json).
    """

    # Assuming you have a function called get_completion to generate the response
    response = get_completion(prompt)
    
    # Parse the JSON response
    try:
        topics_dict = json.loads(response)
        return json.dumps(topics_dict, ensure_ascii=False, indent=2)
    except json.JSONDecodeError:
        print("Error: The generated response is not valid JSON. Please check the output.")
        return None

def gen_detail_situations_SHORTVER_aigender(job_position, situation_group_name, situation, ai_gender):
    """
    
    Truyền trực tiếp giới tính AI 
    """
    prompt = f"""
    Bạn là chuyên gia về phát triển nghề nghiệp và tình huống công việc cho vị trí {job_position}.
    
    Nhiệm vụ: Tạo ra chi tiết cho tình huống GIAO TIẾP "{situation}" liên quan đến chủ đề "{situation_group_name}" cho vị trí {job_position}.
    
    Hướng dẫn:
    1. Các đặc điểm của 1 tình huống 
      - Tính tương tác cao: Tập trung vào các tình huống giao tiếp trực tiếp như cuộc gọi điện thoại, video call, hoặc gặp mặt trực tiếp <<tuyệt đối không gồm việc gửi email>>.
      - Tính ứng dụng thực tế: Phản ánh thực tế công việc, sử dụng ngôn ngữ gần gũi và dễ hiểu , kết hợp với thuật ngữ chuyên ngành của vị trí {job_position}.
      - Tính tình huống và kỹ năng xử lý: Tạo ra các tình huống thách thức, đa chiều và phức tạp, đòi hỏi sự kết hợp nhiều kỹ năng, đảm bảo cân đối để bao quát toàn diện công việc.
      - Tính cụ thể: Thêm chi tiết cụ thể hoặc bối cảnh để làm sống động tình huống GIAO TIẾP ở vị trí {job_position}.
      - Yếu tố văn hóa: Bao gồm tình huống liên quan đến giao tiếp đa văn hóa khi làm việc với khách hàng hoặc đối tác quốc tế.
      - Cập nhật xu hướng mới: Đưa vào các xu hướng mới nhất trong công việc và ngành của vị trí {job_position}, tạo ra các tình huống sáng tạo và thử thách để phát triển kỹ năng toàn diện.

    2. Chi tiết tình huống phải bao gồm:
       - Tên tình huống (tiếng Việt): {situation}
       - Chi tiết tình huống GIAO TIẾP (tiếng Việt): Tạo tình huống 
       - Nhân vật của tôi (character_me) (tiếng Việt): Mô tả ngắn gọn trong 25 ký tự hoặc ít hơn, phản ánh vị trí {job_position}.
       - Nhân vật AI (character_ai) (tiếng Việt): Mô tả ngắn gọn trong 25 ký tự hoặc ít hơn, phù hợp với tình huống và vị trí {job_position}.
       - Giới tính của AI: {ai_gender}
       - Chi tiết tình huống GIAO TIẾP (tiếng Việt): 
          - Bắt đầu với "Tôi" + `situation` (Tức là: Ta sẽ CỤ THỂ HƠN về vai của AI trong TÊN TÌNH HUỐNG{situation} bằng cách thay bằng đúng vai của AI là: `character_ai` thay vì tên gọi chung chung)
          - Ngoài ra: KHÔNG THÊM GÌ NỮA vì sẽ bị vượt quá 90 ký tự.  
          - Chẳng hạn: 
              - Tên tình huống là: "Thảo luận chiến lược bán hàng với đội ngũ bán hàng trong cuộc họp hàng tuần."
              - Nhân vật AI: "Trưởng nhóm bán hàng" 
              => Thì chi tiết tình huống GIAO TIẾP sẽ là: "Tôi thảo luận với Trưởng nhóm bán hàng về chiến lược bán hàng trong cuộc họp hàng tuần."



    Trả về một đối tượng JSON với cấu trúc sau:
    {{
      "job_position": "{job_position}",
      "situation_group_name": "{situation_group_name}",
      "situation": {{
        "situation_name": "{situation}",
        "character_me": "Vai trò của người dùng",
        "character_ai": "Vai trò của AI",
        "ai_gender": "{ai_gender}",
        "situation_details": "Chi tiết tình huống giao tiếp"
      }}
    }}

    Example 

    {{
  "job_position": "Accountant (Kế Toán)",
  "situation_group_name": "Tương tác với đồng nghiệp",
  "situation": {{
    "situation_name": "Thảo luận với bộ phận bán hàng về việc cập nhật hóa đơn",
    "character_me": "Kế toán viên",
    "character_ai": "Trưởng bộ phận bán hàng",
    "ai_gender": "Nữ",
    "situation_details": "Tôi thảo luận với Trưởng bộ phận bán hàng về việc cập nhật hoá đơn."
      }}
    }}

    
    Đảm bảo đầu ra là một đối tượng JSON hợp lệ không có bất kỳ định dạng hoặc từ khóa bổ sung nào.

    

    """

    response = get_completion(prompt)
    
    try:
        situation_dict = json.loads(response)
        return json.dumps(situation_dict, ensure_ascii=False, indent=2)
    except json.JSONDecodeError:
        print("Error: The generated response is not valid JSON. Please check the output.")
        return None


In [2]:
import json
import pandas as pd

def gen_situation_group_AND_detail_situation(job_position: str) -> pd.DataFrame:
    """
    - (1 tham số duy nhất)
    - Output: Trả về Output 1 file excel với các cột 
        CÔNG VIỆC	TOPIC	TÊN TÌNH HUỐNG	CHI TIẾT TÌNH HUỐNG	NHÂN VẬT TÔI	NHÂN VẬT AI	Giới tính AI 	Câu mở đầu của AI	"LIST CÂU HỎI do AI hỏi"
    - Thêm các print để kiểm tra tiến độ và fix được lỗi (các print quan trọng, vừa đủ, không quá thừa)

    Output: Vừa có print ra console vừa có output là file excel, return nên là định dạng dễ sử dụng về sau (ĐÓ LÀ: DUYỆT TỪNG job_position ở đâu đó, sử dụng cái hàm gen_situation_group_AND_detail_situation(job_position) để tạo hàng loạt cho job_position, sau đó output gộp lại được thành 1 file với mỗi job_position là 1 sheet)
    - Sau khi tạo các nhóm tình huống, hãy in ra các nhóm tình huống đó trước đã nhé 
    - Tức là thêm các index ở đầu lúc lưu data từng câu hỏi ở cột "LIST CÂU HỎI do AI hỏi"
    - Làm sao để check được data in ra đúng chưa, thay vì phải đợi chạy xong toàn bộ => In ra dữ liệu từng tình huống để kiểm tra
    """
    # Bắt đầu quá trình với vị trí công việc được cung cấp
    print(f"Starting process for job position: {job_position}")
    
    # Bước 1: Tạo nhóm tình huống
    situation_groups_json = gen_situation_groups_AND_situation_SHORTVER2(job_position)
    print(situation_groups_json) # In các nhóm tình huống tạo được
    situation_groups = json.loads(situation_groups_json)
    
    # Sau khi tạo các nhóm tình huống, hãy in ra các nhóm tình huống đó trước đã nhé 
    
    print("\nGenerated Situation Groups:")
    for group_key, group in situation_groups["situation_groups"].items():
        print(f"Group: {group['situation_group_name']}")
        for situation_key, situation_value in group.items():
            if situation_key.startswith("situation") and situation_key != "situation_group_name":
                print(f"  - Situation: {situation_value}")

    # Bước 2: Tạo chi tiết tình huống cho từng nhóm và tình huống
    data = []
    processed_situations = set()  # Để theo dõi các tình huống đã xử lý
    situation_number = 1  # Thêm biến đếm này ĐỂ GEN GIỚI TÍNH
    print(f"Tạo tình huống số {situation_number}")

    # Duyệt qua các nhóm tình huống
    for group_key, group in situation_groups["situation_groups"].items():
        print(f"Processing group: {group['situation_group_name']}")
        # Duyệt qua từng tình huống trong nhóm
        for situation_key, situation_value in group.items():
            # Kiểm tra nếu key bắt đầu với "situation" và tình huống chưa được xử lý
            if situation_key.startswith("situation") and situation_key != "situation_group_name" and situation_value not in processed_situations:
                print("--------------")
                print(f"Generating details for : {situation_value}")
                # Gọi hàm để tạo chi tiết tình huống
                ai_gender = 'Nữ' if situation_number % 2 != 0 else 'Nam' # Tạo giới tính AI FIX CỨNG NHƯ NÀY ĐỂ TẠO CÂN BẰNG GIỚI

                detailed_situation_json = gen_detail_situations_SHORTVER_aigender(
                    job_position, 
                    group["situation_group_name"], 
                    situation_value, 
                    ai_gender
                )
                detailed_situation = json.loads(detailed_situation_json)
                
                # Lấy dữ liệu chi tiết từ tình huống
                situation_data = detailed_situation["situation"]
                

                situation_dict = {
                    "CÔNG VIỆC": job_position,
                    "TOPIC": group["situation_group_name"],
                    "TÊN TÌNH HUỐNG": situation_data["situation_name"],
                    "NHÂN VẬT TÔI": situation_data["character_me"],
                    "NHÂN VẬT AI": situation_data["character_ai"],
                    "Giới tính AI": situation_data["ai_gender"],
                    "CHI TIẾT TÌNH HUỐNG": situation_data["situation_details"],

                }
                
                # Làm sao để check được data in ra đúng chưa, thay vì phải đợi chạy xong toàn bộ => In ra dữ liệu từng tình huống để kiểm tra
                # In ra dữ liệu của tình huống để kiểm tra
                print("\nGenerated Detailed Situation Data:")
                for key, value in situation_dict.items():
                    print(f"{key}: {value}")
                
                data.append(situation_dict)
                
                # Đánh dấu tình huống này đã được xử lý
                processed_situations.add(situation_value)
                print("--------------")
                print("Next situation")
                situation_number += 1  # Tăng số thứ tự lên sau mỗi tình huống, CHỈ ĐỂ KIỂM SOÁT GIỚI TÍNH AI
                

    # Tạo DataFrame từ danh sách dữ liệu
    df = pd.DataFrame(data)
    print(f"Completed processing for job position: {job_position}")
    print(f"Total situations generated: {len(df)}")
    return df




```
các nhóm công việc sau
Student/Sinh viên: 9.23%
Accountant/Kế toán: 8.46%
IT/Developer/Software Engineer/Engineer/Kỹ sư: 14.62%
Construction/Contruction Engineer: 1.54%"
Sales/Sale Manager: 6.92%
Marketing: 3.08%
"Teacher/Giáo viên: 6.15%
Teacher Assistant/Teaching Related: 2.31%"
Manager/Quản lý: 5.38%
Logistics: 4.62%
"Doctor/Bác sĩ: 3.08%
Pharmacist/Dược sĩ: 2.31%"
Freelancer: 3.08%
HR/Human Resources: 3.08%
Project Manager: 2.31%
Business: 2.31%
Customer Service: 1.54%
Designer: 1.54%
Business Analyst: 1.54%
```

- 5-6 phút/1 job_position => 120 phút. 
- Thay vì 1 phát 20 jobs => Chia nhỏ. 
1. Chia nhỏ để chạy song song nhiều nơi 
2. Chia nhỏ để check được output từng phần trong quá trình đợi gen tiếp các mẻ. <Thay vì xong hết rồi mới check 20 sheet>, thì có thể gen 3 sheet 1 lần, trong lúc đang gen 3 sheet thì check 3 sheet khác. 

In [3]:
def generate_multi_job_situations(job_positions: List[str], filename_output: str) -> str:
    print("Starting multi-job situation generation process...")
    
    # Create a Pandas Excel writer using XlsxWriter as the engine
    with pd.ExcelWriter(filename_output, engine='xlsxwriter') as writer:
        for job_position in job_positions:
            print(f"\nProcessing job position: {job_position}")
            df = gen_situation_group_AND_detail_situation(job_position)
            
            # Write each DataFrame to a different worksheet
            sheet_name = job_position[:31]  # Excel sheet names have a 31 character limit
            df.to_excel(writer, sheet_name=sheet_name, index=False)
            print(f"Sheet '{sheet_name}' added to Excel file")

    print(f"\nExcel file generated: {filename_output}")
    return filename_output




if __name__ == "__main__":
    job_positions = ["Student(Học sinh, sinh viên)"]
    excel_file = generate_multi_job_situations(job_positions, "Student_Exception.xlsx")
    print(f"Final Excel file: {excel_file}")

Starting multi-job situation generation process...


PermissionError: [Errno 13] Permission denied: 'Student_Exception.xlsx'


Trong cột H, cột I. 
- H2: "Hi, I'm Maria, the international student in our group. I'm excited to work on this project with you all. To start, can you explain what specific tasks we need to divide among ourselves?"
- I2: """
1. Can you explain what specific tasks we need to divide among ourselves?
2. What resources do you think we should use for our research?
3. How often should we meet to discuss our progress?
4. Are there any cultural considerations we should keep in mind while working together?
5. What is the deadline for each part of the project?
6. How should we handle any disagreements or conflicts that arise?
7. What is the best way for us to communicate outside of our scheduled meetings?
"""

Muốn kiểm tra xem câu cuối của H2 " To start, can you explain what specific tasks we need to divide among ourselves?" có trùng với "1. Can you explain what specific tasks we need to divide among ourselves?" của I2 không

Tương tự với H3 - I3, H4-I4, => công thức trong GOOGLE SHEET là gì? 

- Các đề tài cho sinh viên và bác sĩ nên cân nhắc thêm sự linh hoạt => gen tay 


#### Sửa đổi requirements => Output đơn giản hơn

Output: 
1. Gộp lại thành 1 file chung 19 sheet, hỏng đâu sửa đó hoặc sheet nào được rồi đẩy lên sheet trên Drive => trả cho a Trúc. 
2. ***Sau khi a Cường và a Trúc duyệt output và requirements*** => MỚI ĐẨY LÊN NOTION 

- Bác sĩ, Dược Sĩ: sửa "Hỗ trợ chăm sóc khách hàng" => "Hỗ trợ chăm sóc bệnh nhân". 
- Freelancer, Sinh Viên. 