In [None]:
import json
import os
import random
import re
import time
from datetime import datetime
import hashlib # Required for blueprint hashing
# openai 라이브러리 v1.17.0 이상 권장
from openai import OpenAI, APIError
# pydantic v2 이상 권장! (pip install -U pydantic)
from pydantic import BaseModel, Field, ValidationError
from typing import List, Dict, Any, Optional, Union, Type, Tuple

# --- 0. 환경 설정 ---
# !!! 실행 전 환경변수 'FRIENDLI_TOKEN'에 API 키를 설정해야 합니다 !!!
if "FRIENDLI_TOKEN" not in os.environ:
    raise ValueError("환경변수 'FRIENDLI_TOKEN'이 설정되지 않았습니다.")

client = OpenAI(
    base_url="https://api.friendli.ai/serverless/v1",
    api_key=os.environ.get("FRIENDLI_TOKEN")
)
# !!! Function Calling 지원 모델 확인 필요 !!!
MODEL_ID = "deepseek-r1" # 일반 대화, Blueprint 생성 등에 사용할 모델
FC_MODEL_ID = "deepseek-r1" # Function Calling 시 사용할 모델

# --- Pydantic 모델 정의 (Pydantic V2+ 기준) ---
class ToolCallInternal(BaseModel):
    tool_name: str = Field(..., description="호출할 도구의 이름")
    arguments: Dict[str, Any] = Field(..., description="도구 호출에 필요한 인자들 (딕셔너리 형태)")

class GetWeatherArgs(BaseModel):
    location: str = Field(..., description="날씨를 조회할 도시 이름")

class GetNewsArgs(BaseModel):
    topic: str = Field(..., description="뉴스를 검색할 주제")

class Blueprint(BaseModel):
    q: str = Field(..., description="사용자의 초기 질문 또는 요청")
    a_gt: List[ToolCallInternal] = Field(..., description="Ground Truth: 에이전트가 수행해야 할 도구 호출 순서")
    o_gt: str = Field(..., description="예상되는 최종 결과에 대한 설명 (문자열)")

# ---------------

# --- 도구 정의 (Fake 데이터 반환) ---
def get_weather(location: str) -> str:
    """주어진 location(도시명)의 오늘 날씨 정보를 반환합니다."""
    print(f"** 도구 실행: get_weather(location='{location}') - Fake Data 반환 **")
    fake_weather_data = {"location": location, "date": "2025-01-01", "weather": "항상 맑음", "temperature": "23°C"}
    return json.dumps(fake_weather_data, ensure_ascii=False)

def get_news(topic: str) -> str:
    """주어진 topic(뉴스 주제)의 최신 뉴스 헤드라인을 반환합니다."""
    print(f"** 도구 실행: get_news(topic='{topic}') - Fake Data 반환 **")
    fake_news_data = {"topic": topic, "date": "2025-01-01", "headlines": ["고정 뉴스 A", "고정 뉴스 B"]}
    return json.dumps(fake_news_data, ensure_ascii=False)

available_tools_mapping = {"get_weather": get_weather, "get_news": get_news}
tools_definition_for_api = [
    {"type": "function", "function": {"name": "get_weather", "description": "지정된 위치의 현재 날씨 정보를 가져옵니다.", "parameters": {"type": "object", "properties": {"location": {"type": "string", "description": "날씨를 조회할 도시 이름 (예: 서울, Paris)"}}, "required": ["location"]}}},
    {"type": "function", "function": {"name": "get_news", "description": "지정된 주제에 대한 최신 뉴스 기사 몇 개를 가져옵니다.", "parameters": {"type": "object", "properties": {"topic": {"type": "string", "description": "뉴스를 검색할 주제 (예: IT, 경제)"}}, "required": ["topic"]}}},
]

# ---------------

# --- Helper Function: API 호출 ---
def call_friendli_api(messages: List[Dict[str, Any]], tools: Optional[List[Dict[str, Any]]] = None, tool_choice: Optional[Union[str, Dict[str, Any]]] = None, role_description: str = "API Call", max_retries: int = 1) -> Optional[Dict[str, Any]]:
    """ Friendli.ai API를 호출하는 중앙 함수 """
    print(f"\n--- Friendli API 호출 ({role_description}) ---")
    last_exception = None
    current_model_id = FC_MODEL_ID if tools else MODEL_ID
    print(f"사용 모델: {current_model_id}")
    for attempt in range(max_retries + 1):
        try:
            params = {"model": current_model_id, "messages": messages}
            if tools: params["tools"] = tools
            if tool_choice: params["tool_choice"] = tool_choice
            completion = client.chat.completions.create(**params)
            response_message = completion.choices[0].message
            log_content = response_message.content or ""
            log_tool_calls = f" Tool Calls: {[tc.function.name for tc in response_message.tool_calls]}" if response_message.tool_calls else ""
            print(f"성공: 응답 Role={response_message.role} Content='{log_content[:50]}...' {log_tool_calls}")
            return response_message.model_dump()
        except APIError as e:
            print(f"시도 {attempt + 1}: API 오류: {e}")
            last_exception = e
            if hasattr(e, 'status_code') and e.status_code == 422: print("422 에러 발생. 재시도 중단."); break
            if attempt < max_retries: time.sleep(1.5 ** attempt)
        except Exception as e:
            print(f"시도 {attempt + 1}: 예외 발생: {e}")
            last_exception = e
            if attempt < max_retries: time.sleep(1.5 ** attempt)
    print(f"최대 재시도({max_retries}) 실패. 오류: {last_exception}"); return None

# ---------------

# --- Helper Function: Blueprint ID 생성 (중복 검사용) ---
def create_blueprint_id(blueprint: Blueprint) -> str:
    """Blueprint 객체로부터 고유 식별 해시를 생성합니다."""
    try:
        a_gt_serializable = sorted(
            [{"tool_name": tc.tool_name, "arguments": dict(sorted(tc.arguments.items()))} for tc in blueprint.a_gt],
            key=lambda x: (x['tool_name'], json.dumps(x['arguments'], sort_keys=True))
        )
        data_to_hash = {"q": blueprint.q, "a_gt": a_gt_serializable, "o_gt": blueprint.o_gt}
        canonical_string = json.dumps(data_to_hash, sort_keys=True, ensure_ascii=False)
        hash_object = hashlib.sha256(canonical_string.encode('utf-8'))
        return hash_object.hexdigest()
    except Exception as e: print(f"오류: Blueprint ID 생성 중 예외: {e}"); return f"error_{random.random()}_{time.time()}"

# ---------------

# --- Step 1-1: 청사진 생성 (LLM 호출) ---
def generate_blueprint_string(tools_api_def: List[Dict[str, Any]], max_retries: int = 2) -> Optional[str]:
    """LLM을 호출하여 작업 청사진 JSON 문자열을 생성합니다."""
    print("\n--- 1-1: 작업 청사진 생성 (LLM 호출) ---")
    tool_desc_str = "\n".join([f"- {t['function']['name']}: {t['function'].get('description', '')}" for t in tools_api_def])
    system_prompt_gen = f"""당신은 AI 에이전트 훈련 데이터를 생성하는 역할입니다. 주어진 도구 설명을 바탕으로 현실적인 사용자 질문(q), 이를 해결하기 위해 에이전트가 호출해야 하는 정확한 도구 호출 순서(a_gt), 그리고 예상되는 최종 결과 설명(o_gt)을 포함하는 JSON 객체를 생성해야 합니다.
**JSON 구조 요구사항:** q(string), a_gt(list of objects with tool_name(string) and arguments(object)), o_gt(string).
**응답 규칙:** 유효한 JSON 객체만 응답 (```json ... ``` 블록 안에), 다른 텍스트 절대 포함 금지."""
    user_prompt_gen = f"사용 가능한 도구:\n{tool_desc_str}\n\n위 도구 사용 시나리오 JSON 생성 (규칙 준수):"
    api_response = call_friendli_api(messages=[{"role": "system", "content": system_prompt_gen}, {"role": "user", "content": user_prompt_gen}], role_description="작업 생성 LLM", max_retries=max_retries)
    response_content = api_response.get("content") if api_response else None
    if not response_content: print("LLM 청사진 응답 받기 실패."); return None
    json_match = re.search(r'\{[\s\S]*\}', response_content)
    if json_match: print("성공: 청사진 JSON 문자열 추출 완료"); return json_match.group(0)
    else: print(f"오류: LLM 응답 JSON 찾기 실패. Raw: {response_content}"); return None

# ---------------

# --- Step 1: 청사진 파싱 및 검증 (Pydantic) ---
def parse_and_validate_blueprint(blueprint_str: str) -> Optional[Blueprint]:
    """JSON 문자열을 파싱하고 Blueprint Pydantic 모델로 검증합니다."""
    print("\n--- 1-1b: 청사진 파싱 및 검증 (Pydantic) ---")
    parsed_dict = None
    try:
        parsed_dict = json.loads(blueprint_str)
        blueprint_obj = Blueprint.model_validate(parsed_dict)
        print("성공: Blueprint 파싱 및 검증 완료")
        return blueprint_obj
    except Exception as e: print(f"Blueprint 파싱/검증 오류: {e}"); return None

# ---------------

# --- Step 1-2: 청사진 실행 가능성 검사 ---
def check_blueprint_execution(blueprint: Blueprint, tool_mapping: Dict[str, callable]) -> bool:
    """Blueprint의 a_gt 도구 호출 실행 가능성 검사."""
    # TODO: 논문의 실제 환경 시뮬레이션 및 Policy Compliance Check 미구현
    print("\n--- 1-2: 형식/실행 검사 ---")
    for action in blueprint.a_gt:
        tool_name = action.tool_name; arguments = action.arguments
        if tool_name not in tool_mapping: print(f"오류: 도구 '{tool_name}' 없음"); return False
        try:
            if tool_name == "get_weather": GetWeatherArgs.model_validate(arguments)
            elif tool_name == "get_news": GetNewsArgs.model_validate(arguments)
        except ValidationError as e: print(f"오류: '{tool_name}' 인자 검증 실패: {e}"); return False
        print(f"도구 '{tool_name}' (인자: {arguments}) 실행 가능 확인.")
    print("형식/실행 검사 통과."); return True

# ---------------

# --- Step 1-3: 청사진 검토 (LLM 호출) ---
def review_blueprint(blueprint: Blueprint, max_retries: int = 1) -> Tuple[bool, str]:
    """LLM을 호출하여 Blueprint를 검토하고 결과(통과여부, 이유)를 반환합니다."""
    # TODO: 논문의 Multi-LLM Committee, Majority Voting, Reflection 기반 Feedback Loop 미구현
    print("\n--- 1-3: 검토 위원회 ---")
    system_prompt_review = "당신은 AI 에이전트 계획 검토자입니다... 'pass'/'fail'...텍스트 응답... <think> 태그 지양..."
    user_prompt_review = f"다음 작업 청사진 검토:\n질문(q): {blueprint.q}\n액션(a_gt): {blueprint.model_dump_json(indent=2)}\n결과(o_gt): {blueprint.o_gt}\n\n타당한가요? (pass/fail 및 이유)"
    api_response = call_friendli_api(messages=[{"role": "system", "content": system_prompt_review}, {"role": "user", "content": user_prompt_review}], role_description="검토 위원회 LLM", max_retries=max_retries)
    review_response = api_response.get("content") if api_response else None
    review_passed = False; reason = "응답 없음/분석 불가"
    if review_response:
        cleaned_response = re.sub(r'<think>.*?</think>', '', review_response, flags=re.DOTALL).strip()
        if re.search(r'^\W*\bpass\b', cleaned_response, re.IGNORECASE):
            review_passed = True
            match = re.search(r'^\W*\bpass\b\W*', cleaned_response, re.IGNORECASE)
            reason = cleaned_response[(match.end() if match else 0):].strip() or cleaned_response
        else: reason = cleaned_response or "응답 없음"
    if review_passed: print(f"검토 통과. 이유: {reason}")
    else: print(f"검토 실패: {reason}")
    return review_passed, reason

# ---------------

# --- Step 2-1: 첫 사용자 턴 시뮬레이션 ---
def simulate_first_user_turn(blueprint_q: str, max_retries: int = 1) -> Optional[str]:
    """사용자의 첫 발화를 시뮬레이션합니다."""
    # TODO: 논문의 Persona 기반 생성 미구현
    print("\n--- 2-1: 시뮬레이션된 인간 (첫 발화) ---")
    user_utterance = blueprint_q # 간단 버전: Blueprint의 q 사용
    print(f"사용자 첫 발화 (Blueprint q 사용): {user_utterance}")
    return user_utterance

# ---------------

# --- Step 2-2: 에이전트 턴 시뮬레이션 (Function Calling) ---
def simulate_agent_turn(history: List[Dict], tools_api_def: List[Dict], max_retries: int = 2) -> Optional[Dict[str, Any]]:
    """Function Calling을 사용하여 에이전트의 응답(텍스트 또는 도구 호출)을 생성합니다."""
    print("\n--- 2-2: 테스트 에이전트 (결정/응답) ---")
    agent_response_message = call_friendli_api(messages=history, tools=tools_api_def, tool_choice="auto", role_description="테스트 에이전트 (결정)", max_retries=max_retries)
    if not agent_response_message: print("에이전트 응답 생성 실패.")
    return agent_response_message

# ---------------

# --- Step 2-3: 도구 실행 ---
def execute_tool_calls(tool_calls: List[Dict], tool_mapping: Dict[str, callable]) -> Tuple[List[Dict[str, Any]], List[ToolCallInternal]]:
    """모델 요청 도구 호출 실행 및 결과/성공 목록 반환."""
    # TODO: 논문의 실제 Executable Environment 연동 미구현 (현재 Fake data 사용)
    tool_response_messages = []
    successfully_executed_calls = []
    for tool_call in tool_calls:
        tool_call_id = tool_call["id"]
        function_to_call = tool_call["function"]
        tool_name = function_to_call["name"]
        arguments_str = function_to_call["arguments"]
        print(f"\n--- 2-3: 환경/도구 실행기 ({tool_name}) ---")
        content = ""; executed_successfully = False; arguments_dict = None
        if tool_name in tool_mapping:
            try:
                arguments_dict = json.loads(arguments_str)
                if tool_name == "get_weather": GetWeatherArgs.model_validate(arguments_dict)
                elif tool_name == "get_news": GetNewsArgs.model_validate(arguments_dict)
                content = tool_mapping[tool_name](**arguments_dict)
                executed_successfully = True
            except Exception as e: print(f"오류: '{tool_name}' 실행/검증 실패: {e}"); content = json.dumps({"error": f"Tool error: {e}"})
        else: print(f"오류: 알 수 없는 도구 '{tool_name}'"); content = json.dumps({"error": f"Tool '{tool_name}' not found."})
        tool_response_messages.append({"role": "tool", "tool_call_id": tool_call_id, "name": tool_name, "content": content})
        if executed_successfully and arguments_dict is not None:
             successfully_executed_calls.append(ToolCallInternal(tool_name=tool_name, arguments=arguments_dict))
    return tool_response_messages, successfully_executed_calls

# ---------------

# --- Step 2-4: 최종 에이전트 응답 생성 ---
def get_final_agent_response(history_with_tool_results: List[Dict], tools_api_def: List[Dict], max_retries: int = 1) -> Optional[Dict[str, Any]]:
    """도구 결과를 포함한 히스토리 기반으로 최종 텍스트 응답 생성."""
    print("\n--- 2-4: 테스트 에이전트 (도구 결과 기반 응답 생성) ---")
    final_response = call_friendli_api(messages=history_with_tool_results, tools=tools_api_def, tool_choice="none", role_description="테스트 에이전트 (최종 응답)", max_retries=max_retries)
    if not final_response or not final_response.get("content"):
        print("경고: 최종 응답 생성 실패 또는 내용 없음.")
        return {"role": "assistant", "content": "알겠습니다. 요청하신 정보를 처리했습니다."} # Fallback
    return final_response

# ---------------

# --- Step 2-5: 다음 사용자 턴 시뮬레이션 ---
def simulate_next_user_turn(history: List[Dict], agent_final_text: str, next_utterance_type: str, max_retries: int = 1) -> Optional[str]:
    """LLM을 사용하여 다음 사용자 턴 발화 시뮬레이션."""
    # TODO: 논문의 BoN Sampling, Self-Critique 등 안정화 기법 미구현
    print("\n--- 다음 턴: 시뮬레이션된 인간 ---")
    system_prompt_human_next = f"당신은 AI 비서와 대화하는 사용자입니다... 현재 상황: '{next_user_utterance_type}'..."
    user_prompt_human_next = f"대화 기록:\n{json.dumps(history, ensure_ascii=False)}\n\nAI 마지막 응답: '{agent_final_text}'\n\n'{next_user_utterance_type}' 상황에 맞는 다음 발화:"
    api_response = call_friendli_api(messages=[{"role": "system", "content": system_prompt_human_next}, {"role": "user", "content": user_prompt_human_next}], role_description=f"시뮬레이션된 인간 ({next_user_utterance_type})", max_retries=max_retries)
    user_utterance = api_response.get("content") if api_response else None
    if user_utterance: print(f"다음 사용자 발화: {user_utterance}"); return user_utterance
    else: print("다음 사용자 발화 생성 실패."); return None

# ---------------

# --- Step 2-6: 궤적 검증 ---
def validate_trajectory(executed_actions: List[ToolCallInternal], ground_truth_actions: List[ToolCallInternal]) -> bool:
    """실행된 도구 호출과 Ground Truth 비교하여 궤적 유효성 검증."""
    # TODO: 논문의 State-based / Output-based (o_gt) 검증 미구현
    print("\n--- 2-6: 궤적 검증 ---")
    if len(executed_actions) == len(ground_truth_actions) and executed_actions == ground_truth_actions:
        print("궤적 검증 결과: 통과"); return True
    else:
        print(f"오류: 실행/GT 액션 불일치"); print(f"  GT: {[a.model_dump() for a in ground_truth_actions]}"); print(f"  Executed: {[e.model_dump() for e in executed_actions]}"); print("궤적 검증 결과: 실패"); return False

# ---------------

# --- 메인 실행 로직 ---
if __name__ == "__main__":
    final_dataset = []
    num_data_to_generate = 10 # 생성할 최종 고유 데이터 수
    max_attempts_per_data = 3 # 데이터 하나 생성 위한 최대 내부 시도 횟수
    max_total_attempts = num_data_to_generate * max_attempts_per_data * 3 # 전체 최대 시도 횟수

    seen_blueprint_ids = set() # 중복 청사진 ID 추적용

    print("="*44); print(" APIGen-MT 데이터 생성 파이프라인 시작 (Refactored v5 - Final) "); print(f" 일반 모델: {MODEL_ID} / FC 모델: {FC_MODEL_ID}"); print(f" 생성 목표 데이터 수: {num_data_to_generate}"); print("="*44)

    generated_count = 0
    total_attempts_count = 0

    while generated_count < num_data_to_generate and total_attempts_count < max_total_attempts:
        total_attempts_count += 1
        print(f"\n\n===== 데이터 생성 시도 (목표: {generated_count + 1}/{num_data_to_generate}, 전체 시도: {total_attempts_count}) =====")
        current_data_generated_successfully = False

        for attempt in range(max_attempts_per_data):
            print(f"--- 내부 시도 {attempt + 1} / {max_attempts_per_data} ---")
            pipeline_failed_at_step = None

            # --- 1단계 ---
            blueprint_str = generate_blueprint_string(tools_definition_for_api)
            if not blueprint_str: pipeline_failed_at_step = "1-1"; continue
            validated_blueprint = parse_and_validate_blueprint(blueprint_str)
            if not validated_blueprint: pipeline_failed_at_step = "1-1b"; continue
            if not check_blueprint_execution(validated_blueprint, available_tools_mapping): pipeline_failed_at_step = "1-2"; continue
            passed_review, _ = review_blueprint(validated_blueprint)
            if not passed_review: pipeline_failed_at_step = "1-3"; continue

            # --- 청사진 중복 검사 ---
            blueprint_id = create_blueprint_id(validated_blueprint)
            if blueprint_id in seen_blueprint_ids:
                print(f"중복된 청사진 발견 (ID: {blueprint_id[:8]}...). 이번 시도 건너뜁니다.")
                pipeline_failed_at_step = "dedupe"
                continue # 다음 내부 시도

            # --- 2단계 ---
            print("=== 1단계 통과, 2단계 시작 ===")
            trajectory: List[Dict[str, Any]] = []
            history: List[Dict[str, Any]] = []
            executed_actions: List[ToolCallInternal] = []
            turn_count = 0; max_turns_traj = 8

            system_msg = {"role": "system", "content": f"AI 에이전트. 도구({', '.join(available_tools_mapping.keys())}) 사용 가능. 오늘:{datetime.now().strftime('%Y-%m-%d')}"}
            history.append(system_msg)

            user_utterance = simulate_first_user_turn(validated_blueprint.q)
            if not user_utterance: pipeline_failed_at_step = "2-1"; break
            user_msg = {"role": "user", "content": user_utterance}
            history.append(user_msg); trajectory.append(user_msg)

            while turn_count < max_turns_traj:
                turn_count += 1; print(f"\n--- Trajectory Turn {turn_count} ---")
                agent_response_message = simulate_agent_turn(history, tools_definition_for_api)
                if not agent_response_message: pipeline_failed_at_step = "2-2"; break

                # **** 히스토리/궤적 업데이트 (정제 로직 포함) ****
                trajectory.append(agent_response_message) # 원본은 궤적에
                sanitized_assistant_msg = {"role": agent_response_message.get("role", "assistant"), "content": agent_response_message.get("content")}
                if agent_response_message.get("tool_calls"): sanitized_assistant_msg["tool_calls"] = agent_response_message["tool_calls"]
                sanitized_assistant_msg = {k:v for k,v in sanitized_assistant_msg.items() if v is not None}
                history.append(sanitized_assistant_msg) # 정제된 것 히스토리에

                agent_final_text = ""
                if agent_response_message.get("tool_calls"):
                    tool_calls = agent_response_message["tool_calls"]
                    tool_response_messages, successful_calls = execute_tool_calls(tool_calls, available_tools_mapping)
                    executed_actions.extend(successful_calls)
                    history.extend(tool_response_messages); trajectory.extend(tool_response_messages)
                    final_agent_response_message = get_final_agent_response(history, tools_definition_for_api)
                    if final_agent_response_message:
                         trajectory.append(final_agent_response_message) # 원본은 궤적에
                         sanitized_final_msg = {"role": final_agent_response_message.get("role", "assistant"),"content": final_agent_response_message.get("content")}
                         sanitized_final_msg = {k:v for k,v in sanitized_final_msg.items() if v is not None}
                         history.append(sanitized_final_msg) # 정제본 히스토리에
                         agent_final_text = sanitized_final_msg.get("content", "")
                    else: pipeline_failed_at_step = "2-4"; break
                elif agent_response_message.get("content"): agent_final_text = agent_response_message.get("content", "")
                else: pipeline_failed_at_step = "agent_resp_error"; break

                if pipeline_failed_at_step: break # 내부 루프 실패 시 즉시 중단

                if len(executed_actions) == len(validated_blueprint.a_gt) and not agent_response_message.get("tool_calls"): should_end_next = True; next_user_utterance_type = "감사 및 종료"
                elif len(executed_actions) < len(validated_blueprint.a_gt): should_end_next = False; next_user_utterance_type = "다음 질문 또는 확인"
                else: should_end_next = False; next_user_utterance_type = "대화 마무리"
                next_user_utterance = simulate_next_user_turn(history, agent_final_text, next_user_utterance_type)
                if not next_user_utterance: pipeline_failed_at_step = "2-5"; break

                is_ending = any(end in next_user_utterance for end in ["감사", "없습", "됐어", "그만", "수고", "알겠습니다", "해결됐", "괜찮"])
                user_msg = {"role": "user", "content": next_user_utterance}
                history.append(user_msg); trajectory.append(user_msg)
                if is_ending or should_end_next: print("대화 종료 조건 충족."); break
                if turn_count >= max_turns_traj - 1: print("최대 턴 도달."); break
            # --- 턴 루프 종료 ---

            if pipeline_failed_at_step:
                print(f"2단계 실패 (Step: {pipeline_failed_at_step}). 다음 시도 진행...")
                continue # 현재 시도 실패, 다음 내부 시도로

            # 2-6: 궤적 검증
            if validate_trajectory(executed_actions, validated_blueprint.a_gt):
                # 최종 성공 시 데이터셋에 추가 및 중복 ID 기록
                final_dataset.append({"blueprint": validated_blueprint.model_dump(), "trajectory": trajectory})
                seen_blueprint_ids.add(blueprint_id) # **** 성공 시 ID 추가 ****
                generated_count += 1 # **** 성공 카운터 증가 ****
                current_data_generated_successfully = True
                print(f"\n데이터 생성 성공! (현재 {generated_count}/{num_data_to_generate}개)")
                break # 내부 for 루프만 탈출, 바깥 while은 계속 진행
            else:
                print("궤적 검증 실패.") # 실패 시 다음 내부 시도로

        # --- 내부 시도 루프 종료 ---
        # 내부 시도에서 성공했든 실패했든 바깥 while 루프는 조건에 따라 계속 반복
        if not current_data_generated_successfully:
             print(f"내부 시도 {max_attempts_per_data}회 모두 실패 또는 중복으로 현재 데이터 포인트 생성 불가.")
             # 이 경우, 다음 total_attempt로 넘어감 (바깥쪽 while 루프 계속)

    # --- 최종 결과 처리 ---
    print(f"\n\n{'='*44}"); print(f" 총 {generated_count}개의 고유 데이터 생성 완료 (전체 시도 {total_attempts_count}회)."); print("="*44)
    if final_dataset:
        filename = f"apigen_mt_dataset_{MODEL_ID}_fc_{FC_MODEL_ID}_final_{datetime.now().strftime('%Y%m%d_%H%M%S')}.jsonl"
        print(f"\n생성된 데이터를 '{filename}' 파일로 저장합니다.")
        try:
            with open(filename, "w", encoding="utf-8") as f:
                # **** 추가: 파일 저장 시 None 값 제거 ****
                for data_item in final_dataset:
                    cleaned_trajectory = []
                    for turn in data_item['trajectory']:
                        # 각 메시지(turn)에서 값이 None인 키-값 쌍 제거
                        cleaned_turn = {k: v for k, v in turn.items() if v is not None}
                        # tool_calls 내부도 정리 (선택적이지만 추천)
                        if 'tool_calls' in cleaned_turn and cleaned_turn['tool_calls']:
                            cleaned_tool_calls = []
                            for tc in cleaned_turn['tool_calls']:
                                cleaned_tc = {k: v for k, v in tc.items() if v is not None}
                                # function 내부도 정리
                                if 'function' in cleaned_tc and cleaned_tc['function']:
                                    cleaned_tc['function'] = {k: v for k, v in cleaned_tc['function'].items() if v is not None}
                                cleaned_tool_calls.append(cleaned_tc)
                            cleaned_turn['tool_calls'] = cleaned_tool_calls

                        cleaned_trajectory.append(cleaned_turn)

                    # blueprint는 이미 dict 상태, 필요시 동일 로직 적용 가능
                    cleaned_data = {
                        "blueprint": data_item['blueprint'], # 이미 model_dump()된 상태
                        "trajectory": cleaned_trajectory
                    }
                    f.write(json.dumps(cleaned_data, ensure_ascii=False) + "\n")
            print("파일 저장 완료.")
        except IOError as e: print(f"파일 저장 중 오류 발생: {e}")

 APIGen-MT 데이터 생성 파이프라인 시작 (Refactored v5 - Final) 
 일반 모델: deepseek-r1 / FC 모델: deepseek-r1
 생성 목표 데이터 수: 10


===== 데이터 생성 시도 (목표: 1/10, 전체 시도: 1) =====
--- 내부 시도 1 / 3 ---

--- 1-1: 작업 청사진 생성 (LLM 호출) ---

--- Friendli API 호출 (작업 생성 LLM) ---
사용 모델: deepseek-r1
성공: 응답 Role=assistant Content='<think>
Okay, let me try to create a JSON object b...' 
성공: 청사진 JSON 문자열 추출 완료

--- 1-1b: 청사진 파싱 및 검증 (Pydantic) ---
Blueprint 파싱/검증 오류: Extra data: line 1 column 24 (char 23)
--- 내부 시도 2 / 3 ---

--- 1-1: 작업 청사진 생성 (LLM 호출) ---

--- Friendli API 호출 (작업 생성 LLM) ---
사용 모델: deepseek-r1
성공: 응답 Role=assistant Content='<think>
Okay, let me try to create a JSON object b...' 
성공: 청사진 JSON 문자열 추출 완료

--- 1-1b: 청사진 파싱 및 검증 (Pydantic) ---
Blueprint 파싱/검증 오류: Extra data: line 1 column 24 (char 23)
--- 내부 시도 2 / 3 ---

--- 1-1: 작업 청사진 생성 (LLM 호출) ---

--- Friendli API 호출 (작업 생성 LLM) ---
사용 모델: deepseek-r1
성공: 응답 Role=assistant Content='<think>
사용자의 요구를 분석하기 위해 어떤 상황을 만들지 고민해야 해요. 먼저 도구...' 
성공: 청사진 JSON 문자열 