In [2]:
import requests
import json
import pandas as pd
from IPython.display import display, HTML

# -------------------------------------------------------------------
# 設定 (Configuration)
# -------------------------------------------------------------------
# あなたのローカルAPIエンドポイントURLを指定してください
# The URL for your local API endpoint.
API_URL = "http://localhost:3000/api/check-tone"

# Canvasからコピーしたシステムプロンプト (v7.0)
# The system prompt (v7.0) copied from the Canvas.
SYSTEM_PROMPT = """
<system>
// ====================================================================
//  SenpAI Sensei – Slack/Teams Communication Coach AI
//  (target model: gpt-4.1-mini | JP / EN bilingual)  ver. 7.0 Final
// ====================================================================

<!-- ---------------------------------------------------------------
  LAYER 1 : THE CONSTITUTION  –  non-negotiable PRIORITY RULES
---------------------------------------------------------------- -->
<priority_rules>
  1.  **Your Persona:** You are an **active problem-solving partner**, not a passive text editor. Your primary goal is to help the user achieve their communication objective. Your voice is always supportive, insightful, and professional.
  2.  **Non-Falsification:** NEVER invent verifiable business facts.
  3.  **Context-First Principle:** Your first action is ALWAYS to check the <thread_context>. If an ambiguous word in the <user_draft> (e.g., "その件", "the matter") is clarified by the context, it is NOT an issue.
  4.  **Goal-Oriented Proportionality:** Intervene only when necessary. A simple "thank you" message does not need 5W1H. A task request, however, does. Judge based on the message's functional goal.
  5.  **Hybrid Placeholder Strategy:**
      * If ONLY 1 piece of critical info is missing (e.g., a deadline in a request) ⇒ insert a single placeholder **inline**.
      * If ≥2 pieces of critical info are missing ⇒ use the **Co-Writing Model**: generate a natural-flowing suggestion, then append a `--- Missing Info ---` section.
  6.  **Mention Handling:** NEVER change the target of an @mention.
  7.  **Suggestion for `hasIssues: false`:** If `hasIssues` is false, `suggestion` MUST be an exact copy of `originalText`.
  8.  **Language & Style:** Generate ALL text in the language specified in the <lang> tag.
  9.  **Reasoning:** A very brief (≤ 50 chars) internal debug log on the "cost" perspective.
  10. **JSON Only:** Output ONLY the JSON object defined in <format>.
</priority_rules>

<!-- ---------------------------------------------------------------
  LAYER 2 : THE ENGINE  –  thinking process & tools
---------------------------------------------------------------- -->
<analysis_engine>

  <action_playbook>
    <!-- Your library of proactive tactics. -->
    [1. Clarify Situation]
      - AC-01  Information Gathering : "齟齬があってはいけませんので、〇〇についてもう少し詳しく教えていただけますか？"
    [2. Build Relationship]
      - AC-04  Appreciation / Feedback : "〇〇していただき、ありがとうございます。〇〇な点で、特に助けられました。"
    [3. Co-create Solutions]
      - AC-05  Offer Support     : "もしよろしければ、この部分のドラフト作成は私が担当しましょうか？"
    [4. Drive Process]
      - AC-03  Propose Alternatives : "代替案として、(1) 〇〇、(2) △△、といった方法はいかがでしょうか？"
      - AC-07  Schedule / Sync      : "この件について、5分ほどお電話でお話しするお時間をいただけますか？"
  </action_playbook>

  <analysis_steps>
    1.  **Context-First Analysis (Rule #3):** BEFORE evaluating the draft, read the <thread_context>. Resolve any ambiguities (like "その件") using the context. If the context makes the draft clear, DO NOT flag it as an issue.
    2.  **Functional Goal Analysis (Rule #4):** Identify the draft's practical goal (e.g., to thank, to request, to decide).
    3.  **Issue Classification & Proportionality:** Based on the goal, classify any issues. A "thank you" message lacking a "when" is NOT an issue. A "request" message lacking a "when" IS a `VagueIntent` issue. Do not over-intervene.
    4.  **"hasIssues" Flag Setting:** Set the `hasIssues` flag based on the result of step 3.
    5.  **Intervention Level Assessment:** Determine the necessary level of intervention (L1: Rephrasing, L2: Info Augmentation, L3: Proactive Action).
    6.  **"ai_receipt" Generation:** Draft "ai_receipt" by empathetically mirroring the user's intent.
    7.  **"detailed_analysis" Generation:** Generate "detailed_analysis" following the "Impact → Perspective" structure.
    8.  **"improvement_points" Generation:** Summarize the most critical action points.
    9.  **Suggestion Generation:**
        * L1 → Rephrase the draft to be more polite and constructive.
        * L2 → Apply the Hybrid Placeholder Strategy (Rule #5).
        * L3 → Select a tactic from the <action_playbook> and embed a concrete, actionable plan into the suggestion.
    10. **Final JSON Assembly:** Compose "reasoning" and return the final JSON object.
  </analysis_steps>

</analysis_engine>

<!-- ---------------------------------------------------------------
  LAYER 3 : APPENDIX  –  tag defs, theory, examples
---------------------------------------------------------------- -->
<appendix>

  <appendix_tag_defs>
    [Clarity Cost]
      - "VagueIntent": A critical piece of information for a *request* (like deadline or target) is ambiguous.
      - "MissingContext": The topic reference is missing AND cannot be resolved by the <thread_context>.
    [Emotional Cost]
      - "HarshTone": The tone is negative, blaming, or aggressive.
      - "Impolite": Lacks greetings, thanks, or politeness.
    [Actional Cost]
      - "MissingAcknowledgment": Fails to acknowledge the other's contribution or feelings.
  </appendix_tag_defs>

  <behavioral_guidance>
    * **ABC Model:** Your suggestions should create effective **Antecedents** (clear, low-effort triggers/CTAs) for the recipient and provide positive **Consequences** (praise, acknowledgment) for desired behaviors.
    * **RFT & ACT:** Your suggestions should **reframe** conflict into collaboration, accept difficult feelings, defuse from unhelpful thoughts (like blame), and act based on professional values (like teamwork).
  </behavioral_guidance>

  <examples>

    <!-- Example 1: Context is Key (Testing Rule #3) -->
    <example>
      <ctx>[14:00] 田中さん: C社の新機能開発プロジェクトの件ですが、現状のA案で進めて問題ないでしょうか？ご確認をお願いします。</ctx>
      <draft>はい、その件、問題ありません。A案で進めてください。</draft>
      <tags>{"lang":"japanese"}</tags>
      <output>{
        "originalText": "はい、その件、問題ありません。A案で進めてください。",
        "hasIssues": false,
        "issue_pattern": [],
        "detected_mentions": [],
        "ai_receipt": "文脈を的確に捉えた、簡潔で分かりやすい承認のメッセージですね。",
        "detailed_analysis": "直前の田中さんのメッセージで具体的なトピックが提示されているため、「その件」という指示語を使っても、何について話しているかが明確です。これにより、無駄な繰り返しを避け、効率的なコミュニケーションが実現できています。",
        "improvement_points": "文脈を活かした、簡潔で素晴らしい返信です。このままお使いいただけます。",
        "suggestion": "はい、その件、問題ありません。A案で進めてください。",
        "reasoning": "Context resolves ambiguity."
      }</output>
    </example>

    <!-- Example 2: Over-Correction Prevention (Testing Rule #4) -->
    <example>
      <ctx></ctx>
      <draft>先日のA社との会議ですが、議事録を関係者に共有しておいていただけますか。</draft>
      <tags>{"lang":"japanese"}</tags>
      <output>{
        "originalText": "先日のA社との会議ですが、議事録を関係者に共有しておいていただけますか。",
        "hasIssues": false,
        "issue_pattern": [],
        "detected_mentions": [],
        "ai_receipt": "会議の議事録共有を依頼する、丁寧で分かりやすいメッセージですね。",
        "detailed_analysis": "依頼の目的が明確で、丁寧な言葉遣いができています。多くの場合、共有すべき「関係者」や「先日」が指す会議は文脈上明らかであり、このままで十分に意図が伝わります。",
        "improvement_points": "このままお使いいただけます。もし緊急性が高い場合や、関係者が多岐にわたる場合にのみ、期限や共有範囲を追記するとより親切です。",
        "suggestion": "先日のA社との会議ですが、議事録を関係者に共有しておいていただけますか。",
        "reasoning": "Sufficiently clear for many contexts. No intervention needed."
      }</output>
    </example>

    <!-- Example 3: Multiple Missing Info (Testing Rule #5, Co-Writing) -->
    <example>
      <ctx></ctx>
      <draft>例のプロジェクトの件、例の資料を更新して、展開してください。</draft>
      <tags>{"lang":"japanese"}</tags>
      <output>{
        "originalText": "例のプロジェクトの件、例の資料を更新して、展開してください。",
        "hasIssues": true,
        "issue_pattern": ["MissingContext", "VagueIntent"],
        "detected_mentions": [],
        "ai_receipt": "プロジェクトを前に進めたいという意図、素晴らしいです。ただ、受け手が「何をすればいいか」一目で分かるように、少しだけ情報を補足しましょう。",
        "detailed_analysis": "【現状の表現がもたらす影響】「例の」という言葉が多用されており、具体的なプロジェクト名や資料名が不明です。これでは、受け手はどのタスクを指しているのか推測する必要があり、誤解が生じたり、確認の手間が発生したりしてしまいます。\n【より良い結果に繋がる視点】具体的な固有名詞を使い、誰に、いつまでに、何をしてほしいのかを明確にすることで、相手は確認の手間なく、すぐに作業に取り掛かることができます。",
        "improvement_points": "以下の確認事項をあなたの言葉で補足することで、この依頼は、誰が読んでも迷わない、明確で実行可能な指示になります。",
        "suggestion": "お疲れ様です。プロジェクトの件でご依頼です。\n\nお手数ですが、資料を更新し、関係者の皆様へ展開をお願いいたします。\n\nメッセージを送信される前に、以下の点をご確認・ご追記いただけますでしょうか。\n\n--- Missing Info ---\n• どのプロジェクトか: [■■■■]\n• どの資料を更新するか: [■■■■]\n• 誰に展開するか: [■■■■]\n• いつまでに対応してほしいか: [■■■■]\n---------------------\n\nご確認のほど、よろしくお願いいたします。",
        "reasoning": "Multiple ambiguous references."
      }</output>
    </example>

    <!-- Example 4: Proactive Action (Testing L3 Intervention) -->
    <example>
      <ctx>[10:00] 上司: @ユーザーさん、急で申し訳ないんだけど、明日の15時から入っているB社との定例、代わりにファシリテーターお願いできないかな？</ctx>
      <draft>すみません、明日の15時はクライアントとの最重要プレゼンと完全に重複しており、対応不可能です。</draft>
      <tags>{"lang":"japanese"}</tags>
      <output>{
        "originalText": "すみません、明日の15時はクライアントとの最重要プレゼンと完全に重複しており、対応不可能です。",
        "hasIssues": true,
        "issue_pattern": ["MissingAcknowledgment"],
        "detected_mentions": [],
        "ai_receipt": "急なお願いを断らなければならない状況、心苦しいですよね。相手の期待に応えたい気持ちと、ご自身の重要な責務との間で、どう伝えるべきか悩むお気持ち、お察しします。",
        "detailed_analysis": "【現状の表現がもたらす影響】「不可能です」と断るだけでは、相手に冷たい印象を与え、協力的な姿勢がないと受け取られる可能性があります。上司は「ではどうすればいいのか」と、次の手を自分で考えなければなりません。\n【より良い結果に繋がる視点】まず依頼してくれたことへの感謝を伝え、断る理由を丁寧に説明した上で、単に断るだけでなく、目的を達成するための具体的な代替案を自ら能動的に提案することが、信頼関係を維持し、問題解決能力を示す上で非常に重要です。",
        "improvement_points": "依頼への感謝を伝え、断る理由を丁寧に説明した上で、「代わりに〇〇するのはどうでしょうか？」という具体的な代替案を提案すると、問題解決への貢献意欲が伝わります。",
        "suggestion": "@上司さん\n\nお声がけいただきありがとうございます！急なご用件とのことで、ぜひお力になりたかったのですが、大変申し訳ありません。明日の15時は、B社との最重要プレゼンと時間が完全に重なっておりまして…。\n\nもしよろしければ、代替案として、\n(1) 私からCさんに代理をお願いしてみる\n(2) 会議の重要な論点だけでも、事前に私にインプットいただく\nといった方法が考えられますが、いかがでしょうか？",
        "reasoning": "Passive rejection; needs proactive alternatives."
      }</output>
    </example>

  </examples>

  <format>{
    "originalText": "",
    "hasIssues": false,
    "issue_pattern": [],
    "detected_mentions": [],
    "ai_receipt": "",
    "detailed_analysis": "",
    "improvement_points": "",
    "suggestion": "",
    "reasoning": ""
  }</format>

</system>
"""

# -------------------------------------------------------------------
# テストケースの定義 (Test Case Definitions)
# -------------------------------------------------------------------
test_cases = [
    {
        "case_name": "Test Case 1: The \"Do Nothing\" Test",
        "payload": {
            "user_draft": "承知いたしました。ご依頼の件、本日17時までに対応いたします。",
            "thread_context": "",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": False,
            "issue_pattern": [],
            "suggestion": "承知いたしました。ご依頼の件、本日17時までに対応いたします。",
            "reasoning": "No issues found."
        }
    },
    {
        "case_name": "Test Case 2: The \"Simple Fix\" Test",
        "payload": {
            "user_draft": "明日までにこの資料、修正しといて。",
            "thread_context": "",
            "hierarchy": "junior",
            "social_distance": "somewhat_close",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["Impolite", "HarshTone"],
            "suggestion": "お疲れ様です。\n\nお忙しいところ恐れ入りますが、この資料を明日までに修正していただけますでしょうか？\n\nご対応よろしくお願いいたします。",
            "reasoning": "Impolite tone imposes emotional cost."
        }
    },
    {
        "case_name": "Test Case 3: The \"Over-Correction\" Test",
        "payload": {
            "user_draft": "先日のA社との会議ですが、議事録を関係者に共有しておいていただけますか。",
            "thread_context": "",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": False,
            "issue_pattern": [],
            "suggestion": "先日のA社との会議ですが、議事録を関係者に共有しておいていただけますか。",
            "reasoning": "Sufficiently clear for many contexts. No intervention needed."
        }
    },
    {
        "case_name": "Test Case 4: The \"Multiple Missing Info\" Test",
        "payload": {
            "user_draft": "例のプロジェクトの件、例の資料を更新して、展開してください。",
            "thread_context": "",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["MissingContext", "VagueIntent"],
            "suggestion": "お疲れ様です。プロジェクトの件でご依頼です。\n\nお手数ですが、資料を更新し、関係者の皆様へ展開をお願いいたします。\n\nメッセージを送信される前に、以下の点をご確認・ご追記いただけますでしょうか。\n\n--- Missing Info ---\n• どのプロジェクトか: [■■■■]\n• どの資料を更新するか: [■■■■]\n• 誰に展開するか: [■■■■]\n• いつまでに対応してほしいか: [■■■■]\n---------------------\n\nご確認のほど、よろしくお願いいたします。",
            "reasoning": "Multiple ambiguous references."
        }
    },
    {
        "case_name": "Test Case 5: The \"Proactive Action\" Test",
        "payload": {
            "user_draft": "すみません、明日の15時はクライアントとの最重要プレゼンと完全に重複しており、対応不可能です。",
            "thread_context": "[10:00] 上司: @ユーザーさん、急で申し訳ないんだけど、明日の15時から入っているB社との定例、代わりにファシリテーターお願いできないかな？",
            "hierarchy": "senior",
            "social_distance": "close",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["MissingAcknowledgment"],
            "suggestion": "@上司さん\n\nお声がけいただきありがとうございます！急なご用件とのことで、ぜひお力になりたかったのですが、大変申し訳ありません。明日の15時は、B社との最重要プレゼンと時間が完全に重なっておりまして…。\n\nもしよろしければ、代替案として、\n(1) 私からCさんに代理をお願いしてみる\n(2) 会議の重要な論点だけでも、事前に私にインプットいただく\nといった方法が考えられますが、いかがでしょうか？",
            "reasoning": "Passive rejection; needs proactive alternatives."
        }
    },
    {
        "case_name": "Test Case 6: The \"Context is Key\" Test",
        "payload": {
            "user_draft": "はい、その件、問題ありません。A案で進めてください。",
            "thread_context": "[14:00] 田中さん: C社の新機能開発プロジェクトの件ですが、現状のA案で進めて問題ないでしょうか？ご確認をお願いします。",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": False,
            "issue_pattern": [],
            "suggestion": "はい、その件、問題ありません。A案で進めてください。",
            "reasoning": "Context resolves ambiguity."
        }
    }
]

# -------------------------------------------------------------------
# テスト実行と結果表示の関数 (Test Execution and Display Functions)
# -------------------------------------------------------------------

def run_single_test(api_url: str, payload: dict) -> dict:
    """指定されたペイロードでAPIにリクエストを送信し、結果を返す"""
    """Sends a request to the API with the given payload and returns the result."""
    headers = {"Content-Type": "application/json"}
    try:
        response = requests.post(api_url, data=json.dumps(payload), headers=headers)
        response.raise_for_status()  # エラーがあれば例外を発生させる
        return response.json()
    except requests.exceptions.RequestException as e:
        return {"error": str(e)}

def create_comparison_table(case_name: str, payload: dict, ideal: dict, actual: dict) -> str:
    """比較結果のHTMLテーブルを生成する"""
    """Generates an HTML table for comparison results."""
    
    # スタイル定義
    # Style definitions
    style = """
    <style>
        .comparison-table {
            width: 100%;
            border-collapse: collapse;
            margin-bottom: 20px;
            font-family: sans-serif;
        }
        .comparison-table th, .comparison-table td {
            border: 1px solid #ddd;
            padding: 8px;
            text-align: left;
            vertical-align: top;
        }
        .comparison-table th {
            background-color: #f2f2f2;
            font-weight: bold;
        }
        .comparison-table pre {
            white-space: pre-wrap;
            word-wrap: break-word;
            margin: 0;
            font-size: 13px;
        }
        .status-ok { color: green; font-weight: bold; }
        .status-ng { color: red; font-weight: bold; }
    </style>
    """
    
    # テーブルヘッダー
    # Table header
    html = f"<h3>{case_name}</h3>"
    html += f"<pre>Input: {json.dumps(payload, indent=2, ensure_ascii=False)}</pre>"
    html += "<table class='comparison-table'>"
    html += "<tr><th>評価項目（キー）</th><th>理想のアウトプット</th><th>実際のAIアウトプット</th><th>コメント</th></tr>"
    
    # テーブルボディ
    # Table body
    all_keys = sorted(list(set(ideal.keys()) | set(actual.keys())))
    
    for key in all_keys:
        ideal_val = ideal.get(key, "N/A")
        actual_val = actual.get(key, "N/A")
        
        # 比較とコメント生成
        # Comparison and comment generation
        comment = ""
        if ideal_val == actual_val:
            comment = "<span class='status-ok'>✅ 一致</span>"
        else:
            # hasIssuesは厳密に比較
            # Strictly compare hasIssues
            if key == 'hasIssues' and ideal_val != actual_val:
                 comment = "<span class='status-ng'>❌ 不一致</span>"
            # issue_patternは順不同で比較
            # Compare issue_pattern regardless of order
            elif key == 'issue_pattern' and isinstance(ideal_val, list) and isinstance(actual_val, list) and sorted(ideal_val) == sorted(actual_val):
                comment = "<span class='status-ok'>✅ 一致</span>"
            else:
                comment = "<span class='status-ng'>❌ 不一致</span>"

        # JSONオブジェクトやリストは見やすく整形
        # Format JSON objects and lists for readability
        if isinstance(ideal_val, (dict, list)):
            ideal_val = json.dumps(ideal_val, indent=2, ensure_ascii=False)
        if isinstance(actual_val, (dict, list)):
            actual_val = json.dumps(actual_val, indent=2, ensure_ascii=False)
            
        html += f"""
        <tr>
            <td><code>{key}</code></td>
            <td><pre>{ideal_val}</pre></td>
            <td><pre>{actual_val}</pre></td>
            <td>{comment}</td>
        </tr>
        """
        
    html += "</table>"
    return style + html

# -------------------------------------------------------------------
# メイン処理 (Main Process)
# -------------------------------------------------------------------
print(f"テストを開始します... APIエンドポイント: {API_URL}")
print(f"Executing tests... API Endpoint: {API_URL}")

all_results_html = ""
for test in test_cases:
    case_name = test["case_name"]
    payload = test["payload"]
    ideal_output = test["ideal_output"]
    
    print(f"\n--- {case_name} を実行中 ---")
    print(f"--- Executing {case_name} ---")
    
    # 実際のAPIコール
    # Actual API call
    actual_output = run_single_test(API_URL, payload)
    
    # 理想のアウトプットのキーを実際の出力と比較するために絞り込む
    # Filter ideal output keys for comparison with actual output
    ideal_for_comparison = {key: ideal_output[key] for key in ideal_output if key in actual_output or key in ['hasIssues', 'issue_pattern', 'suggestion', 'reasoning']}

    # 比較表を生成
    # Generate comparison table
    if "error" in actual_output:
        print(f"エラーが発生しました: {actual_output['error']}")
        print(f"Error occurred: {actual_output['error']}")
        all_results_html += f"<h3>{case_name}</h3><p style='color:red;'>テスト実行エラー: {actual_output['error']}</p>"
    else:
        # 比較対象のキーを理想のアウトプットから抽出
        # Extract keys for comparison from ideal output
        comparison_keys = ['hasIssues', 'issue_pattern', 'suggestion', 'reasoning']
        ideal_subset = {k: ideal_output.get(k) for k in comparison_keys}
        actual_subset = {k: actual_output.get(k) for k in comparison_keys}
        
        table_html = create_comparison_table(case_name, payload, ideal_subset, actual_subset)
        all_results_html += table_html

print("\n--- 全てのテストが完了しました ---")
print("--- All tests completed ---")

# 結果をJupyter Notebookに表示
# Display results in Jupyter Notebook
display(HTML(all_results_html))


テストを開始します... APIエンドポイント: http://localhost:3000/api/check-tone/route
Executing tests... API Endpoint: http://localhost:3000/api/check-tone/route

--- Test Case 1: The "Do Nothing" Test を実行中 ---
--- Executing Test Case 1: The "Do Nothing" Test ---
エラーが発生しました: 404 Client Error: Not Found for url: http://localhost:3000/api/check-tone/route
Error occurred: 404 Client Error: Not Found for url: http://localhost:3000/api/check-tone/route

--- Test Case 2: The "Simple Fix" Test を実行中 ---
--- Executing Test Case 2: The "Simple Fix" Test ---
エラーが発生しました: 404 Client Error: Not Found for url: http://localhost:3000/api/check-tone/route
Error occurred: 404 Client Error: Not Found for url: http://localhost:3000/api/check-tone/route

--- Test Case 3: The "Over-Correction" Test を実行中 ---
--- Executing Test Case 3: The "Over-Correction" Test ---
エラーが発生しました: 404 Client Error: Not Found for url: http://localhost:3000/api/check-tone/route
Error occurred: 404 Client Error: Not Found for url: http://localhost:30