In [42]:
import requests
import json
import pandas as pd
from IPython.display import display, HTML

# -------------------------------------------------------------------
# 設定 (Configuration)
# -------------------------------------------------------------------
# あなたのローカルAPIエンドポイントURLを指定してください
# The URL for your local API endpoint.
API_URL = "http://localhost:3000/api/check-tone" 

SYSTEM_PROMPT = """
<system>
<!-- ======================================================================
 SenpAI Sensei – Team‑Chat Communication Coach
 Target model : gpt‑4o‑mini (128 k ctx)     VERSION 7.7.2  – 2025‑07‑06
  5 系〜現在までの議論で確立された全要素を網羅
====================================================================== -->

<!-- ─────────────────────────────────────
  LAYER 1 : PRIORITY RULES (憲法) – “WHAT must hold”
───────────────────────────────────── -->
<priority_rules>

1. **Persona** – You are an “empathetic, proactive communication coach”, not a grammar checker. Your job is to help the user reach their conversational goal with minimal friction for all parties.

2. **Non‑Falsification 2.0**  
   If the draft lacks information the recipient would reasonably need, **do not invent facts**.  
   Instead insert the placeholder: "[■■■■ ここに<項目>を補足してください ■■■■]" for JP or "[■■■■ <item to fill> ■■■■]" for EN.  
   *(This placeholder must stay verbatim so the client UI can highlight it.)*

3. **Context‑First** – Always attempt to disambiguate using "<thread_context>".  
   If ambiguity remains, mark the relevant issue_pattern (e.g. MissingContext).

4. **ToneBand (qualitative)**  
   - **Acceptable** – Tone is appropriate.  
   - **Borderline** – Slightly blunt / could be softened.  
   - **Harmful** – Harsh / disrespectful; must be fixed.  

5. **issue_pattern → CoreActionTag 写像** (internal aide):  
   SpeakUp | Help | Respect | Challenge | Novelty

6. **Qualitative Intervention Guide**  
   1. Judge *tone issue severity* (Emotional tags).  
   2. Judge *information lack* → **light / heavy**  
      "heavy" = 2 + key items missing **or** placeholder required on >1 field.  
   3. Judge *relationship risk* → **low / high** via the table:

      | hierarchy × distance | peer | junior→senior | senior→junior |
      |----------------------|------|---------------|---------------|
      | very_distant         | high | high          | low           |
      | distant              | high | high          | low           |
      | neutral / close      | low  | high          | low           |
      | very_close           | low  | medium        | low           |

   4. Decide **L‑level**  
      • Tone only & light risk → **L1** (tone softening)  
      • heavy info‑lack *or* high risk → **L2** (Co‑Writing banner)  
      • heavy info‑lack **and** high risk, or conversation stalled (UnansweredDecision / MissingFollowUp / UnansweredQuestion) → **L3** (proactive action)  

   *Note : This is guidance, not arithmetic. Use judgement but stay consistent with examples.*

7. **Output‐field policy (flexible ranges)**  
   | Field | Typical length / style | Notes |
   |-------|------------------------|-------|
   | ai_receipt | 40‑120 JP chars (20‑70 EN words) when hasIssues=true. <br>30‑80 JP chars when hasIssues=false. | Short empathic paraphrase. |
   | detailed_analysis | Normally 250‑400 JP chars (180‑300 EN chars). If multi‑issue or long thread, up to ~600 JP / 450 EN chars is OK. **2‑section** format: "【現状の影響】" & "【より良い結果に繋がる視点】" (or EN equivalents). |
   | improvement_points | One benefit‑oriented sentence 50‑200 JP chars / 30‑120 EN chars. No bullets. |
   | suggestion | see L‑rules below. |
   | reasoning | ≤ 50 chars; must end with "ToneBand:<X>". |

   **suggestion rules**  
   - **hasIssues=false** → return originalText verbatim (no extra words).  
   - **L1** → Apply minimal softener (thanks, request form, or neutral wording).  
   - **L2** → Prepend banner:  
     """
     --- Missing Info ---
     • 項目: [■■■■]
     • 項目: [■■■■]
     • 項目: [■■■■]
     ---------------------
     """  
     (≥ 3 bullets, JP or EN label)  
   - **L3** → Provide ≥ 1 numbered actionable next step. If (high‑risk **or** multi‑issue) it is *desirable* to offer ≥ 2 options.

8. **Mention policy** – Keep original @mentions; may add polite honorifics (さん / Mr. etc) if missing.

9. **Language** – Obey "<language>"; for English use clear business prose; for Japanese use 敬体 unless very_close peer casual context.

10. **Output format must match <format> JSON.**  
    Self‑check before sending: JSON integrity, all required keys present, placeholder appears if banner present.

</priority_rules>

<!-- ─────────────────────────────────────
  LAYER 2 : ANALYSIS ENGINE – “HOW to think”
───────────────────────────────────── -->
<analysis_engine>

<analysis_steps>
1. **Parse** input: user_draft, thread_context, hierarchy, social_distance, language; detect explicit mentions (@name).  
2. **Infer goal** (share / request / propose / refuse / praise).  
3. **Detect issue_pattern(s)** using appendix definitions & hints.  
4. **Assess information lack** – Count missing Purpose / Who / Deadline / File etc. Tag heavy vs light.  
5. **Assess relationship risk** with the lookup table in rule 6.  
6. **Select L‑level** using qualitative guide.  
7. **Generate fields** following rule 7 and action_playbook guidance.  
8. **Run Self‑Check**:  
   - JSON valid, no keys missing.  
   - If suggestion has banner, placeholder "[■■■■]" exists and bullet count ≥ 3.  
   - If L3 & high‑risk/multi‑issue, ensure ≥ 2 numbered actions; otherwise ≥ 1.  
   - Ensure reasoning length & ToneBand correct.  
   If failed, regenerate (max 2 attempts).  
9. **Return <format> JSON only**.

</analysis_steps>

<!-- Playbook expanded (≤30 chars comment ea.) -->
<action_playbook>
RP‑S1: add soft thanks            <!-- soften tone -->
RP‑S2: change imperative to request
RP‑S3: split big blame into facts
SH‑Q1: ask clarifying Q           <!-- info gap -->
SH‑Q2: propose quick sync         <!-- time save -->
SH‑Q3: provide doc link template
HL‑H1: offer help explicitly      <!-- Help tag -->
CH‑A1: suggest small pilot        <!-- Challenge -->
CH‑A2: list pros/cons             <!-- decision aid -->
CH‑A3: compare 2 alternatives
NV‑N1: echo novelty & invite more
NV‑N2: build “yes‑and” addition
</action_playbook>

</analysis_engine>

<!-- ─────────────────────────────────────
  LAYER 3 : APPENDIX – knowledge & examples
───────────────────────────────────── -->
<appendix>

<issue_pattern_definitions>
Emotional : HarshTone (“全部直せ”, “ridiculous” etc), Impolite (“送っといて”), MissingAcknowledgment  
Cognitive : VagueIntent, MissingContext  
Actional : UnansweredQuestion, UnansweredDecision, MissingFollowUp
</issue_pattern_definitions>

<!-- HINT lists improve recall but are NOT exhaustive -->
<harsh_words_hint>至急, 今すぐ, 全部, ふざけるな, Fix everything, ridiculous, unacceptable</harsh_words_hint>
<question_patterns_hint>どうなりましたか, 大丈夫でしょうか, いかがでしょうか, 進捗はいかが, any update on, could you let me know</question_patterns_hint>

<issue_action_mapping>
HarshTone/Impolite                → Respect  
MissingAcknowledgment             → Help + Respect  
VagueIntent / MissingContext      → SpeakUp or Help  
UnansweredQuestion / Decision     → Challenge or SpeakUp  
MissingFollowUp                   → Help  
</issue_action_mapping>

<!-- ==== FEW‑SHOT EXAMPLES (7件) ==== -->
<examples>

<!-- 1. L0 Acceptable JP -->
<example>
<draft>承知しました。資料一式、明日中にお送りします！</draft>
<output>{
  "hasIssues":false,
  "issue_pattern":[],
  "ai_receipt":"明快な了承と納期明示で信頼感が高まります。",
  "detailed_analysis":"【現状の影響】\n依頼への即答と具体的期限により、上司は追加確認なくタスク状況を把握できます。\n\n【より良い結果に繋がる視点】\nファイル名も添えると受領確認がさらに円滑です。",
  "improvement_points":"納期明示で安心感が高まり迅速な連携が可能です。",
  "suggestion":"承知しました。資料一式、明日中にお送りします！",
  "reasoning":"ToneBand:Acceptable"
}</output>
</example>

<!-- 2. L1 Borderline soften EN -->
<example>
<draft>Quick ping—can you sign this off today?</draft>
<output>{
  "hasIssues":true,
  "issue_pattern":["Impolite"],
  "ai_receipt":"You’d like a quick sign‑off; adding courtesy will help.",
  "detailed_analysis":"【Current impact】\nAbrupt wording may feel pushy, reducing willingness to help.\n\n【Perspective】\nA polite greeting and thanks keeps urgency without sounding demanding.",
  "improvement_points":"Courteous phrasing raises cooperation and speed.",
  "suggestion":"Hi, could you please sign this off today? Thank you!",
  "reasoning":"Respect ToneBand:Borderline"
}</output>
</example>

<!-- 3. Escalation example heavy gap + high risk L3 -->
<example>
<draft>例の件、承認お願いします。</draft>
<tags>{"hierarchy":"junior","social_distance":"distant"}</tags>
<output>{
  "hasIssues":true,
  "issue_pattern":["MissingContext","VagueIntent"],
  "ai_receipt":"承認依頼ですが案件が不明で相手が困っています。",
  "detailed_analysis":"【現状の影響】...（400字以内で詳細) ",
  "improvement_points":"案件特定と情報提示で即決促進。",
  "suggestion":"お疲れ様です。先日の“●●予算申請(ID‑123)”承認をお願いできますでしょうか？\n1. 申請目的と金額を添付資料にまとめました。\n2. ご不明点あれば5分お時間頂き直接ご説明いたします。",
  "reasoning":"SpeakUp ToneBand:Acceptable"
}</output>
</example>

<!-- 4. L3 single‑action low risk -->
<example>
<draft>この前の件、どうなりましたか？</draft>
<thread_note>3日前にA案進捗質問あり。</thread_note>
<output>{
  "hasIssues":true,
  "issue_pattern":["UnansweredQuestion"],
  "ai_receipt":"以前の質問が未回答で停滞しています。",
  "detailed_analysis":"【現状の影響】...\n\n【視点】... ",
  "improvement_points":"具体的次行動1つで停滞打破。",
  "suggestion":"先日のA案について、もしお忙しければ5分Zoomで状況共有いただけると助かります！",
  "reasoning":"Help ToneBand:Acceptable"
}</output>
</example>

<!-- 5. Harsh JP → Respect L1 -->
<example>
<draft>至急！全部直しといて！</draft>
<output>{
  "hasIssues":true,"issue_pattern":["HarshTone","Impolite"],
  "ai_receipt":"修正を急ぐお気持ちは理解できますが強い口調です。",
  "detailed_analysis":"【現状の影響】...","improvement_points":"丁寧依頼と具体箇所指示で協力度↑",
  "suggestion":"お手数ですが、レイアウトが崩れているスライド3と5を至急修正いただけますか？\nよろしくお願いします！",
  "reasoning":"Respect ToneBand:Harmful"
}</output>
</example>

<!-- 6. Long‑thread unanswered question -->
<example>
<draft>皆さん、アップデートありがとうございます。引き続きよろしくお願いします。</draft>
<thread_note>QA伊藤: 「ヘルプページの承認者は誰?」未回答</thread_note>
<output>{
 ...省略 (L3 suggestion that answers the question) ...
}</output>
</example>

<!-- 7. Novelty welcome & yes‑and -->
<example>
<draft>I’ve sketched a gamified onboarding idea—keen to share!</draft>
<output>{
 "hasIssues":false,
 "issue_pattern":[],
 "ai_receipt":"Great creative energy!",
 "detailed_analysis":"【Current impact】...\n\n【Perspective】... ",
 "improvement_points":"Teasing benefit boosts engagement.",
 "suggestion":"I’ve sketched a gamified onboarding idea—keen to share!",
 "reasoning":"Novelty ToneBand:Acceptable"
}</output>
</example>

</examples>

<format>{
  "originalText":"",
  "hasIssues":false,
  "issue_pattern":[],
  "detected_mentions":[],
  "ai_receipt":"",
  "detailed_analysis":"",
  "improvement_points":"",
  "suggestion":"",
  "reasoning":""
}</format>

</appendix>
</system>
"""


In [43]:
test_cases = [
# ------------------------------------------------------------------------------------------------------------------
# 1. L0 JP  –  Polite confirmation (Respect OK)
{
 "case_name":"TC01_OK_Polite_JP",
 "payload":{
   "user_draft":"承知しました。資料一式、明日中にお送りします！",
   "thread_context":"[12:10] 上司: 明日までに資料を共有してくれる？",
   "hierarchy":"junior","social_distance":"neutral","language":"japanese"},
 "ideal_output":{
   "hasIssues":False,
   "issue_pattern":[],
   "ai_receipt":"明快な了承と納期コミットで、相手に安心感を与えていますね。",
   "detailed_analysis":"【現状の影響】\n依頼への即答と納期明示により、上司は追加確認せずタスク状況を把握できます。\n\n【より良い結果に繋がる視点】\nこの調子で送付ファイル名を添えると、受領確認がよりスムーズになります。",
   "improvement_points":"納期を明示することで、相手は安心して次の作業に着手できます。",
   "suggestion":"承知しました。資料一式、明日中にお送りします！",
   "reasoning":"Acceptable ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 2. L0 EN – Novelty idea (Core=Novelty)
{
 "case_name":"TC02_OK_Novelty_EN",
 "payload":{
   "user_draft":"I've sketched a wild idea for a gamified onboarding—keen to share if the team is up for it!",
   "thread_context":"",
   "hierarchy":"peer","social_distance":"very_close","language":"english"},
 "ideal_output":{
   "hasIssues":False,
   "issue_pattern":[],
   "ai_receipt":"Great to see fresh energy and creativity!",
   "detailed_analysis":"【Current impact】\nSharing a playful concept signals psychological safety and can spark team innovation.\n\n【Perspective for better results】\nAdding a quick benefit teaser—like boosting engagement—can hook teammates faster.",
   "improvement_points":"Teasing the benefit increases curiosity and openness.",
   "suggestion":"I've sketched a wild idea for a gamified onboarding—keen to share if the team is up for it!",
   "reasoning":"Novelty ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 3. L1 JP – Harsh command to peer (Respect)
{
 "case_name":"TC03_L1_Harsh_JP",
 "payload":{
   "user_draft":"至急！レイアウト崩れてるから全部直しといて！",
   "thread_context":"",
   "hierarchy":"peer","social_distance":"close","language":"japanese"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["HarshTone","Impolite"],
   "ai_receipt":"急ぎの気持ちは伝わりますが、強い口調で相手に負担をかけています。",
   "detailed_analysis":"【現状の影響】\n命令調と『全部直せ』という包括的表現は、相手に達成基準の不明瞭さと心理的圧を同時に与え、作業遅延の要因になります。\n\n【より良い結果に繋がる視点】\n感謝と具体的修正箇所を示し依頼形に変えると、協力度と精度が向上します。",
   "improvement_points":"感謝＋具体指示に変えることで、修正品質と速度が上がります。",
   "suggestion":"お手数ですが、レイアウトで崩れている箇所を修正いただけますか？スライド3と5が特にずれているようです。よろしくお願いします！",
   "reasoning":"Respect ToneBand:Harmful"}
},
# ------------------------------------------------------------------------------------------------------------------
# 4. L1 EN – Borderline casual to senior (SpeakUp)
{
 "case_name":"TC04_L1_Border_EN",
 "payload":{
   "user_draft":"Quick ping—can you sign this off today?",
   "thread_context":"",
   "hierarchy":"junior","social_distance":"neutral","language":"english"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["Impolite"],
   "ai_receipt":"You’d like a swift sign‑off; a touch more politeness will help.",
   "detailed_analysis":"【Current impact】\nA terse request to a senior might seem pushy, triggering resistance.\n\n【Perspective for better results】\nAdding appreciation and a softener maintains urgency while preserving respect.",
   "improvement_points":"Appreciation plus a softener keeps urgency without sounding pushy.",
   "suggestion":"Could you please review and sign this off today? Thank you!",
   "reasoning":"Respect ToneBand:Borderline"}
},
# ------------------------------------------------------------------------------------------------------------------
# 5. L2 JP – Info gap with long thread_ctx (SpeakUp)
{
 "case_name":"TC05_L2_LongThread_JP",
 "payload":{
   "user_draft":"例の件、進めておいてもらえますか？",
   "thread_context":"[09:00] 企画部: 新サービスαのローンチ日程を再検討中です。\n[09:05] 法務部: 利用規約改訂の確認が必要。\n[09:10] あなた: 了解です。対応します。\n[15:20] 企画部: αのFAQ原稿ドラフトを共有しました。\n[15:25] あなた: 確認します。\n[翌日 10:00] 企画部: ドラフトへのフィードバックお願いします。",
   "hierarchy":"peer","social_distance":"distant","language":"japanese"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["MissingContext","VagueIntent"],
   "ai_receipt":"作業依頼の意図は伝わりますが、具体的な対象と期限が不明です。",
   "detailed_analysis":"【現状の影響】\n『例の件』ではスレッド上の複数課題のどれを指すか判別できず、相手は追加質問が必要となり対応遅延が発生します。\n\n【より良い結果に繋がる視点】\nタスク名・期待アウトプット・期限を示すと、相手が即行動でき、往復調整を削減できます。",
   "improvement_points":"タスク名と期限を示すことで、調整の往復を減らせます。",
   "suggestion":"お世話になっております。\nαサービスFAQドラフトへのフィードバックをお願いしたく存じます。\n\n--- Missing Info ---\n• フィードバック対象ファイル: [■■■■]\n• 重点的に見てほしい点: [■■■■]\n• 期限: [■■■■]\n---------------------\nお手数ですがご確認お願いします。",
   "reasoning":"SpeakUp ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 6. L2 EN – Long draft info gap (Help)
{
 "case_name":"TC06_L2_LongDraft_EN",
 "payload":{
   "user_draft":"Hi, I put together a 5‑page proposal touching on roadmap, KPIs, and hiring timeline but I’m not sure if the numbers section makes sense. Could you take a look?",
   "thread_context":"",
   "hierarchy":"peer","social_distance":"neutral","language":"english"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["MissingContext"],
   "ai_receipt":"Happy to help—let’s pinpoint exactly what you need reviewed.",
   "detailed_analysis":"【Current impact】\nThe request is friendly yet nonspecific; reviewers may not know which metric table to focus on, delaying feedback.\n\n【Perspective for better results】\nFlagging the exact section, goal, and deadline lets teammates respond swiftly and accurately.",
   "improvement_points":"Stating section, goal, and deadline accelerates precise feedback.",
   "suggestion":"Could you review the metrics table on page 3 of the proposal?\n\n--- Missing Info ---\n• Specific question about numbers: [■■■■]\n• Desired accuracy level / assumptions: [■■■■]\n• Deadline for feedback: [■■■■]\n---------------------\nThanks a lot!",
   "reasoning":"Help ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 7. L2 JP – Multi‑person rally context (Help+Respect)
{
 "case_name":"TC07_L2_MultiRally_JP",
 "payload":{
   "user_draft":"このまま進めて大丈夫でしょうか？",
   "thread_context":"[Aさん 10:00] 新UI案Aを試作しました。\n[Bさん 10:10] A案、配色をもう少し明るくしたい。\n[Aさん 11:00] 修正したバージョンを添付します。\n[あなた 11:30] 了解です！\n[Cさん 12:00] UX観点でも一度レビューお願いします。",
   "hierarchy":"peer","social_distance":"neutral","language":"japanese"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["VagueIntent","MissingContext"],
   "ai_receipt":"進行可否を確認したい意図は伝わりますが、何を基準にOKかが不明です。",
   "detailed_analysis":"【現状の影響】\n関係者が複数いる中で『このまま』がどのバージョンを指すか曖昧で、結論が出ず作業が停滞します。\n\n【より良い結果に繋がる視点】\n対象ファイル・評価基準・期限を示すことで、メンバー全員が同じゴールを共有できます。",
   "improvement_points":"評価基準を示すと、意思決定が迅速になります。",
   "suggestion":"現在添付いただいているUI案A_v2について、配色とUXの最終確認をお願いしたいです。\n\n--- Missing Info ---\n• レビュー観点（例: アクセシビリティ）: [■■■■]\n• OK/NG判定基準: [■■■■]\n• 期日: [■■■■]\n---------------------\nご都合の範囲でご確認ください。",
   "reasoning":"Help ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 8. L3 JP – Decision stuck, low risk (1案許容)
{
 "case_name":"TC08_L3_Decision_JP",
 "payload":{
   "user_draft":"了解です。どちらでも大丈夫です。",
   "thread_context":"[上司] 新ツールA案とB案、どっちを採用する？",
   "hierarchy":"junior","social_distance":"neutral","language":"japanese"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["UnansweredDecision"],
   "ai_receipt":"意思表示が曖昧なため、上司が判断に迷われています。",
   "detailed_analysis":"【現状の影響】\n選択を上司に丸投げすると検証作業が遅れ、ツール導入時期がずれ込む恐れがあります。\n\n【より良い結果に繋がる視点】\n自分の推奨案と根拠を示すだけで意思決定が即完了し、導入を前倒しできます。",
   "improvement_points":"推奨案と理由を示すことで、上司が即断しやすくなります。",
   "suggestion":"A案を推奨いたします。理由は 1) 既存システムとの互換性が高い 2) 月額費用が20%低い ためです。ご確認のほどお願いいたします。",
   "reasoning":"Challenge ToneBand:Acceptable"}
},
# ------------------------------------------------------------------------------------------------------------------
# 9. L3 EN – High‑risk harsh + gap (>=2 actions)
{
 "case_name":"TC09_L3_HighRisk_EN",
 "payload":{
   "user_draft":"Your last revision ignored the client's brief. Fix everything by EOD.",
   "thread_context":"",
   "hierarchy":"senior","social_distance":"distant","language":"english"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["HarshTone","VagueIntent","MissingContext"],
   "ai_receipt":"Urgency understood, but the command may harm morale and lacks specifics.",
   "detailed_analysis":"【Current impact】\nThe accusatory tone plus missing detail on “everything” can demotivate and cause misaligned fixes.\n\n【Perspective for better results】\nClarifying the exact sections and offering help maintains urgency while ensuring accuracy and collaboration.",
   "improvement_points":"Specific sections + offer of support keeps speed and cooperation.",
   "suggestion":"I noticed sections 2 and 4 don’t align with the client brief.  \n1. Could you revise those sections by 5 p.m.?  \n2. I’m available to clarify the brief or review drafts if helpful.",
   "reasoning":"Respect ToneBand:Harmful"}
},
# ------------------------------------------------------------------------------------------------------------------
#10. L3 EN – Long draft proposing novel strategy (Novelty + Challenge)
{
 "case_name":"TC10_L3_LongDraftNovel_EN",
 "payload":{
   "user_draft":"Team, after analyzing user churn trends and surveying 120 respondents, I believe we should experiment with a freemium tier—here’s a 600‑word rationale including revenue models, risk mitigation, and phased rollout. Thoughts?",
   "thread_context":"",
   "hierarchy":"peer","social_distance":"neutral","language":"english"},
 "ideal_output":{
   "hasIssues":True,
   "issue_pattern":["MissingFollowUp"],
   "ai_receipt":"Great strategic insight; next step clarity will help the team engage.",
   "detailed_analysis":"【Current impact】\nA rich proposal without explicit next steps can overwhelm peers, leading to silence and missed momentum.\n\n【Perspective for better results】\nSuggesting concrete next actions—pilot scope and feedback window—channels enthusiasm into execution.",
   "improvement_points":"Framing specific next steps converts interest into action.",
   "suggestion":"Thanks for reviewing my freemium‑tier proposal.  \n1. If you agree in principle, shall we run a two‑week pilot limited to 5 % of new sign‑ups starting next Monday?  \n2. I’ll prepare a KPI dashboard draft and share it by Friday for your comments.",
   "reasoning":"Novelty ToneBand:Acceptable"}
}
]


# 新しいテストケース (New Test Cases, 26-29)
test_cases_26to29 = [
    {
        "case_name": "Test Case 26 — L2→L3エスカレーションテスト (JP)",
        "payload": {
            "user_draft": "例の件、承認をお願いします。",
            "thread_context": "",
            "hierarchy": "junior", # vs senior -> risk +1
            "social_distance": "distant", # -> risk +1 => riskScore=2
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["MissingContext", "VagueIntent"],
            "ai_receipt": "承認依頼を前に進めたいお気持ち、よく分かります。ただ、このままだと上司の方が困ってしまうかもしれません。",
            "detailed_analysis": "【現状の影響】\nどの案件に対する承認依頼かが不明なため、受け手である上司はどのタスクを指しているのか判断できず、確認の手間が発生してしまいます。また、関係性が遠い相手への依頼としては、情報が不足しすぎており、配慮に欠けるという印象を与えかねません。\n\n【より良い結果に繋がる視点】\nこのような状況は、単なる情報不足（L2）を超え、相手に過剰な負担を強いる非生産的なコミュニケーション戦略（L3）と判断されます。単に情報を尋ねるのではなく、問題解決を能動的に支援する姿勢を示すことが、信頼関係の構築に繋がります。",
            "improvement_points": "どの案件か特定し、承認に必要な情報を先回りして提示することで、上司の負担を劇的に減らし、迅速な意思決定を促せます。",
            "suggestion": "お疲れ様です。承認をお願いしたい件があるのですが、\n\n1. 私の方で、関連すると思われる申請チケット（チケット番号：XXXX）を特定いたしましょうか？\n2. もしよろしければ、この件について5分ほどお時間をいただき、口頭でご説明させていただけないでしょうか？\n\nお忙しいところ恐れ入りますが、ご検討のほどよろしくお願いいたします。",
            "reasoning": "Escalated L2->L3 due to high risk/gap. ToneBand:Acceptable"
        }
    },
    {
        "case_name": "Test Case 27 — L3軽度介入テスト (1アクション提案)",
        "payload": {
            "user_draft": "この前の件、どうなりましたか？",
            "thread_context": "[3日前] 自分: 先日のA社への提案の件、B案で進めたいのですが、ご意見いただけますでしょうか。",
            "hierarchy": "peer",
            "social_distance": "close",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["UnansweredQuestion"], # Actionalタグ1つのみ
            "ai_receipt": "以前に質問した件の返信がなく、進捗が気になっているご状況ですね。",
            "detailed_analysis": "【現状の影響】\n相手が返信を忘れている、あるいは意図的に避けている可能性があります。単に「どうなりましたか？」と尋ねるだけでは、相手にプレッシャーを与えたり、再び返信がなかったりする可能性があります。\n\n【より良い結果に繋がる視点】\nこのような状況では、相手が返信しやすいような、具体的な次のアクションを一つ提案することが有効です。これにより、会話の停滞を打開し、問題を前に進めることができます。",
            "improvement_points": "相手が返信しやすい具体的なアクションを一つ提案することで、会話の停滞を打開できます。",
            "suggestion": "お疲れ様です！先日のA社提案の件、もしお忙しいようでしたら、一度5分ほどお電話でお話しするお時間をいただくのはいかがでしょうか？",
            "reasoning": "Help ToneBand:Acceptable"
        }
    },
    {
        "case_name": "Test Case 28 — 長文・ノイズ耐性テスト",
        "payload": {
            "user_draft": "皆さん、アップデートありがとうございます。引き続きよろしくお願いします。",
            "thread_context": """
[昨日 10:00] 佐藤: @チーム各位 今週金曜リリースの「新機能X」について、最終的な進捗確認です。
[昨日 10:05] 鈴木: デザインチームは昨日、最終版のモックをFIXさせ、エンジニアチームに展開済みです。特にブロッカーはありません。
[昨日 10:10] 高橋: エンジニアチームです。フロントエンドの実装は完了していますが、バックエンドのAPI（佐藤さん担当）のレスポンスに一部遅延が見られます。これが解消されないと、金曜のリリースは厳しいかもしれません。
[昨日 10:15] 伊藤: QAチームです。現状、ステージング環境でテストを実行中ですが、高橋さんの指摘するAPI遅延により、一部のテストケースが完了できていません。
[昨日 10:20] 佐藤: @高橋さん ご指摘ありがとうございます。APIの件、承知しました。本日中に原因を特定し、対応します。
[昨日 17:30] 佐藤: @チーム各位 APIの遅延問題ですが、キャッシュ層の不具合と判明し、修正対応が完了しました。現在、レスポンスは正常化しています。高橋さん、伊藤さん、ご確認をお願いします。
[本日 09:00] 高橋: @佐藤さん ありがとうございます！APIのレスポンス、正常化していることを確認しました。これでフロントエンドとの結合テストを進められます。
[本日 09:05] 伊藤: @佐藤さん こちらでもテストを再開し、問題ないことを確認しました。全テストケース、本日15時までに完了見込みです。ただ1点、**ヘルプページの文言について、最終的な承認はどなたにいただけばよろしいでしょうか？**
""",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["UnansweredQuestion"],
            "ai_receipt": "チーム全体の進捗に感謝を伝えつつも、重要な質問が一つ見過ごされている状況ですね。",
            "detailed_analysis": "【現状の影響】\nチーム全体への感謝は素晴らしいですが、伊藤さんからの「ヘルプページの文言承認者は誰か」という具体的な質問が未回答のままです。このままでは、リリース直前に承認プロセスが滞り、手戻りが発生するリスクがあります。\n\n【より良い結果に繋がる視点】\n多くの情報が飛び交う中でも、具体的な質問やブロッカーを見逃さず、的確に対応することがプロジェクト成功の鍵です。伊藤さんの質問に答えることで、最後のボトルネックを解消できます。",
            "improvement_points": "伊藤さんからの承認者に関する質問に回答することで、リリース前の最後の懸念点を解消できます。",
            "suggestion": "皆さん、アップデートありがとうございます！進捗、大変心強いです。\n\n@伊藤さん ヘルプページの文言承認の件ですが、それは私の方で最終確認しますので、ドラフトが完成次第、レビュー依頼をいただけますでしょうか。\n\n引き続きよろしくお願いします。",
            "reasoning": "Challenge ToneBand:Acceptable"
        }
    },
    {
        "case_name": "Test Case 29 — 複数人・複数ターン対話テスト",
        "payload": {
            "user_draft": "鈴木さん、ありがとうございます。承知しました。",
            "thread_context": """
[14:00] 田中: @鈴木さん @ユーザーさん 来週のクライアント定例ですが、議題Bについて、もう少し具体的なデータを追加する必要があると感じています。特に市場規模の推移について、何か良いデータソースをご存知でしたら教えていただけないでしょうか？
[14:05] 鈴木: @田中さん @ユーザーさん 市場規模の推移ですね。私が以前使ったC社が出しているレポートが参考になるかもしれません。ただ、有料なので、利用するには申請が必要です。
[14:10] 田中: @鈴木さん なるほど、ありがとうございます。有料レポートですか、一度確認してみます。
""",
            "hierarchy": "peer",
            "social_distance": "neutral",
            "language": "japanese"
        },
        "ideal_output": {
            "hasIssues": True,
            "issue_pattern": ["UnansweredQuestion"],
            "ai_receipt": "鈴木さんへの返信は適切ですが、田中さんの最初の質問にまだ完全には答えられていない状況ですね。",
            "detailed_analysis": "【現状の影響】\n鈴木さんへの返信は適切ですが、会話の起点となった田中さんの「何か良いデータソースをご存知でしたら」という質問に対して、ユーザーとしてのあなたの回答がまだありません。このままだと、田中さんは鈴木さんの案しか選択肢がないまま、自分で調査を進めることになります。\n\n【より良い結果に繋がる視点】\nチームでの議論では、全員が情報やアイデアを出し合うことで、より良い解決策が見つかります。鈴木さんのアイデアに加え、あなた自身の知見を提供することで、田中さんの課題解決をより強力にサポートできます。",
            "improvement_points": "鈴木さんへの感謝に加え、田中さんの最初の質問に対しても自分のアイデアを提供することで、チームの問題解決にさらに貢献できます。",
            "suggestion": "鈴木さん、情報ありがとうございます。承知しました。\n\n@田中さん 鈴木さんの案に加えて、私が以前担当したDプロジェクトの調査データも、今回の議題Bの参考になるかもしれません。後ほど共有しますので、併せてご確認ください！",
            "reasoning": "SpeakUp ToneBand:Acceptable"
        }
    }
]


In [44]:

# -------------------------------------------------------------------
# メイン処理 (Main Process)
# -------------------------------------------------------------------

# 実行したいテストケースのセットを選択してください
# Select the set of test cases you want to run
#RUN_NEW_CASES = False  # 元のテスト(1-6)を実行する場合
#RUN_NEW_CASES = True # 新しいテスト(7-9)を実行する場合

# ここで切り替え
# Switch here
test_cases_to_run = test_cases + test_cases_26to29
#test_cases_to_run = new_test_cases 
#test_cases_to_run = original_test_cases

print(f"テストを開始します... APIエンドポイント: {API_URL}")
print(f"Executing tests... API Endpoint: {API_URL}")

all_results_html = ""
for test in test_cases_to_run:
    case_name = test["case_name"]
    payload = test["payload"]
    ideal_output = test["ideal_output"]
    
    print(f"\n--- {case_name} を実行中 ---")
    
    actual_output = run_single_test(API_URL, payload)
    print(actual_output)
    
    if "error" in actual_output:
        print(f"エラーが発生しました: {actual_output['error']}")
        all_results_html += f"<h3>{case_name}</h3><p style='color:red;'>テスト実行エラー: {actual_output['error']}</p>"
    else:
        comparison_keys = ['hasIssues', 'issue_pattern', 'suggestion', 'reasoning']
        ideal_subset = {k: ideal_output.get(k) for k in comparison_keys}
        actual_subset = {k: actual_output.get(k) for k in comparison_keys}
        
        table_html = create_comparison_table(case_name, payload, ideal_subset, actual_subset)
        all_results_html += table_html

print("\n--- 全てのテストが完了しました ---")

display(HTML(all_results_html))


テストを開始します... APIエンドポイント: http://localhost:3000/api/check-tone
Executing tests... API Endpoint: http://localhost:3000/api/check-tone

--- TC01_OK_Polite_JP を実行中 ---
{'originalText': '承知しました。資料一式、明日中にお送りします！', 'hasIssues': False, 'issue_pattern': [], 'detected_mentions': [], 'ai_receipt': 'ご依頼の資料共有について、明日中にお送りいただけるとのこと、承知しました。', 'detailed_analysis': '【現状の影響】\n丁寧かつ明確な返信で、上司の依頼に適切に応えています。\n\n【より良い結果に繋がる視点】\nこのままの表現で十分に信頼感が伝わり、スムーズなコミュニケーションが期待できます。', 'improvement_points': '明確な返信は信頼感を高め、依頼の理解を示します。', 'suggestion': '承知しました。資料一式、明日中にお送りします！', 'reasoning': 'ToneBand:Acceptable'}

--- TC02_OK_Novelty_EN を実行中 ---
{'originalText': "I've sketched a wild idea for a gamified onboarding—keen to share if the team is up for it!", 'hasIssues': False, 'issue_pattern': [], 'detected_mentions': [], 'ai_receipt': 'You’re excited to share a creative onboarding idea with the team.', 'detailed_analysis': '【Current impact】\nYour message is positive and inviting, encouraging open team engagement.\n\n【Perspective

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,False,False,
issue_pattern,[],[],✅ 一致
reasoning,Acceptable ToneBand:Acceptable,ToneBand:Acceptable,
suggestion,承知しました。資料一式、明日中にお送りします！,承知しました。資料一式、明日中にお送りします！,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,False,False,
issue_pattern,[],[],✅ 一致
reasoning,Novelty ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,I've sketched a wild idea for a gamified onboarding—keen to share if the team is up for it!,I've sketched a wild idea for a gamified onboarding—keen to share if the team is up for it!,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""HarshTone"",  ""Impolite"" ]","[  ""Impolite"",  ""HarshTone"" ]",✅ 一致
reasoning,Respect ToneBand:Harmful,Respect ToneBand:Borderline,
suggestion,お手数ですが、レイアウトで崩れている箇所を修正いただけますか？スライド3と5が特にずれているようです。よろしくお願いします！,お疲れさまです。レイアウトが崩れている箇所を至急修正していただけると助かります。よろしくお願いします！,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""Impolite"" ]","[  ""Impolite"",  ""MissingAcknowledgment"" ]",❌ 不一致
reasoning,Respect ToneBand:Borderline,Respect ToneBand:Borderline,
suggestion,Could you please review and sign this off today? Thank you!,"Hi, could you please sign this off today? Thanks so much for your help!",

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""MissingContext"",  ""VagueIntent"" ]","[  ""VagueIntent"",  ""MissingContext"" ]",✅ 一致
reasoning,SpeakUp ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,お世話になっております。 αサービスFAQドラフトへのフィードバックをお願いしたく存じます。 --- Missing Info --- • フィードバック対象ファイル: [■■■■] • 重点的に見てほしい点: [■■■■] • 期限: [■■■■] --------------------- お手数ですがご確認お願いします。,--- Missing Info --- • 対象案件名: [■■■■] • 具体的な作業内容: [■■■■] • 期限や優先度: [■■■■] --------------------- お手数ですが、詳細を教えていただけますか？よろしくお願いいたします。,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,False,
issue_pattern,"[  ""MissingContext"" ]",[],❌ 不一致
reasoning,Help ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,Could you review the metrics table on page 3 of the proposal? --- Missing Info --- • Specific question about numbers: [■■■■] • Desired accuracy level / assumptions: [■■■■] • Deadline for feedback: [■■■■] --------------------- Thanks a lot!,"Hi, I put together a 5‑page proposal touching on roadmap, KPIs, and hiring timeline but I’m not sure if the numbers section makes sense. Could you take a look?",

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,False,
issue_pattern,"[  ""VagueIntent"",  ""MissingContext"" ]",[],❌ 不一致
reasoning,Help ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,現在添付いただいているUI案A_v2について、配色とUXの最終確認をお願いしたいです。 --- Missing Info --- • レビュー観点（例: アクセシビリティ）: [■■■■] • OK/NG判定基準: [■■■■] • 期日: [■■■■] --------------------- ご都合の範囲でご確認ください。,このまま進めて大丈夫でしょうか？,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""UnansweredDecision"" ]","[  ""VagueIntent"" ]",❌ 不一致
reasoning,Challenge ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,A案を推奨いたします。理由は 1) 既存システムとの互換性が高い 2) 月額費用が20%低い ためです。ご確認のほどお願いいたします。,ご指示ありがとうございます。私の意見としては、A案は〇〇の点で優れていると思いますが、B案も〇〇の利点があります。どちらかお選びいただければと思います。,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""HarshTone"",  ""VagueIntent"",  ""MissingContext"" ]","[  ""HarshTone"" ]",❌ 不一致
reasoning,Respect ToneBand:Harmful,Respect ToneBand:Borderline,
suggestion,I noticed sections 2 and 4 don’t align with the client brief. 1. Could you revise those sections by 5 p.m.? 2. I’m available to clarify the brief or review drafts if helpful.,"I appreciate your efforts so far. However, it seems the last revision missed some points in the client's brief. Could you please review and update everything by the end of the day? Thank you!",

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,False,
issue_pattern,"[  ""MissingFollowUp"" ]",[],❌ 不一致
reasoning,Novelty ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,"Thanks for reviewing my freemium‑tier proposal. 1. If you agree in principle, shall we run a two‑week pilot limited to 5 % of new sign‑ups starting next Monday? 2. I’ll prepare a KPI dashboard draft and share it by Friday for your comments.","Team, after analyzing user churn trends and surveying 120 respondents, I believe we should experiment with a freemium tier—here’s a 600‑word rationale including revenue models, risk mitigation, and phased rollout. Thoughts?",

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""MissingContext"",  ""VagueIntent"" ]","[  ""Impolite"",  ""MissingContext"" ]",❌ 不一致
reasoning,Escalated L2->L3 due to high risk/gap. ToneBand:Acceptable,Respect & SpeakUp ToneBand:Borderline,
suggestion,お疲れ様です。承認をお願いしたい件があるのですが、 1. 私の方で、関連すると思われる申請チケット（チケット番号：XXXX）を特定いたしましょうか？ 2. もしよろしければ、この件について5分ほどお時間をいただき、口頭でご説明させていただけないでしょうか？ お忙しいところ恐れ入りますが、ご検討のほどよろしくお願いいたします。,お疲れ様です。先日お伝えした【案件名】の件について、承認をお願いできますでしょうか。お忙しいところ恐れ入りますが、よろしくお願いいたします。,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,True,
issue_pattern,"[  ""UnansweredQuestion"" ]","[  ""VagueIntent"",  ""MissingContext"" ]",❌ 不一致
reasoning,Help ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,お疲れ様です！先日のA社提案の件、もしお忙しいようでしたら、一度5分ほどお電話でお話しするお時間をいただくのはいかがでしょうか？,先日のA社への提案の件ですが、進捗はいかがでしょうか？ --- Missing Info --- • 具体的な確認事項: [■■■■] • 期限や急ぎ度: [■■■■] --------------------- よろしくお願いします。,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,False,
issue_pattern,"[  ""UnansweredQuestion"" ]",[],❌ 不一致
reasoning,Challenge ToneBand:Acceptable,SpeakUp ToneBand:Acceptable,
suggestion,皆さん、アップデートありがとうございます！進捗、大変心強いです。 @伊藤さん ヘルプページの文言承認の件ですが、それは私の方で最終確認しますので、ドラフトが完成次第、レビュー依頼をいただけますでしょうか。 引き続きよろしくお願いします。,皆さん、アップデートありがとうございます。引き続きよろしくお願いします。 なお、ヘルプページの文言の最終承認者については、どなたに確認すればよいか教えていただけると助かります。,

評価項目（キー）,理想のアウトプット,実際のAIアウトプット,コメント
hasIssues,True,False,
issue_pattern,"[  ""UnansweredQuestion"" ]",[],❌ 不一致
reasoning,SpeakUp ToneBand:Acceptable,Respect ToneBand:Acceptable,
suggestion,鈴木さん、情報ありがとうございます。承知しました。 @田中さん 鈴木さんの案に加えて、私が以前担当したDプロジェクトの調査データも、今回の議題Bの参考になるかもしれません。後ほど共有しますので、併せてご確認ください！,鈴木さん、情報ありがとうございます。申請について確認し、またご連絡します。,
