# Session 3 — Prompt Engineering **V2** 중급 전략

이 노트북은 Session 2(V1)에서 학습한 기본 전략 위에 **5가지 V2 중급 전략**을 더해 실습하도록 설계되었습니다.

| 버전 | 전략 | 핵심 개념 |
|---|---|---|
| **V1.1** | **Role Prompting** | 챗봇의 역할을 명확히 부여 |
| **V1.2** | **Sentiment Routing** | 사용자 감정(긍/부정)별 응답 분기 |
| **V1.3** | **Least‑to‑Most Prompting** | 단순→복잡 문제로 단계적 해결 |
| **V1.4** | **Ask for Context** | 부족한 입력을 유도적으로 보완 |
| **V1.5** | **Pre‑warm Chat** | 직전 히스토리 활용 맥락 최적화 |
---
---
> **모델:** `gpt‑4o‑mini` (단일)
>
> **데이터:** 예시 3종(`order_delivery`, `refund`, `account_login`)
>
> **목표:** 각 버전별 **응답·지연 시간·비용**을 비교하고, 최종적으로 V1 + V2 조합을 실험합니다.


## 📦 패키지 설치

In [1]:
!pip install -r ../requirements.txt

zsh:1: command not found: pip


## ⚙️ 환경 설정 및 Langfuse 초기화

In [2]:
import os, asyncio, time, nest_asyncio, pandas as pd
from dotenv import load_dotenv

load_dotenv()
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
USE_STUB = OPENAI_API_KEY is None

# Langfuse
try:
    from langfuse import Langfuse
    langfuse = Langfuse()
except ModuleNotFoundError:
    langfuse = None
    print("⚠️  langfuse 패키지가 설치되지 않았습니다. Trace 기록이 비활성화됩니다.")

if not USE_STUB:
    from langfuse.openai import AsyncOpenAI
    client = AsyncOpenAI(api_key=OPENAI_API_KEY)
else:
    client = None
    print('🔧  Stub 모드: OPENAI_API_KEY 가 없어 더미 응답 사용')

nest_asyncio.apply()

PRICING = {'input':0.15/1_000_000, 'output':0.60/1_000_000}

async def call_openai(system_p, user_p, chat_history=None, tag='V0'):
    start = time.perf_counter_ns()
    if USE_STUB:
        await asyncio.sleep(0.05)
        answer = f"[STUB {tag}] 응답 예시"
        prompt_tok, completion_tok = 30, 120
    else:
        messages = chat_history[:] if chat_history else []
        messages += [{'role':'system','content':system_p},
                     {'role':'user','content':user_p}]
        resp = await client.chat.completions.create(
            model='gpt-4o-mini',
            messages=messages
        )
        answer = resp.choices[0].message.content.strip()
        usage = resp.usage
        prompt_tok, completion_tok = usage.prompt_tokens, usage.completion_tokens
    latency = (time.perf_counter_ns()-start)/1_000_000
    cost = prompt_tok*PRICING['input'] + completion_tok*PRICING['output']

    return dict(answer=answer, latency_ms=latency,
                prompt_tokens=prompt_tok, completion_tokens=completion_tok,
                usd_cost=cost)


## 📝 예시 시나리오

In [2]:
scenarios = [
    {'scenario':'order_delivery','question':'주문한 상품이 배송 예정일을 지났는데 아직 도착하지 않았어요. 어떻게 확인하나요?'},
    {'scenario':'refund','question':'반품 신청을 했는데 환불 처리가 언제 완료되나요?'},
    {'scenario':'account_login','question':'로그인 시 2단계 인증 오류가 발생합니다. 어떻게 해결할 수 있나요?'}
]
df = pd.DataFrame(scenarios)
df

Unnamed: 0,scenario,question
0,order_delivery,주문한 상품이 배송 예정일을 지났는데 아직 도착하지 않았어요. 어떻게 확인하나요?
1,refund,반품 신청을 했는데 환불 처리가 언제 완료되나요?
2,account_login,로그인 시 2단계 인증 오류가 발생합니다. 어떻게 해결할 수 있나요?


## 🏃‍♂️ 실행 도우미

In [7]:
async def run(df, version_name, build_sys_prompt, build_user_prompt=lambda r: r['question'],
               chat_history=None):
    tasks=[]
    for _, row in df.iterrows():
        tasks.append(call_openai(build_sys_prompt(row),
                                 build_user_prompt(row),
                                 chat_history=chat_history,
                                 tag=version_name))
    results = await asyncio.gather(*tasks)
    out=df.copy()
    for i,res in enumerate(results):
        for k,v in res.items():
            out.loc[i,f'{version_name}_{k}']=v
    return out

## 🔹 Baseline — V1 (Persona + Tone)

In [16]:
def sys_v1(row):
    return ('You are a calm and professional Korean CS chatbot for an e‑commerce platform. '
            'Answer politely in Korean, max 5 sentences.')
baseline = await run(df, 'V1', sys_v1)
baseline[['scenario','V1_answer']]

Unnamed: 0,scenario,V1_answer
0,order_delivery,"안녕하세요, 고객님. 상품의 배송 상태를 확인하기 위해서는 주문 확인 페이지에서 배..."
1,refund,안녕하세요. 반품 신청을 해주셔서 감사합니다. 환불 처리는 일반적으로 반품 상품이 ...
2,account_login,"안녕하세요! 2단계 인증 오류가 발생하셨군요. 먼저, 입력하신 인증 코드가 정확한지..."


## 1️⃣ Role Prompting — V1.1

In [17]:
def sys_role(row):
    return ('You are an experienced senior customer‑support agent specialised in '
            f"{row['scenario'].replace('_',' ')} issues. Speak with authority and provide clear next steps in Korean.")
v_role = await run(baseline, 'V1_1', sys_role)
v_role[['scenario','V1_1_answer']]

Unnamed: 0,scenario,V1_1_answer
0,order_delivery,"고객님, 안녕하세요. 주문하신 상품이 배송 예정일을 지났음에도 불구하고 아직 도착하..."
1,refund,반품 신청 후 환불 처리는 일반적으로 7-14일 이내에 완료됩니다. 반품 제품이 당...
2,account_login,2단계 인증 오류가 발생하는 경우 다음과 같은 단계를 따라 문제를 해결해 보시기 바...


## 2️⃣ Sentiment Routing — V1.2

In [18]:
neg_words={'늦','환불','오류','지연','불만','짜증'}
def detect_sent(q): return 'neg' if any(w in q for w in neg_words) else 'pos'
def sys_sent(row):
    return ('You are a friendly CS chatbot. First apologise sincerely in Korean, '
            'then propose 2 concrete actions.' if detect_sent(row['question'])=='neg'
            else 'You are a cheerful CS chatbot. Answer briefly with 2 bullet points in Korean.')
v_sent = await run(v_role, 'V1_2', sys_sent)
v_sent[['scenario','V1_2_answer']]

Unnamed: 0,scenario,V1_2_answer
0,order_delivery,- 배송 추적 번호를 확인하여 배송 상태를 확인하세요.\n- 주문한 쇼핑몰 고객센터...
1,refund,죄송합니다. 불편을 드려서 정말 죄송합니다. \n\n환불 처리에 대한 구체적인 안내...
2,account_login,죄송합니다. 귀하의 불편에 대해 진심으로 사과드립니다.\n\n2단계 인증 오류를 해...


## 3️⃣ Least‑to‑Most Prompting — V1.3

In [19]:
def sys_ltm(row):
    return ('Break the problem into simpler hidden steps before answering. '
            'Return only the final concise answer in Korean, numbered 1‑3.')
v_ltm = await run(v_sent, 'V1_3', sys_ltm)
v_ltm[['scenario','V1_3_answer']]

Unnamed: 0,scenario,V1_3_answer
0,order_delivery,1. 주문한 상품의 배송 추적 번호를 확인합니다.\n2. 해당 배송 업체의 웹사이트...
1,refund,1. 반품 신청 상태 확인: 반품 신청이 승인되었는지 확인합니다. \n2. 반품 배...
2,account_login,"1. 2단계 인증 관련 설정을 확인하고, 올바른 인증 방법이 선택되었는지 확인합니다..."


## 4️⃣ Ask for Context — V1.4

In [20]:
def sys_ask(row):
    return ('If the user question lacks details, politely ask exactly one clarifying question in Korean '
            'before providing a solution; otherwise answer in up to 4 sentences.')
v_ctx = await run(v_ltm, 'V1_4', sys_ask)
v_ctx[['scenario','V1_4_answer']]

Unnamed: 0,scenario,V1_4_answer
0,order_delivery,어떤 쇼핑몰이나 서비스에서 주문하셨는지 알려주실 수 있나요?
1,refund,"반품 신청 후 환불 처리 기간은 보통 3-7일 정도 소요됩니다. 하지만, 정확한 기..."
2,account_login,어떤 플랫폼에서 2단계 인증 오류가 발생하고 있는지 말씀해 주실 수 있나요?


## 5️⃣ Pre‑warm Chat — V1.5

In [21]:
history=[{'role':'system','content':'Prior conversation: 고객이 배송 지연 문제로 여러 번 문의한 기록이 있음.'}]
def sys_prewarm(row):
    return ('You already know the user felt frustration about delays. Empathise first (1 sentence), '
            'then provide precise tracking steps (≤3 sentences, Korean).')
v_pw = await run(v_ctx, 'V1_5', sys_prewarm, chat_history=history)
v_pw[['scenario','V1_5_answer']]

Unnamed: 0,scenario,V1_5_answer
0,order_delivery,"배송 지연으로 인해 불편을 드려 정말 죄송합니다. 먼저, 주문 확인 이메일에서 제공..."
1,refund,"불편을 드려 정말 죄송합니다. 반품 신청을 하신 경우, 환불은 물품이 저희 창고에 ..."
2,account_login,"먼저, 2단계 인증 오류로 인해 불편을 겪으신 점 정말 안타깝게 생각합니다. 확인해..."


In [22]:
v_pw

Unnamed: 0,scenario,question,V1_answer,V1_latency_ms,V1_prompt_tokens,V1_completion_tokens,V1_usd_cost,V1_1_answer,V1_1_latency_ms,V1_1_prompt_tokens,...,V1_4_answer,V1_4_latency_ms,V1_4_prompt_tokens,V1_4_completion_tokens,V1_4_usd_cost,V1_5_answer,V1_5_latency_ms,V1_5_prompt_tokens,V1_5_completion_tokens,V1_5_usd_cost
0,order_delivery,주문한 상품이 배송 예정일을 지났는데 아직 도착하지 않았어요. 어떻게 확인하나요?,"안녕하세요, 고객님. 상품의 배송 상태를 확인하기 위해서는 주문 확인 페이지에서 배...",1755.57025,61.0,92.0,6.4e-05,"고객님, 안녕하세요. 주문하신 상품이 배송 예정일을 지났음에도 불구하고 아직 도착하...",4037.666416,61.0,...,어떤 쇼핑몰이나 서비스에서 주문하셨는지 알려주실 수 있나요?,781.622458,65.0,20.0,2.2e-05,"배송 지연으로 인해 불편을 드려 정말 죄송합니다. 먼저, 주문 확인 이메일에서 제공...",1518.089334,87.0,75.0,5.8e-05
1,refund,반품 신청을 했는데 환불 처리가 언제 완료되나요?,안녕하세요. 반품 신청을 해주셔서 감사합니다. 환불 처리는 일반적으로 반품 상품이 ...,1549.096166,52.0,74.0,5.2e-05,반품 신청 후 환불 처리는 일반적으로 7-14일 이내에 완료됩니다. 반품 제품이 당...,1976.46175,51.0,...,"반품 신청 후 환불 처리 기간은 보통 3-7일 정도 소요됩니다. 하지만, 정확한 기...",2329.359792,56.0,82.0,5.8e-05,"불편을 드려 정말 죄송합니다. 반품 신청을 하신 경우, 환불은 물품이 저희 창고에 ...",1601.155792,78.0,71.0,5.4e-05
2,account_login,로그인 시 2단계 인증 오류가 발생합니다. 어떻게 해결할 수 있나요?,"안녕하세요! 2단계 인증 오류가 발생하셨군요. 먼저, 입력하신 인증 코드가 정확한지...",1700.794416,57.0,92.0,6.4e-05,2단계 인증 오류가 발생하는 경우 다음과 같은 단계를 따라 문제를 해결해 보시기 바...,4328.061833,57.0,...,어떤 플랫폼에서 2단계 인증 오류가 발생하고 있는지 말씀해 주실 수 있나요?,944.206166,61.0,23.0,2.3e-05,"먼저, 2단계 인증 오류로 인해 불편을 겪으신 점 정말 안타깝게 생각합니다. 확인해...",2871.494958,83.0,90.0,6.6e-05


## 📊 Latency & Cost 비교

In [23]:
cols=['scenario']
for v in ['V1','V1_1','V1_2','V1_3','V1_4','V1_5']:
    cols += [f'{v}_latency_ms', f'{v}_usd_cost']
v_pw[cols]

Unnamed: 0,scenario,V1_latency_ms,V1_usd_cost,V1_1_latency_ms,V1_1_usd_cost,V1_2_latency_ms,V1_2_usd_cost,V1_3_latency_ms,V1_3_usd_cost,V1_4_latency_ms,V1_4_usd_cost,V1_5_latency_ms,V1_5_usd_cost
0,order_delivery,1755.57025,6.4e-05,4037.666416,0.000174,1303.255875,2.5e-05,2035.655708,5.2e-05,781.622458,2.2e-05,1518.089334,5.8e-05
1,refund,1549.096166,5.2e-05,1976.46175,8.6e-05,2090.640333,9.1e-05,3858.488708,5.7e-05,2329.359792,5.8e-05,1601.155792,5.4e-05
2,account_login,1700.794416,6.4e-05,4328.061833,0.000184,3349.277208,0.000128,1997.864,7.9e-05,944.206166,2.3e-05,2871.494958,6.6e-05


## 🔄 V1 + V2 조합 예시

In [24]:
def sys_combo(row):
    s = sys_role(row)
    s += ' 내부적으로 문제를 3단계로 분해 후 최종 요약만 제공합니다.'
    return s
combo = await run(v_pw,'V2_combo', sys_combo)
combo[['scenario','V2_combo_answer']]

Unnamed: 0,scenario,V2_combo_answer
0,order_delivery,"고객님, 배송이 지연된 상황에 대해 안내드리겠습니다. 문제를 세 가지 단계로 나누어..."
1,refund,환불 처리는 일반적으로 다음 세 단계로 진행됩니다:\n\n1. **반품 접수 확인*...
2,account_login,로그인 시 2단계 인증 오류를 해결하기 위해 다음 단계를 따르세요:\n\n1. **...


---

## ✍️ 개인 실습 영역

아래 셀을 복제하여 자신만의 **My_V2** 버전을 만들어 보세요.
1. 시나리오 3개 중 1개를 골라 다양한 기법을 조합합니다.  
2. `run()` 함수를 활용해 결과를 추가 열로 기록합니다.


In [None]:
# TODO: 여기서부터 자유롭게 실험해 보세요


# 끝 🎉

## 작업한 V1.0 Prompt Langfuse에 등록

In [None]:
from pathlib import Path
from langfuse import Langfuse

def parse_prompty(path: Path):
    """Langfuse-style .prompty → ChatPrompt 형태로 변환"""
    content = path.read_text(encoding="utf-8")
    sections = content.strip().split('---')

    if len(sections) < 3:
        raise ValueError("❌ .prompty 파일은 YAML + system + user prompt 형식이어야 합니다.")

    _ = sections[1]
    prompt_block = sections[2]

    # 각 부분 추출
    system_prompt = ""
    user_prompt = ""
    current_role = None
    lines = prompt_block.strip().splitlines()

    for line in lines:
        if line.strip().startswith("system:"):
            current_role = "system"
            continue
        elif line.strip().startswith("user:"):
            current_role = "user"
            continue

        if current_role == "system":
            system_prompt += line + "\n"
        elif current_role == "user":
            user_prompt += line + "\n"
    
    print(system_prompt)
    print(user_prompt)

    return [
        {"role": "system", "content": system_prompt.strip()},
        {"role": "user", "content": user_prompt.strip()}
    ]

# Langfuse Prompt 등록
lf = Langfuse()
PROMPT_PATH = Path("../prompts/01_order_delivery/v2_0.prompty")
PROMPT_NAME = "order_delivery.v2_0"
version = "2.0"

chat_prompt = parse_prompty(PROMPT_PATH)

try:
    existing = lf.get_prompt(name=PROMPT_NAME, type="chat")
except Exception as e:
    if "404" in str(e):
        existing = None
    else:
        raise e

if existing:
    lf.update_prompt(
        prompt_id = existing.id,
        prompt    = chat_prompt,
        tags      = ["smart_cs"],
        labels    = ["stable"],
    )
    print("🔄 Prompt updated (v2.0)")
else:
    lf.create_prompt(
        name      = PROMPT_NAME,
        type      = "chat",
        prompt    = chat_prompt,
        tags      = ["smart_cs"],
        labels    = ["stable"],
    )
    print("✅ Prompt created (v2.0)")

print("👀 Langfuse UI ▸ Prompts ▸ order_delivery 확인")


  # Role Prompting
  당신은 **30대 중반의 숙련된 전자상거래 배송 CS 담당자**입니다.  
  말투는 **차분·전문적**으로 유지하며, 고객의 감정에 공감(Empathy) 표현을 추가합니다.
  
  # 내부 사고 지침 (Chain-of-Thought) — 고객에게는 보이지 않음
  1. 질문 유형 분류: 주소 변경 / 배송 지연 / 운송장 오류 / 기타  
  2. 고객 질문에서 **감정(불안, 분노, 급함, 중립 등)**을 추정 → 공감 문구 수위 결정
  3. 주문·주소·배송 상태를 단계별 확인  
  4. [Ask-for-Context] 필수 정보가 비어 있으면 ➜ **정중한 추가 질문**을 먼저 출력하고 종료  
     필수: shipping_status, tracking_number, address_line1  
  5. 정보가 충분하면 [Least-to-Most]로 간단→복잡 순서로 해결책 작성  
  6. 120단어 이내 한국어 응답, 숫자 목록 활용, 마지막 줄은  
     “추가 문의사항이 있으면 언제든 말씀해주세요.”  
  
  # 응답 포맷
  - 1줄: 고객명·상품·현재상태 요약 + 감정 공감 문구  
  - 1~3줄: 조치 계획(숫자 목록)  
  - 1줄: 마무리 문구
assistant: |-
  {% if history_summary %}
  🔄 이전 대화 요약: {{history_summary}}
  {% endif %}

  ### 질문
  {{question}}
  
  ### 고객·주문 컨텍스트
  ID: {{customer_id}}  이름: {{customer_name}}
  주문번호: {{order_id}}  상품: {{product_name}}
  배송상태: {{shipping_status}}  (최근 업데이트: {{last_update}})
  택배사: {{shipping_company}}  송장: {{tracking_number}}
  기본주소: {{address_line1}}, {{cit

Error while fetching prompt 'order_delivery-label:production': status_code: 404, body: {'message': "Prompt not found: 'order_delivery' with label 'production'", 'error': 'LangfuseNotFoundError'}


✅ Prompt created (v1.0)
👀 Langfuse UI ▸ Prompts ▸ order_delivery 확인


# 작업한 V2.0 Prompty 파일 불러와서, 시나리오 결과 돌리기.

In [7]:
from jinja2 import Template

def render_prompt(messages: list, variables: dict) -> list:
    """Langfuse prompt template (list of dicts) → rendered OpenAI messages"""
    rendered = []
    for message in messages:
        role = message["role"]
        content_template = message["content"]
        content = Template(content_template).render(**variables)
        rendered.append({"role": role, "content": content})
    return rendered


In [8]:
"""
• Scenario_QA.csv → 10건 Async 처리(gpt-4o-mini)
• 프롬프트: order_delivery/v2_0@stable (smart_cs)
• 결과: data/01_order_delivery/answer_results/Scenario_QA_V2_gpt-4o-mini_<ts>.xlsx
"""
import asyncio, time
from datetime import datetime
from pathlib import Path
import nest_asyncio, pandas as pd
from langfuse import Langfuse
from openai import AsyncOpenAI
from langfuse.decorators import langfuse_context
from langfuse.decorators import observe

nest_asyncio.apply()

# ─── 경로 세팅 ────────────────────────────────────────────────
BASE = Path("../data/01_order_delivery")
RESULT_DIR = BASE / "answer_results"
RESULT_DIR.mkdir(exist_ok=True)

# ─── Langfuse / Prompt ──────────────────────────────────────
lf  = Langfuse()
PROMPT = lf.get_prompt("order_delivery", label="stable").prompt  # <-- 레이블 lookup

# ─── CSV 로딩 ────────────────────────────────────────────────
scenario = pd.read_csv(BASE / "Scenario_QA.csv")
cust     = pd.read_csv(BASE / "Customer_Info.csv")
addr     = pd.read_csv(BASE / "Delivery_Address.csv")
order    = pd.read_csv(BASE / "Order_Info.csv")
shipping = pd.read_csv(BASE / "Shipping_Issue_Log.csv")

df = (
    scenario
    .merge(cust,  on="customer_id", suffixes=("", "_cust"), how="left")
    .merge(order, on="customer_id", suffixes=("", "_order"), how="left")
    .merge(addr, on="customer_id", suffixes=("", "_addr"), how="left")
    .merge(shipping, on="order_id", suffixes=("", "_shipping"), how="left")
)

# ─── LLM 호출 ───────────────────────────────────────────────
MODEL  = "gpt-4o-mini"
client = AsyncOpenAI()  # OPENAI_API_KEY 환경변수 필요

@observe()
async def call_llm(row):
    prompt_input = {
        "question":          row.question,
        "customer_id":       row.customer_id,
        "customer_name":     row.customer_name,
        "order_id":          row.order_id,
        "product_name":      row.product_name,
        "shipping_status":   row.shipping_status,
        "last_update":       row.last_update or "",
        "shipping_company":  row.shipping_company or "",
        "tracking_number":   row.tracking_number or "",
        "address_line1":     row.address_line1,
        "city":              row.city,
        "postal_code":       row.postal_code,
    }

    # Langfuse trace (session metadata)
    langfuse_context.update_current_trace(
        name       = "order_delivery",
        user_id    = row.customer_id,
        session_id = row.scenario_id,
        tags       = ["V2", "smart_cs"],
        metadata   = {"model": MODEL},
    )

    # Langfuse Prompt 템플릿 메시지 → 실제 messages 생성
    rendered_messages = render_prompt(PROMPT, prompt_input)

    start = time.perf_counter_ns()

    # 직접 OpenAI 호출
    response = await client.chat.completions.create(
        model       = MODEL,
        messages    = rendered_messages,
        temperature = 0.3,
        max_tokens  = 350,
    )

    latency_ms = (time.perf_counter_ns() - start) / 1e6

    return response.choices[0].message.content, latency_ms, response.usage.prompt_tokens, response.usage.completion_tokens

async def main():
    tasks   = [call_llm(row) for _, row in df.iterrows()]
    results = await asyncio.gather(*tasks)

    out = df.copy()
    out[["answer", "latency_ms", "prompt_tokens", "completion_tokens"]] = pd.DataFrame(results)

    ts = datetime.now().strftime("%Y%m%d_%H%M%S")
    out_path = RESULT_DIR / f"Scenario_QA_V2_gpt-4o-mini_{ts}.xlsx"
    out.to_excel(out_path, index=False)
    print(f"✅ 결과 저장: {out_path}")


asyncio.run(main())


✅ 결과 저장: ../data/01_order_delivery/answer_results/Scenario_QA_V2_gpt-4o-mini_20250615_190642.xlsx
