In [None]:
from langchain.chat_models import AzureChatOpenAI
import sys
import os
sys.path.append(os.path.abspath(os.path.join(os.getcwd(), "../..")))
from config import settings


llm = AzureChatOpenAI(
    deployment_name=settings.LLM_DEPLOYMENT,
    openai_api_key=settings.LLM_API_KEY,
    openai_api_version=settings.LLM_API_VERSION,
    azure_endpoint=settings.LLM_ENDPOINT,
    temperature=settings.LLM_TEMPERATURE,
)

# STEP 1: Auto Pattern 특성 추출 (1회만 사용해도 됨)
everyday_examples = [
    "오늘 점심 뭐 먹지?",
    "주말에 친구들이랑 놀러 갈 거야.",
    "요즘 날씨가 너무 덥다.",
    "어제 본 영화 진짜 재밌었어!",
    "다음 주에 여행 가는 거 기대돼!",
    "새로운 카페 발견했어, 같이 가볼래?",
    "이번 주말에 등산 가는 거 어때?",
    "최근에 읽은 책이 정말 감동적이었어.",
    "오늘 저녁에 뭐 먹을까 고민 중이야.",
    "친구 생일 파티 준비해야 해.",
]

work_examples = [
    "이력서에서 프로젝트 경험을 좀 더 구체적으로 작성해보세요.",
    "자기소개서에 지원 동기를 강조해 주세요.",
    "포트폴리오에 결과물 스크린샷을 추가하면 더 좋을 것 같아요.",
    "이 직무에서 중요하게 여기는 역량은 문제 해결 능력입니다.",
    "협업 경험을 중심으로 자소서 내용을 구성해 주세요.",
    "사용한 기술 스택을 이력서에 명확히 명시해 주세요.",
    "프로젝트에서 맡은 역할과 기여도를 강조해 주세요.",
    "이력서에 성과 지표를 추가하면 좋을 것 같아요.",
    "자기소개서에 직무 관련 경험을 구체적으로 서술해 주세요",
    "이 포지션은 클라우드 경험이 중요하니 관련 경험을 부각해 주세요.",
]

def extract_features(examples: list[str], label: str):
    example_text = "\n".join(f"- {s}" for s in examples)
    prompt = f"""
다음 문장들은 '{label}' 대화입니다. 이 문장들의 공통된 말투, 목적, 사용되는 단어, 어조 등을 요약해주세요:

{example_text}

→ 요약된 특성:
"""
    return llm.predict(prompt).strip()

feature_everyday = extract_features(everyday_examples, "일상")
feature_work = extract_features(work_examples, "업무")




📌 일상 특성:
 요약된 특성:

· 말투  
  - 편안하고 격식 없는 구어체(친구에게 하는 수준의 반말·존댓말 혼용)  
  - 짧고 간결한 문장으로 대화 흐름이 자연스러움  

· 목적  
  - 일상 정보 공유(식사, 날씨, 영화·책 감상 등)  
  - 계획 제안 및 일정 조율(주말·여행·등산·카페 방문 등)  
  - 의견 묻기·조언 구하기(“뭐 먹지?”, “어때?”)  
  - 친목 도모와 소소한 즐거움 나누기  

· 어조  
  - 친근하고 가볍게 대화를 이어감  
  - 긍정적·낙천적인 분위기  
  - 감탄(“진짜 재밌었어!”, “정말 감동적이었어”)이나 기대(“기대돼!”) 표현이 자주 등장  

· 사용 어휘  
  - 일상생활·여가 관련 단어(점심, 주말, 날씨, 영화, 여행, 카페, 등산, 책, 파티 등)  
  - 동작·감정 동사(먹다, 놀다, 낡다, 재미있다, 기대되다, 고민하다, 준비하다)  
  - 제안·초대 표현(~갈래?, ~어때?, ~해야 해)  

· 대화 구조  
  - 질문형, 제안형 문장이 많아 상호 소통 유도  
  - 경험 공유→감상/소감 전달→다음 행동 제안 순으로 자연스럽게 이어짐
📌 업무 특성:
 요약된 특성:

• 목적:  
  – 지원자의 이력서·자기소개서·포트폴리오를 구체적이고 경쟁력 있게 개선  
  – 직무에 맞는 핵심 역량·경험을 강조해 합격 가능성 상승

• 말투 및 어조:  
  – 명령형·요청형 문장 (“~해 주세요”, “~추가하면 좋겠어요”)  
  – 공손하면서도 직접적이고 간결  
  – 실용적이고 결과 지향적

• 주요 키워드·표현:  
  – “구체적으로 작성/서술”  
  – “강조/부각”  
  – “명확히 명시”  
  – “중심으로 구성”  
  – “성과 지표”  
  – “중요하게 여기는 역량”  
  – “기여도”  
  – “스크린샷·결과물 추가”  
  – “클라우드 경험 등 직무 관련 경험”

• 특징:  
  – 문서별(이력서·자기소개서·포트폴리오) 맞춤형 조언  

In [7]:
print("📌 일상 특성:\n", feature_everyday)

📌 일상 특성:
 요약된 특성:

· 말투  
  - 편안하고 격식 없는 구어체(친구에게 하는 수준의 반말·존댓말 혼용)  
  - 짧고 간결한 문장으로 대화 흐름이 자연스러움  

· 목적  
  - 일상 정보 공유(식사, 날씨, 영화·책 감상 등)  
  - 계획 제안 및 일정 조율(주말·여행·등산·카페 방문 등)  
  - 의견 묻기·조언 구하기(“뭐 먹지?”, “어때?”)  
  - 친목 도모와 소소한 즐거움 나누기  

· 어조  
  - 친근하고 가볍게 대화를 이어감  
  - 긍정적·낙천적인 분위기  
  - 감탄(“진짜 재밌었어!”, “정말 감동적이었어”)이나 기대(“기대돼!”) 표현이 자주 등장  

· 사용 어휘  
  - 일상생활·여가 관련 단어(점심, 주말, 날씨, 영화, 여행, 카페, 등산, 책, 파티 등)  
  - 동작·감정 동사(먹다, 놀다, 낡다, 재미있다, 기대되다, 고민하다, 준비하다)  
  - 제안·초대 표현(~갈래?, ~어때?, ~해야 해)  

· 대화 구조  
  - 질문형, 제안형 문장이 많아 상호 소통 유도  
  - 경험 공유→감상/소감 전달→다음 행동 제안 순으로 자연스럽게 이어짐


In [8]:
print("📌 업무 특성:\n", feature_work)

📌 업무 특성:
 요약된 특성:

• 목적:  
  – 지원자의 이력서·자기소개서·포트폴리오를 구체적이고 경쟁력 있게 개선  
  – 직무에 맞는 핵심 역량·경험을 강조해 합격 가능성 상승

• 말투 및 어조:  
  – 명령형·요청형 문장 (“~해 주세요”, “~추가하면 좋겠어요”)  
  – 공손하면서도 직접적이고 간결  
  – 실용적이고 결과 지향적

• 주요 키워드·표현:  
  – “구체적으로 작성/서술”  
  – “강조/부각”  
  – “명확히 명시”  
  – “중심으로 구성”  
  – “성과 지표”  
  – “중요하게 여기는 역량”  
  – “기여도”  
  – “스크린샷·결과물 추가”  
  – “클라우드 경험 등 직무 관련 경험”

• 특징:  
  – 문서별(이력서·자기소개서·포트폴리오) 맞춤형 조언  
  – 직무 핵심 역량·기술 스택·협업 경험 등 구체적인 요소 강조  
  – 수치·지표·스크린샷 등의 시각적·정량적 근거 제시 권장  
  – 전체적으로 실무적인 관점에서 ‘어떻게 하면 더 눈에 띄게 할까’를 중심으로 구성


In [11]:
import os
import json

# 저장할 폴더 및 파일 경로
folder_path = os.path.abspath(os.path.join(os.getcwd(), "../../test/resources"))
save_path = os.path.join(folder_path, "llm_features.json")

# 폴더 없으면 자동 생성
os.makedirs(folder_path, exist_ok=True)

# 추출된 특성 저장
features = {
    "everyday": feature_everyday,
    "work": feature_work
}

# JSON 저장
with open(save_path, "w", encoding="utf-8") as f:
    json.dump(features, f, ensure_ascii=False, indent=2)

print("✅ LLM 특성 JSON 저장 완료:", save_path)


✅ LLM 특성 JSON 저장 완료: /Users/soobeompark/Desktop/microsoft-rounders-intelligence/rounders/test/resources/llm_features.json
