In [None]:
from openai import OpenAI
import pandas as pd
from pathlib import Path
from tqdm import tqdm
import json
import re

# API 및 모델
client = OpenAI(api_key="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")
MODEL_NAME = "gpt-4o-mini"

# 경로
base_dir = Path("./data")
info_path = base_dir / "학생정보.csv"
twelve_week_path = base_dir / "12주학습지표.csv" 
cluster_path = base_dir / "클러스터_메타.csv"
segment_path = base_dir / "세그먼트_메타.csv"
unit_meta_path = base_dir / "단원차시_메타.csv"

# 데이터 불러오기
df = pd.read_csv(twelve_week_path)
segment_meta = pd.read_csv(segment_path)
cluster_meta = pd.read_csv(cluster_path)


def get_level(score):
    if pd.isnull(score):
        return '정보없음'
    if score >= 80:
        return '높음'
    elif score >= 60:
        return '중간'
    else:
        return '낮음'

strategy_piece = {
    '주간리듬점수': {
        '높음': "자율성 존중",
        '중간': "책임감 공유",
        '낮음': "환경적 구조화, 호기심 유발",
        '정보없음': ""
    },
    '세그먼트_정답률': {
        '높음': "관계 중심 몰입, 자기성찰",
        '중간': "학습 장벽 낮추기, 성취 동기 자극",
        '낮음': "실수 허용, 정서적 격려",
        '정보없음': ""
    },
    '세그먼트_학습완료율': {
        '높음': "학습의 의미화",
        '중간': "기대감 고취",
        '낮음': "작은 성공 경험, 외적 책임 부여",
        '정보없음': ""
    },
    '재도전태도점수': {
        '높음': "자기효능감 강화",
        '중간': "학습 중요성(가치) 강조",
        '낮음': "외적 책임 부여",
        '정보없음': ""
    }
}

def generate_prompt(row):
    plan_level = get_level(row['주간리듬점수'])
    acc_level = get_level(row['세그먼트_정답률'])
    comp_level = get_level(row['세그먼트_학습완료율'])
    self_level = get_level(row['재도전태도점수'])

    segment_row = segment_meta[segment_meta['세그먼트번호'] == row['세그먼트번호']].iloc[0]
    cluster_row = cluster_meta[cluster_meta['클러스터번호'] == row['클러스터번호']].iloc[0]

    strategy_summary = f"""- [계획] {strategy_piece['주간리듬점수'][plan_level]}
- [실행(정답률)] {strategy_piece['세그먼트_정답률'][acc_level]}
- [실행(완료율)] {strategy_piece['세그먼트_학습완료율'][comp_level]}
- [자기점검] {strategy_piece['재도전태도점수'][self_level]}"""

    prompt = f"""
[학생 정보]
학년: {row.get('학년','')}, 성별: {row.get('성별','')}
세그먼트: {segment_row['세그먼트해석']}
클러스터: {cluster_row['클러스터해석']}
주요 학습지표: 주간리듬점수={row['주간리듬점수']}, 정답률={row['세그먼트_정답률']}, 완료율={row['세그먼트_학습완료율']}, 재도전태도점수={row['재도전태도점수']}

[주간 특이사항]
- 지난 1주간 지표 변화 및 특징을 요약(예: 정답률/완료율 급상승 또는 하락 등)
- 학생의 학습 성향과 행동 특성 중 이번주 집중해서 봐야 할 부분을 객관적으로 기술

[지난주 지도가이드]
- 지난주 수행 상황 및 태도에 대한 칭찬/격려, 개선 포인트 제공
- 학생의 세그먼트 및 클러스터 특성에 맞춘 피드백

[이번주 지도가이드]
- 이번주 중점적으로 실천해야 할 학습 전략 제안
- 아래 전략 요약을 참고하여 학생의 강점/보완점/행동을 구체적으로 제시

[메시지 전략 요약]
{strategy_summary}

=> 위 정보를 바탕으로 학생의 동기부여를 최대한 이끌어낼 수 있도록, 친근하고 구체적인 지도 메시지를 3단 구성([주간 특이사항] [지난주 지도가이드] [이번주 지도가이드])으로 출력해줘. 학생 수준에 따라 쉽고 긍정적인 어조로 작성할 것.
"""
    return prompt

def call_gpt(prompt, model=MODEL_NAME):
    completion = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "system", "content": "당신은 초등학생을 전문적으로 지도하는 학습 전문가입니다. 학생의 특성과 상황에 맞게 긍정적이고 구체적으로 지도 메시지를 작성하세요. 반드시 JSON 형식으로 응답해 주세요."},
            {"role": "user", "content": prompt}
        ],
        temperature=0.7,
        max_tokens=200
    )
    content = completion.choices[0].message.content.strip()

    # ✅ 코드블록 제거
    code_match = re.search(r"```json\s*(\{.*?\})\s*```", content, re.DOTALL)
    if code_match:
        content = code_match.group(1)

    try:
        parsed = json.loads(content)
    except Exception:
        parsed = {
            "특이사항": content,
            "지난주": content,
            "이번주": content
        }
    return parsed

# 전체 실행
results = []
for _, row in tqdm(df.iterrows(), total=len(df)):
    prompt = generate_prompt(row)
    try:
        msg = call_gpt(prompt)
    except Exception as e:
        msg = f"[API Error]: {e}"
    results.append({
        '학생ID': row['학생ID'],
        '학년': row.get('학년',''),
        '성별': row.get('성별',''),
        '세그먼트번호': row['세그먼트번호'],
        '클러스터번호': row['클러스터번호'],
        '메시지': msg
    })

result_df = pd.DataFrame(results)
result_df.to_csv("./result/학생별_주간지도_메시지결과.csv", index=False, encoding='utf-8-sig')

print(result_df.head(3))

  0%|          | 0/20 [00:00<?, ?it/s]

  5%|▌         | 1/20 [00:02<00:56,  2.97s/it]


KeyboardInterrupt: 

In [11]:
results

[{'학생ID': 'S001',
  '학년': '',
  '성별': '',
  '세그먼트번호': 3,
  '클러스터번호': 1,
  '메시지': {'특이사항': '```json\n{\n  "주간특이사항": {\n    "요약": "이 주간의 학습 지표를 보면, 정답률이 56.1로 약간 하락했지만, 완료율은 84.5로 아주 높게 유지되고 있어요. 이는 여러분이 과제를 거의 다 마쳤다는 것을 뜻해요! 하지만 정답률이 조금 낮아진 것은 더 많은 연습이 필요하다는 신호일 수 있어요. 이번 주에는 이 부분에 집중해보면 좋겠어요.",\n    "관찰": "이번 주에는 특히 정답률이 낮은 문제 유형이나 주제를 파악하여 더 많은 연습을 해보는 것이 중요해요. 여러분의 자발적인 참여가 큰 힘이 될 수 있답니다!"\n  },\n  "지난주지도가이드": {\n    "칭찬": "지난 주에 여러분은 매우 잘했어요! 완료율이',
   '지난주': '```json\n{\n  "주간특이사항": {\n    "요약": "이 주간의 학습 지표를 보면, 정답률이 56.1로 약간 하락했지만, 완료율은 84.5로 아주 높게 유지되고 있어요. 이는 여러분이 과제를 거의 다 마쳤다는 것을 뜻해요! 하지만 정답률이 조금 낮아진 것은 더 많은 연습이 필요하다는 신호일 수 있어요. 이번 주에는 이 부분에 집중해보면 좋겠어요.",\n    "관찰": "이번 주에는 특히 정답률이 낮은 문제 유형이나 주제를 파악하여 더 많은 연습을 해보는 것이 중요해요. 여러분의 자발적인 참여가 큰 힘이 될 수 있답니다!"\n  },\n  "지난주지도가이드": {\n    "칭찬": "지난 주에 여러분은 매우 잘했어요! 완료율이',
   '이번주': '```json\n{\n  "주간특이사항": {\n    "요약": "이 주간의 학습 지표를 보면, 정답률이 56.1로 약간 하락했지만, 완료율은 84.5로 아주 높게 유지되고 있어요. 이는 여러분이 과제를 거의 다 마쳤다는 것을 뜻해요! 하지만 정답률이 조금 낮아진 것은 더 많