In [2]:
import pandas as pd
from pathlib import Path

# --- 1) 데이터 읽기 --------------------------------------------------------
file_path = Path("/Users/yujimin/KB AI CHALLENGE/project/data/dummy_trade_history_v2.json")   # 필요에 따라 경로 수정
df = pd.read_json(file_path)

# --- 2) 날짜 컬럼 전처리 ----------------------------------------------------
df["date"] = pd.to_datetime(df["orderTime"]).dt.date  # 날짜(YYYY-MM-DD)만 추출

# --- 3-A) 사용자×종목별 거래 날짜 범위 & 빈도 요약 ---------------------------
#  * min / max : 거래 시작일, 종료일
#  * nunique   : 실제 거래가 존재한 날짜 수(활성 일수)
#  * count     : 총 체결 건수
summary = (
    df.groupby(["userId", "stockName"])["date"]
      .agg(start_date="min", end_date="max",
           active_days="nunique", total_trades="count")
      .reset_index()
)

print("\n[요약] 사용자-종목별 거래 날짜 범위 및 빈도")
print(summary.to_string(index=False))

# --- 3-B) 사용자×종목×날짜별 일일 거래 건수 -------------------------------
freq = (
    df.groupby(["userId", "stockName", "date"])
      .size()
      .reset_index(name="trades_per_day")
      .sort_values(["userId", "stockName", "date"])
)

print("\n[상세] 사용자-종목-날짜별 일일 거래 건수")
print(freq.to_string(index=False))

# --- (선택) CSV로 저장하고 싶다면 -----------------------------------------
# summary.to_csv("trade_date_summary.csv", index=False, encoding="utf-8-sig")
# freq.to_csv("trade_date_frequency.csv", index=False, encoding="utf-8-sig")



[요약] 사용자-종목별 거래 날짜 범위 및 빈도
 userId stockName start_date   end_date  active_days  total_trades
      1     NAVER 2025-07-08 2025-08-05           12            12
      1      삼성전자 2025-07-07 2025-08-04            9             9
      1       카카오 2025-07-11 2025-08-04           11            11
      1       현대차 2025-07-07 2025-08-01           12            12
      2     NAVER 2025-07-07 2025-08-05           22            22
      2      삼성전자 2025-07-07 2025-08-05           22            22
      2       카카오 2025-07-07 2025-08-05           22            22
      2       현대차 2025-07-07 2025-08-05           22            22
      3     NAVER 2025-07-07 2025-08-05           22            59
      3      삼성전자 2025-07-07 2025-08-05           22            72
      3       카카오 2025-07-07 2025-08-05           22            63
      3       현대차 2025-07-07 2025-08-05           22            68
      4     NAVER 2025-07-08 2025-07-28           10            10
      4      삼성전자 2025-07-07 2025-