In [None]:
## 🎯 실습 목표

- `.apply(lambda)` + `if-elif-else` 조건문 구조 익히기
- 중첩 딕셔너리에서 안전하게 `.get().get()`으로 값 추출
- 가격과 방문 횟수를 기준으로 고객 분류 컬럼 생성
- `assert`로 결과 검증하는 실무형 검증 패턴 체득

---

## ✅ 실습 조건

1. **price_category 컬럼 생성**
    - 기준: info["items"][0]["price"]
    - 조건:
        - `>= 10000` → `"고가"`
        - `>= 5000` → `"중가"`
        - `< 5000` → `"저가"`

2. **visit_grade 컬럼 생성**
    - 기준: info["customer"]["visit_count"]
    - 조건:
        - `>= 15` → `"단골"`
        - `>= 5` → `"일반"`
        - `< 5` → `"신규"`

In [None]:
## 정답답

from pathlib import Path
import pandas as pd
import json

# 파일 경로 지정
data_dir = Path("../week04/data")
orders_path = data_dir / "claude_orders.csv"

assert data_dir.exists(), "파일이 존재하지 않습니다"
assert orders_path.exists(), "CSV 파일이 존재하지 않습니다"

df = pd.read_csv(orders_path)
assert not df.empty, "데이터가 비어 있습니다."

# JSON 문자열 파싱
df["info"] = df["order_info"].apply(json.loads)

# 가격 기반 분류 컬럼 생성
df["price_category"] = df["info"].apply(
    lambda x: "고가" if x.get("items", [{}])[0].get("price", 0) >= 10000
    else "중가" if x.get("items", [{}])[0].get("price", 0) >= 5000
    else "저가"
)

# 방문 등급 컬럼 생성
df["visit_grade"] = df["info"].apply(
    lambda x: "단골" if x.get("customer", {}).get("visit_count", 0) >= 15
    else "일반" if x.get("customer", {}).get("visit_count", 0) >= 5
    else "신규"
)

# 결과 출력
print(df["price_category"])
print(df["visit_grade"])

# 검증
assert df["price_category"].tolist() == ["저가", "저가", "저가", "저가", "저가"], "❌ 가격 카테고리 분류 오류"
assert df["visit_grade"].tolist() == ["단골", "일반", "단골", "신규", "일반"], "❌ 방문 등급 분류 오류"


In [None]:
## 직접실습습

from pathlib import Path
import pandas as pd
import json

## 파일 경로 지정

data_dir = Path("../week04/data")
orders_path = data_dir / "claude_orders.csv"

assert data_dir.exists(), "파일이 존재하지 않습니다"

df = pd.read_csv(orders_path)

assert not df.empty, "데이터가 비어 있습니다."

df["info"] = df["order_info"].apply(json.loads)

df["price_category"] = df["info"].apply(lambda x: "고가" if x.get("itemes",[{}][0]).get("price",0) >= 10000 
                                        else "중가" if x.get("itemes",[{}][0]).get("price",0) >= 5000
                                        else "저가")

df["visit_grade"] = df["info"].apply(lambda x: "단골" if x.get("customer",{}).get("visit_count",0) >= 15
                                     else "일반" if x.get("customer",{}).get("visit_count",0) >= 5
                                     else "신규")

print(df["price_category"])
print(df["visit_grade"])

0    저가
1    저가
2    저가
3    저가
4    저가
Name: price_category, dtype: object
0    단골
1    일반
2    단골
3    신규
4    일반
Name: visit_grade, dtype: object
