# 더미데이터 생성


In [48]:
import csv
import random
from datetime import datetime, timedelta

def generate_transaction_data(num_rows=1000, seed=42):
    random.seed(seed)

    merchants = [
        '롯데월드', '세븐일레븐', '이마트', '맥도날드', '세인트존스호텔',
        'GS25', '톡스앤필의원', '롯데리아', '카카오프렌즈', '롯데시네마',
        'CGV', '코스트코', '(주)에이비카페', '런던베이글', '강동도서관',
        '오렌지주유소', '더벤티', '쿰베오', '메가커피', '은혜공인중개사무소', '정약국'
    ]

    amount_ranges = {
        '롯데월드': (50000, 150000),
        '세븐일레븐': (1000, 15000),
        '이마트': (5000, 45000),
        '맥도날드': (3000, 20000),
        '세인트존스호텔': (80000, 150000),
        'GS25': (1000, 12000),
        '톡스앤필의원': (30000, 200000),
        '롯데리아': (2000, 15000),
        '카카오프렌즈': (5000, 25000),
        '롯데시네마': (8000, 25000),
        'CGV': (8000, 25000),
        '코스트코': (20000, 80000),
        '(주)에이비카페': (4000, 15000),
        '런던베이글': (3000, 25000),
        '강동도서관': (1000, 5000),
        '오렌지주유소': (40000, 120000),
        '더벤티': (3000, 12000),
        '쿰베오': (8000, 20000),
        '메가커피': (2000, 12000),
        '은혜공인중개사무소': (500000, 2000000),
        '정약국': (5000, 30000),
    }


    profile_weights = {
        1: {'세븐일레븐': 35, 'GS25': 30, '이마트': 20, '코스트코': 10, '정약국': 5, '롯데월드': 1, 'CGV': 2, '롯데시네마': 2},
        2: {'(주)에이비카페': 30, '메가커피': 25, '더벤티': 20, '런던베이글': 15, '쿰베오': 10, '맥도날드': 15, '롯데리아': 10, '세븐일레븐': 5},
        3: {'CGV': 35, '롯데시네마': 30, '롯데월드': 8, '(주)에이비카페': 10, '메가커피': 6, '세븐일레븐': 6, '이마트': 5},
        4: {'톡스앤필의원': 45, '정약국': 25, '세븐일레븐': 10, '이마트': 10, '(주)에이비카페': 5, 'CGV': 2, '롯데시네마': 2, '롯데월드': 1},
        5: {'오렌지주유소': 40, '코스트코': 25, '이마트': 20, '세븐일레븐': 10, '(주)에이비카페': 5},
        6: {m: 1 for m in merchants},
        7: {'(주)에이비카페': 25, '메가커피': 20, '더벤티': 15, '런던베이글': 12, '쿰베오': 10, '세븐일레븐': 10, '이마트': 8},
        8: {'세븐일레븐': 20, 'GS25': 15, '이마트': 15, '코스트코': 10, 'CGV': 15, '롯데시네마': 15, '(주)에이비카페': 10},
        9: {'CGV': 25, '롯데시네마': 25, '(주)에이비카페': 15, '런던베이글': 10, '맥도날드': 10, '세인트존스호텔': 5, '롯데월드': 10},
        10: {'은혜공인중개사무소': 3, '이마트': 25, '코스트코': 20, '세븐일레븐': 20, '정약국': 10, '오렌지주유소': 10, '(주)에이비카페': 12},
    }

    # 빠진 상점은 낮은 기본 가중치로 채워 넣기
    def get_weights_for_member(mid: int):
        base = {m: 0.5 for m in merchants}  # 기본 0.5
        prof = profile_weights.get(mid, {})
        base.update(prof)
        # random.choices는 리스트 순서대로 weights를 요구
        return [base[m] for m in merchants]

    start_date = datetime(2025, 6, 1)
    end_date = datetime(2025, 8, 31)
    date_range = (end_date - start_date).days

    with open('dataset/member.csv', 'w', newline='', encoding='utf-8') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['memberId', 'amount', 'merchant', 'date'])

        for i in range(num_rows):
            member_id = (i % 10) + 1

            # 멤버별 가중치로 상점 선택
            weights = get_weights_for_member(member_id)
            merchant = random.choices(merchants, weights=weights, k=1)[0]

            min_amount, max_amount = amount_ranges[merchant]
            amount = random.randint(min_amount, max_amount)
            amount = int(amount * random.uniform(0.8, 1.2))  # 약간의 변동

            random_days = random.randint(0, date_range)
            transaction_date = start_date + timedelta(days=random_days)
            date_str = transaction_date.strftime('%Y-%m-%d')

            writer.writerow([member_id, amount, merchant, date_str])

    print(f"member.csv 파일 생성 완료 ({num_rows}행)")

if __name__ == '__main__':
    generate_transaction_data(1000)


member.csv 파일 생성 완료 (1000행)


# 데이터 구성 확인

In [49]:
import pandas as pd

# CSV 파일 경로 지정
file_path = 'dataset/member.csv'

# CSV 불러오기
df = pd.read_csv(file_path)

# 상위 5개 행 출력
df.head()

Unnamed: 0,memberId,amount,merchant,date
0,1,1545,GS25,2025-07-02
1,2,11829,롯데리아,2025-08-09
2,3,6430,세븐일레븐,2025-06-12
3,4,169105,톡스앤필의원,2025-08-11
4,5,39402,이마트,2025-07-28


# 사용처 기반 카테고리 추출

In [51]:
import os
import time
import requests
import pandas as pd
from dotenv import load_dotenv

load_dotenv()

API_KEY = os.getenv("KAKAO_API_KEY")
HEADERS = {"Authorization": f"KakaoAK {API_KEY}"}
SEARCH_URL = "https://dapi.kakao.com/v2/local/search/keyword.json"

# 대분류로 그대로 인정할 목록
TOP_CATEGORIES = {
    "음식점",
    "서비스,산업",
    "가정,생활",
    "생활, 가전",  # 응답 변동 대비 별칭 처리
    "의료,건강",
    "교육,학문",
    "교통,수송",
    "스포츠,레저",
    "부동산",
    "문화,예술",
    "여행",
}

# '가정,생활'로 합치는 별칭(응답 일관성 대비)
HOME_LIFE_ALIASES = {"가정,생활", "생활, 가전"}

def parse_category_name(category_name: str) -> str:
    """
    카카오 category_name을 규칙에 맞춰 최종 카테고리로 매핑
    """
    if not category_name:
        return "기타"

    # "A > B > C" 형태를 토큰화
    tokens = [t.strip() for t in category_name.split(">") if t.strip()]
    if not tokens:
        return "기타"

    top = tokens[0]  # 대분류
    subs = tokens[1:]  # 중분류 이하

    # ---- 음식점 규칙 ----
    if top == "음식점":
        # 중분류 어디든 '카페'가 있으면 카페로
        if any("카페" in s for s in subs):
            return "카페"
        return "음식점"

    # ---- 가정,생활 규칙 (별칭 포함) ----
    if top in HOME_LIFE_ALIASES:
        # 우선순위: 편의점/대형마트/패션/문구,사무용품
        # 문구,사무용품을 다양한 표기로 허용
        if any("편의점" in s for s in subs):
            return "편의점"
        if any("대형마트" in s for s in subs):
            return "대형마트"
        if any("패션" in s for s in subs):
            return "패션"
        if any(("문구" in s and "사무" in s) or ("문구,사무용품" in s) for s in subs):
            return "문구,사무용품"
        # 없으면 대분류로
        return "가정,생활"

    # ---- 여행 규칙 ----
    if top == "여행":
        if any("숙박" in s for s in subs):
            return "숙박"
        # 관광,명소/관광명소/명소 등 허용
        if any(("관광" in s and "명소" in s) or ("관광명소" in s) or (s.strip() == "명소") for s in subs):
            return "관광,명소"
        return "여행"

    # ---- 그 외 대분류는 그대로 반환 ----
    if top in TOP_CATEGORIES:
        # '생활, 가전'은 표준화해서 '가정,생활'로 통일해 주면 좋음
        return "가정,생활" if top in HOME_LIFE_ALIASES else top

    # 어떤 규칙에도 해당 안 되면 기타
    return "기타"


def get_category_from_kakao(merchant_name: str, sleep_sec: float = 0.0) -> str:
    """
    상호명으로 카카오 키워드검색 호출 -> category_name 파싱 -> 규칙 매핑
    """
    if not merchant_name or not merchant_name.strip():
        return "기타"

    try:
        resp = requests.get(
            SEARCH_URL,
            headers=HEADERS,
            params={"query": merchant_name, "size": 1},  # 가장 관련 높은 1건
            timeout=5,
        )
        # 간단한 rate control (필요시)
        if sleep_sec > 0:
            time.sleep(sleep_sec)

        if resp.status_code != 200:
            return "기타"

        docs = resp.json().get("documents", [])
        if not docs:
            return "기타"

        cat_name = docs[0].get("category_name", "")
        return parse_category_name(cat_name)

    except requests.RequestException:
        return "기타"

df = pd.read_csv("dataset/member.csv")

# 새 컬럼: rules_category (규칙 기반 최종 카테고리)
df["category"] = df["merchant"].apply(lambda x: get_category_from_kakao(str(x)))
df.to_csv("dataset/member_with_category.csv", index=False, encoding="utf-8-sig")
df.head()

Unnamed: 0,memberId,amount,merchant,date,category
0,1,1545,GS25,2025-07-02,편의점
1,2,11829,롯데리아,2025-08-09,음식점
2,3,6430,세븐일레븐,2025-06-12,편의점
3,4,169105,톡스앤필의원,2025-08-11,"의료,건강"
4,5,39402,이마트,2025-07-28,대형마트


## 카테고리별 MCC 수동 매핑

In [52]:
import pandas as pd

# 카카오 기준에 맞춰 MCC 수동 매핑
mcc_mapping = {

    "음식점": "5812",
    "카페": "5814",
    "편의점": "5499",
    "대형마트": "5300",
    "패션": "5651",
    "문구,사무용품": "5943",
    "서비스,산업": "7399",
    "생활, 가전": "5722",
    "의료,건강": "8062",
    "교육,학문": "8299",
    "교통,수송": "4111",
    "스포츠,레저": "7997",
    "부동산": "6513",
    "문화,예술": "7991",
    "관광,명소": "7991",
    "여행": "4722",
    "숙박": "7011",
    "기타": "0000"
}


# CSV 파일 불러오기
df = pd.read_csv('dataset/member_with_category.csv')

# category 컬럼(대분류명)을 기반으로 MCC 코드를 매핑해 새 컬럼 생성
df['mcc'] = df['category'].map(mcc_mapping).fillna('0000')  # 미매핑시 '0000' 처리

# 결과 저장
df.to_csv('dataset/member_with_category_mcc.csv', index=False)

df.head()


Unnamed: 0,memberId,amount,merchant,date,category,mcc
0,1,1545,GS25,2025-07-02,편의점,5499
1,2,11829,롯데리아,2025-08-09,음식점,5812
2,3,6430,세븐일레븐,2025-06-12,편의점,5499
3,4,169105,톡스앤필의원,2025-08-11,"의료,건강",8062
4,5,39402,이마트,2025-07-28,대형마트,5300


## MCC 기반 탄소 배출량 매핑

In [38]:
import pandas as pd
import requests
import uuid

# 1) member_with_category_mcc 파일을 같은 폴더에 두고 불러오기
df = pd.read_csv('dataset/member_with_category_mcc.csv')
from dotenv import load_dotenv
load_dotenv()
import os

# 2) demo API URL
API_URL = os.getenv("CARBON_API_URL")

# 3) 각 행마다 demo 호출 및 carbonEmissionInOunces 수집
carbon_list = []
for _, row in df.iterrows():
    tx_id = str(uuid.uuid4())
    payload = [
        {
            "transactionId": tx_id,
            "amount": {
                "value": str(row['amount']),
                "currencyCode": "KRW"
            },
            "transactionDate": row['date'],
            "mcc": int(row['mcc']),
            "merchantCountryCode": "KOR",
            "paymentNetwork": "MASTERCARD",
            "cardBrand": "OTH"
        }
    ]
    resp = requests.post(API_URL, json=payload)
    if resp.status_code == 200:
        data = resp.json()[0]
        carbon_value = data.get('carbonEmissionInOunces')
        # None이나 Null인 경우 0으로 대체
        if carbon_value is None:
            carbon_value = 0
        carbon_list.append(carbon_value)
    else:
        carbon_list.append(0)  # 에러 시에도 0으로 처리

# 4) 원본 DataFrame에 컬럼 추가 (컬럼명 'carbon'으로 변경)
df['carbon'] = carbon_list

# 5) final_member.csv 로 저장
df.to_csv('dataset/final_member.csv', index=False)

df.head()

Unnamed: 0,memberId,amount,merchant,date,category,mcc,carbon
0,1,1545,GS25,2025-07-02,편의점,5499,8.88
1,2,11829,롯데리아,2025-08-09,음식점,5812,129.7
2,3,6430,세븐일레븐,2025-06-12,편의점,5499,36.97
3,4,169105,톡스앤필의원,2025-08-11,"의료,건강",8062,690.19
4,5,39402,이마트,2025-07-28,대형마트,5300,222.16


## 데이터 기반 탄소 배출 분석

In [39]:
import pandas as pd

columns = ['memberId', 'amount', 'merchant', 'date', 'category', 'mcc', 'carbon']
df = pd.read_csv('dataset/final_member.csv', names=columns, header=None)

df['date'] = pd.to_datetime(df['date'], format='%Y-%m-%d', errors='coerce')
df['amount'] = pd.to_numeric(df['amount'], errors='coerce').fillna(0)
df['carbon'] = pd.to_numeric(df['carbon'], errors='coerce').fillna(0)

# ===== 1) 기간별 멤버 탄소/금액 합산/등수/평균대비/상위% =====
def get_rank_by_period(df, start_date, end_date):
    mask = (df['date'] >= pd.to_datetime(start_date)) & (df['date'] <= pd.to_datetime(end_date))
    df_period = df.loc[mask]

    carbon_sum = df_period.groupby('memberId')['carbon'].sum().sort_index()
    amount_sum = df_period.groupby('memberId')['amount'].sum().sort_index()

    if carbon_sum.empty:
        return pd.DataFrame(columns=['memberId','carbon_sum','amount_sum','rank','vs_avg','top_label'])

    avg_carbon = carbon_sum.mean()
    ranks = carbon_sum.rank(method='dense', ascending=True).astype(int)

    if avg_carbon == 0:
        diff_label = pd.Series(["0%"] * len(carbon_sum), index=carbon_sum.index)
    else:
        diff_percent = ((carbon_sum - avg_carbon) / avg_carbon * 100).round(1)
        diff_label = diff_percent.apply(lambda x: f"▲ {abs(x)}%" if x > 0 else (f"▼ {abs(x)}%" if x < 0 else "0%"))

    n_members = len(carbon_sum)
    top_percent = (ranks / n_members * 100).round(1)
    top_label = top_percent.apply(lambda x: f"상위 {x}%")

    result = pd.DataFrame({
        'memberId': carbon_sum.index,
        'carbon_sum': carbon_sum.values,
        'amount_sum': amount_sum.reindex(carbon_sum.index, fill_value=0).values,
        'rank': ranks.values,
        'vs_avg': diff_label.values,
        'top_label': top_label.values
    }).sort_values('rank').reset_index(drop=True)

    return result

# ===== 2) 멤버별 고/저탄소 업종 Top3 =====
def get_top3_categories_by_period(df, start_date, end_date):
    mask = (df['date'] >= pd.to_datetime(start_date)) & (df['date'] <= pd.to_datetime(end_date))
    df_period = df.loc[mask].copy()

    df_period = df_period[df_period['category'] != '기타']
    df_period['carbon'] = pd.to_numeric(df_period['carbon'], errors='coerce').fillna(0)

    grouped = df_period.groupby(['memberId', 'category'])['carbon'].sum().reset_index()

    top3_high = grouped.groupby('memberId', group_keys=False).apply(
        lambda x: x.nlargest(3, 'carbon')
    ).reset_index(drop=True)

    top3_low  = grouped.groupby('memberId', group_keys=False).apply(
        lambda x: x.nsmallest(3, 'carbon')
    ).reset_index(drop=True)

    return top3_high, top3_low

# ===== 3) 리포트 한 번에 뽑아주는 헬퍼 =====
def build_reports(df, start_date, end_date):
    today = pd.to_datetime('today').normalize()

    period_rank = get_rank_by_period(df, start_date, end_date)
    top3_high, top3_low = get_top3_categories_by_period(df, start_date, end_date)

    rank_day = get_rank_by_period(df, today, today)
    week_start = today - pd.Timedelta(days=6)
    rank_week = get_rank_by_period(df, week_start, today)
    month_start = today - pd.Timedelta(days=29)
    rank_month = get_rank_by_period(df, month_start, today)

    return {
        "period_rank": period_rank,
        "top3_high": top3_high,
        "top3_low": top3_low,
        "rank_day": rank_day,
        "rank_week": rank_week,
        "rank_month": rank_month,
    }

# ===== 4) 사용 예시 (Jupyter에서는 display로 보기) =====
reports = build_reports(df, '2025-06-05', '2025-07-31')
#
from IPython.display import display
display(reports['period_rank'].head(10))  #저탄소 소비 래킹
display(reports['top3_high'].head(10)) #저탄소 업종 Top3
display(reports['top3_low'].head(10)) #고탄소 업종 Top3
display(reports['rank_day'].head(10)) #금일 탄소 소비 분석
display(reports['rank_week'].head(10)) #금주 탄소 소비 분석
display(reports['rank_month'].head(10)) #금월 탄소 소비 분석


Unnamed: 0,memberId,carbon_sum,amount_sum,rank,vs_avg,top_label
0,8,5187.35,2154511.0,1,▼ 61.8%,상위 10.0%
1,3,5355.93,1353032.0,2,▼ 60.6%,상위 20.0%
2,1,6110.26,1080564.0,3,▼ 55.1%,상위 30.0%
3,2,6248.69,579541.0,4,▼ 54.0%,상위 40.0%
4,7,7615.28,833120.0,5,▼ 44.0%,상위 50.0%
5,6,7690.68,3833363.0,6,▼ 43.4%,상위 60.0%
6,9,13323.48,1810147.0,7,▼ 2.0%,상위 70.0%
7,4,15598.87,3699269.0,8,▲ 14.7%,상위 80.0%
8,10,21430.82,1597523.0,9,▲ 57.6%,상위 90.0%
9,5,47393.71,3391447.0,10,▲ 248.6%,상위 100.0%


Unnamed: 0,memberId,category,carbon
0,1,대형마트,4018.78
1,1,편의점,1566.41
2,1,카페,280.04
3,10,"교통,수송",16486.8
4,10,대형마트,2894.28
5,10,편의점,786.61
6,2,카페,3839.55
7,2,음식점,2292.38
8,2,편의점,116.76
9,3,"문화,예술",2434.48


Unnamed: 0,memberId,category,carbon
0,1,"문화,예술",105.3
1,1,"의료,건강",139.73
2,1,카페,280.04
3,10,"문화,예술",41.63
4,10,"문구,사무용품",100.94
5,10,음식점,180.95
6,2,편의점,116.76
7,2,음식점,2292.38
8,2,카페,3839.55
9,3,"문구,사무용품",109.77


Unnamed: 0,memberId,carbon_sum,amount_sum,rank,vs_avg,top_label
0,1,66.99,11651.0,1,▼ 62.8%,상위 16.7%
1,3,110.84,37479.0,2,▼ 38.4%,상위 33.3%
2,6,130.59,11910.0,3,▼ 27.5%,상위 50.0%
3,9,236.53,55503.0,4,▲ 31.4%,상위 66.7%
4,8,250.05,55672.0,5,▲ 38.9%,상위 83.3%
5,5,285.03,50552.0,6,▲ 58.3%,상위 100.0%


Unnamed: 0,memberId,carbon_sum,amount_sum,rank,vs_avg,top_label
0,10,211.34,1411394.0,1,▼ 78.5%,상위 10.0%
1,8,435.48,105172.0,2,▼ 55.6%,상위 20.0%
2,1,447.7,78744.0,3,▼ 54.4%,상위 30.0%
3,7,452.72,59563.0,4,▼ 53.9%,상위 40.0%
4,3,594.56,177648.0,5,▼ 39.4%,상위 50.0%
5,2,748.15,68232.0,6,▼ 23.8%,상위 60.0%
6,6,959.53,145298.0,7,▼ 2.2%,상위 70.0%
7,4,1560.05,361332.0,8,▲ 59.0%,상위 80.0%
8,9,1995.66,272858.0,9,▲ 103.4%,상위 90.0%
9,5,2408.61,152087.0,10,▲ 145.4%,상위 100.0%


Unnamed: 0,memberId,carbon_sum,amount_sum,rank,vs_avg,top_label
0,8,2933.67,573314.0,1,▼ 64.9%,상위 10.0%
1,3,3053.43,699614.0,2,▼ 63.5%,상위 20.0%
2,2,3135.41,290618.0,3,▼ 62.5%,상위 30.0%
3,6,3293.29,1279937.0,4,▼ 60.6%,상위 40.0%
4,1,3579.03,618011.0,5,▼ 57.2%,상위 50.0%
5,7,5697.34,688652.0,6,▼ 31.8%,상위 60.0%
6,4,6640.08,1549331.0,7,▼ 20.6%,상위 70.0%
7,9,6808.36,885697.0,8,▼ 18.5%,상위 80.0%
8,10,16675.47,2510242.0,9,▲ 99.5%,상위 90.0%
9,5,31769.87,1930777.0,10,▲ 280.1%,상위 100.0%


In [45]:
import math
import pandas as pd

def parse_dates_mixed(series):

    try:
        # pandas 2.0+ 에서 지원
        return pd.to_datetime(series, format="mixed", errors="coerce")
    except Exception:
        s1 = pd.to_datetime(series, format="%Y%m%d", errors="coerce")
        s2 = pd.to_datetime(series, format="%Y-%m-%d", errors="coerce")
        return s1.fillna(s2)


def sdiv(a, b):
    return a / b if (pd.notna(a) and pd.notna(b) and b != 0) else 0

df = pd.read_csv("dataset/final_member.csv")

if 'date' in df.columns:
    df['date'] = parse_dates_mixed(df['date'])

# 여가 관련 카테고리(시간 로직 제거, 카테고리 기반만 사용)
LEISURE_CATS = ['카페', '음식점', '스포츠,레저', '여행', '문화,예술','관광,명소']

summary_list = []

for member_id in df['memberId'].unique():
    sub = df[df['memberId'] == member_id].copy()  # copy()로 SettingWithCopyWarning 방지
    if sub.empty:
        continue

    # ---- 카테고리 집중도 ----
    cat_summary = (
        sub.groupby('category', dropna=False)['carbon']
        .sum()
        .sort_values(ascending=False)
    )
    total_carbon = sub['carbon'].sum()

    if cat_summary.empty:
        top_category = '기타'
        cat_focus_ratio = 0
    else:
        top_category = cat_summary.index[0]
        cat_focus_ratio = sdiv(cat_summary.iloc[0], total_carbon)

    # ---- 브랜드 반복성 ----
    brand_counts = sub['merchant'].value_counts()
    if brand_counts.empty:
        top_brand = ''
        brand_repeat_ratio = 0
    else:
        top_brand = brand_counts.index[0]
        brand_repeat_ratio = sdiv(brand_counts.iloc[0], len(sub))

    # ---- 탄소 민감도 (amount=0 방어) ----
    sub['carbon_per_amount'] = sub.apply(lambda r: sdiv(r['carbon'], r['amount']), axis=1)
    carbon_sensitivity = sub['carbon_per_amount'].mean(skipna=True)
    if pd.isna(carbon_sensitivity):
        carbon_sensitivity = 0

    # ---- 탄소 집중도 (Pareto 20%) ----
    n_top = max(1, math.ceil(len(sub) * 0.2))
    top_20 = sub.nlargest(n_top, 'carbon')
    carbon_concentration = sdiv(top_20['carbon'].sum(), total_carbon)

    # ---- 여가 소비 비율 (시간 사용 X, 카테고리만) ----
    leisure_ratio = sdiv(sub['category'].isin(LEISURE_CATS).sum(), len(sub))

    summary_list.append({
        "memberId": int(member_id),
        "총거래수": int(len(sub)),
        "총탄소배출": round(float(total_carbon), 2),
        "탄소주요카테고리": top_category,
        "카테고리집중도": round(float(cat_focus_ratio), 2),
        "주요브랜드": top_brand,
        "브랜드반복성": round(float(brand_repeat_ratio), 2),
        "탄소민감도": round(float(carbon_sensitivity), 3),
        "탄소집중도(Pareto20)": round(float(carbon_concentration), 2),
        "여가소비비율": round(float(leisure_ratio), 2),
    })

df_summary = pd.DataFrame(summary_list)

# ============== 행동 유형 분류 (주말 관련 조건 제거) ==============
def classify_motivation(row):
    if row['여가소비비율'] >= 0.6 and row['탄소민감도'] >= 0.1:
        return "🎯 여가-탄소 과다형"
    elif row['브랜드반복성'] >= 0.3 and row['탄소주요카테고리'] in ['대형마트', '편의점']:
        return "🔁 루틴 소비형"
    elif row['탄소민감도'] >= 0.15 and row['탄소집중도(Pareto20)'] <= 0.35:
        return "🎯 탄소 민감형"
    elif row['탄소집중도(Pareto20)'] >= 0.5:
        return "🎲 소비 편중형"
    else:
        return "🎭 혼합형"

df_summary["행동동기유형"] = df_summary.apply(classify_motivation, axis=1)

df_summary


Unnamed: 0,memberId,총거래수,총탄소배출,탄소주요카테고리,카테고리집중도,주요브랜드,브랜드반복성,탄소민감도,탄소집중도(Pareto20),여가소비비율,행동동기유형
0,1,100,9734.63,대형마트,0.64,세븐일레븐,0.33,0.006,0.55,0.07,🔁 루틴 소비형
1,2,100,10436.54,카페,0.57,(주)에이비카페,0.21,0.011,0.35,0.96,🎭 혼합형
2,3,100,10661.93,"문화,예술",0.35,롯데시네마,0.34,0.005,0.58,0.86,🎲 소비 편중형
3,4,100,24699.96,"의료,건강",0.85,톡스앤필의원,0.44,0.005,0.49,0.11,🎭 혼합형
4,5,100,77077.81,"교통,수송",0.83,오렌지주유소,0.36,0.012,0.55,0.09,🎲 소비 편중형
5,6,100,21743.98,"교통,수송",0.25,이마트,0.09,0.007,0.68,0.45,🎲 소비 편중형
6,7,100,12768.8,카페,0.46,(주)에이비카페,0.25,0.01,0.46,0.75,🎭 혼합형
7,8,100,8956.82,대형마트,0.54,롯데시네마,0.23,0.005,0.55,0.42,🎲 소비 편중형
8,9,100,19967.32,숙박,0.44,CGV,0.23,0.006,0.72,0.85,🎲 소비 편중형
9,10,100,31500.05,"교통,수송",0.7,세븐일레븐,0.23,0.008,0.79,0.14,🎲 소비 편중형


In [42]:
# 소비항목 기여도 분석 (merchant 단위)
def get_merchant_summary(df_user):
    merchant_summary = df_user.groupby('merchant').agg({
        'carbon': 'sum',
        'amount': 'sum',
        'category': 'first'  # 대표 카테고리 표시용
    }).reset_index()

    total_carbon = df_user['carbon'].sum()
    merchant_summary['carbon_ratio'] = merchant_summary['carbon'] / total_carbon
    merchant_summary['carbon_intensity'] = merchant_summary['carbon'] / merchant_summary['amount']
    merchant_summary = merchant_summary.sort_values('carbon_ratio', ascending=False)

    return merchant_summary





In [43]:
def get_merchant_summary(df_user):
    merchant_summary = df_user.groupby('merchant').agg({
        'carbon': 'sum',
        'amount': 'sum',
        'category': 'first'
    }).reset_index()

    # ✅ 전체 합이 정확히 1이 되게
    total_carbon = merchant_summary['carbon'].sum()

    merchant_summary['carbon_ratio'] = merchant_summary['carbon'] / total_carbon
    merchant_summary['carbon_intensity'] = merchant_summary['carbon'] / merchant_summary['amount']
    merchant_summary = merchant_summary.sort_values('carbon_ratio', ascending=False)

    return merchant_summary


def score_reduction_targets(merchant_df, user_summary_row):
    """
    merchant_df: get_merchant_summary로 나온 df
    user_summary_row: df_summary에서 한 사람의 row (Series)
    """
    leisure_categories = ['카페', '음식점', '문화시설']

    scores = []
    for _, row in merchant_df.iterrows():
        score = 0
        explanation = []

        # 1. 탄소 기여도 (weight 0.4)
        score += row['carbon_ratio'] * 0.4
        explanation.append(f"탄소기여도 +{round(row['carbon_ratio']*0.4, 3)}")

        # 2. 탄소 단가 (weight 0.2)
        score += row['carbon_intensity'] * 0.2
        explanation.append(f"탄소단가 +{round(row['carbon_intensity']*0.2, 3)}")

        # 3. 여가 소비 여부 (weight 0.2)
        if row['category'] in leisure_categories:
            score += 0.2
            explanation.append("여가소비 +0.2")

        # 4. 브랜드 반복성 (weight -0.1 if 반복성 높음)
        if row['merchant'] == user_summary_row['주요브랜드']:
            repeat_penalty = -0.1 * user_summary_row['브랜드반복성']
            score += repeat_penalty
            explanation.append(f"브랜드반복성 패널티 {round(repeat_penalty,3)}")

        # 5. 행동동기유형 기반 penalty (예시: 루틴 소비형이면 생필품은 줄이기 어려움)
        if user_summary_row['행동동기유형'] == '🔁 루틴 소비형' and row['category'] in ['대형마트', '편의점']:
            score -= 0.15
            explanation.append("루틴소비형 - 생필품 감축저항 -0.15")

        scores.append({
            'merchant': row['merchant'],
            'category': row['category'],
            'carbon_ratio': round(row['carbon_ratio'], 3),
            'carbon_intensity': round(row['carbon_intensity'], 3),
            '감축우선순위점수': round(score, 4),
            '설명': " / ".join(explanation)
        })

    return pd.DataFrame(scores).sort_values('감축우선순위점수', ascending=False)




# 1번 사용자 데이터 분석
df_user1 = df[df['memberId'] == 1]
merchant_df1 = get_merchant_summary(df_user1)

# 요약 테이블에서 1번 사용자 row 가져오기
row_user1 = df_summary[df_summary['memberId'] == 1].iloc[0]

# 감축 타겟 점수 계산
priority_df = score_reduction_targets(merchant_df1, row_user1)
priority_df

Unnamed: 0,merchant,category,carbon_ratio,carbon_intensity,감축우선순위점수,설명
5,맥도날드,음식점,0.021,0.011,0.2105,탄소기여도 +0.008 / 탄소단가 +0.002 / 여가소비 +0.2
6,(주)에이비카페,카페,0.016,0.011,0.2087,탄소기여도 +0.006 / 탄소단가 +0.002 / 여가소비 +0.2
7,쿰베오,카페,0.013,0.011,0.2072,탄소기여도 +0.005 / 탄소단가 +0.002 / 여가소비 +0.2
4,정약국,"의료,건강",0.025,0.004,0.0109,탄소기여도 +0.01 / 탄소단가 +0.001
8,CGV,"문화,예술",0.008,0.003,0.0036,탄소기여도 +0.003 / 탄소단가 +0.001
9,롯데시네마,"문화,예술",0.007,0.003,0.0034,탄소기여도 +0.003 / 탄소단가 +0.001
0,코스트코,대형마트,0.376,0.006,0.0015,탄소기여도 +0.15 / 탄소단가 +0.001 / 루틴소비형 - 생필품 감축저항 -...
1,이마트,대형마트,0.263,0.006,-0.0435,탄소기여도 +0.105 / 탄소단가 +0.001 / 루틴소비형 - 생필품 감축저항 ...
3,GS25,편의점,0.118,0.006,-0.1017,탄소기여도 +0.047 / 탄소단가 +0.001 / 루틴소비형 - 생필품 감축저항 ...
2,세븐일레븐,편의점,0.153,0.006,-0.1205,탄소기여도 +0.061 / 탄소단가 +0.001 / 브랜드반복성 패널티 -0.033...


In [44]:
def recommend_reduction_range(user_df, merchant_name):

    df_merchant = user_df[user_df['merchant'] == merchant_name]

    if len(df_merchant) < 3:
        return {
            "range": (0, 10),
            "reason": "해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다."
        }

    # 월별 소비 추이 분석 (예시: 금액 기준)
    monthly = df_merchant.groupby(df_merchant['date'].dt.to_period('M'))['amount'].sum()
    std_ratio = monthly.std() / (monthly.mean() + 1e-6)

    # std_ratio → 감축 가능 범위 추정
    if std_ratio > 0.7:
        r = (20, 80)
        reason = f"소비 변동성이 매우 크기 때문에, 최대 80%까지도 감축 가능합니다. (표준편차비: {std_ratio:.2f})"
    elif std_ratio > 0.4:
        r = (10, 40)
        reason = f"소비 변동성이 중간 수준이며, 10~40% 범위 감축이 가능합니다. (표준편차비: {std_ratio:.2f})"
    else:
        r = (0, 15)
        reason = f"소비가 매우 일정하여 감축 여지가 낮습니다. (표준편차비: {std_ratio:.2f})"

    return {
        "range": r,
        "reason": reason
    }

def analyze_top_reduction_targets(df_user, df_summary, member_id, top_n=5):

    # 개별 사용자 데이터 추출
    df_user_indiv = df_user[df_user['memberId'] == member_id]
    row_user = df_summary[df_summary['memberId'] == member_id].iloc[0]

    # 1. merchant summary
    merchant_df = get_merchant_summary(df_user_indiv)

    # 2. 감축우선순위 점수 계산
    priority_df = score_reduction_targets(merchant_df, row_user)

    # 3. 상위 N개 merchant에 대해 감축률 추천
    reduction_infos = []
    for _, row in priority_df.head(top_n).iterrows():
        merchant_name = row['merchant']
        reduction = recommend_reduction_range(df_user_indiv, merchant_name)

        reduction_infos.append({
            "merchant": merchant_name,
            "category": row['category'],
            "carbon_ratio": row['carbon_ratio'],
            "감축우선순위점수": row['감축우선순위점수'],
            "감축률_추천범위": f"{reduction['range'][0]}% ~ {reduction['range'][1]}%",
            "감축률_추천_이유": reduction['reason'],
            "설명": row['설명']
        })

    return pd.DataFrame(reduction_infos)


top_reduction_df = analyze_top_reduction_targets(df, df_summary, member_id=1, top_n=5)
top_reduction_df



Unnamed: 0,merchant,category,carbon_ratio,감축우선순위점수,감축률_추천범위,감축률_추천_이유,설명
0,맥도날드,음식점,0.021,0.2105,0% ~ 10%,"해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.",탄소기여도 +0.008 / 탄소단가 +0.002 / 여가소비 +0.2
1,(주)에이비카페,카페,0.016,0.2087,0% ~ 10%,"해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.",탄소기여도 +0.006 / 탄소단가 +0.002 / 여가소비 +0.2
2,쿰베오,카페,0.013,0.2072,0% ~ 10%,"해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.",탄소기여도 +0.005 / 탄소단가 +0.002 / 여가소비 +0.2
3,정약국,"의료,건강",0.025,0.0109,10% ~ 40%,"소비 변동성이 중간 수준이며, 10~40% 범위 감축이 가능합니다. (표준편차비: ...",탄소기여도 +0.01 / 탄소단가 +0.001
4,CGV,"문화,예술",0.008,0.0036,0% ~ 10%,"해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.",탄소기여도 +0.003 / 탄소단가 +0.001


# LLM 기반 탄소 감축 전략 액션 플랜 제공

In [33]:
# -*- coding: utf-8 -*-
import os
import json
import requests
from dotenv import load_dotenv

# 환경변수에서 API Key 로드
load_dotenv()
API_KEY  = os.getenv("GEMINI_API_KEY")
MODEL_ID = "gemini-2.5-flash"
ENDPOINT = (
    f"https://generativelanguage.googleapis.com/v1beta/models/"
    f"{MODEL_ID}:generateContent?key=AIzaSyAtHIIhgWL3Xam5OHWV0WblQUMW2VgnUdM"
)

def call_gemini_api(prompt: str, temperature: float = 0.0, max_tokens: int = 4096) -> str:

    payload = {
        "contents": [
            {"parts": [{"text": prompt}]}
        ],
        "generationConfig": {
            "temperature": temperature,
            "maxOutputTokens": max_tokens,
            "thinkingConfig": {"thinkingBudget": 0}
        }
    }
    body = json.dumps(payload, ensure_ascii=False).encode("utf-8")
    headers = {"Content-Type": "application/json; charset=utf-8"}

    resp = requests.post(ENDPOINT, headers=headers, data=body)
    resp.raise_for_status()
    return resp.json()["candidates"][0]["content"]["parts"][0]["text"]

# ──────────────────────────────
# 소비자별 요약 + LLM 프롬프트 생성 및 호출
# ──────────────────────────────
def summarize_user_targets_and_ask_llm(member_id, df_user, df_summary, top_n=5):
    """
    감축우선순위 기반 추천 + Gemini 프롬프트 생성 및 호출
    """
    # 1. 사용자 데이터 정리
    df_user_indiv = df_user[df_user['memberId'] == member_id]
    total_amount = df_user_indiv["amount"].sum()
    total_carbon = df_user_indiv["carbon"].sum()

    # 2. 감축 타겟 분석
    df_targets = analyze_top_reduction_targets(df_user, df_summary, member_id, top_n=top_n)

    # 3. 프롬프트 구성
    summary_lines = [
        f"소비자 {member_id}의 한 달 소비 요약:",
        f"- 총 지출: {round(total_amount,1)}원, 총 탄소 배출: {round(total_carbon,1)}kgCO₂",
        f"- 탄소 감축 우선순위 Top {top_n} 항목:"
    ]

    for _, row in df_targets.iterrows():
        summary_lines.append(
            f"• {row['merchant']} ({row['category']}): "
            f"탄소기여도 {round(row['carbon_ratio']*100, 1)}%, "
            f"감축우선순위 점수 {round(row['감축우선순위점수'], 3)}, "
            f"추천 감축률 {row['감축률_추천범위']} → 이유: {row['감축률_추천_이유']}"
        )

    summary_lines.append("\n이 소비자에게 탄소 감축을 위해 어떤 실천 전략이 가장 효과적일까요?")
    summary_lines.append("항목별로 감축률을 선택할 수 있게 유도하고, 총 감축 효과가 얼마나 될지도 예측해주세요.")
    summary_lines.append("다음과 같은 형식에 맞춰 구체적으로 답변해 주세요. 반드시 아래 구조를 따르되, 내용은 소비자 특성에 맞게 맞춤화해 주세요:\n")
    summary_lines.append("""
    1. 소비자 인삿말 및 분석 요약

    2. [현재 소비 패턴 분석]
    - 총지출 대비 탄소 배출량 특이점
    - 어떤 업종/브랜드가 주요 기여자인지
    - 탄소 감축 가능성이 있는 소비 패턴
    - 추천 감축률이 낮은 이유 (ex: 소비 기록 적음)

    3. [감축 전략 제안]
    - 외식/문화 등 업종별 구체적 조언 포함
    - 실천 가능한 행동 위주로 제안

    4. [Top 5 항목별 감축률 가이드]
    아래 형식을 반복해서 제시:
    - 브랜드명 (업종)
    - 현재 탄소 기여도 (kgCO₂)
    - 추천 감축률 (예: 0% / 5% / 10% / 20% / 30%)
    - 실천 전략 (bullet 2~3개)
    - 감축률별 감축 예상량 (계산 기반)

    5. [총 감축 효과 예측]
    - 예시 시나리오 제시
    - 각 항목 감축률 선택 + 총 감축량 계산
    - 감축 후 총 배출량 제시

    6. [마무리 코멘트]
    - 긍정적인 격려
    - 다음 단계 제안

    **반드시 위 양식을 지켜 작성해주세요.**""")

    prompt = "\n".join(summary_lines)

    print(f"\n[Gemini 프롬프트 - member {member_id}]\n{prompt}\n")

    # Gemini API 호출
    response = call_gemini_api(prompt)
    print(f"[Gemini 응답 - member {member_id}]\n{response}\n{'-'*50}")

# ──────────────────────────────
# 전체 실행

if __name__ == "__main__":
    # memberId별로 루프 돌며 Gemini 호출
    for member_id in df["memberId"].unique():
        summarize_user_targets_and_ask_llm(member_id, df, df_summary, top_n=5)



[Gemini 프롬프트 - member 1]
소비자 1의 한 달 소비 요약:
- 총 지출: 1715102원, 총 탄소 배출: 9734.6kgCO₂
- 탄소 감축 우선순위 Top 5 항목:
• 맥도날드 (음식점): 탄소기여도 2.1%, 감축우선순위 점수 0.21, 추천 감축률 0% ~ 10% → 이유: 해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.
• (주)에이비카페 (카페): 탄소기여도 1.6%, 감축우선순위 점수 0.209, 추천 감축률 0% ~ 10% → 이유: 해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.
• 쿰베오 (카페): 탄소기여도 1.3%, 감축우선순위 점수 0.207, 추천 감축률 0% ~ 10% → 이유: 해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.
• 정약국 (의료,건강): 탄소기여도 2.5%, 감축우선순위 점수 0.011, 추천 감축률 10% ~ 40% → 이유: 소비 변동성이 중간 수준이며, 10~40% 범위 감축이 가능합니다. (표준편차비: 0.55)
• CGV (문화,예술): 탄소기여도 0.8%, 감축우선순위 점수 0.004, 추천 감축률 0% ~ 10% → 이유: 해당 브랜드의 소비 기록이 적어, 안전하게 0~10% 감축만 권장됩니다.

이 소비자에게 탄소 감축을 위해 어떤 실천 전략이 가장 효과적일까요?
항목별로 감축률을 선택할 수 있게 유도하고, 총 감축 효과가 얼마나 될지도 예측해주세요.
다음과 같은 형식에 맞춰 구체적으로 답변해 주세요. 반드시 아래 구조를 따르되, 내용은 소비자 특성에 맞게 맞춤화해 주세요:


    1. 소비자 인삿말 및 분석 요약

    2. [현재 소비 패턴 분석]
    - 총지출 대비 탄소 배출량 특이점
    - 어떤 업종/브랜드가 주요 기여자인지
    - 탄소 감축 가능성이 있는 소비 패턴
    - 추천 감축률이 낮은 이유 (ex: 소비 기록 적음)

    3. [감축 전략 제안]
    - 외식/문화 등

# LLM 기반 ESG 금융 상품 추천

In [34]:
# -*- coding: utf-8 -*-
import os
import json
import requests
from PyPDF2 import PdfReader
from dotenv import load_dotenv

load_dotenv()
API_KEY  = os.getenv("GEMINI_API_KEY")
MODEL_ID = "gemini-2.5-flash"
ENDPOINT = (
    f"https://generativelanguage.googleapis.com/v1beta/models/"
    f"{MODEL_ID}:generateContent?key=AIzaSyAtHIIhgWL3Xam5OHWV0WblQUMW2VgnUdM"
)

# ▶ STEP 2: Gemini API 호출 함수
def call_gemini_api(prompt: str, temperature: float = 0.5, max_tokens: int = 4096) -> str:
    payload = {
        "contents": [{"parts": [{"text": prompt}]}],
        "generationConfig": {
            "temperature": temperature,
            "maxOutputTokens": max_tokens
        }
    }
    body = json.dumps(payload, ensure_ascii=False).encode("utf-8")
    headers = {"Content-Type": "application/json; charset=utf-8"}
    resp = requests.post(ENDPOINT, headers=headers, data=body)
    resp.raise_for_status()
    return resp.json()["candidates"][0]["content"]["parts"][0]["text"]

# ▶ STEP 3: PDF 텍스트 추출 함수
def extract_text_from_pdf(pdf_path):
    reader = PdfReader(pdf_path)
    return "\n".join([page.extract_text() for page in reader.pages if page.extract_text()])

# ▶ STEP 4: 프롬프트 생성 함수
def generate_prompt(pdf_text, filename):
    return f"""
다음은 금융상품 약관 문서 '{filename}'의 전문 내용입니다.

--------------------------
{pdf_text}
--------------------------

이 문서 내용을 기반으로 다음 정보를 작성해 주세요:

1. 이 문서의 핵심 요약 (5줄 이내)
2. 이 금융상품의 주요 특징 3가지
3. 이 문서와 관련된 추천 금융상품 3가지
   - 추천 이유 포함
   - 해당 금융상품이 적합한 고객 유형 포함
"""

# ▶ STEP 5: 전체 PDF 처리
def process_all_pdfs(folder_path):
    for filename in os.listdir(folder_path):
        if filename.endswith(".pdf"):
            pdf_path = os.path.join(folder_path, filename)
            print(f"\n📄 [처리 중] {filename}")
            pdf_text = extract_text_from_pdf(pdf_path)
            prompt = generate_prompt(pdf_text, filename)
            try:
                response = call_gemini_api(prompt)
                print(f"\n🧠 [Gemini 응답 - {filename}]\n{response}\n{'='*70}")
            except Exception as e:
                print(f"❌ Gemini API 호출 실패: {e}")

# ▶ STEP 6: 실행 경로 설정 후 실행
if __name__ == "__main__":
    folder_path = r"C:\Users\USER\Desktop\금융상품"
    process_all_pdfs(folder_path)


FileNotFoundError: [WinError 3] 지정된 경로를 찾을 수 없습니다: 'C:\\Users\\USER\\Desktop\\금융상품'

## 저탄소 소비 특화 챗봇

In [44]:
import os
import json
import requests
from dotenv import load_dotenv

def load_api_key():
    load_dotenv()
    key = os.getenv("GEMINI_API_KEY")
    if not key:
        raise ValueError("GEMINI_API_KEY가 설정되지 않았습니다. .env 파일을 확인하세요.")
    return key

def generate_environmental_response(user_prompt: str) -> str:

    api_key = load_api_key()
    model_id = "gemini-2.5-flash"
    endpoint = f"https://generativelanguage.googleapis.com/v1beta/models/{model_id}:generateContent?key={api_key}"

    system_prompt = """당신은 저탄소 소비 특화 챗봇입니다. 사용자의 질문을 환경적 지속 가능성 관점에서 분석하고,
    실용적이고 구체적인 조언을 300자 이내로 제공해주세요.  """

    contents = [
        {
            "parts": [
                {"text": system_prompt},
                {"text": f"질문: {user_prompt}"}
            ]
        }
    ]

    payload = {
        "contents": contents,
        "generationConfig": {
            "temperature": 0.7,
            "candidateCount": 1,
            "maxOutputTokens": 2048,
            "topP": 0.8,
            "topK": 40
        },
        "safetySettings": [
            {
                "category": "HARM_CATEGORY_HARASSMENT",
                "threshold": "BLOCK_MEDIUM_AND_ABOVE"
            },
            {
                "category": "HARM_CATEGORY_HATE_SPEECH",
                "threshold": "BLOCK_MEDIUM_AND_ABOVE"
            }
        ]
    }

    headers = {"Content-Type": "application/json; charset=UTF-8"}

    try:
        response = requests.post(endpoint, headers=headers, json=payload, timeout=30)

        if response.status_code != 200:
            raise RuntimeError(f"API 실패: {response.status_code} - {response.text}")

        data = response.json()

        if "candidates" not in data or not data["candidates"]:
            raise ValueError("API 응답에 candidates가 없습니다.")

        candidate = data["candidates"][0]
        finish_reason = candidate.get("finishReason", "UNKNOWN")

        # 텍스트 추출
        result_text = ""

        # 1. 표준 구조: content.parts[].text
        if "content" in candidate and "parts" in candidate["content"]:
            parts = candidate["content"]["parts"]
            if isinstance(parts, list) and len(parts) > 0:
                for part in parts:
                    if isinstance(part, dict) and "text" in part:
                        result_text += part["text"]

        # 2. 직접 text 필드
        if not result_text and "text" in candidate:
            result_text = candidate["text"]

        # 3. content 직속 text 필드
        if not result_text and "content" in candidate and "text" in candidate["content"]:
            result_text = candidate["content"]["text"]

        # 4. 기타 가능한 필드들 확인
        if not result_text:
            possible_text_fields = ["output", "response", "answer", "message", "generated_text"]
            for field in possible_text_fields:
                if field in candidate:
                    result_text = str(candidate[field])
                    break

        return result_text.strip()

    except requests.exceptions.Timeout:
        return "API 요청 시간이 초과되었습니다. 다시 시도해주세요."
    except requests.exceptions.RequestException as e:
        return f"네트워크 오류가 발생했습니다: {str(e)}"
    except json.JSONDecodeError:
        return "API 응답을 파싱할 수 없습니다."
    except Exception as e:
        return f"처리 중 오류가 발생했습니다: {str(e)}"


def test_api_response_structure():
    try:
        test_prompt = "간단한 테스트 질문입니다."
        result = generate_environmental_response(test_prompt)
        return result
    except Exception as e:
        print(f"테스트 실패: {e}")
        return None


if __name__ == '__main__':
    test_result = test_api_response_structure()

    if test_result:
        # 사용자 프롬프트 입력
        user_prompt = "분리수거 하는 법 알려줘"
        answer = generate_environmental_response(user_prompt)
        print(answer)

분리수거는 자원 순환의 핵심입니다. 환경적 지속 가능성을 위해 다음 원칙을 지켜주세요:

1.  **비우고 헹구기:** 내용물을 깨끗이 비우고 물로 헹궈 오염을 제거합니다. (음식물 오염 시 재활용 불가)
2.  **재질별 분리:** 플라스틱, 종이, 유리, 캔 등 재질별로 정확히 나눕니다.
3.  **라벨/뚜껑 분리:** 비닐 라벨, 금속 뚜껑 등 다른 재질은 제거 후 따로 배출합니다.
4.  **압축:** 부피를 줄여 효율적인 운반 및 재활용을 돕습니다.

이 작은 노력이 지구의 부담을 크게 줄입니다.
