In [4]:
import pandas as pd
import numpy as np
import joblib
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
import psycopg2
from sqlalchemy import create_engine

In [5]:
# 상태를 숫자로 매핑 (실수형으로 변경)
status_mapping = {
    '새상품': 5.0,
    '사용감 없음': 4.0,
    '사용감 적음': 3.0,
    '사용감 많은': 2.0,
    '중고': 2.0,
    '고장/파손 상품': 1.0
}

# 훈련된 랜덤 포레스트 모델 로드 (state를 사용하여 훈련된 모델)
rf_model = joblib.load('Random_Forest_Model.pkl')

# SQLAlchemy 연결 생성
db_url = f"postgresql://{db_params['user']}:{db_params['password']}@{db_params['host']}:{db_params['port']}/{db_params['dbname']}"
engine = create_engine(db_url)


# 상태를 숫자로 매핑 (실수형으로 변경)
status_mapping = {
    '새상품': 5.0,
    '사용감 없음': 4.0,
    '사용감 적음': 3.0,
    '사용감 많은': 2.0,
    '중고': 2.0,
    '고장/파손 상품': 1.0
}


# 최근 추가된 특정 카테고리의 아이템 데이터를 가져오는 함수
def get_recent_items(category_no, limit=20):
    try:
        query = """
        SELECT * FROM item
        WHERE category_no = %s
        ORDER BY date DESC
        LIMIT %s
        """
        df = pd.read_sql_query(query, engine, params=(category_no, limit))
        # item_state를 float으로 변환하여 올바르게 필터링 가능하도록 준비
        df['item_state'] = df['item_state'].astype(float)
        return df
    except Exception as error:
        print(f"Error fetching recent items: {error}")
        return None

# 카테고리 가격 정보를 업데이트하는 함수
def update_category_price(category_no, status, min_price, max_price):
    connection = None
    try:
        connection = psycopg2.connect(**db_params)
        cursor = connection.cursor()

        # category_no와 status가 고유한 조합이 되도록 ON CONFLICT를 사용하여 업데이트 논리 추가
        update_query = """
        INSERT INTO category_price (category_no, max_price, min_price, status)
        VALUES (%s, %s, %s, %s)
        ON CONFLICT (category_no, status) 
        DO UPDATE SET max_price = EXCLUDED.max_price, min_price = EXCLUDED.min_price;
        """
        
        cursor.execute(update_query, (category_no, max_price, min_price, status))
        connection.commit()
        print(f"Category {category_no}, Status {status} price range updated successfully.")
    except Exception as error:
        print(f"Error updating category price: {error}")
    finally:
        if cursor:
            cursor.close()
        if connection:
            connection.close()

# 최근 추가된 아이템을 기반으로 상태별 가격 범위 예측 및 데이터베이스 업데이트
def predict_and_update_prices(category_no):
    # 최근 등록된 아이템 가져오기
    recent_items_df = get_recent_items(category_no)
    if recent_items_df is None or recent_items_df.empty:
        print("No recent items found for this category.")
        return

    # 데이터프레임에서 'state' 열을 'sale_state'로 변경 (판매 상태와 모델 피처를 구분하기 위해)
    recent_items_df.rename(columns={'state': 'sale_state'}, inplace=True)

    # 각 상태별로 가격 예측 수행
    for condition, condition_value in status_mapping.items():
        # 해당 상태에 맞는 데이터 필터링 (item_state를 float으로 변환한 후 비교)
        condition_items = recent_items_df[recent_items_df['item_state'] == condition_value]

        # 필터링된 데이터가 있는지 출력해서 확인하기
        print(f"Checking items for condition: {condition} (value: {condition_value})")
        print(f"Number of items found: {len(condition_items)}")
        
        if condition_items.empty:
            print(f"No items found for condition: {condition}")
            continue

        # 예측 시 모델이 훈련 시 사용한 피처 이름과 일치하도록 컬럼 이름 변경
        condition_items = condition_items.rename(columns={'item_state': 'state'})

        # 피처 선택 및 예측 수행 (상태 값을 예측에 사용할 피처로 사용)
        feature_columns = ['state']  # 'state'로 이름을 변경하여 사용
        features = condition_items[feature_columns]

        # 모델을 사용하여 가격 예측
        try:
            features = features.astype(float)  # feature가 float 타입인지 확인하고 변환
            predicted_prices = rf_model.predict(features)

            # 예측된 가격 범위 계산 (상하 20%로 설정)
            min_price = np.min(predicted_prices) * 0.8
            max_price = np.max(predicted_prices) * 1.2

            # `category_price` 테이블 업데이트
            update_category_price(category_no, condition_value, min_price, max_price)

        except ValueError as e:
            print(f"ValueError during prediction: {e}")
            continue

# 특정 카테고리에 대해 가격 예측 및 업데이트 실행
predict_and_update_prices(category_no=1)


Checking items for condition: 새상품 (value: 5.0)
Number of items found: 4
Category 1, Status 5.0 price range updated successfully.
Checking items for condition: 사용감 없음 (value: 4.0)
Number of items found: 8
Category 1, Status 4.0 price range updated successfully.
Checking items for condition: 사용감 적음 (value: 3.0)
Number of items found: 7
Category 1, Status 3.0 price range updated successfully.
Checking items for condition: 사용감 많은 (value: 2.0)
Number of items found: 1
Category 1, Status 2.0 price range updated successfully.
Checking items for condition: 중고 (value: 2.0)
Number of items found: 1
Category 1, Status 2.0 price range updated successfully.
Checking items for condition: 고장/파손 상품 (value: 1.0)
Number of items found: 0
No items found for condition: 고장/파손 상품
