In [9]:
import pandas as pd
import os
from dotenv import load_dotenv
from sqlalchemy import create_engine



# 1. 전처리된 CSV 파일 읽기
df = pd.read_csv('../data/cleaned/cleaned_data.csv') 

# sql 테이블 컬럼명 모두 소문자라 동일하게 형식 맞춤
df.columns = df.columns.str.lower().str.strip()

# 2. PostgreSQL 연결 정보 설정
# 형식: 'postgresql://유저명:비밀번호@호스트:포트/데이터베이스명'
# DB_USER = 'postgres'  # PostgreSQL 사용자명
# DB_PASSWORD = 'your_password'  # 비밀번호 입력 필요
# DB_HOST = 'localhost'  # 로컬이면 localhost
# DB_PORT = '5432'  # 기본 포트
# DB_NAME = 'ecommerce'

# .env 파일 로드
load_dotenv()

# 환경변수에서 읽기
DB_USER = os.getenv('DB_USER')
DB_PASSWORD = os.getenv('DB_PASSWORD')
DB_HOST = os.getenv('DB_HOST')
DB_PORT = os.getenv('DB_PORT')
DB_NAME = os.getenv('DB_NAME')

# 3. 연결 엔진 생성
engine = create_engine(f'postgresql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}')
print(engine)

# 4. 데이터 적재
df.to_sql(
    name='cleaned_data',  # 테이블 이름
    con=engine,
    if_exists='append',  # 'replace': 테이블 덮어쓰기, 'append': 데이터 추가
    index=False,  # 인덱스 컬럼 제외
    method='multi',  # 빠른 삽입
    chunksize=1000  # 1000개씩 나눠서 삽입 (메모리 효율)
)

print(" 데이터 적재 완료")

Engine(postgresql://postgres:***@localhost:5432/ecommerce)
