In [None]:
import os
from sqlalchemy import create_engine

# ถ้าคุณรันใน Notebook บนเครื่องตัวเอง ต้องใช้ localhost เสมอ!
DB_URL = "postgresql://admin:admin123@localhost:5432/credit_score_db"

engine = create_engine(DB_URL)

try:
    with engine.connect() as conn:
        print("✅ เชื่อมต่อสำเร็จผ่าน localhost!")
except Exception as e:
    print(f"❌ ยังเชื่อมต่อไม่ได้: {e}")
    
    
    

✅ เชื่อมต่อสำเร็จผ่าน localhost!


In [9]:
import sys
import os
from sqlalchemy import create_engine, inspect

# 1. บังคับให้ Python มองเห็นโฟลเดอร์ app
sys.path.append(os.path.abspath('..'))

# 2. สร้าง Engine (ตรวจสอบ User/Pass/DB Name ให้ตรงกับ .env อีกครั้ง)
# ใช้ localhost สำหรับ Notebook
DB_URL = "postgresql://admin:admin123@localhost:5432/credit_score_db"
engine = create_engine(DB_URL)

# 3. Import Model และสั่งสร้างตาราง
try:
    from app.models import Base
    Base.metadata.create_all(bind=engine)
    
    # 4. ตรวจสอบทันทีว่าตารางมาหรือยัง
    inspector = inspect(engine)
    tables = inspector.get_table_names()
    print(f"Tables in Database: {tables}")
    
    if 'customers' in tables:
        print("✅ SUCCESS: ตาราง 'customers' ถูกสร้างเรียบร้อยแล้ว!")
    else:
        print("❌ ERROR: คำสั่งรันผ่านแต่ไม่พบตาราง ลองตรวจสอบ models.py")
except Exception as e:
    print(f"❌ เกิดข้อผิดพลาด: {e}")

Tables in Database: ['customers', 'financial_records', 'credit_score_logs']
✅ SUCCESS: ตาราง 'customers' ถูกสร้างเรียบร้อยแล้ว!


In [10]:
import pandas as pd

# 1. อ่านข้อมูลจาก CSV
df = pd.read_csv('/Users/hilmanyusoh/Desktop/Credit-Scoring-System/data/ibank_dataset.csv')

# 2. จัดการข้อมูลให้ตรงกับ Type ใน Database (Boolean)
# แปลง Y/N เป็น True/False
df['owns_car'] = df['owns_car'].map({'Y': True, 'N': False})
df['owns_house'] = df['owns_house'].map({'Y': True, 'N': False})

# 3. เตรียมข้อมูลสำหรับตาราง 'customers'
# เลือกเฉพาะคอลัมน์ที่มีใน models.py ของตาราง Customer
customers_data = df[[
    'member_id', 'first_name', 'age', 'gender', 
    'province', 'owns_car', 'owns_house'
]].copy()

# 4. ส่งข้อมูลเข้าตาราง 'customers'
try:
    customers_data.to_sql('customers', engine, if_exists='append', index=False)
    print(f"✅ สำเร็จ! นำเข้าข้อมูลลูกค้า {len(customers_data)} รายเรียบร้อย")
except Exception as e:
    print(f"❌ เกิดข้อผิดพลาดในการนำเข้าข้อมูล: {e}")

# 5. ตรวจสอบข้อมูลใน DBeaver
# ลองรันคำสั่ง: SELECT * FROM customers LIMIT 10;


❌ เกิดข้อผิดพลาดในการนำเข้าข้อมูล: Execution failed on sql 'INSERT INTO customers (member_id, first_name, age, gender, province, owns_car, owns_house) VALUES (:member_id, :first_name, :age, :gender, :province, :owns_car, :owns_house)': (psycopg2.errors.UniqueViolation) duplicate key value violates unique constraint "ix_customers_member_id"
DETAIL:  Key (member_id)=(ID2026000) already exists.

[SQL: INSERT INTO customers (member_id, first_name, age, gender, province, owns_car, owns_house) VALUES (%(member_id__0)s, %(first_name__0)s, %(age__0)s, %(gender__0)s, %(province__0)s, %(owns_car__0)s, %(owns_house__0)s), (%(member_id__1)s, %(first_name__ ... 65476 characters truncated ... me__499)s, %(age__499)s, %(gender__499)s, %(province__499)s, %(owns_car__499)s, %(owns_house__499)s)]
[parameters: {'age__0': 54, 'owns_house__0': False, 'member_id__0': 'ID2026000', 'gender__0': 'ชาย', 'first_name__0': 'Member_1', 'province__0': 'กรุงเทพมหานคร', 'owns_car__0': True, 'age__1': 44, 'owns_house__

In [11]:
# 1. ดึงข้อมูล customer_id และ member_id จาก DB ออกมาเพื่อทำ Mapping
db_customers = pd.read_sql('SELECT customer_id, member_id FROM customers', engine)

# 2. นำข้อมูลจาก DataFrame หลัก (df) มา Merge กับ db_customers เพื่อเอา ID มาใส่
# เราจะใช้ member_id เป็นตัวเชื่อม (Key)
df_financial = df.merge(db_customers, on='member_id')

# 3. เลือกเฉพาะคอลัมน์ที่ต้องใส่ในตาราง financial_records
# (ตรวจสอบชื่อคอลัมน์ให้ตรงกับที่ตั้งไว้ใน models.py)
financial_to_db = df_financial[[
    'customer_id', 
    'net_monthly_income', 
    'yearly_debt_payments', 
    'credit_limit_used_pct', 
    'prev_defaults'
]].copy()

# 4. ส่งข้อมูลเข้าตาราง 'financial_records'
try:
    financial_to_db.to_sql('financial_records', engine, if_exists='append', index=False)
    print(f"✅ สำเร็จ! นำเข้าข้อมูลการเงิน {len(financial_to_db)} รายการเรียบร้อย")
except Exception as e:
    print(f"❌ เกิดข้อผิดพลาด: {e}")

✅ สำเร็จ! นำเข้าข้อมูลการเงิน 500 รายการเรียบร้อย


In [12]:
import pandas as pd
import joblib
import os
from xgboost import XGBClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import LabelEncoder, StandardScaler

# 1. ดึงข้อมูลจาก SQL (Join ครบทุกตาราง)
query = """
SELECT 
    c.age, c.owns_car, c.owns_house,
    f.net_monthly_income, f.yearly_debt_payments, f.prev_defaults,
    f.credit_limit_used_pct, f.account_tenure_months, f.occupation_type
FROM customers c
JOIN financial_records f ON c.customer_id = f.customer_id
"""
df_train = pd.read_sql(query, engine)

# 2. Feature Engineering
# สร้าง Target สำหรับเรียนรู้ (NPL = 1, ปกติ = 0) โดยใช้ prev_defaults เป็นตัวชี้วัดเบื้องต้น
df_train['is_risky'] = df_train['prev_defaults'].apply(lambda x: 1 if x > 0 else 0)
df_train['dti_ratio'] = df_train['yearly_debt_payments'] / df_train['net_monthly_income']

# ฟีเจอร์ที่จะใช้จริงในโมเดล
features = [
    'net_monthly_income', 'dti_ratio', 'credit_limit_used_pct', 
    'prev_defaults', 'account_tenure_months', 'occupation_type'
]

X = df_train[features].copy()
y = df_train['is_risky']

# 3. จัดการ Categorical Data (Encoding)
le_dict = {}
for col in X.select_dtypes(include='object').columns:
    le = LabelEncoder()
    X[col] = le.fit_transform(X[col].astype(str))
    le_dict[col] = le

# 4. Train Models
# XGBoost
xgb_model = XGBClassifier(n_estimators=100, learning_rate=0.1, max_depth=5, random_state=42)
xgb_model.fit(X, y)

# Logistic Regression (ต้อง Scale ข้อมูลก่อน)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)
log_model = LogisticRegression(max_iter=1000)
log_model.fit(X_scaled, y)

print("✅ Model Training Complete!")

DatabaseError: Execution failed on sql '
SELECT 
    c.age, c.owns_car, c.owns_house,
    f.net_monthly_income, f.yearly_debt_payments, f.prev_defaults,
    f.credit_limit_used_pct, f.account_tenure_months, f.occupation_type
FROM customers c
JOIN financial_records f ON c.customer_id = f.customer_id
': (psycopg2.errors.UndefinedColumn) column f.account_tenure_months does not exist
LINE 5:     f.credit_limit_used_pct, f.account_tenure_months, f.occu...
                                     ^

[SQL: 
SELECT 
    c.age, c.owns_car, c.owns_house,
    f.net_monthly_income, f.yearly_debt_payments, f.prev_defaults,
    f.credit_limit_used_pct, f.account_tenure_months, f.occupation_type
FROM customers c
JOIN financial_records f ON c.customer_id = f.customer_id
]
(Background on this error at: https://sqlalche.me/e/20/f405)