In [3]:
#เทรนนิ่งโมเดล
import boto3
import pandas as pd
import s3fs
import sagemaker
from sagemaker import get_execution_role
from sagemaker.inputs import TrainingInput
from sagemaker.estimator import Estimator

# กำหนด role และ session
role = get_execution_role()
sess = sagemaker.Session()

# ใช้ path S3 ที่มีข้อมูล clean แล้วโดยตรง
train_data_path = 's3://stress-prediction-project/preprocessed_data_training_xgboost/preprocessed-data-training.csv'

# สร้าง estimator ของ XGBoost built-in algorithm
xgb_container = sagemaker.image_uris.retrieve("xgboost", sess.boto_region_name, version="1.5-1")

xgb = Estimator(
    image_uri=xgb_container,
    role=role,
    instance_count=1,
    instance_type='ml.m5.xlarge',
    output_path='s3://stress-prediction-project/processed-data-training-xgboost/',
    sagemaker_session=sess
)

# กำหนด hyperparameters
xgb.set_hyperparameters(
    objective='multi:softmax',
    num_class=5,  # ปรับเป็น 10 เพราะ label อยู่ในช่วง 0–9
    eval_metric='merror',
    num_round=100
)

# เริ่มเทรนโมเดล โดยชี้ไปที่ path ข้อมูล S3
xgb.fit({'train': TrainingInput(train_data_path, content_type='csv')})

2025-05-28 06:03:11 Starting - Starting the training job......

In [4]:
#สร้าง endpoint ไว้ deployed 

from sagemaker import Session
from sagemaker.model import Model
import sagemaker

sess = sagemaker.Session()
role = sagemaker.get_execution_role()

# ตำแหน่งไฟล์โมเดลใน S3
model_data = 's3://stress-prediction-project/processed-data-training-xgboost/sagemaker-xgboost-2025-05-28-05-59-59-167/output/model.tar.gz'

# ดึง container image ของ XGBoost version ที่ใช้ตอนเทรน (ปรับ version ให้ตรงกับของคุณ)
xgb_container = sagemaker.image_uris.retrieve('xgboost', sess.boto_region_name, version='1.5-1')

# สร้าง Model
xgb_model = Model(
    image_uri=xgb_container,
    model_data=model_data,
    role=role,
    sagemaker_session=sess
)

# ตั้งชื่อ endpoint ที่ต้องการ
endpoint_name = 'xgboost-endpoint'

# Deploy endpoint
predictor = xgb_model.deploy(
    initial_instance_count=1,
    instance_type='ml.m5.xlarge',
    endpoint_name=endpoint_name
)

print(f"Deployed endpoint: {endpoint_name}")

--------!Deployed endpoint: xgboost-endpoint
