# 03a: Introduction to Machine Learning

## วัตถุประสงค์การเรียนรู้
- เข้าใจความแตกต่างระหว่าง Descriptive และ Predictive Analytics
- ทำความเข้าใจประเภทของ Machine Learning
- เรียนรู้ขั้นตอนการทำงานของ Machine Learning

---

## 1. Descriptive vs Predictive Analytics

### Descriptive Analytics
- **คำถาม**: "เกิดอะไรขึ้นในอดีต?"
- **วัตถุประสงค์**: อธิบายและสรุปข้อมูลในอดีต
- **เครื่องมือ**: สถิติพื้นฐาน, กราฟ, Dashboard

### Predictive Analytics
- **คำถาม**: "จะเกิดอะไรขึ้นในอนาคต?"
- **วัตถุประสงค์**: ทำนายเหตุการณ์ในอนาคต
- **เครื่องมือ**: Machine Learning, Statistical Modeling

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# สร้างข้อมูลตัวอย่างยอดขาย
np.random.seed(42)
dates = pd.date_range(start='2023-01-01', end='2024-12-31', freq='M')
trend = np.linspace(1000, 1500, len(dates))
seasonal = 200 * np.sin(2 * np.pi * np.arange(len(dates)) / 12)
noise = np.random.normal(0, 50, len(dates))
sales = trend + seasonal + noise

sales_data = pd.DataFrame({'date': dates, 'sales': sales})
print("ข้อมูลยอดขาย:")
print(sales_data.head())

## 2. ประเภทของ Machine Learning

### Supervised Learning
- มีข้อมูลเป้าหมาย (Target/Label)
- **Classification**: ทำนายหมวดหมู่
- **Regression**: ทำนายค่าต่อเนื่อง

### Unsupervised Learning
- ไม่มีข้อมูลเป้าหมาย
- หาแพทเทิร์นในข้อมูล
- ตัวอย่าง: Clustering

### Reinforcement Learning
- เรียนรู้ผ่านการลองผิดลองถูก
- ได้รับ Reward/Penalty

In [None]:
from sklearn.datasets import make_classification, make_regression, make_blobs

# สร้างข้อมูลตัวอย่าง
X_class, y_class = make_classification(n_samples=200, n_features=2, 
                                      n_redundant=0, random_state=42)
X_reg, y_reg = make_regression(n_samples=200, n_features=1, 
                              noise=10, random_state=42)
X_cluster, _ = make_blobs(n_samples=200, centers=3, 
                         n_features=2, random_state=42)

# แสดงผล
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

axes[0].scatter(X_class[:, 0], X_class[:, 1], c=y_class, cmap='viridis')
axes[0].set_title('Classification')

axes[1].scatter(X_reg, y_reg, alpha=0.7)
axes[1].set_title('Regression')

axes[2].scatter(X_cluster[:, 0], X_cluster[:, 1], alpha=0.7)
axes[2].set_title('Clustering')

plt.tight_layout()
plt.show()

## 3. Machine Learning Workflow

1. **Problem Definition** - กำหนดปัญหา
2. **Data Collection** - รวบรวมข้อมูล
3. **Data Preprocessing** - เตรียมข้อมูล
4. **Feature Engineering** - สร้าง Features
5. **Model Selection** - เลือกอัลกอริทึม
6. **Model Training** - ฝึกแบบจำลอง
7. **Model Evaluation** - ประเมินประสิทธิภาพ
8. **Model Deployment** - นำไปใช้งาน

In [None]:
# ตัวอย่าง ML Workflow
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# 1. Problem: ทำนายยอดขาย
# 2. Data: ใช้ข้อมูลที่สร้างไว้
# 3. Preprocessing: แปลงวันที่เป็นตัวเลข
sales_data['date_numeric'] = (sales_data['date'] - sales_data['date'].min()).dt.days

# 4. Features
X = sales_data[['date_numeric']]
y = sales_data['sales']

# 5-6. Model Selection & Training
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
model = LinearRegression()
model.fit(X_train, y_train)

# 7. Evaluation
y_pred = model.predict(X_test)
print(f"R² Score: {r2_score(y_test, y_pred):.3f}")

# Visualization
plt.figure(figsize=(10, 4))
plt.scatter(X_test, y_test, alpha=0.7, label='Actual')
plt.scatter(X_test, y_pred, alpha=0.7, label='Predicted')
plt.legend()
plt.title('Sales Prediction')
plt.show()

## สรุป

- **Descriptive Analytics**: วิเคราะห์อดีต
- **Predictive Analytics**: ทำนายอนาคต
- **ML Types**: Supervised, Unsupervised, Reinforcement
- **Workflow**: จากปัญหาถึงการใช้งาน

### Next: Classification Algorithms