
# Lab 1: 機器學習基礎與線性回歸實作

## 1. 環境設定

在開始之前，請確保已安裝以下工具：
1. Python 3.x：https://www.python.org/downloads/
2. Visual Studio Code (VS Code)：https://code.visualstudio.com/

### 安裝 Jupyter Notebook
使用 pip 安裝 Jupyter Notebook：


In [None]:
pip install jupyter


### 安裝必要的 Python 函式庫

In [None]:
pip install numpy matplotlib scikit-learn


---

## 2. 機器學習中的回歸分析

回歸（Regression）是一種監督式學習方法，主要用來預測數值變數。常見應用包括：
- 預測房價
- 預測銷售額
- 預測病情進展

### 載入 Diabetes 資料集

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn import datasets

# 載入 diabetes 資料集
X, y = datasets.load_diabetes(return_X_y=True)

# 顯示資料形狀與第一筆數據
print("X shape:", X.shape)
print("第一筆數據:", X[0])

X shape: (442, 10)
第一筆數據: [ 0.03807591  0.05068012  0.06169621  0.02187239 -0.0442235  -0.03482076
 -0.04340085 -0.00259226  0.01990749 -0.01764613]


我們選擇 BMI（第 3 個變數）作為特徵變數：

In [2]:
X = X[:, 2].reshape(-1, 1)


---

## 3. 建立線性回歸模型

### 分割訓練與測試數據

In [3]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)


### 訓練線性回歸模型

In [4]:
from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X_train, y_train)


### 進行預測

In [5]:
y_pred = model.predict(X_test)


### 可視化回歸結果

In [None]:
plt.scatter(X_test, y_test, color='black', label='Actual Data')
plt.plot(X_test, y_pred, color='blue', linewidth=3, label='Regression Line')
plt.xlabel('BMI')
plt.ylabel('Disease Progression')
plt.title('Diabetes Progression vs BMI')
plt.legend()
plt.show()


---

## 4. 挑戰題

嘗試不同的變數：使用其他變數（如 age 或 bp）進行回歸分析：

In [None]:
X = X[:, 0].reshape(-1, 1)


嘗試 Ridge 回歸：

In [None]:
from sklearn.linear_model import Ridge

ridge_model = Ridge(alpha=1.0)
ridge_model.fit(X_train, y_train)
y_ridge_pred = ridge_model.predict(X_test)

可視化 Ridge 回歸結果：

In [None]:
plt.scatter(X_test, y_test, color='black', label='Actual Data')
plt.plot(X_test, y_ridge_pred, color='green', linewidth=3, label='Ridge Regression Line')
plt.xlabel('BMI')
plt.ylabel('Disease Progression')
plt.title('Diabetes Progression with Ridge Regression')
plt.legend()
plt.show()


---

## 5. 練習

1. 使用不同的資料集進行回歸分析。
2. 比較線性回歸與 Ridge 回歸的效果。
3. 嘗試使用更多變數或特徵來提升模型準確性。

祝學習愉快！🚀
