# **第5回 – 回帰学習（2）**  
## **1. 予測はいつも当たるとは限らない！**

### **1.1 前回の復習：予測って何？**

前回は、「年齢」から「身長」を予測する例をやりました。

たとえば：
- 8歳なら → **だいたい125cmくらい**かな？
- 9歳なら → **130cmくらい？**

でも…

### **1.2 こんなことってあるよね？**

- 同じ年齢でも、**背が高い子・低い子**がいる
- 気温の予想も、**雨がふったり風が強かったり**して外れる

つまり、**予測はいつも当たるわけじゃない！**  
→ これが「**誤差（ごさ）**」です。

### **例：予測と本当の違い**

| 年齢 | 予測（cm） | 実際（cm） | 誤差（cm） |
|------|------------|------------|------------|
| 8歳  | 125        | 126        | +1         |
| 9歳  | 130        | 128        | -2         |

## **2. どうしたらもっと正確にできるの？**

### **2.1 方法①：もっとたくさんのデータを使う**

- たとえば、**10人の身長より、100人分のほうが平均がはっきりする**
- データが多いと、**いろんなパターンを知ることができる！**

### **2.2 方法②：ほかの情報も使う**

身長を予測したいとき、「年齢」だけじゃなくて…

- **性別（男の子・女の子）**
- **毎日の運動時間**
- **食べているもの**

など、**いろんな特徴（とくちょう）**を使えば、もっと正確に予測できるかもしれません！

> これは、機械学習でとても大切な考え方なんだよ！

## **3. Pythonで「予測と誤差」を見てみよう！**

```python
import numpy as np
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error

# 年齢と身長データ（例）
X = np.array([5, 6, 7, 8, 9, 10]).reshape(-1, 1)
y = np.array([110, 115, 120, 126, 128, 133])  # ちょっとバラバラ

# モデル作成
model = LinearRegression()
model.fit(X, y)

# 予測
y_pred = model.predict(X)

# 誤差（エラー）の計算
mse = mean_squared_error(y, y_pred)
print("平均二乗誤差（MSE）:", mse)
```

### このコードでわかること
- 実際の身長と、予測した身長にどれくらい**差**があるかがわかる
- **誤差（MSE）が小さいほど、予測がうまくいっている**！

## **4. アクティビティ：サイコロの目の平均を考える**

### ゲームのねらい
- データが**少ないとバラバラ**になりやすいことを体験
- **平均（へいきん）＝予測のヒント**になることを知る！

### やり方

1. **サイコロをふる**
　- 1人がサイコロを10回ふって、出た目を記録！

2. **平均を計算してみよう！**
　- たとえば、[4, 6, 3, 2, 5, 1, 4, 6, 2, 3] の平均は？

　→ (4+6+3+2+5+1+4+6+2+3) ÷ 10 = 3.6

3. **次に出る目を予想！**
　→ 「たぶん3～4くらいかな？」と予想してみよう！

4. **実際に1回ふってみる！**
　→ 予想が当たった？はずれた？なぜだと思う？

### ゲームのポイント！

- **回数が少ないと平均がずれやすい**
- でも**何百回もふれば、6のうちの平均「3.5」に近づく！**
- → これが、「**データが多いほど予測が当たりやすくなる**」ということ！

## **5. まとめ：予測は練習のくり返し！**

| 学び | 内容 |
|------|------|
| 予測は外れることもある | 人によってちがうし、変化もある |
| 正しくするには？ | データを増やしたり、特徴を増やす |
| 平均を考える力も大事 | データの「まんなか」が予測のヒントになる |
| 機械学習も、まちがえて学び直す | それでだんだんうまくなるよ！