# **第2回 – 分類学習（1）**  
## **1. 分類ってどういうこと？**

### **1.1 「分ける」って毎日やってる！**
みんなは毎日の生活の中で、いろんなものを**分けて**考えてるよね。

たとえば…

- ごはんのとき、お皿を「スプーン」「フォーク」「お皿」に分ける
- 動物園では「ライオン」「ゾウ」「サル」など、動物の種類に分ける
- 学校では「体育」「算数」「図工」みたいに授業の種類で分ける

これを、**コンピュータにもできるようにする**のが「分類（ぶんるい）」なんだ！

### **1.2 コンピュータにとっての分類**
コンピュータは、目や耳がないから、**数字やデータ**でしか物を見たり感じたりできません。

でも、写真や音を数字に変えてあげると、そこからルールを見つけて、「これは犬」「これは猫」と**分けられるようになる**んだよ！

## **2. コンピュータが「猫」と「犬」を見分けるには？**

### **2.1 特徴（とくちょう）を使う**
人間は「耳がとがってる」「ひげが長い」などの見た目で判断してるよね。

コンピュータも同じように、「特徴（とくちょう）」を見て考えます。

たとえば：

| 写真           | 耳の形 | しっぽの長さ | 動物 |
|----------------|--------|----------------|------|
| 犬の写真     | とがってる | 長い             | 犬   |
| 猫の写真     | 丸い      | 中くらい         | 猫   |

このような特徴をたくさん集めて、「この特徴があるなら、たぶん犬だな！」と考えるようになるのが分類学習です。

## **3. 機械学習の分類はこうやって進む！**

### **3.1 ステップ1：たくさんのデータを見る**
最初はコンピュータも何も知りません。だから、たくさんの「これは犬」「これは猫」と教えてあげます。

これは、「**学習（がくしゅう）データ**」といって、コンピュータにルールを覚えてもらう材料になります。

### **3.2 ステップ2：ルールを自分で見つける**
「犬はしっぽが長くて、耳がピンとしてるな…」  
「猫は耳が小さくて、顔がまるいな…」

こんなふうに、自分なりに**ルールを見つける**のが、機械学習のすごいところ！

### **3.3 ステップ3：新しいものを見て判断する**
「これはまだ見たことない写真だけど…耳がとがってて、しっぽが長いから…たぶん犬！」

こんなふうに、新しいデータにも自分で答えを出せるようになるよ！

## **4. 実際にやってみよう！〜アイリスの花の分類**

### **4.1 アイリスってどんな花？**
アイリスというのは、**アヤメ科の花**で、何種類かに分けられます。  
ここでは、次の3つに分けてみましょう。

1. Setosa（セトサ）
2. Versicolor（バージカラー）
3. Virginica（バージニカ）

それぞれ、**花びらの長さや幅**、**がくの大きさ**が違います。

### **4.2 データの中身を見てみよう**

| がくの長さ（cm） | がくの幅（cm） | 花びらの長さ（cm） | 花びらの幅（cm） | 花の種類 |
|------------------|------------------|----------------------|------------------|------------|
| 5.1              | 3.5              | 1.4                  | 0.2              | Setosa     |
| 7.0              | 3.2              | 4.7                  | 1.4              | Versicolor |
| 6.3              | 3.3              | 6.0                  | 2.5              | Virginica  |

このようなデータが**150個**あります！

### **4.3 Pythonで分類してみよう！**

```python
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier

# アイリスのデータを読み込む
iris = load_iris()
X = iris.data      # 特徴（花びらの長さなど）
y = iris.target    # 正解（花の種類）

# データを訓練（けんしゅう）用とテスト用に分ける
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

# モデルを作る（ここではK近傍法）
model = KNeighborsClassifier(n_neighbors=3)
model.fit(X_train, y_train)  # 学習！

# 新しいデータで予測してみよう！
pred = model.predict(X_test)

print("予測結果:", pred)
print("正解:", y_test)
```

### ポイント！
- `load_iris()` は、あらかじめ用意された花のデータを読み込む関数です。
- `KNeighborsClassifier` は「近くにあるデータを参考にして判断する」方法（k近傍法）です。
- `fit()` で学習し、`predict()` で新しいデータを分類します。

## **5. お菓子分けゲームで遊んでみよう！**

### **5.1 使うもの**
- 本物のお菓子（チョコ、ガム、キャンディ など）
- もしくはお菓子の写真カード

### **5.2 ステップ**
1. **特徴を考える**
   - 例：丸い、四角い、色が赤い、包み紙がある

2. **みんなで分類してみよう**
   - このお菓子はどのグループ？
   - 特徴に注目して、分類！

3. **答えあわせ**
   - どこで間違えたかな？どんな特徴を見ればよかった？

### ゲームのねらい
- 「分類」という考え方を楽しく体験する
- 「特徴を見つけること」が大切だとわかる

## **6. まとめ**

| ポイント | 説明 |
|----------|------|
| 分類って？ | 物をグループに分けること |
| 機械学習での分類 | 特徴（数字）を見て、グループを決める |
| アイリスの花の例 | 花の長さなどを使って、種類を当てる |
| 大切なこと | データをたくさん見せて、ルールを学ばせる |

## 次回予告
次回は、「分類（2）」として、**どうやって正しいか間違ってるかを判断するか**や、**間違ったときにどう学び直すか**を見ていきます！  
さらに、**ニューラルネット**についてもやさしく解説します！