# 图像识别 👀

## 欢迎来到图像识别的世界！

想象一下，如果你能让计算机学会"看"东西，是不是很神奇？这就是图像识别的魅力！

在这个notebook中，我们将一起探索：
- 什么是图像识别？
- 为什么要图像识别？
- 如何用Python实现简单的图像识别？

准备好了吗？让我们开始吧！

## 1. 什么是图像识别？ 🤔

### 生活中的例子
想象你在看照片：
- 认出照片里的人是谁
- 认出照片里的动物是什么
- 认出照片里的物体是什么

这就是图像识别！计算机也可以学会这种技能。

### 小测验
1. 下面哪些是图像识别的例子？
   - [x] 人脸识别
   - [x] 识别手写数字
   - [ ] 计算1+1=2
   - [x] 识别交通标志

2. 为什么需要图像识别？
   - 帮助我们识别图像
   - 让计算机学会"看"东西
   - 提高工作效率

3. 你能想到哪些图像识别的例子？
   - 比如：人脸识别、物体识别、文字识别...

In [None]:
# 导入必要的库
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import load_digits
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix
import seaborn as sns

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

print("工具准备完毕！让我们开始吧！")

## 2. 手写数字识别：从0到9 🔢

### 生活中的例子
- 识别邮政编码
- 识别验证码
- 识别手写笔记

让我们用Python实现一个简单的手写数字识别器！

In [None]:
# 加载手写数字数据集
digits = load_digits()
X = digits.data
y = digits.target

# 显示一些数字图像
plt.figure(figsize=(10, 4))
for i in range(10):
    plt.subplot(2, 5, i+1)
    plt.imshow(digits.images[i], cmap='gray')
    plt.title(f'数字: {digits.target[i]}')
    plt.axis('off')
plt.tight_layout()
plt.show()

# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 创建并训练KNN分类器
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# 预测
predictions = knn.predict(X_test)

# 计算准确率
accuracy = accuracy_score(y_test, predictions)
print(f'准确率: {accuracy:.2f}')

# 显示混淆矩阵
cm = confusion_matrix(y_test, predictions)
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.title('混淆矩阵')
plt.xlabel('预测标签')
plt.ylabel('真实标签')
plt.show()

### 动手做一做
1. 修改KNN的邻居数量，观察准确率如何变化
2. 尝试使用不同的分类算法
3. 观察混淆矩阵，看看哪些数字容易混淆

### 思考题
1. 为什么需要训练数据？
2. 你能想到其他可以用图像识别解决的问题吗？

## 3. 特征提取：让计算机"看"得更清楚 🔍

### 生活中的例子
- 找出图片中的边缘
- 找出图片中的颜色
- 找出图片中的纹理

让我们学习如何提取图像特征！

In [None]:
# 显示原始图像和边缘检测
from skimage import feature

# 选择一个数字图像
image = digits.images[0]

# 提取边缘特征
edges = feature.canny(image, sigma=2)

# 显示原始图像和边缘
plt.figure(figsize=(10, 4))
plt.subplot(1, 2, 1)
plt.imshow(image, cmap='gray')
plt.title('原始图像')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.imshow(edges, cmap='gray')
plt.title('边缘检测')
plt.axis('off')
plt.show()

# 提取颜色直方图
plt.figure(figsize=(10, 4))
plt.subplot(1, 2, 1)
plt.imshow(image, cmap='gray')
plt.title('原始图像')
plt.axis('off')

plt.subplot(1, 2, 2)
plt.hist(image.ravel(), bins=50)
plt.title('灰度直方图')
plt.show()

### 动手做一做
1. 修改边缘检测的参数，观察结果如何变化
2. 尝试提取其他特征（如：纹理、形状）
3. 观察不同特征对识别效果的影响

### 思考题
1. 为什么需要特征提取？
2. 你能想到其他提取特征的方法吗？

## 4. 模型评估：如何判断识别的好坏？ 📊

### 生活中的例子
- 人脸识别的准确率
- 物体识别的可靠性
- 文字识别的错误率

让我们评估一下我们的模型！

In [None]:
# 计算准确率
accuracy = accuracy_score(y_test, predictions)
print(f'准确率: {accuracy:.2f}')

# 显示混淆矩阵
cm = confusion_matrix(y_test, predictions)
plt.figure(figsize=(10, 8))
sns.heatmap(cm, annot=True, fmt='d', cmap='Blues')
plt.title('混淆矩阵')
plt.xlabel('预测标签')
plt.ylabel('真实标签')
plt.show()

# 显示一些预测结果
plt.figure(figsize=(10, 4))
for i in range(5):
    plt.subplot(1, 5, i+1)
    plt.imshow(X_test[i].reshape(8, 8), cmap='gray')
    plt.title(f'预测: {predictions[i]}
实际: {y_test[i]}')
    plt.axis('off')
plt.show()

### 动手做一做
1. 修改训练数据，观察模型性能如何变化
2. 尝试使用不同的评估指标
3. 比较不同模型的性能

### 思考题
1. 为什么需要评估模型？
2. 你能想到其他评估模型的方法吗？

## 5. 趣味练习 🎯

### 练习1：手写数字识别
1. 收集手写数字图像
2. 设计一个识别器
3. 测试识别效果

### 练习2：物体识别
1. 收集物体图像
2. 设计一个识别器
3. 识别不同的物体

### 练习3：人脸识别
1. 收集人脸图像
2. 设计一个识别器
3. 识别不同的人脸

## 6. 知识总结 📝

### 今天学到了什么？
1. 图像识别的基本概念
2. 不同的图像识别算法
3. 如何用Python实现图像识别

### 下节课预告
下次我们将学习如何用机器学习进行自然语言处理，让计算机学会理解文字！

## 7. 趣味问答 🤔

1. 选择题
   - 下面哪个不是图像识别的例子？
     a) 人脸识别
     b) 计算1+1=2
     c) 识别手写数字
     d) 识别交通标志

2. 判断题
   - 图像识别就是让计算机"看"东西（对/错）
   - 特征提取对图像识别很重要（对/错）

3. 开放题
   - 你能想到哪些有趣的图像识别问题？
   - 为什么图像识别很重要？
   - 你觉得图像识别会如何改变我们的生活？