# 机器学习基础概念 🎯

## 欢迎来到机器学习的世界！

想象一下，如果你有一个机器人朋友，它可以通过观察和学习变得越来越聪明，这就是机器学习的魅力所在！

在这个notebook中，我们将一起探索：
- 什么是机器学习？
- 机器学习能做什么？
- 我们如何教计算机学习？

准备好了吗？让我们开始吧！

## 1. 什么是机器学习？ 🤔

### 生活中的例子
想象你在学习骑自行车：
- 第一次可能会摔倒
- 通过不断练习，你学会了保持平衡
- 最后，你可以轻松地骑自行车

机器学习也是这样！计算机通过"练习"（处理大量数据）来学习完成特定任务。

### 小测验
1. 你觉得下面哪些是机器学习的例子？
   - [ ] 计算器做加减乘除
   - [x] 手机识别你的脸解锁
   - [x] 天气预报预测明天是否下雨
   - [ ] 电脑播放音乐

2. 为什么计算器不是机器学习？
   - 因为计算器只是按照固定规则计算，不会从经验中学习

3. 你能想到哪些机器学习的例子？
   - 比如：智能音箱、自动驾驶、推荐系统...

In [None]:
# 让我们先导入需要的工具
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 设置中文显示
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False

print("工具准备完毕！让我们开始吧！")

## 2. 我们的第一个机器学习例子 🎮

### 学习时间与成绩的关系
假设我们收集了一些同学的学习时间和考试成绩数据，让我们看看它们之间有什么关系。

In [None]:
# 创建数据集
study_hours = np.array([2, 3, 4, 5, 6, 7, 8, 9, 10])
scores = np.array([65, 70, 75, 80, 85, 90, 95, 100, 105])

# 绘制散点图
plt.figure(figsize=(10, 6))
plt.scatter(study_hours, scores, color='blue', s=100)
plt.title('学习时间与成绩的关系')
plt.xlabel('学习时间（小时）')
plt.ylabel('成绩')
plt.grid(True)

# 添加趋势线
z = np.polyfit(study_hours, scores, 1)
p = np.poly1d(z)
plt.plot(study_hours, p(study_hours), "r--", alpha=0.8)

plt.show()

### 观察与思考
1. 你发现了什么规律？
   - 学习时间越长，成绩越高
   - 这种关系看起来像一条直线

2. 动手做一做
   - 修改上面的数据，添加你自己的学习时间和成绩
   - 观察图表会如何变化

3. 你能想到其他类似的例子吗？
   - 比如：运动时间与体能的关系
   - 比如：练习时间与技能水平的关系

## 3. 算法效率：为什么这很重要？ ⚡

### 生活中的例子
想象你在图书馆找一本书：
- 方法1：从第一本书开始，一本一本地找（线性搜索）
- 方法2：先看中间，再决定往左还是往右找（二分搜索）

哪种方法更快？让我们来试试！

In [None]:
import time

def linear_search(numbers, target):
    '线性搜索: 一本一本地找'
    for i, num in enumerate(numbers):
        if num == target:
            return i
    return -1

def binary_search(numbers, target):
    '二分搜索: 先看中间，再决定往左还是往右'
    left, right = 0, len(numbers) - 1
    while left <= right:
        mid = (left + right) // 2
        if numbers[mid] == target:
            return mid
        elif numbers[mid] < target:
            left = mid + 1
        else:
            right = mid - 1
    return -1

# 创建一个有序的数字列表
numbers = list(range(1000000))
target = 999999

# 测试两种方法的速度
start_time = time.time()
linear_search(numbers, target)
linear_time = time.time() - start_time

start_time = time.time()
binary_search(numbers, target)
binary_time = time.time() - start_time

print(f'线性搜索用时: {linear_time:.4f}秒')
print(f'二分搜索用时: {binary_time:.4f}秒')

### 思考题
1. 为什么二分搜索比线性搜索快？
   - 因为二分搜索每次都能排除一半的可能性
   - 就像猜数字游戏，每次都能缩小一半的范围

2. 生活中的例子
   - 你能想到生活中其他类似的例子吗？
   - 比如：查字典、找电话号码...

3. 你能想到其他提高效率的方法吗？
   - 比如：分类整理、索引查找...

## 4. 趣味练习 🎯

### 练习1：预测成绩
如果小明学习了7.5小时，你觉得他的成绩会是多少？
- 观察上面的图表
- 在趋势线上找到对应的点
- 写下你的预测

In [None]:
# 计算预测成绩
hours = 7.5
predicted_score = p(hours)
print(f'如果学习{hours}小时，预测成绩为: {predicted_score:.1f}分')

### 练习2：生活中的机器学习
1. 观察你周围，找出3个机器学习的例子
2. 思考：这些例子是如何"学习"的？
3. 分享你的发现！

### 练习3：算法效率
1. 你能想到哪些提高效率的方法？
2. 这些方法在生活中有什么应用？
3. 分享你的想法！

## 5. 知识总结 📝

### 今天学到了什么？
1. 机器学习是让计算机从数据中学习
2. 通过观察数据，我们可以发现规律
3. 不同的算法有不同的效率

### 下节课预告
下次我们将学习如何用图表展示数据，让数据变得更有趣！

## 6. 趣味问答 🤔

1. 选择题
   - 机器学习最像下面哪个过程？
     a) 背乘法口诀表
     b) 学习骑自行车
     c) 使用计算器
     d) 看天气预报

2. 判断题
   - 机器学习就是让计算机记住所有答案（对/错）
   - 算法效率对机器学习很重要（对/错）

3. 开放题
   - 你能想到哪些可以用机器学习解决的问题？
   - 为什么机器学习现在这么受欢迎？
   - 你觉得机器学习会改变我们的生活吗？