## 第一部分：机器学习基础 (1-3周) 详细讲义
### 1.1 机器学习概述

- 什么是机器学习？
    - **定义**:  机器学习 (Machine Learning, ML) 是一门**多领域交叉学科**，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。其主要研究**计算机模拟或实现人类的学习行为**，以获取新的知识或技能，**重新组织已有的知识结构**使之不断改善自身的性能。
    - **核心思想**:  **从数据中学习**，使计算机系统能够像人类一样，通过学习和经验积累来**改进性能**，而无需显式地进行编程。
    - **与传统编程的区别**:
        - **传统编程**:  程序员编写明确的指令，告诉计算机**如何**解决问题。
        - **机器学习**:  提供**数据**和**目标**，让计算机**学习**如何解决问题。

- 机器学习的应用场景
    - **图像识别**:  人脸识别、图像分类、物体检测。
    - **自然语言处理 (NLP)**:  机器翻译、文本分类、情感分析、聊天机器人。
    - **语音识别**:  语音助手、语音输入。
    - **推荐系统**:  电商推荐、视频推荐、音乐推荐。
    - **金融风控**:  信用评分、欺诈检测。
    - **医疗诊断**:  疾病预测、医学影像分析。
    - **自动驾驶**:  环境感知、路径规划、车辆控制。
    - **智能客服**:  自动回答用户问题。
    - **广告投放**:  精准广告推荐。
    - **搜索引擎**:  网页排序、信息检索。
    - ... 等等，几乎各行各业都有机器学习的应用。

- 机器学习的类型
    - **监督学习 (Supervised Learning)**:  从**已标记**的训练数据中学习，建立输入特征与输出目标之间的映射关系。
        - 目标变量是**离散型**时，称为**分类 (Classification)** 任务，目标变量是**连续型**时，称为**回归 (Regression)** 任务。
        - 例子：垃圾邮件检测（分类）、房价预测（回归）。
    - **无监督学习 (Unsupervised Learning)**:  从**未标记**的数据中学习，发现数据中的模式和结构。
        - 例子：聚类、降维、关联规则挖掘。
    - **强化学习 (Reinforcement Learning)**: 通过与环境的**交互**学习，目标是学习如何在特定环境中采取行动以最大化累积奖励。
        - 例子：游戏AI、机器人控制、资源管理。

- 机器学习的基本流程
    - **数据收集与准备**:
        - 收集相关数据，并进行清洗、整合、转换等预处理操作。
        - 数据质量直接影响模型性能。
    - **模型选择与训练**:
        - 根据任务类型选择合适的机器学习模型（算法）。
        - 使用训练数据训练模型，调整模型参数以优化性能。
    - **模型评估与优化**:
        - 使用测试数据评估模型性能，选择合适的评估指标。
        - 根据评估结果调整模型或算法，进行迭代优化。
    - **部署与应用**:
        - 将训练好的模型部署到实际应用场景中，进行预测或决策。
        - 监控模型性能，并进行维护和更新。

- Python 机器学习环境搭建
    - **开发工具选择**:
        - **Cursor**:  推荐使用 Cursor，它是一款专为 AI 协同编程设计的编辑器，内置强大的 AI 功能，可以极大地提高编程效率，特别是在机器学习和数据科学领域。
        - **VS Code + AI 插件**:  如果习惯使用 VS Code，可以通过安装 AI 插件，如 GitHub Copilot, Codeium 等，来获得 AI 辅助编程能力。
    - **VS Code 安装 Python 插件**:
        - 打开 VS Code，点击左侧边栏的扩展图标 (Extensions)。
        - 在搜索框中输入 "Python"，找到由 Microsoft 发布的 Python 扩展并安装。
        - 安装完成后，重启 VS Code。
    - **使用 VS Code 快捷键创建 `venv` 虚拟环境**:
        - 在 VS Code 中打开你的项目文件夹。
        - 使用快捷键 `Ctrl+Shift+P` (Windows/Linux) 或 `Cmd+Shift+P` (macOS) 打开命令面板。
        - 在命令面板中输入 "Python: Create Environment" 并选择。
        - 选择 "Venv" 作为环境类型。
        - 选择你的 Python 解释器版本（推荐选择最新版本）。
        - VS Code 将会在你的项目目录下创建 `.venv` 虚拟环境。
        - 激活虚拟环境后，VS Code 会自动使用该虚拟环境作为项目的工作环境。你可以在 VS Code 窗口右下角看到当前激活的 Python 环境。
    - **常用的 Python 相关 VS Code 插件**:
        - **Python**: (Microsoft) 提供了丰富的 Python 语言支持，包括代码补全、语法检查、调试等核心功能。（已默认安装）
        - **Pylance**: (Microsoft)  强大的语言服务器，提供更快速、更准确的代码分析和智能提示。
        - **flake8**:  代码风格检查工具，帮助你保持代码风格一致和规范。
        - **autopep8**:  代码格式化工具，可以自动将代码格式化为符合 PEP 8 规范。
        - **Jupyter**: (Microsoft)  支持在 VS Code 中直接编写和运行 Jupyter Notebook。
    - **常用的 AI 辅助编程 VS Code 插件**:
        - **GitHub Copilot**: (GitHub)  强大的 AI 代码补全和生成工具，可以根据上下文自动生成代码片段甚至整个函数。
        - **Codeium**: (Ex-Stanford AI Researchers)  类似于 Copilot 的 AI 代码补全工具，提供免费版本，也具有强大的代码生成能力。
        - **Tabnine**: (Tabnine)  另一款流行的 AI 代码补全工具，支持多种编程语言，可以提高编码效率。
    - **Jupyter Notebook / JupyterLab 使用**:  交互式编程环境，方便代码编写、运行和结果展示。JupyterLab 是 Jupyter Notebook 的升级版，功能更强大，推荐使用。
    - **常用库介绍**:
        - **NumPy**:  数值计算库，提供高性能的数组和矩阵运算。
        - **pandas**: 数据分析库，提供 DataFrame 数据结构，方便数据处理和分析。
        - **scikit-learn**:  机器学习库，包含了常用的机器学习算法、模型评估工具和数据集。
        - **matplotlib/seaborn**:  数据可视化库，用于绘制各种图表。

### 1.2 监督学习概述

- 监督学习的核心思想
    - **输入特征 (Features) 与 输出目标 (Target)**:
        - **特征 (Features)**: 描述样本的属性，模型的输入。也称为自变量、预测变量。
        - **目标 (Target)**:  模型需要预测的结果，监督学习的输出。也称为因变量、响应变量、标签 (Label)。

::: {.callout-note}
## 特征工程的重要性

**特征工程** 是指从原始数据中提取、选择和转换特征的过程。 良好的特征工程能够显著提升模型性能。 特征工程往往比选择模型算法更为重要。 它可以包括：

- **特征提取**: 从原始数据中创建新的特征。 例如，从日期中提取月份、星期几等。
- **特征选择**: 选择对模型训练最有用的特征，去除冗余或无关特征。
- **特征转换**: 对特征进行缩放、归一化、编码等处理，使其更适合模型训练。
:::

- **训练数据 (Training Data) 与 测试数据 (Testing Data)**:
    - **训练数据**: 用于训练模型的数据集，模型从中学习规律。
    - **测试数据**: 用于评估模型性能的数据集，模型在训练过程中未见过的数据。

::: {.callout-tip}
## 训练集、验证集和测试集

在模型开发过程中，通常会将数据集划分为三个部分：

- **训练集 (Training Set)**: 用于模型训练。 模型通过学习训练集中的数据来调整自身参数，以期在训练数据上表现良好。
- **验证集 (Validation Set)**: 用于模型调参和选择，在训练过程中监控模型性能。 验证集帮助我们选择合适的模型和超参数，防止模型在训练集上过拟合。
- **测试集 (Testing Set)**: 用于最终评估模型泛化能力，在模型开发完成后使用。 测试集模拟了模型在真实世界中遇到的新数据，其上的表现能够更客观地反映模型的实际性能。

**划分数据集的意义**:  合理划分数据集能够帮助我们更准确地评估模型的性能，并有效地进行模型选择和优化。 避免在训练集上表现良好，但在新数据上表现很差的 **过拟合** 现象。
:::

- 分类 (Classification) 与 回归 (Regression)
    - **分类：离散型输出**:  预测样本属于哪个类别。
        - 例子：垃圾邮件检测（是/否）、图像识别（猫/狗/鸟）。
    - **回归：连续型输出**: 预测一个连续的数值。
        - 例子：房价预测、股票价格预测、温度预测。

- 常用术语
    - **特征 (Feature)**:  输入变量。
    - **标签 (Label)**:  监督学习中的输出目标。
    - **样本 (Sample)**:  数据集中的一个数据点，包含特征和标签（监督学习）。
    - **模型 (Model)**:  机器学习算法学习到的函数或结构，用于进行预测或决策。
    - **算法 (Algorithm)**:  解决特定问题的步骤或方法，机器学习算法是实现机器学习模型的具体方法。

### 1.3 数据获取

- **常见公开数据集平台**:
    - **Kaggle**:  [https://www.kaggle.com/datasets](https://www.kaggle.com/datasets)  提供丰富的数据集，涵盖各种领域，如图像、文本、音频、表格数据等。
    - **UCI 机器学习库**:  [http://archive.ics.uci.edu/ml/datasets.php](http://archive.ics.uci.edu/ml/datasets.php)  经典的数据集资源库，包含各种分类、回归、聚类等任务的数据集。
    - **Google Dataset Search**:  [https://datasetsearch.research.google.com/](https://datasetsearch.research.google.com/)  Google 提供的搜索引擎，可以搜索互联网上的公开数据集。
    - **国内数据集平台**:  阿里云天池、DataFountain 等也提供一些中文数据集。

- **公开 API**:
    - **定义**:  应用程序编程接口 (API)，允许程序之间进行数据交换和功能调用。公开 API 指的是对外公开，可以免费或付费使用的 API。
    - **常见类型**:
        - **RESTful API**:  基于 HTTP 协议，使用 JSON 或 XML 格式传输数据，如天气 API、地理位置 API、新闻 API 等。

        ::: {.callout-note}
        ## RESTful API 详解

        **REST (Representational State Transfer)** 是一种软件架构风格，用于设计网络应用程序。 RESTful API  具有以下特点：

        - **无状态 (Stateless)**:  每次请求都包含所有必要的信息，服务器不保存客户端的状态。
        - **客户端-服务器 (Client-Server)**:  客户端和服务器职责分离，可以独立演化。
        - **统一接口 (Uniform Interface)**:  提供一致的资源访问方式，使用标准的 HTTP 方法 (GET, POST, PUT, DELETE) 进行操作。
        - **分层系统 (Layered System)**:  允许使用中间层 (如代理、缓存) 提高可扩展性和性能。

        **JSON (JavaScript Object Notation)** 是一种轻量级的数据交换格式，易于人阅读和编写，也易于机器解析和生成。 常用于 RESTful API 的数据传输。
        :::

        - **GraphQL API**:  更灵活的数据查询语言，可以按需获取数据，减少数据冗余。
    - **示例**:
        - **高德开放平台 API**:  [https://lbs.amap.com/](https://lbs.amap.com/)  提供天气、地理位置、路径规划等地图服务 API
        - **百度翻译 API**:  [https://fanyi-api.baidu.com/](https://fanyi-api.baidu.com/)  提供多语言翻译服务 API
        - **阿里云市场 API**:  [https://market.aliyun.com/](https://market.aliyun.com/)  提供多种商业数据 API 服务

- **Playwright 简单爬虫**:
    - **Playwright 简介**:  一个强大的自动化测试和爬虫库，支持多种浏览器，可以模拟用户在浏览器中的操作，抓取动态网页数据。
    - **简单爬虫示例 (Python)**:

In [3]:
from playwright.async_api import async_playwright
import asyncio
import nest_asyncio

# 在Jupyter中运行异步代码需要使用nest_asyncio
nest_asyncio.apply()

async def scrape_quotes():
    async with async_playwright() as p:
        browser = await p.chromium.launch()
        page = await browser.new_page()
        await page.goto("https://quotes.toscrape.com/")  # 示例网站

        quotes = await page.query_selector_all(".quote")
        for quote_element in quotes:
            text = await quote_element.query_selector(".text")
            author = await quote_element.query_selector(".author")
            text_content = await text.inner_text()
            author_content = await author.inner_text()
            print(f"Quote: {text_content}\nAuthor: {author_content}\n---")

        await browser.close()

# 在Jupyter中运行异步代码
asyncio.run(scrape_quotes())

Quote: “The world as we have created it is a process of our thinking. It cannot be changed without changing our thinking.”
Author: Albert Einstein
---
Quote: “It is our choices, Harry, that show what we truly are, far more than our abilities.”
Author: J.K. Rowling
---
Quote: “There are only two ways to live your life. One is as though nothing is a miracle. The other is as though everything is a miracle.”
Author: Albert Einstein
---
Quote: “The person, be it gentleman or lady, who has not pleasure in a good novel, must be intolerably stupid.”
Author: Jane Austen
---
Quote: “Imperfection is beauty, madness is genius and it's better to be absolutely ridiculous than absolutely boring.”
Author: Marilyn Monroe
---
Quote: “Try not to become a man of success. Rather become a man of value.”
Author: Albert Einstein
---
Quote: “It is better to be hated for what you are than to be loved for what you are not.”
Author: André Gide
---
Quote: “I have not failed. I've just found 10,000 ways that won't 

::: {.callout-caution}
## 爬虫注意事项

**Robots.txt 协议**:  网站通常会通过 `robots.txt` 文件声明哪些内容允许爬取，哪些内容禁止爬取。 爬虫程序应该首先检查目标网站的 `robots.txt` 文件，并遵守其规定。

**频率限制**:  为了防止服务器过载，网站可能会限制来自同一 IP 地址的请求频率。 爬虫程序需要合理控制爬取频率，避免对网站造成过大压力。

**用户代理 (User-Agent)**:  在 HTTP 请求头中设置 User-Agent 字段，表明爬虫的身份。 建议使用能够识别爬虫身份的 User-Agent，并注明联系方式，以便网站管理员在必要时联系你。

**法律法规和伦理**:  爬虫行为应遵守相关法律法规和伦理规范，不得用于非法用途，不得侵犯网站权益和用户隐私。 爬取个人信息等敏感数据时，务必谨慎，并遵守数据保护法规。
:::


### 1.4  数据初探与可视化

- 数据类型
    - **结构化数据 (Structured Data)**:  可以存储在关系型数据库中，以表格形式组织的数据。
        - 例子：表格数据、CSV 文件、SQL 数据库中的数据。
    - **非结构化数据 (Unstructured Data)**:  不方便用表格或关系型数据库表示的数据。
        - 例子：文本数据、图像数据、音频数据、视频数据。

::: {.callout-important}
## 半结构化数据

除了结构化数据和非结构化数据，还存在 **半结构化数据**。 半结构化数据介于两者之间，不完全符合关系型数据库的结构，但包含一些结构化的信息。

- **例子**:  JSON 数据、XML 数据、HTML 数据等。  这些数据通常使用标签或标记来组织信息，具有一定的结构，但不如结构化数据那样严格。  例如，JSON 数据使用键值对来组织数据，XML 和 HTML 使用标签来标记数据。

半结构化数据在 Web 数据、NoSQL 数据库等领域广泛应用。  处理半结构化数据时，可以使用相应的解析库 (如 JSON 解析库、XML 解析库) 来提取和处理其中的结构化信息。
:::


- 数据探索性分析 (EDA)
    - **描述性统计**:  计算数据的统计量，如均值、中位数、标准差、分位数等，了解数据的基本分布和特征。
    - **数据可视化**:  使用图表将数据可视化，更直观地发现数据中的模式、趋势和异常。
        - **常用图表**:
            - **直方图 (Histogram)**:  展示数值数据的分布。
            - **散点图 (Scatter Plot)**:  展示两个数值变量之间的关系。
            - **箱线图 (Box Plot)**:  展示数值数据的分布、中位数、四分位数和异常值。
            - **条形图 (Bar Chart)**:  展示类别数据的频数或占比。
            - **折线图 (Line Chart)**:  展示数据随时间变化的趋势。

- 案例：使用 pandas 读取数据，进行基本的数据查看和可视化
    - 使用 `pandas.read_csv()` 读取 CSV 文件。
    - 使用 `data.head()`, `data.info()`, `data.describe()` 查看数据基本信息。
    - 使用 `matplotlib` 或 `seaborn` 绘制直方图、散点图、箱线图等。

### 1.5 学生项目1：分类问题 - 问题选择与数据收集提示

在开始您的第一个机器学习项目（分类问题）之前，问题和数据的选择至关重要。一个好的开始是成功的一半。以下是一些提示，可以帮助您选择合适的问题并有效地收集数据。

- **问题选择提示**

::: {.callout-tip}
##  选择您感兴趣且具有实际意义的问题

选择一个您真正感兴趣，并且在现实世界中有一定应用价值的问题。 这样可以提高您的学习热情，并使项目成果更具意义。 避免选择过于抽象或过于理论化的问题。

- **例子**: 垃圾邮件检测、图像分类（例如，猫 vs. 狗）、客户流失预测、电影评论情感分析等。
:::

::: {.callout-tip}
##  问题难度适中，范围可控

作为初学者项目，选择难度适中，范围可控的问题非常重要。 避免一开始就挑战过于复杂或需要大量专业知识的问题。  将问题范围缩小到您可以处理的程度，例如，先从二分类问题开始，再逐步扩展到多分类问题。

- **初期建议**:  从二分类问题入手，例如，判断邮件是否为垃圾邮件（是/否），或者图片是猫还是狗。
- **避免**:  一开始就尝试解决复杂的多分类问题，例如，识别 100 种不同的物体，或者进行细粒度的图像分类。
:::

::: {.callout-tip}
##  考虑问题的可行性

在选择问题之前，考虑解决该问题的可行性。  您是否能够找到或收集到足够的数据？  您是否具备解决该问题所需的基本知识和技能？  确保您选择的问题在您现有的能力范围内是可行的。

- **数据可获取性**:  确保您可以找到或创建与您选择的问题相关的数据集。  公开数据集平台（如 Kaggle, UCI）是很好的起点。
- **技能匹配**:  选择与您当前技能水平相匹配的问题。  随着项目的进行，您可以逐步学习和提升技能。
:::

- **数据收集提示**

::: {.callout-tip}
##  利用公开数据集平台

优先考虑使用公开数据集平台，如 Kaggle, UCI 机器学习库, Google Dataset Search 等。 这些平台提供了大量高质量、标注好的数据集，可以节省您数据收集的时间和精力。  在 1.3 节 “数据获取” 中，我们已经介绍了一些常用的数据集平台，请回顾并善加利用。

- **优势**:  数据质量较高，通常已经过清洗和预处理，可以直接用于模型训练。
- **快速开始**:  使用公开数据集可以让您快速开始项目的数据分析和模型构建阶段。
:::

::: {.callout-tip}
##  考虑使用公开 API 获取数据

对于某些问题，您可以使用公开 API 来获取实时或动态数据。 例如，如果您想做一个与天气相关的问题，可以使用天气 API 获取最新的天气数据。  1.3 节 “数据获取” 中也介绍了一些常用的公开 API，例如高德地图 API, 百度翻译 API 等。

- **实时数据**:  API 可以提供最新的数据，适用于需要实时信息的项目。
- **数据多样性**:  API 可以提供各种类型的数据，例如文本、图像、地理位置信息等。
:::

::: {.callout-tip}
##  学习简单的网页爬虫技术 (谨慎使用)

如果公开数据集和 API 无法满足您的需求，您可以学习使用简单的网页爬虫技术来收集数据。  1.3 节 “Playwright 简单爬虫” 部分提供了一个简单的爬虫示例。  但请务必**谨慎使用爬虫技术**，遵守网站的 `robots.txt` 协议和相关法律法规，尊重网站条款，避免过度爬取。

- **作为补充**:  爬虫技术应作为数据收集的补充手段，仅在必要时使用。
- **伦理和法律**:  务必遵守爬虫伦理和法律规范，不得用于非法用途。
:::

::: {.callout-tip}
##  关注数据质量和数量

数据质量和数量直接影响模型性能。  在选择或收集数据时，关注数据的**完整性**、**准确性**、**一致性**和**相关性**。  同时，确保数据集具有足够的**规模**，以便模型能够充分学习数据中的模式。

- **数据清洗**:  收集到数据后，可能需要进行数据清洗和预处理，例如处理缺失值、异常值、重复值等。
- **数据增强**:  对于某些问题（例如图像分类），可以考虑使用数据增强技术来扩充数据集。
:::

- **更多参考选题与数据获取方式**

    为了帮助您更具体地选择项目，以下提供一些更详细的参考选题，以及可能的数据获取方式：

::: {.callout-example}
## 垃圾邮件检测

- **问题描述**:  构建一个模型，判断邮件是否为垃圾邮件。这是一个经典的二分类问题。
- **数据获取**:
    - **公开数据集**:  UCI Machine Learning Repository 提供了 [Spambase 数据集](https://archive.ics.uci.edu/ml/datasets/Spambase)，可以直接使用。 Kaggle 上也有一些垃圾邮件数据集。
    - **数据特点**:  通常是文本数据，需要进行文本预处理和特征提取（例如，词袋模型、TF-IDF）。
:::

::: {.callout-example}
## 图像分类：猫 vs. 狗

- **问题描述**:  构建一个图像分类器，区分图片是猫还是狗。 这是一个经典的二分类图像分类问题。
- **数据获取**:
    - **公开数据集**:  Kaggle 上的 [Dogs vs. Cats 数据集](https://www.kaggle.com/c/dogs-vs-cats) 是一个常用的数据集。 也可以使用 TensorFlow 或 PyTorch 等深度学习框架提供的内置数据集。
    - **数据特点**:  图像数据，需要进行图像预处理和特征提取（例如，使用卷积神经网络 CNN）。
:::

::: {.callout-example}
## 客户流失预测

- **问题描述**:  预测客户是否会流失（例如，电信客户流失、银行客户流失）。 这是一个商业领域常见的二分类问题。
- **数据获取**:
    - **公开数据集**:  Kaggle 上有许多客户流失预测数据集，例如 [Telco Customer Churn](https://www.kaggle.com/blastchar/telco-customer-churn)。
    - **数据特点**:  通常是表格数据，包含客户的人口统计信息、消费行为等特征。
:::

::: {.callout-example}
## 电影评论情感分析

- **问题描述**:  分析电影评论的情感倾向（正面/负面）。 这是一个自然语言处理领域的二分类问题。
- **数据获取**:
    - **公开数据集**:  常用的数据集包括 [IMDB 电影评论数据集](http://ai.stanford.edu/~amaas/data/sentiment/)，可以直接下载。 Kaggle 上也有相关数据集。
    - **数据特点**:  文本数据，需要进行文本预处理和特征提取（例如，词袋模型、TF-IDF、词向量）。
:::

::: {.callout-example}
##  手写数字识别 (MNIST)

- **问题描述**:  识别手写数字 (0-9)。 这是一个经典的多分类问题，也是深度学习入门的常用例子。
- **数据获取**:
    - **公开数据集**:  MNIST 数据集是非常经典的数据集，可以直接从 scikit-learn 或 TensorFlow/Keras 等库中加载。
    - **数据特点**:  图像数据，灰度图像，图像尺寸较小 (28x28)。
:::

::: {.callout-example}
##  糖尿病预测

- **问题描述**:  根据患者的临床特征（如年龄、BMI、血糖水平等），预测患者是否患有糖尿病。这是一个经典的二分类问题，适用于医疗健康领域。
- **数据获取**:
    - **公开数据集**:  Pima Indians Diabetes 数据集是一个广泛使用的糖尿病预测数据集，包含768个样本和8个特征。可以在 [UCI Machine Learning Repository](https://archive.ics.uci.edu/ml/datasets/Pima+Indians+Diabetes) 或 [Kaggle](https://www.kaggle.com/datasets/uciml/pima-indians-diabetes-database) 获取。
    - **数据特点**:  表格数据，包含数值型特征，需要进行数据清洗、特征选择和标准化处理。
:::

**数据获取方式总结**:

- **公开数据集平台**:  Kaggle, UCI Machine Learning Repository, Google Dataset Search 等是获取高质量数据集的主要来源。
- **Python 库内置数据集**:  scikit-learn, TensorFlow/Keras, PyTorch 等库提供了一些常用的内置数据集，方便快速开始项目。
- **学术数据集网站**:  一些大学或研究机构的网站也会公开一些数据集。
- **数据竞赛平台**:  Kaggle, DataFountain, 阿里云天池等平台上的竞赛通常会提供数据集。

希望这些更具体的例子和数据获取方式能够帮助学生们更好地选择他们的第一个分类问题项目。  记住，选择自己感兴趣且难度适中的问题，并找到合适的数据集，是项目成功的关键步骤。 祝大家项目顺利！