**项目基于conda，使用前需要先安装conda**  
    [点击这里下载conda](https://www.anaconda.com/download)  
    [conda使用教程](https://www.bilibili.com/video/BV1Mv411x775/)

# 一、环境准备  
  
安装完成并且确认**环境变量配置好**之后，在**CMD**依次执行以下命令
1. 创建虚拟环境  
    ```command
    conda create -n 环境名称
    ```
2. 切换至刚才创建的虚拟环境
    ```command
    activate 环境名称
    ```
3. 将CMD路径切换到项目根目录下执行一下命令，过程中需要确认输入Y
    ```command
    conda install --file requirements.txt
    ```


# 二、准备数据集配置  
**1. 首先确认datasets等依赖文件夹是否创建，没有则创建**  
**2. 确认config文件夹下是否有label_generator.yaml配置文件。**    

*执行下面的代码快速完成*

In [1]:
from os import path
from utils.project_path import ProjectPath
import os
import yaml

if not path.exists(ProjectPath.datasets_path): os.mkdir(ProjectPath.datasets_path)
if not path.exists(ProjectPath.yamls_path): os.mkdir(ProjectPath.yamls_path)
if not path.exists(ProjectPath.config_path): os.mkdir(ProjectPath.config_path)

label_generator_path = path.join(ProjectPath.config_path, 'label_generator.yaml')
if not path.exists(label_generator_path):
    default_config = { "selectors": ["v-popover-wrap", "channel-link"], "pages": ["https://www.bilibili.com/"] }
    with open(label_generator_path, 'w') as yf:
        yaml.dump(default_config, yf)
        yf.close()

**3. 规范填写label_generator.yaml文件。***（ <font style="color: gery">这个真没法帮，得自己去页面抓）</font>*   

**selectors:** 这下面放页面抓取的dom元素，不区分页面所有的元素一股脑全放这里即可，代码会自动检测是否存在  
**pages:** 这下面放需要捕获的链接  
- selectors下最好是放元素的class，并且要区分开。例如有两个按钮，一个常规按钮class为: <button class="cc-btn" style="border-radius: 4px;color: #FFFFFF;background: #00AEEC;border: 1px solid #00AEEC;">cc-btn</button>，一个弱提示按钮class为: <button class="cc-btn cc-btn-weak" style="border-radius: 4px;color: #61666D;background: #F6F7F8;border: 1px solid #F1F2F3;">cc-btn cc-btn-weak</button>。虽然两个都可以用cc-btn找到，但是cc-btn cc-btn-weak一定要写全。
- selectors支持直接从F12的DOM树中复制的class(即使带空格)，也支持直接写css选择器。
- 绝对相同的class写一次即可，像cc-btn、cc-btn cc-btn-weak这个场景，理论上来说写cc-btn-weak也能找到元素，但是**建议写全**。

**示例：**  
```yaml
selectors:
  - v-popover-wrap
  - channel-link
  - channel-items__right
  - center-search-container
  - bili-live-card is-rcmd
  - bili-video-card is-rcmd
  - video-info-container report-wrap-module report-scroll-module
  - up-info-container
  - up-info--left
  - up-info--right
  - default-btn old-charge-btn following-charge-btn
  - default-btn new-charge-btn charge-btn-loaded
  - default-btn follow-btn b-gz following
  - default-btn follow-btn b-gz not-follow
  - video-page-card-small
  - root-reply-container
  - sub-reply-container
pages:
  - https://www.bilibili.com/
  - https://www.bilibili.com/video/BV1LF411o7Gj
  - https://www.bilibili.com/video/BV1B4411w79q
  - https://www.bilibili.com/video/BV1884y1f7Cp
  - https://www.bilibili.com/video/BV1w44y1w7Z9
  - https://www.bilibili.com/video/BV1Hx4y1X7Y9
```


# 三、开始捕获数据集  

yaml文件写好之后可以执行以下命令开始制作数据集

In [1]:
from utils.label_generator import LabelGenerator
from utils.browser_launcher import BrowserLauncher

def on_before(launcher: BrowserLauncher):
    """
    开始之前的回调函数
    如果制作数据集之前需要执行什么逻辑可以写在这里，触发的时机是在初始化的页面加载完毕之后。例如需要登录可以写在这里。

    :param launcher: BrowserLauncher类实例化之后的对象，可以使用BrowserLauncher的api操作已打开的浏览器。BrowserLauncher基于Playwright库。
    """
    page = launcher.page
    browser = launcher.page

# 初始化页面的url，改成初始化页面（例如登录页面）
INDEX_URL= "https://www.bilibili.com/"
# 数据集文件夹的名称，执行完之后将在datasets下生成这个文件夹存放数据集文件
SOURCES_DIR_NAME = 'bilibili'

# 开始执行，会弹出一个Chrome浏览器，可以最小化也可以切换窗口，但不能关闭它，但不能关闭它，但不能关闭它
LabelGenerator(url=INDEX_URL, sources_dir_name=SOURCES_DIR_NAME, before_start=on_before)

# 报错的话把代码复制到main.py里面执行，如果使用Pycharm记得在绑定conda环境，如果使用CMD执行记得先进入conda虚拟环境在再执行

ModuleNotFoundError: No module named 'playwright'

参考下图：  
![image1](public\images\python_with_cli.png)

**执行完毕之后：**
- 会在`datasets \ 你填写的文件夹名称`下面生成两个文件夹：`images`、`labels`。  
- `yamls`文件夹下会生成`你填写的文件夹名称.yaml`文件    
- `images`下有两个文件夹`train`、`val`，以及大量的**图片**  
- `labels`下有两个文件夹`train`、`val`，以及大量的**txt文件**  
- `images`与`labels`下的**图片**与**txt**文件名都是一一对应，**不要随意更改文件名**，`images`一张图片对应`labels`一个txt文件  
- **把图片分成两份，把txt跟图片一样（文件名一样）分成两份**，一份多一份少，多的放进`train`文件夹用作**训练集**，少的放进`val`文件夹用作**验证集**  
  
不明白的可以[点击下载](https://objects.githubusercontent.com/github-production-release-asset-2e65be/264818686/0042e965-cf41-440c-a72d-e17c3dc898bb?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAIWNJYAX4CSVEH53A%2F20230819%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20230819T121355Z&X-Amz-Expires=300&X-Amz-Signature=561a18ef34dfdd9772971ba407b6befdfe4ddb2e60748a9e68f0281c76da243a&X-Amz-SignedHeaders=host&actor_id=0&key_id=0&repo_id=264818686&response-content-disposition=attachment%3B%20filename%3Dcoco8.zip&response-content-type=application%2Foctet-stream)这个COCO数据集，看看是怎么放的。  
*PS:下载文件源自GitHub，如果下载失败刷新几次或者使用魔法工具*

# 四、开始训练

在CMD依次执行以下命令  
1. 激活conda虚拟环境  
    ```command
    activate E:\auto_flow_ai
    ```
2. 进入项目根目录
3. 开始训练
    - **data=yamls/bilibili.yaml:** bilibili.yaml换成你的yamls文件夹下生成的yaml文件  
    - **model=yolov8m.yaml:** 需要训练的模型，8后面的`l`可选`n`,`s`,`m`,`l`,`x`。依次是从小到大，模型越大识别精度越高，对训练硬件要求也高。本人测试环境3060ti最高只能使用yolov8m.yaml。
    - **epochs=1000:** 需要训练的步数。`PS：训练时如果超过50步没有更好的模型出现会自动停止训练`
    ```command
    yolo detect train data=yamls/bilibili.yaml model=yolov8m.yaml epochs=1000
    ```
4. 训练完毕之后的模型文件保存在`runs\detect\train*\weights`下 * 可能是空或者数字，取决于训练的总次数。`best.pt`代表训练最好的模型，`last.pt`代表最后一次的模型。  
5. 如果要继续某一次的训练，可以把`model=`改成模型文件，例如`model=runs\detect\train9\weights\best.pt`。  
    ```command
    yolo detect train data=yamls/bilibili.yaml model=runs\detect\train9\weights\best.pt epochs=1000
    ```

6. 推理  
    - 使用CMD命令`model=runs\detect\train9\weights\best.pt`传入模型，`source='C:\Users\11523\Pictures\Screenshots'`传入图片路径，或者存放图片的文件夹路径。
        ```command
        yolo detect predict model=runs\detect\train9\weights\best.pt source='C:\Users\11523\Pictures\Screenshots'
        ```
    - 使用Python代码
        ```python
        from ultralytics import YOLO

        model = YOLO(r"runs\detect\train9\weights\best.pt")
        result = model(source=r'C:\Users\11523\Pictures\Screenshots', show=True)
        for index, item in enumerate(result):
            print(item.tojson())
        ```

### @引用
- **[Ultralytics YOLOv8](https://github.com/ultralytics/ultralytics)**
- **[Playwright](https://github.com/microsoft/playwright)**