Skip to content

Fish0403/AutoVisionLab

Repository files navigation

AutoVisionLab

用 AI 自动化计算机视觉模型优化流程,构建实验分析工作流。

中文 | English

React FastAPI PyTorch SQLite

工业视觉里的模型优化,很多时候仍然是偏手工的工作:调参数、跑实验、看结果、再改一轮。真正耗时的往往不是问题本身,而是重复试验、零散对比和来回切换工具。AutoVisionLab 关注的就是这一段重复流程。它把 AI 接入训练和实验闭环,让实验结果在完成后被自动收集、结构化,并进入统一的分析流程。

工程师仍然负责定义目标、约束和判断标准,AI 负责执行重复但必要的分析与迭代工作。系统会基于已有实验做比较、总结趋势,并给出下一步探索方向,让实验过程更容易追踪、比较和持续积累。

核心能力

  • Compare:用于多模型 baseline 对比,集中查看关键指标差异
  • Search:基于历史实验结果持续搜索更优配置,并追踪每一轮变化与当前最优路径
Compare 模式页 Search 模式页

示例结果

以本地 NEU 搜索 run(run_3bf12efc)为例,它从 base 出发,通过一系列显式 delta 推进到了更强的 best 配置。

相对 Base 的累计 delta

阶段 实验 Top-1 Acc 相对 Base 的提升 变更内容
Base exp_ec639557 0.9611 - adamwlr=0.003avg_poollinear,不使用 mixup/cutmix/random erasing
Best path 1 exp_50f10900 0.9694 +0.0083 切换为 focal_loss,并将 focal_gamma 设为 2.0
Best path 2 exp_782f439d 0.9722 +0.0111 learning_rate 降到 0.002
Best path 3 exp_d206fd8b 0.9750 +0.0139 将 neck 改为 gem_pool
Best path 4 exp_b56de8ec 0.9806 +0.0195 增加 dropout_linear head
当前最佳 exp_72c2a950 0.9861 +0.0250 label_smoothing 提升到 0.15

这条路径主要靠 focal loss、较低学习率、轻量结构改动和最后一次 label smoothing 提升拿到增益;后续的 mixup、cutmix、weight decay、focal gamma、batch size 和 image size 分支都没有超过当前 best。

搜索效果展示

快速开始

  1. 准备数据集。

    分类数据分成两层:

    • data/raw/<dataset_name>/ 存按类别名分文件夹的图片
    • data/classification/<dataset_name>/ 存由 raw/ 生成的切分清单

    训练器读取的切分文件通常包括 train.txtval.txt,以及可选的 test.txt

    以仓库自带的 NEU 数据集为例:

    1. 从东北大学官方页面下载 NEU-CLSNEU surface defect database

    2. 将解压后的 NEU-CLS 放到 data/raw/NEU-CLS/

    3. 使用 data/prepare_neucls_split.py 生成 train.txtval.txttest.txt

      python3 data/prepare_neucls_split.py --source-root data/raw/NEU-CLS --dataset-name NEU --val-ratio 0.2 --test-ratio 0.1 --seed 42 --force

    Demo Mode 可用于本地快速验证。开启后,如果数据集大于限制,会使用更小的确定性子集。

  2. 创建并激活 Python 虚拟环境。

    python3 -m venv .venv
    source .venv/bin/activate
    pip install --upgrade pip
  3. 安装后端依赖。

    pip install -r requirements.txt
  4. 安装前端依赖。

    cd frontend/web
    npm install
  5. 配置环境变量。

    cp .env.example .env

    在启动后端前填好 .env 中的 API key、模型和 base URL。

  6. 启动后端和前端。

    ./scripts/run_backend.sh
    ./scripts/run_frontend.sh

默认地址:

  • 后端:http://127.0.0.1:8000
  • 前端:http://127.0.0.1:5173

文档导航

许可

本项目采用 Apache License 2.0

[如果这个项目对你有帮助,欢迎给仓库点个 Star:] 在 GitHub 上 Star

About

AutoVisionLab automates the run–analyze–improve loop in computer vision model optimization, reducing repetitive work in tuning and experiment comparison.

Topics

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors