# SD Scripts Kaggle
Created by [licyk](https://github.com/licyk)

Jupyter Notebook 仓库：[licyk/sd-webui-all-in-one](https://github.com/licyk/sd-webui-all-in-one)


## 简介
一个在 [Kaggle](https://www.kaggle.com) 部署 [sd-scripts](https://github.com/kohya-ss/sd-scripts) 的 Jupyter Notebook，可用于 Stable Diffusion 模型的训练。


## 不同运行单元的功能
该 Notebook 分为以下几个单元：

- [功能初始化](#功能初始化)
- [参数配置](#参数配置)
- [安装环境](#安装环境)
- [模型训练](#模型训练)
- [模型上传](#模型上传)

使用时请按顺序运行笔记单元。

通常情况下[功能初始化](#功能初始化)和[模型上传](#模型上传)单元的内容无需修改，其他单元包含不同功能的注释，可阅读注释获得帮助。

[参数配置](#参数配置)单元用于修改安装，训练，上传模型时的配置。

[安装](#安装)单元执行安装训练环境的命令和下载模型 / 训练集的命令，可根据需求进行修改。

[模型训练](#模型训练)执行训练模型的命令，需要根据自己的需求进行修改，该单元也提供一些训练参数的例子，可在例子的基础上进行修改。

如果需要快速取消注释，可以选中代码，按下`Ctrl + /`取消注释。


## 提示
1. 不同单元中包含注释, 可阅读注释获得帮助。
2. 训练代码的部分需要根据自己的需求进行更改。
3. 推荐使用 Kaggle 的 `Save Version` 的功能运行笔记，可让 Kaggle 笔记在无人值守下保持运行，直至所有单元运行完成。
4. 如果有 [HuggingFace](https://huggingface.co) 账号或者 [ModelScope](https://modelscope.cn) 账号，可通过填写 Token 和仓库名后实现自动上传训练好的模型，仓库需要手动创建。
5. 进入 Kaggle 笔记后，在 Kaggle 的右侧栏可以调整 kaggle 笔记的设置，也可以上传训练集等。注意，在 Kaggle 笔记的`Session options`->`ACCELERATOR`中，需要选择`GPU T4 x 2`，才能使用 GPU 进行模型训练。
6. 使用 Kaggle 进行模型训练时，训练集中最好没有 NSFW 内容，否则可能会导致 Kaggle 账号被封禁。
7. 不同单元的标题下方包含快捷跳转链接，可使用跳转链接翻阅 Notebook。
8. 该 Notebook 的使用方法可阅读：</br>[使用 HuggingFace / ModelScope 保存和下载文件 - licyk的小窝](https://licyk.netlify.app/2025/01/16/use-huggingface-or-modelscope-to-save-file/)</br>[使用 Kaggle 进行模型训练 - licyk的小窝](https://licyk.netlify.app/2025/01/16/use-kaggle-to-training-sd-model)


## 功能初始化
通常不需要修改该单元的内容  
1. [[下一个单元 →](#参数配置)]

In [None]:
# 初始化功能, 不需要修改
# 建议直接看下一个单元的内容
# 如果想要了解该 Notebook 功能的具体代码实现可阅读该部分的代码
################################################################
import time
from typing import Union, Optional
from pathlib import Path



def echo(*args) -> None:
    """格式化消息输出
    
    参数:
        *args:
            要输出的信息
    """
    t = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
    for i in args:
        print(f"[{t}]:: {i}")



class ARIA2:
    """基于 Aria2 的文件下载工具"""

    def __init__(self, workspace: Union[str, Path], workfolder: str) -> None:
        """基于 Aria2 的文件下载工具

        参数:
            workspace (`str`, `Path`):
                工作区路径

            workfolder (`str`):
                工作区的文件夹名称
        """
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    def aria2(self, url: str, path: Union[str, Path], filename: str, retry: Optional[int] = 3) -> Union[str, None]:
        """调用 Aria2 下载文件

        参数:
            url (`str`):
                文件的下载链接

            path (`str`, `Path`):
                将文件下载到本地的路径

            filename (`str`):
                将要下载的文件重命名

        返回值:
            `str`: 文件保存路径
        """
        import os
        count = 0
        file_path = os.path.join(path, filename)
        if not os.path.exists(file_path):
            echo(f"开始下载 {filename} ，路径: {file_path}")
            while count < retry:
                count += 1
                !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M "{url}" -d "{path}" -o "{filename}"
                if os.path.exists(file_path) and not os.path.exists(file_path + ".aria2"):
                    echo(f"{filename} 下载完成")
                    return file_path
                else:
                    echo(f"{filename} 下载中断")
                    if count < retry:
                        echo(f"重试下载 {filename} 中")
                    else:
                        return None
        else:
            if os.path.exists(file_path + ".aria2"):
                echo(f"开始下载 {filename} ，路径: {path}/{filename}")
                while count < retry:
                    count += 1
                    !aria2c --console-log-level=error -c -x 16 -s 16 -k 1M "{url}" -d "{path}" -o "{filename}"
                    if os.path.exists(file_path) and not os.path.exists(file_path + ".aria2"):
                        echo(f"{filename} 下载完成")
                        return file_path
                    else:
                        echo(f"{filename} 下载中断")
                        if count < retry:
                            echo(f"重试下载 {filename} 中")
                        else:
                            return None
            else:
                echo(f"{filename} 文件已存在，路径: {file_path}")
                return file_path



class GIT:
    """基于 Git 命令的模块"""

    def __init__(self, workspace: Union[str, Path], workfolder: str) -> None:
        """基于 Git 命令的模块

        参数:
            workspace (`str`, `Path`):
                工作区路径

            workfolder (`str`):
                工作区的文件夹名称
        """
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    def exists(self, addr: Optional[str]= None, path: Optional[Union[str, Path]]= None, name: Optional[str]= None) -> bool:
        """检测要克隆的项目是否存在于指定路径

        参数:
            addr (`str`, `None`):
                Git 仓库的地址

            path (`str`, `Path`, `None`):
                将 Git 仓库下载到本地的路径

            name (`str`, `None`):
                将 Git 仓库进行重命名

        返回值:
            `bool`: Git 仓库存在时则返回`True`, 否则返回`False`
        """
        import os
        if addr is not None:
            if path is None and name is None:
                path = os.path.join(os.getcwd(), addr.split("/").pop().split(".git", 1)[0])
            elif path is None and name is not None:
                path = os.path.join(os.getcwd(), name)
            elif path is not None and name is None:
                path = os.path.join(os.path.normpath(path), addr.split("/").pop().split(".git", 1)[0])
            elif path is not None and name is not None:
                path = os.path.join(os.path.normpath(path), name)

        if os.path.exists(path):
            return True
        else:
            return False


    def clone(self, addr: str, path: Optional[Union[str, Path]]= None, name: Optional[str]= None, retry: Optional[int] = 3) -> Union[str, None]:
        """克隆 Git 仓库到本地

        参数:
            addr (`str`):
                Git 仓库的地址

            path (`str`, `Path`, `None`):
                将 Git 仓库下载到本地的路径

            name (`str`, `None`):
                将 Git 仓库进行重命名

            retry (`int`):
                重试下载的次数, 默认为 3

        返回值:
            `str`: 下载的仓库地址
        """
        import os
        count = 0
        repo = addr.split("/").pop().split(".git", 1)[0]
        if path is None and name is None:
            path = os.getcwd()
            name = repo
        elif path is not None and name is None:
            name = repo
        elif path is None and name is not None:
            path = os.getcwd()

        repo_path = os.path.join(path, name)

        if not self.exists(addr, path, name):
            echo(f"开始下载 {repo}")
            while count < retry:
                count += 1
                !git clone {addr} "{repo_path}" --recurse-submodules
                if os.path.exists(repo_path):
                    echo(f"{repo} 下载成功, 路径: {repo_path}")
                    return repo_path
                else:
                    echo(f"{repo} 下载失败")
                    if count < retry:
                        echo(f"重试下载 {repo} 中")
                    else:
                        return None
        else:
            echo(f"{repo} 已存在, 路径: {repo_path}")
            echo(f"更新 {repo} 中")
            !git -C "{repo_path}" pull --recurse-submodules
            return repo_path


    def checkout(self, path: Union[str, Path], branch: str) -> None:
        """切换 Git 仓库到指定分支

        参数:
            path (`str`, `Path`):
                Git 仓库的路径

            branch (`str`):
                指定要切换 Git 仓库分支
        """
        import os
        if os.path.exists(os.path.join(path, ".git")) and branch:
            echo(f"切换 {os.path.basename(path)} 的分支至 {branch}")
            !git -C "{path}" checkout "{branch}" --recurse-submodules


    def reset(self, path: Union[str, Path], commit: str) -> None:
        """切换到指定的 Git 提交记录上

        参数:
            path (`str`, `Path`):
                Git 仓库的路径

            commmit (`str`):
                指定要切换 Git 仓库的提交哈希值
        """
        import os
        if os.path.exists(os.path.join(path, ".git")) and commit:
            echo(f"切换 {os.path.basename(path)} 的分支至 {commit}")
            !git -C "{path}" reset "{commit}" --hard --recurse-submodules



class ENV:
    """提供初始化环境的功能"""

    def __init__(self, workspace: Union[str, Path], workfolder: str) -> None:
        """提供初始化环境的功能

        参数:
            workspace (`str`, `Path`):
                工作区路径

            workfolder (`str`):
                工作区的文件夹名称
        """
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    def prepare_env_depend(self, use_uv: bool = False) -> None:
        """为 Notebook 的功能准备必须的环境依赖

        参数:
            use_uv (`bool`):
                是否使用 uv 代替 Pip 安装 Python 软件包
        """
        echo("安装自身组件依赖")
        !pip install uv -U
        pkg = "huggingface_hub modelscope"
        if use_uv:
            !uv pip install {pkg} -U || pip install {pkg} -U
        else:
            !pip install {pkg} -U
        !apt update
        !apt install aria2 google-perftools p7zip-full unzip tree -y


    def prepare_torch(self, torch_ver: Optional[str] = None, xformers_ver: Optional[str] = None, use_uv: bool = False) -> None:
        """安装 PyTorch 和 xFormers

        参数:
            torch_ver (`str`, `None`):
                PyTorch 软件包名称和版本信息, 如`torch==2.0.0 torchvision==0.15.1`

            xformers_ver (`str`, `None`):
                xFormers 软件包名称和版本信息, 如`xformers==0.0.18`

            use_uv (`bool`):
                使用 uv 代替 Pip 进行 Python 软件包安装
        """
        if use_uv:
            if torch_ver:
                echo("安装 PyTorch")
                !uv pip install {torch_ver} || pip install {torch_ver}
            else:
                echo("未指定 PyTorch 包名, 跳过安装")

            if xformers_ver:
                echo("安装 xFormers")
                !uv pip install {xformers_ver} --no-deps  || pip install {xformers_ver} --no-deps
            else:
                echo("未指定 xFormers 包名, 跳过安装")
        else:
            if torch_ver:
                echo("安装 PyTorch")
                !pip install {torch_ver}
            else:
                echo("未指定 PyTorch 包名, 跳过安装")

            if xformers_ver:
                echo("安装 xFormers")
                !pip install {xformers_ver} --no-deps
            else:
                echo("未指定 xFormers 包名, 跳过安装")


    def install_requirements(self, path: Union[str, Path], use_uv: bool = False) -> None:
        """从文件 (requirements.txt) 中安装 Python 软件包

        参数:
            path (`str`, `Path`):
                依赖记录文件的路径

            use_uv (`bool`):
                使用 uv 代替 Pip 进行 Python 软件包安装
        """
        import os
        if os.path.exists(path):
            echo("安装依赖")
            if use_uv:
                !uv pip install -r "{path}" || pip install -r "{path}"
            else:
                !pip install -r "{path}"
        else:
            echo("依赖文件路径为空")


    def py_pkg_manager(self, pkg: str, type: Optional[str] = None, use_uv: bool = False) -> None:
        """使用 Pip / uv 执行对 Python 软件包的操作

        参数:
            pkg (`str`):
                指定 Python 软件包名

            type (`str`, `None`):
                指定对 Python 软件包的操作

                可选的操作: (install / install_single / force_install / force_install_single / update / uninstall)

            use_uv (bool):
                使用 uv 代替 Pip 进行 Python 软件包安装

        type 支持的操作和对应的命令行参数如下:
            安装: install -> install

            仅安装: install_single -> install --no-deps

            强制重装: force_install -> install --force-reinstall

            仅强制重装: force_install_single -> install --force-reinstall --no-deps

            更新: update -> install --upgrade

            卸载: uninstall -> uninstall -y
        """

        if type == "install":
            func = "install"
            args = ""
        elif type == "install_single":
            func = "install"
            args = "--no-deps"
        elif type == "force_install":
            func = "install"
            args = "--force-reinstall"
        elif type == "force_install_single":
            func = "install"
            args = "install --force-reinstall --no-deps"
        elif type == "update":
            func = "install"
            args = "--upgrade"
        elif type == "uninstall":
            func = "uninstall"
            args = "-y"
        else:
            echo(f"未知操作: {type}")
            return

        if use_uv:
            echo(f"执行操作: uv pip {func} {pkg} {args}")
            !uv pip {func} {pkg} {args}
        else:
            echo(f"执行操作: pip {func} {pkg} {args}")
            !pip {func} {pkg} {args}


    def tcmalloc(self) -> None:
        """使用 TCMalloc 优化内存的占用, 通过 LD_PRELOAD 环境变量指定 TCMalloc"""
        echo("配置内存优化")
        import os
        os.environ["LD_PRELOAD"] = "/usr/lib/x86_64-linux-gnu/libtcmalloc_minimal.so.4"



class MANAGER:
    """环境管理"""

    def __init__(self, workspace: Union[str, Path], workfolder: Union[str, Path]) -> None:
        """环境管理

        参数:
            workspace (`str`, `Path`):
                工作区路径

            workfolder (`str`):
                工作区的文件夹名称
        """
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    def clear_up(self) -> None:
        """清理 Notebook 的内容输出"""
        from IPython.display import clear_output
        clear_output(wait=False)


    def check_gpu(self) -> None:
        """检查环境中是否有可用的 GPU"""
        echo("检测 GPU 是否可用")
        import tensorflow as tf
        echo(f"TensorFlow 版本: {tf.__version__}")
        if tf.test.gpu_device_name():
            echo("GPU 可用")
        else:
            echo("GPU 不可用")
            raise Exception("\n没有可用的 GPU, 请在 kaggle -> Notebook -> Session options -> ACCELERATOR 选择 GPU T4 x 2\n如果不能使用 GPU, 请检查 Kaggle 账号是否绑定了手机号或者尝试更换账号!")



class REPO_MANAGER:
    """基于 HuggingFace / ModelScope 的仓库管理工具"""
    def __init__(self) -> None:
        pass


    def get_all_file(self, directory: Union[str, Path]) -> list:
        """获取文件夹中所有文件的绝对路径

        参数:
            directory (`str`, `Path`):
                文件夹的路径

        返回值:
            `list`: 所有文件的绝对路径
        """
        import os
        file_list = []
        for dirname, _, filenames in os.walk(directory):
            for filename in filenames:
                file_list.append(os.path.join(dirname, filename))
        return file_list


    def is_file_exists_in_ms_repo(self, upload_file: Union[str, Path], work_path: Union[str, Path], repo_id: str) -> bool:
        """检测指定文件是否存在于 ModelScope 仓库中

        参数:
            upload_file (`str`, `Path`):
                文件在仓库中对应的路径

            work_path (`str`, `Path`):
                仓库在本地的父路径

            repo_id (`str`):
                ModelScope 仓库的 ID

        返回值:
            `bool`: 当文件存在时返回`True`, 否则为`False`
        """
        import os

        repo_file = os.path.join(work_path, repo_id.split("/").pop(), upload_file)
        if os.path.exists(repo_file):
            return True
        else:
            return False


    def clone_modelscope_without_lfs(self, ms_access_token: str, repo_id: str, repo_type: str, work_path: Union[str, Path]) -> None:
        """将 ModelScope 仓库下载到本地中, 并且不包含 Git LFS 文件

        参数:
            ms_access_token (`str`):
                ModelScope 账号的 Git Token

            repo_id (`str`):
                ModelScope 仓库 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 创空间仓库

            work_path (`str`, `Path`):
                将仓库下载到本地的路径
        """
        import os

        # 禁用 Git LFS
        os.environ["GIT_LFS_SKIP_SMUDGE"] = "1"
        !git lfs uninstall

        # 本地存在仓库时进行删除
        repo_name = repo_id.split("/").pop()
        path = os.path.join(work_path, repo_name)
        if os.path.exists(path):
            !rm -rf "{path}"

        # 下载仓库并启用 Git LFS
        if repo_type == "model":
            repo_url = f"https://oauth2:{ms_access_token}@www.modelscope.cn/{repo_id}.git"
        elif repo_type == "dataset":
            repo_url = f"https://oauth2:{ms_access_token}@www.modelscope.cn/datasets/{repo_id}.git"
        elif repo_type == "space":
            repo_url = f"https://oauth2:{ms_access_token}@www.modelscope.cn/studios/{repo_id}.git"

        !git clone "{repo_url}" "{path}"

        # 启用 Git LFS
        os.environ["GIT_LFS_SKIP_SMUDGE"] = "0"
        !git -C "{path}" lfs install


    def push_file_to_modelscope_legacy(
        self,
        ms_access_token: str,
        repo_id: str,
        repo_type: str,
        visibility: bool,
        work_path: Union[str, Path],
        upload_path: Union[str, Path]
    ) -> None:
        """将指定路径中的文件上传到 ModelScope 中, 基于 Git 实现

        参数:
            ms_access_token (`str`):
                ModelScope 账号的 Token

            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 创空间仓库

            work_path (`str`, `Path`):
                将仓库下载到本地的路径

            upload_path (`str`, `Path`):
                要上传文件到 ModelScope 仓库的路径
        """
        import os
        import string
        import random
        from modelscope.hub.api import HubApi
        api = HubApi()

        echo("验证 ModelScope Token 中")
        try:
            ms_access_token = api.login(ms_access_token)[0] # 将 ModelScope Token 转为 ModelScope Git Token
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败, 无法上传文件", e)
            return

        repo_name = repo_id.split("/").pop() # 仓库名称
        tmp_random_name = ''.join(random.choice(string.ascii_letters + string.digits) for _ in range(8)) # 随机名称
        tmp_work_path = os.path.join(work_path, f"__ms_repo_{repo_name}_{tmp_random_name}__") # 临时的工作路径
        repo_local_path = os.path.join(tmp_work_path, repo_name) # 仓库对应的本地绝对路径
        upload_file_lists = self.get_all_file(upload_path) # 原文件的绝对路径列表
        # 统计信息
        count = 0
        sum = len(upload_file_lists)

        # 检查 ModelScope 仓库
        if not self.check_ms_repo(
            repo_id=repo_id,
            repo_type=repo_type,
            visibility=visibility,
            token=ms_access_token
        ):
            echo(f"{repo_id} (类型: {repo_type}) 不存在, 无法上传文件")
            return

        echo(f"将文件上传至 ModelScope: {upload_path} -> {repo_local_path}")
        echo(f"使用的 ModelScope 仓库: {repo_id}, 类型: {repo_type}")

        for upload_file in upload_file_lists:
            count += 1
            rel_upload_file = os.path.relpath(upload_file, upload_path) # 原文件相对路径
            upload_file_name = os.path.basename(upload_file)
            # Git 仓库的配置信息
            if repo_type == "model":
                git_repo_config = f"lfs.https://oauth2:{ms_access_token}@www.modelscope.cn/{repo_id}.git/info/lfs.locksverify"
            elif repo_type == "dataset":
                git_repo_config = f"lfs.https://oauth2:{ms_access_token}@www.modelscope.cn/datasets/{repo_id}.git/info/lfs.locksverify"
            elif repo_type == "space":
                git_repo_config = f"lfs.https://oauth2:{ms_access_token}@www.modelscope.cn/studios/{repo_id}.git/info/lfs.locksverify"

            # 下载仓库到本地
            echo(f"[{count}/{sum}] 克隆仓库到 {tmp_work_path}")
            self.clone_modelscope_without_lfs(
                ms_access_token=ms_access_token,
                repo_id=repo_id,
                repo_type=repo_type,
                work_path=tmp_work_path
            )

            echo(f"[{count}/{sum}] 要上传的文件的相对路径: {rel_upload_file}")
            echo(f"[{count}/{sum}] 要上传的文件的绝对路径: {upload_file}")
            echo(f"[{count}/{sum}] 仓库本地绝对路径: {repo_local_path}")

            # 检测文件是否存在于仓库中
            if self.is_file_exists_in_ms_repo(
                upload_file=rel_upload_file,
                work_path=tmp_work_path,
                repo_id=repo_id
            ):
                !rm -rf "{repo_local_path}"
                echo(f"[{count}/{sum}] {upload_file_name} 已存在于仓库中")
                continue

            # 为仓库创建文件对应的父文件夹
            p_path = os.path.dirname(os.path.join(tmp_work_path, repo_name, rel_upload_file)) # 原文件到仓库中后对应的父文件夹
            if not os.path.exists(p_path):
                echo(f"[{count}/{sum}] 为 {upload_file_name} 创建对应的父文件夹: {p_path}")
                os.makedirs(p_path, exist_ok=True)

            # 复制文件到仓库中
            echo(f"[{count}/{sum}] {upload_file} -> {repo_local_path}/{rel_upload_file}")
            !cp -f "{upload_file}" "{p_path}"

            # 对文件进行追踪
            file_name = os.path.basename(rel_upload_file) # 文件名
            echo(f"[{count}/{sum}] 添加文件： {rel_upload_file}")
            !git -C "{repo_local_path}" add "{rel_upload_file}"

            # 创建提交信息
            echo(f"[{count}/{sum}] 提交信息: \"Upload {file_name}\"")
            !git -C "{repo_local_path}" commit -m "Upload {file_name}"
            !git -C "{repo_local_path}" config "{git_repo_config}" true

            # 推送文件到 ModelScope
            echo(f"[{count}/{sum}] 上传 {file_name} 到 {repo_id} 中")
            !git -C "{repo_local_path}" push

            # 清理仓库文件
            !rm -rf "{repo_local_path}"
            echo(f"[{count}/{sum}] 上传 {file_name} 完成")

        # 清理临时工作路径
        !rm -rf "{tmp_work_path}"
        echo(f"{repo_id} 仓库上传完成")


    def check_ms_repo(self, repo_id: str, repo_type: str, visibility: bool, token: str) -> bool:
        """检查 ModelScope 仓库是否存在并创建

        参数:
            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库类型 (model / dataset/ space)

            visibility (`bool`):
                在创建 ModelScope 仓库时设置仓库的可见性, `True`则设置仓库为公开仓库, `False`则设置仓库为私有仓库

            token (`str`):
                ModelScope 账号 Token

        返回值:
            `bool`: 当仓库存在时 / 仓库不存在但尝试创建成功返回`True`, 否则返回`False`
        """
        from modelscope.hub.api import (
            HubApi,
            ModelVisibility,
            DatasetVisibility,
            REPO_TYPE_MODEL,
            REPO_TYPE_DATASET,
            DEFAULT_DATASET_REVISION,
        )
        api = HubApi()
        repo_exists = False
        repo_type_init = None
        repo_visibility = None

        # 检查仓库是否存在
        echo(f"检查 {repo_id} 仓库是否存在, 类型: {repo_type}")
        if repo_type == "model":
            try:
                api.get_model(repo_id)
                repo_exists = True
            except:
                repo_type_init = REPO_TYPE_MODEL
                # repo_visibility = ModelVisibility.PUBLIC if visibility else ModelVisibility.PRIVATE
                repo_visibility = "public" if visibility else "private"
        elif repo_type == "dataset":
            try:
                api.get_dataset_infos(
                    dataset_hub_id=repo_id,
                    revision=DEFAULT_DATASET_REVISION
                )
                # dataset_namespace = repo_id.split("/")[0]
                # api.get_dataset_id_and_type(
                #     dataset_name=repo_id,
                #     namespace=dataset_namespace
                # )
                repo_exists = True
            except:
                repo_type_init = REPO_TYPE_DATASET
                # repo_visibility = DatasetVisibility.PUBLIC if visibility else DatasetVisibility.PRIVATE
                repo_visibility = "public" if visibility else "private"
        elif repo_type == "space":
            # TODO: 支持 ModelScope 创空间
            repo_exists = True
            repo_type_init = "studio"
            repo_visibility = 5

        # 创建仓库
        if not repo_exists:
            echo(f"{repo_id} 不存在, 尝试创建中, 类型: {repo_type}, 可见性: {'公开' if visibility else '私有'}")
            try:
                api.create_repo(
                    repo_id=repo_id,
                    repo_type=repo_type_init,
                    visibility=repo_visibility,
                    token=token
                )
                echo(f"{repo_id} 创建成功")
                return True
            except Exception as e:
                echo(f"{repo_id} 创建失败", e)
                return False
        else:
            echo(f"{repo_id} 已存在, 类型: {repo_type}")
            return True


    def push_file_to_modelscope(
        self,
        ms_access_token: str,
        repo_id: str,
        repo_type: str,
        visibility: bool,
        upload_path: Union[str, Path]
    ) -> None:
        """上传文件到 ModelScope 中

        参数:
            ms_access_token (`str`):
                ModelScope 账号 Token

            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            upload_path (`str`, `Path`):
                要上传到 ModelScope 仓库的文件本地路径
        """
        import os
        from pathlib import Path
        from modelscope.hub.api import HubApi
        api = HubApi()

        echo("验证 ModelScope Token 中")
        try:
            api.login(ms_access_token) # 将 ModelScope Token 转为 ModelScope Git Token
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败, 无法上传文件", e)
            return

        upload_file_lists = self.get_all_file(upload_path) # 原文件的路径列表
        
        # 统计信息
        count = 0
        sum = len(upload_file_lists)

        # 检查 ModelScope 仓库
        if not self.check_ms_repo(
            repo_id=repo_id,
            repo_type=repo_type,
            visibility=visibility,
            token=ms_access_token
        ):
            echo(f"{repo_id} (类型: {repo_type}) 不存在, 无法上传文件")
            return

        echo(f"将文件上传至 ModelScope: {upload_path} -> {repo_id}")
        echo(f"使用的 ModelScope 仓库: {repo_id}, 类型: {repo_type}")

        ms_repo_file_list = self.get_ms_repo_file_list(ms_access_token, repo_id, repo_type) # 获取仓库中的文件列表

        for upload_file in upload_file_lists:
            count += 1
            rel_upload_file = os.path.relpath(upload_file, upload_path) # 原文件相对路径
            file_name = os.path.basename(upload_file) # 文件名
            hf_path_in_repo = Path(rel_upload_file).as_posix() # 文件在仓库中的路径
            local_file_obj = Path(upload_file).as_posix() # 文件在本地的绝对路径

            echo(f"[{count}/{sum}] 要上传的文件的相对路径: {rel_upload_file}")
            echo(f"[{count}/{sum}] 绝对路径: {upload_file}")

            if rel_upload_file in ms_repo_file_list:
                echo(f"[{count}/{sum}] {file_name} 已存在于仓库中")
                continue

            # 上传文件到 ModelScope
            echo(f"[{count}/{sum}] {local_file_obj} -> {repo_id}/{hf_path_in_repo}")
            echo(f"[{count}/{sum}] 上传 {file_name} 到 {repo_id} 中")
            try:
                api.upload_file(
                    repo_id=repo_id,
                    repo_type=repo_type,
                    path_in_repo=hf_path_in_repo,
                    path_or_fileobj=local_file_obj,
                    commit_message=f"Upload {file_name}",
                    token=ms_access_token
                )
                echo(f"[{count}/{sum}] 上传 {file_name} 完成")
            except Exception as e:
                echo(f"[{count}/{sum}] 上传 {file_name} 失败", e)

        echo(f"{repo_id} 仓库上传完成")


    def get_hf_repo_file_list(self, hf_access_token: str, repo_id: str, repo_type: str) -> list:
        """从 HuggingFace 获取仓库中所有文件路径

        参数:
            hf_access_token (`str`):
                HuggingFace 账号 Token

            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

        返回值:
            `list`: 所有文件在 HuggingFace 仓库中的路径
        """
        from huggingface_hub import HfApi
        api = HfApi()
        try:
            model_list = api.list_repo_files(
                repo_id=repo_id,
                repo_type=repo_type,
                token=hf_access_token
            )
        except:
            model_list = []

        return model_list


    def get_ms_repo_file_list(self, ms_access_token: str, repo_id: str, repo_type: str) -> list:
        """从 ModelScope 获取仓库中所有文件路径

        参数:
            ms_access_token (`str`):
                ModelScope 账号 Token

            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

        返回值:
            `list`: 所有文件在 ModelScope 仓库中的路径
        """
        from modelscope.hub.api import HubApi, DEFAULT_DATASET_REVISION
        from modelscope.hub.snapshot_download import fetch_repo_files
        api = HubApi()
        file_list = []


        def _get_file_path(repo_files: list) -> list:
            """获取 ModelScope Api 返回的仓库列表中的模型路径"""
            file_list = []
            for file in repo_files:
                    if file['Type'] != 'tree':
                        file_list.append(file["Path"])
            return file_list


        try:
            api.login(ms_access_token)
        except Exception as e:
            echo("ModelScope Token 验证失败, 无法获取文件列表", e)
            return file_list

        if repo_type == "model":
            try:
                repo_files = api.get_model_files(
                    model_id=repo_id,
                    recursive=True
                )
                file_list = _get_file_path(repo_files)
            except Exception as e:
                echo(f"获取 {repo_id} (类型: {repo_type}) 仓库的文件列表出现错误", e)
        elif repo_type == "dataset":
            user = repo_id.split("/")[0]
            name = repo_id.split("/")[1]
            try:
                repo_files = fetch_repo_files(
                    _api=api,
                    group_or_owner=user,
                    name=name,
                    revision=DEFAULT_DATASET_REVISION
                )
                file_list = _get_file_path(repo_files)
            except Exception as e:
                echo(f"获取 {repo_id} (类型: {repo_type}) 仓库的文件列表出现错误", e)
        elif repo_type == "space":
            # TODO: 支持创空间
            echo(f"{repo_id} 仓库类型为创空间, 不支持获取文件列表")
        else:
            echo(f"未知的 {repo_type} 仓库类型")

        return file_list


    def check_hf_repo(self, repo_id: str, repo_type: str, visibility: bool, token: str) -> bool:
        """检查 HuggingFace 仓库是否存在并创建

        参数:
            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库类型 (model / dataset/ space)

            visibility (`bool`):
                在创建 HuggingFace 仓库时设置仓库的可见性, `True`则设置仓库为公开仓库, `False`则设置仓库为私有仓库

            token (`str`):
                HuggingFace 账号 Token

        返回值:
            `bool`: 当仓库存在时 / 仓库不存在但尝试创建成功返回`True`, 否则返回`False`
        """
        from huggingface_hub import repo_exists, create_repo

        # 检查仓库是否存在
        echo(f"检查 {repo_id} 仓库是否存在, 类型: {repo_type}")
        if repo_exists(
            repo_id=repo_id,
            repo_type=repo_type,
            token=token
        ):
            echo(f"{repo_id} 已存在, 类型: {repo_type}")
            return True
        else:
            echo(f"{repo_id} 不存在, 尝试创建中, 类型: {repo_type}, 可见性: {'公开' if visibility else '私有'}")
            try:
                create_repo(
                    repo_id=repo_id,
                    repo_type=repo_type,
                    private=False if visibility else True,
                    token=token
                )
                echo(f"{repo_id} 创建成功")
                return True
            except Exception as e:
                echo(f"{repo_id} 创建失败", e)
                return False


    def push_file_to_huggingface(
        self,
        hf_access_token: str,
        repo_id: str,
        repo_type: str,
        visibility: bool,
        upload_path: Union[str, Path]
    ) -> None:
        """上传文件到 HuggingFace 中

        参数:
            hf_access_token (`str`):
                HuggingFace 账号 Token

            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            upload_path (`str`, `Path`):
                要上传到 HuggingFace 仓库的文件本地路径
        """
        import os
        from pathlib import Path
        from huggingface_hub import HfApi, CommitOperationAdd
        api = HfApi()

        try:
            api.whoami(token=hf_access_token)
            echo("HuggingFace Token 验证成功")
        except Exception as e:
            echo("HuggingFace Token 验证失败, 无法上传文件", e)

        upload_file_lists = self.get_all_file(upload_path) # 原文件的路径列表

        # 统计信息
        count = 0
        sum = len(upload_file_lists)

        # 检查 HuggingFace 仓库
        if not self.check_hf_repo(
            repo_id=repo_id,
            repo_type=repo_type,
            visibility=visibility,
            token=hf_access_token
        ):
            echo(f"{repo_id} (类型: {repo_type}) 不存在, 无法上传文件")
            return

        hf_repo_file_list = self.get_hf_repo_file_list(hf_access_token, repo_id, repo_type) # 获取仓库中的文件列表

        echo(f"将文件上传至 HuggingFace: {upload_path} -> {repo_id}")
        echo(f"使用的 HuggingFace 仓库: {repo_id}, 种类: {repo_type}")

        for upload_file in upload_file_lists:
            count += 1
            rel_upload_file = os.path.relpath(upload_file, upload_path) # 原文件相对路径
            file_name = os.path.basename(upload_file) # 文件名
            hf_path_in_repo = Path(rel_upload_file).as_posix() # 文件在仓库中的路径
            local_file_obj = Path(upload_file).as_posix() # 文件在本地的绝对路径

            echo(f"[{count}/{sum}] 要上传的文件的相对路径: {rel_upload_file}")
            echo(f"[{count}/{sum}] 绝对路径: {upload_file}")

            # 检测文件是否存在于仓库中
            if rel_upload_file in hf_repo_file_list:
                echo(f"[{count}/{sum}] {file_name} 已存在于仓库中")
                continue

            # 对文件进行追踪
            echo(f"[{count}/{sum}] {local_file_obj} -> {repo_id}/{hf_path_in_repo}")
            operations = [
                CommitOperationAdd(
                    path_in_repo=hf_path_in_repo,
                    path_or_fileobj=local_file_obj
                )
            ]

            # 上传文件到 HuggingFace
            echo(f"[{count}/{sum}] 上传 {file_name} 到 {repo_id} 中")
            try:
                api.create_commit(
                    repo_id=repo_id,
                    operations=operations,
                    commit_message=f"Upload {file_name}",
                    repo_type=repo_type,
                    token=hf_access_token
                )
                echo(f"[{count}/{sum}] 上传 {file_name} 完成")
            except Exception as e:
                echo(f"[{count}/{sum}] 上传 {file_name} 失败", e)

        echo(f"{repo_id} 仓库上传完成")


    def set_git_config(self, email: str, username: str) -> None:
        """配置 Git 信息

        参数:
            email (`str`):
                邮箱地址

            username (`str`):
                用户名
        """
        echo("配置 Git 信息中")
        !git config --global user.email "{email}"
        !git config --global user.name "{username}"



class HF_DATASET():
    "HuggingFace 数据集处理"
    def __init__(self):
        pass


    def get_hf_file_list(self, repo_id: str, repo_type: str, hf_token: str) -> list:
        """从 HuggingFace 仓库中获取所有文件的路径

        参数:
            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            hf_token (`str`):
                HuggingFace 账号 Token

        返回值:
            `list`: 所有文件在 HuggingFace 仓库中的路径
        """
        from huggingface_hub import HfApi
        echo(f"获取 {repo_id} (类型: {repo_type}) 中所有的文件列表中")
        api = HfApi()
        try:
            model_list = api.list_repo_files(
                repo_id=repo_id,
                repo_type=repo_type,
                token=hf_token
            )
            echo(f"{repo_id} 中所有文件的数量: {len(model_list)}")
        except Exception as e:
            echo(f"获取 {repo_id} 中所有文件的数量时出现了错误", e)
            model_list = []

        return model_list


    def download_hf_file(self, repo_id: str, repo_type: str, filename: str, local_dir: Union[str, Path], hf_token: str, retry: Optional[int] = 3) -> None:
        """从 HuggingFace 仓库下载文件到本地路径

        参数:
            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            filename (`str`):
                文件在 HuggingFace 仓库中的路径

            local_dir (`str`, `Path`):
                将文件下载到的本地路径

            hf_token (`str`):
                HuggingFace 账号 Token

            retry (`int`):
                重试下载次数, 默认为 3
        """
        from huggingface_hub import hf_hub_download
        count = 0
        while count < retry:
            count += 1
            try:
                hf_hub_download(
                    repo_id=repo_id,
                    repo_type=repo_type,
                    filename=filename,
                    local_dir=local_dir,
                    token=hf_token
                )
                break
            except Exception as e:
                echo(f"{filename} 下载失败", e)
                if count < retry:
                    echo(f"重试下载 {filename} 中")


    def filter_file(self, file_list: list, start_dir: str) -> list:
        """从文件列表中过滤出指定的文件列表

        参数:
            file_list (`list`):
                所有文件列表

            start_dir (`str`):
                指定文件所在的路径, 并过滤出新的文件列表

        返回值:
            `list`: 过滤后的文件列表
        """
        filter_file_list = []
        for f in file_list:
            if f.startswith(start_dir):
                filter_file_list.append(f)

        echo(f"{start_dir} 中的文件数量: {len(filter_file_list)}")
        return filter_file_list



class HFDatasetDownloader:
    """HuggingFace 数据集下载器"""

    def __init__(self, urls: list) -> None:
        """HuggingFace 文件下载器创建

        参数:
            urls (`list`):
                下载队列

        下载队列使用`HF_DATASET().download_hf_file()`处理, 下载队列的格式如下:
        ```python
        urls = [
            ["repo_id", "repo_type", "filename", "local_dir", "hf_token"],
            ["repo_id", "repo_type", "filename", "local_dir", "hf_token"],
            ["repo_id", "repo_type", "filename", "local_dir", "hf_token"],
        ]
        ```
        """
        import threading
        import datetime
        from queue import Queue
        self.hf_dataset = HF_DATASET()
        self.urls = urls
        self.datetime = datetime
        self.queue = Queue()
        self.total_urls = len(urls)  # 记录总的 URL 数
        self.downloaded_count = 0  # 记录已下载的数量
        self.lock = threading.Lock()  # 创建锁以保护对下载计数器的访问


    def worker(self) -> None:
        """调用文件下载工具"""
        while True:
            url = self.queue.get()
            if url is None:
                break
            self.hf_dataset.download_hf_file(
                repo_id=url[0],
                repo_type=url[1],
                filename=url[2],
                local_dir=url[3],
                hf_token=url[4],
                retry=self.retry
            )
            self.queue.task_done()
            with self.lock:  # 访问共享资源时加锁
                self.downloaded_count += 1
                self.print_progress()  # 打印进度


    def print_progress(self) -> None:
        """进度条显示"""
        progress = (self.downloaded_count / self.total_urls) * 100
        current_time = self.datetime.datetime.now()
        time_interval = current_time - self.start_time
        hours = time_interval.seconds // 3600
        minutes = (time_interval.seconds // 60) % 60
        seconds = time_interval.seconds % 60
        formatted_time = f"{hours:02}:{minutes:02}:{seconds:02}"

        if self.downloaded_count > 0:
            speed = self.downloaded_count / time_interval.total_seconds()
        else:
            speed = 0

        remaining_urls = self.total_urls - self.downloaded_count

        if speed > 0:
            estimated_remaining_time_seconds = remaining_urls / speed
            estimated_remaining_time = self.datetime.timedelta(seconds=estimated_remaining_time_seconds)
            estimated_hours = estimated_remaining_time.seconds // 3600
            estimated_minutes = (estimated_remaining_time.seconds // 60) % 60
            estimated_seconds = estimated_remaining_time.seconds % 60
            formatted_estimated_time = f"{estimated_hours:02}:{estimated_minutes:02}:{estimated_seconds:02}"
        else:
            formatted_estimated_time = "N/A"

        echo(f"下载进度: {progress:.2f}% | {self.downloaded_count}/{self.total_urls} [{formatted_time}<{formatted_estimated_time}, {speed:.2f}it/s]")


    def start_threads(self, num_threads: int = 16, retry: Optional[int] = 3) -> None:
        """启动多线程下载器

        参数:
            num_threads (`int`):
                下载线程, 默认为 16

            retry (`int`):
                重试下载次数, 默认为 3
        """
        import threading
        import time
        threads = []
        self.retry = retry
        self.start_time = self.datetime.datetime.now()
        time.sleep(0.1) # 避免 print_progress() 计算时间时出现 division by zero
        for _ in range(num_threads):
            thread = threading.Thread(target=self.worker)
            thread.start()
            threads.append(thread)

        for url in self.urls:
            self.queue.put(url)

        self.queue.join()

        for _ in range(num_threads):
            self.queue.put(None)

        for thread in threads:
            thread.join()



class DATASET():
    """数据集下载工具"""
    def __init__(self) -> None:
        self.hf_dataset = HF_DATASET()
        self.aria2 = ARIA2(None, None)


    def get_dataset(
        self,
        dataset_path: Union[str, Path],
        url: str,
        name: Optional[str] = None,
        retry: Optional[int] = 3
    ) -> Union[str, None]:
        """从下载链接获取数据集

        参数:
            dataset_path (`str`, `Path`):
                数据集的存放路径

            url (`str`):
                数据集的下载链接

            name (`str`):
                将下载的文件进行重命名

        返回值:
            `str`: 解压的文件路径
        """
        import os
        path = "/tmp"
        if name is None:
            name = url.split("/").pop()

        archive_format = name.split(".").pop() # 压缩包格式
        origin_file_path = self.aria2.aria2( # 下载文件
            url=url,
            path=path,
            filename=name,
            retry=retry
        )

        if origin_file_path is not None:
            # 解压文件
            echo(f"尝试解压 {name}")
            if archive_format == "7z":
                !7z x "{origin_file_path}" -o"{dataset_path}"
                echo(f"{name} 解压完成, 路径: {dataset_path}")
                return dataset_path
            elif archive_format == "zip":
                !unzip "{origin_file_path}" -d "{dataset_path}"
                echo(f"{name} 解压完成, 路径: {dataset_path}")
                return dataset_path
            elif archive_format == "tar":
                !tar -xvf "{origin_file_path}" -C "{dataset_path}"
                echo(f"{name} 解压完成, 路径: {dataset_path}")
                return dataset_path
            else:
                echo(f"{name} 的格式不支持解压")
                return None
        else:
            echo(f"{name} 下载失败")
            return None


    def get_dataset_from_hf(
        self,
        local_path: Union[str, Path],
        repo_id: str,
        repo_type: str,
        folder: Optional[str] = None,
        hf_token: Optional[str] = None,
        retry: Optional[int] = 3
    ) -> Union[str, None]:
        """从 HuggingFace 下载训练集

        参数:
            local_path (`str`, `Path`):
                将数据集下载到本地的路径

            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            folder (`str`, `None`):
                指定要下载 HuggingFace 中指定的文件夹, 例如:

            hf_token (`str`, `None`):
                HuggingFace 账号 Token

            retry (`int`):
                重试下载的次数, 默认为 3

        返回值:
            `str`: 下载到本地的路径

        说明:
            folder 未指定时, 则下载 HuggingFace 仓库中的所有文件, 如果 folder 指定了, 例如指定的是`aaaki`
            
            而仓库的文件结构如下:

            ```markdown
            HuggingFace Repo
            ├── Nachoneko
            │   ├── 1_nachoneko
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
            │   │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
            │   ├── 2_nachoneko
            │   │       ├── 0(8).txt
            │   │       ├── 0(8).webp
            │   │       ├── 001_2.png
            │   │       └── 001_2.txt
            │   └── 4_nachoneko
            │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
            │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
            │           ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
            │           └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
            └ aaaki
                ├── 1_aaaki
                │   ├── 1.png
                │   ├── 1.txt
                │   ├── 11.png
                │   ├── 11.txt
                │   ├── 12.png
                │   └── 12.txt
                └── 3_aaaki
                    ├── 14.png
                    ├── 14.txt
                    ├── 16.png
                    └── 16.txt
            ```

            则使用该函数下载 HuggingFace 仓库的文件时将下载`aaaki`文件夹中的所有文件, 而`Nachoneko`文件夹中的文件不会被下载
        """
        import os
        from tqdm import tqdm

        echo(f"从 {repo_id} (类型: {repo_type}) 下载数据集")
        # 从 HuggingFace 仓库中获取所有文件列表
        hf_file_list = self.hf_dataset.get_hf_file_list(
            repo_id=repo_id,
            repo_type=repo_type,
            hf_token=hf_token
        )

        # 指定 folder 时过滤出新的文件列表
        if folder is None:
            filter_file_list = hf_file_list
            folder_path = local_path
        else:
            echo(f"指定下载 {folder} 中的文件")
            filter_file_list = self.hf_dataset.filter_file(hf_file_list, folder)
            folder_path = os.path.join(local_path, folder)

        # 创建下载任务
        task = []
        for file in tqdm(filter_file_list, desc="创建下载任务"):
            task.append([repo_id, repo_type, file, local_path, hf_token])

        # 从 HuggingFace 仓库下载文件
        echo(f"下载 {repo_id} 中的文件中")
        dataset_downloader = HFDatasetDownloader(task)
        dataset_downloader.start_threads(num_threads=32, retry=retry)
        if os.path.exists(folder_path):
            echo(f"从 {repo_id} 下载数据集文件完成, 路径: {folder_path}")
            return folder_path
        else:
            echo(f"从 {repo_id} 下载数据集文件失败")
            return None


    def get_dataset_from_ms(
        self,
        local_path: Union[str, Path],
        repo_id: str,
        repo_type: str,
        folder: Optional[str] = None,
        ms_token: Optional[str] = None,
        retry: Optional[int] = 3
    ) -> Union[str, None]:
        """从 ModelScope 下载训练集

        参数:
            local_path (`str`, `Path`):
                将数据集下载到本地的路径

            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            folder (`str`, `None`):
                指定要下载 ModelScope 中指定的文件夹, 例如:

            ms_token (`str`, `None`):
                ModelScope 账号 Token

            retry (`int`):
                重试下载的次数, 默认为 3

        返回值:
            `str`: 下载到本地的路径

        说明:
            folder 未指定时, 则下载 ModelScope 仓库中的所有文件, 如果 folder 指定了, 例如指定的是`aaaki`
            
            而仓库的文件结构如下:

            ```markdown
            ModelScope Repo
            ├── Nachoneko
            │   ├── 1_nachoneko
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
            │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
            │   │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
            │   ├── 2_nachoneko
            │   │       ├── 0(8).txt
            │   │       ├── 0(8).webp
            │   │       ├── 001_2.png
            │   │       └── 001_2.txt
            │   └── 4_nachoneko
            │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
            │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
            │           ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
            │           └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
            └ aaaki
                ├── 1_aaaki
                │   ├── 1.png
                │   ├── 1.txt
                │   ├── 11.png
                │   ├── 11.txt
                │   ├── 12.png
                │   └── 12.txt
                └── 3_aaaki
                    ├── 14.png
                    ├── 14.txt
                    ├── 16.png
                    └── 16.txt
            ```

            则使用该函数下载 ModelScope 仓库的文件时将下载`aaaki`文件夹中的所有文件, 而`Nachoneko`文件夹中的文件不会被下载
        """
        import os
        from modelscope import snapshot_download
        from modelscope.hub.api import HubApi
        api = HubApi()
        count = 0

        echo("验证 ModelScope Token 中")
        try:
            api.login(ms_token)
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败, 无法下载文件", e)
            return

        # TODO: 支持创空间
        if repo_type not in ["model", "dataset"]:
            echo(f"{repo_id} 的类型暂不支持下载文件")
            return None

        # 选择下载模式
        if folder is None:
            folder_path = local_path
            echo(f"下载 {repo_id} (类型: {repo_type}) 仓库中, 路径: {folder_path}")
            while count < retry:
                count += 1
                try:
                    snapshot_download(
                        repo_id=repo_id,
                        repo_type=repo_type,
                        local_dir=local_path
                    )
                    echo(f"下载 {repo_id} (类型: {repo_type}) 仓库成功, 路径: {folder_path}")
                    return folder_path
                except Exception as e:
                    echo(f"下载 {repo_id} (类型: {repo_type}) 仓库时出现错误", e)
                    if count < retry:
                        echo(f"重试下载 {repo_id} (类型: {repo_type}) 仓库中")
                    else:
                        return None
        else:
            folder_path = os.path.join(local_path, folder)
            echo(f"从 {repo_id} (类型: {repo_type}) 下载 {folder} 中, 路径: {folder_path}")
            while count < retry:
                count += 1
                try:
                    snapshot_download(
                        repo_id=repo_id,
                        repo_type=repo_type,
                        local_dir=local_path,
                        allow_file_pattern=f"{folder}/*"
                    )
                    echo(f"从 {repo_id} (类型: {repo_type}) 下载 {folder} 成功, 路径: {folder_path}")
                    return folder_path
                except Exception as e:
                    echo(f"从 {repo_id} (类型: {repo_type}) 下载 {folder} 时出现错误", e)
                    if count <retry:
                        echo(f"重试从 {repo_id} (类型: {repo_type}) 下载 {folder} 中")
                    else:
                        return None


    def get_single_file_from_hf(
        self,
        repo_id: str,
        repo_type: str,
        filename: str,
        local_dir: str,
        token: Optional[str] = None,
        retry: Optional[int] = 3
    ) -> Union[str, None]:
        """从 HuggingFace 仓库下载单个文件

        参数:
            repo_id (`str`):
                HuggingFace 仓库的 ID

            repo_type (`str`):
                HuggingFace 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            filename (`str`):
                文件在 HuggingFace 仓库中的路径

            local_dir (`str`):
                将文件下载到本地的路径

            token (`str`, `None`):
                HuggingFace 账号 Token

            retry (`int`):
                重试下载的次数, 默认为 3

        返回值:
            `str`: 下载的文件路径
        """
        import os
        from huggingface_hub import hf_hub_download

        repo_name = repo_id.split("/").pop()
        tmp = "/tmp"
        tmp_path = os.path.join(tmp, f"__hf_file_downloader_{repo_name}_tmp__") # 临时文件路径
        file_path = os.path.join(local_dir, filename.split("/").pop()) # 下载文件到本地的路径
        count = 0

        # 从 HuggingFace 下载文件
        echo(f"从 {repo_id} (类型: {repo_type}) 下载 {filename} 中, 路径: {file_path}")
        if count < retry:
            count += 1
            try:
                hf_file_path = hf_hub_download(
                    repo_id=repo_id,
                    repo_type=repo_type,
                    filename=filename,
                    local_dir=tmp_path,
                    token=token
                )

                os.makedirs(local_dir, exist_ok=True)
                !mv -f "{hf_file_path}" "{local_dir}"
                echo(f"{filename} 下载完成, 路径: {file_path}")
                return file_path
            except Exception as e:
                echo(f"从 {repo_id} 下载 {filename} 失败", e)
                if count < retry:
                    echo(f"重试从 {repo_id} (类型: {repo_type}) 下载 {filename} 中")
                else:
                    return None


    def get_single_file_from_ms(
        self,
        repo_id: str,
        repo_type: str,
        filename: str,
        local_dir: Union[str, Path],
        token: Optional[str] = None,
        retry: Optional[int] = 3
    ) -> Union[str, None]:
        """从 ModelScope 仓库下载单个文件

        参数:
            repo_id (`str`):
                ModelScope 仓库的 ID

            repo_type (`str`):
                ModelScope 仓库种类 (model / dataset / space), 仓库有以下类型:

                    - model: 模型仓库
                    - dataset: 数据集仓库
                    - space: 在线运行空间仓库

            filename (`str`):
                文件在 ModelScope 仓库中的路径

            local_dir (`str`):
                将文件下载到本地的路径

            token (`str`, `None`):
                ModelScope 账号 Token

            retry (`int`):
                重试下载的次数, 默认为 3

        返回值:
            `str`: 下载的文件路径
        """
        import os
        from pathlib import Path
        from modelscope import model_file_download, dataset_file_download
        from modelscope.hub.api import HubApi
        api = HubApi()

        repo_name = repo_id.split("/").pop()
        tmp = "/tmp"
        tmp_path = os.path.join(tmp, f"__hf_file_downloader_{repo_name}_tmp__") # 临时文件路径
        file_path = os.path.join(local_dir, filename.split("/").pop()) # 下载文件到本地的路径
        download_status = False
        count = 0

        echo("验证 ModelScope Token 中")
        try:
            api.login(token)
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败, 无法下载文件", e)
            return

        echo(f"从 {repo_id} (类型: {repo_type}) 下载 {filename} 中, 路径: {file_path}")
        if repo_type == "model":
            while count < retry:
                count += 1
                try:
                    ms_file_path = model_file_download(
                        model_id=repo_id,
                        file_path=filename,
                        local_dir=tmp_path
                    )
                    download_status = True
                    break
                except Exception as e:
                    echo(f"从 {repo_id} (类型: {repo_type}) 下载 {filename} 时出现错误", e)
                    if count < retry:
                        echo(f"重试从 {repo_id} (类型: {repo_type}) 下载 {filename} 中")
        elif repo_type == "dataset":
            while count < retry:
                count += 1
                try:
                    ms_file_path = dataset_file_download(
                        dataset_id=repo_id,
                        file_path=filename,
                        local_dir=tmp_path,
                    )
                    download_status = True
                    break
                except Exception as e:
                    echo(f"从 {repo_id} (类型: {repo_type}) 下载 {filename} 时出现错误", e)
                    if count < retry:
                        echo(f"重试从 {repo_id} (类型: {repo_type}) 下载 {filename} 中")
        elif repo_type == "space":
            echo(f"{repo_id} 类型为 {repo_type}, 暂不支持下载文件")

        if download_status:
            ms_file_path = Path(ms_file_path)
            os.makedirs(local_dir, exist_ok=True)
            !mv -f "{ms_file_path}" "{local_dir}"
            echo(f"{filename} 下载完成, 路径: {file_path}")
            return file_path
        else:
            return None



class MIRROR:
    """PyPI, HuggingFace, Github 镜像管理工具"""

    def __init__(self, workspace: Union[str, Path]) -> None:
        """设置镜像测试缓存目录和 Git 配置文件目录"""
        self.WORKSPACE = workspace


    def set_pypi_index_mirror(self, mirror: Optional[str] = None) -> None:
        """设置 PyPI Index 镜像源

        参数:
            mirror (`str`, `None`):
                PyPI 镜像源链接, 当不传入镜像源链接时则清除镜像源
        """
        import os
        if mirror:
            echo("使用 PIP_INDEX_URL, UV_INDEX_URL 环境变量设置 PyPI Index 镜像源")
            os.environ["PIP_INDEX_URL"] = mirror
            os.environ["UV_INDEX_URL"] = mirror
        else:
            echo("清除 PIP_INDEX_URL, UV_INDEX_URL 环境变量, 取消使用 PyPI Index 镜像源")
            if "PIP_INDEX_URL" in os.environ:
                del os.environ["PIP_INDEX_URL"]

            if "UV_INDEX_URL" in os.environ:
                del os.environ["UV_INDEX_URL"]


    def set_pypi_extra_index_mirror(self, mirror: Optional[str] = None) -> None:
        """设置 PyPI Extra Index 镜像源

        参数:
            mirror (`str`, `None`):
                PyPI 镜像源链接, 当不传入镜像源链接时则清除镜像源
        """
        import os
        if mirror:
            echo("使用 PIP_EXTRA_INDEX_URL, UV_EXTRA_INDEX_URL 环境变量设置 PyPI Extra Index 镜像源")
            os.environ["PIP_EXTRA_INDEX_URL"] = mirror
            os.environ["UV_EXTRA_INDEX_URL"] = mirror
        else:
            echo("清除 PIP_EXTRA_INDEX_URL, UV_EXTRA_INDEX_URL 环境变量, 取消使用 PyPI Extra Index 镜像源")
            if "PIP_EXTRA_INDEX_URL" in os.environ:
                del os.environ["PIP_EXTRA_INDEX_URL"]

            if "UV_EXTRA_INDEX_URL" in os.environ:
                del os.environ["UV_EXTRA_INDEX_URL"]


    def set_pypi_find_links_mirror(self, mirror: Optional[str] = None) -> None:
        """设置 PyPI Find Links 镜像源

        参数:
            mirror (`str`, `None`):
                PyPI 镜像源链接, 当不传入镜像源链接时则清除镜像源
        """
        import os
        if mirror:
            echo("使用 PIP_FIND_LINKS, UV_FIND_LINKS 环境变量设置 PyPI Find Links 镜像源")
            os.environ["PIP_FIND_LINKS"] = mirror
            os.environ["UV_FIND_LINKS"] = mirror
        else:
            echo("清除 PIP_FIND_LINKS, UV_FIND_LINKS 环境变量, 取消使用 PyPI Find Links 镜像源")
            if "PIP_FIND_LINKS" in os.environ:
                del os.environ["PIP_FIND_LINKS"]

            if "UV_FIND_LINKS" in os.environ:
                del os.environ["UV_FIND_LINKS"]


    def set_github_mirror(self, mirror: Optional[Union[str, list]] = None) -> None:
        """设置 Github 镜像源

        参数:
            mirror (`str`, `list`, `None`):
                Github 镜像源地址, 当传入的是 Github 镜像源地址, 则直接设置 GIT_CONFIG_GLOBAL 环境变量并直接使用该镜像源地址

                如果传入的是镜像源列表, 则自动测试可用的 Github 镜像源并设置 GIT_CONFIG_GLOBAL 环境变量

                当不传入参数时则清除 GIT_CONFIG_GLOBAL 环境变量并删除 GIT_CONFIG_GLOBAL 环境变量对应的 Git 配置文件

        使用:
        ```python
        set_github_mirror() # 不传入参数时则清除 Github 镜像源

        set_github_mirror("https://ghfast.top/https://github.com") # 只设置一个 Github 镜像源时将直接使用该 Github 镜像源

        set_github_mirror( # 传入 Github 镜像源列表时将自动测试可用的 Github 镜像源并设置
            [
                "https://ghfast.top/https://github.com",
                "https://mirror.ghproxy.com/https://github.com",
                "https://ghproxy.net/https://github.com",
                "https://gh.api.99988866.xyz/https://github.com",
                "https://gitclone.com/github.com",
                "https://gh-proxy.com/https://github.com",
                "https://ghps.cc/https://github.com",
                "https://gh.idayer.com/https://github.com",
            ]
        )
        ```
        """
        import os
        import subprocess
        if not mirror:
            echo("清除 GIT_CONFIG_GLOBAL 环境变量, 取消使用 Github 镜像源")
            if "GIT_CONFIG_GLOBAL" in os.environ:
                # 删除对应的配置文件
                if os.path.exists(os.environ["GIT_CONFIG_GLOBAL"]):
                    path = os.environ["GIT_CONFIG_GLOBAL"]
                    !rm -rf "{path}"

                del os.environ["GIT_CONFIG_GLOBAL"]

            return

        git_config_path = os.path.join(self.WORKSPACE, ".gitconfig")
        os.environ["GIT_CONFIG_GLOBAL"] = git_config_path

        if isinstance(mirror, str):
            echo("通过 GIT_CONFIG_GLOBAL 环境变量设置 Github 镜像源")
            !git config --global url."{mirror}".insteadOf "https://github.com"
        elif isinstance(mirror, list):
            mirror_test_path = os.path.join(self.WORKSPACE, "__github_mirror_test__")
            for gh in mirror:
                echo(f"测试 Github 镜像源: {gh}")
                test_repo = f"{gh}/licyk/empty"
                if os.path.exists(mirror_test_path):
                    !rm -rf "{mirror_test_path}"
                result = subprocess.run(f'git clone {test_repo} "{mirror_test_path}"')
                if os.path.exists(mirror_test_path):
                    !rm -rf "{mirror_test_path}"
                if result.returncode == 0:
                    echo("该镜像源可用")
                    !git config --global url."{gh}".insteadOf "https://github.com"
                    return
                else:
                    echo("镜像源不可用")

            echo("无可用的 Github 镜像源, 取消使用 Github 镜像源")
            if os.path.exists(git_config_path):
                !rm -rf "{git_config_path}"
            if "GIT_CONFIG_GLOBAL" in os.environ:
                del os.environ["GIT_CONFIG_GLOBAL"]
        else:
            echo(f"未知镜像源参数类型: {type(mirror)}")
            return


    def set_huggingface_mirror(self, mirror: Optional[str] = None) -> None:
        """设置 HuggingFace 镜像源

        参数:
            mirror (`str`, `None`):
                HuggingFace 镜像源链接, 当不传入镜像源链接时则清除镜像源
        """
        import os
        if mirror:
            echo("使用 HF_ENDPOINT 环境变量设置 HuggingFace 镜像源")
            os.environ["HF_ENDPOINT"] = mirror
        else:
            echo("清除 HF_ENDPOINT 环境变量, 取消使用 HuggingFace 镜像源")
            if "HF_ENDPOINT" in os.environ:
                del os.environ["HF_ENDPOINT"]


    def set_mirror(
        self,
        pypi_index_mirror: Optional[str] = None,
        pypi_extra_index_mirror: Optional[str] = None,
        pypi_find_links_mirror: Optional[str] = None,
        github_mirror: Optional[Union[str, list]] = None,
        huggingface_mirror: Optional[str] = None
    ) -> None:
        """镜像源设置

        参数:
            pypi_index_mirror (`str`, `None`):
                PyPI Index 镜像源链接

            pypi_extra_index_mirror (`str`, `None`):
                PyPI Extra Index 镜像源链接

            pypi_find_links_mirror (`str`, `None`):
                PyPI Find Links 镜像源链接

            github_mirror (`str`, `list`, `None`):
                Github 镜像源链接或者镜像源链接列表

            huggingface_mirror (`str`, `None`):
                HuggingFace 镜像源链接
        """
        echo("配置镜像源中")
        self.set_pypi_index_mirror(pypi_index_mirror)
        self.set_pypi_extra_index_mirror(pypi_extra_index_mirror)
        self.set_pypi_find_links_mirror(pypi_find_links_mirror)
        self.set_github_mirror(github_mirror)
        self.set_huggingface_mirror(huggingface_mirror)
        echo("镜像源配置完成")


    def configure_pip(self) -> None:
        """使用环境变量配置 Pip / uv"""
        echo("配置 Pip / uv")
        import os
        import sys
        os.environ["UV_HTTP_TIMEOUT"] = "30"
        os.environ["UV_CONCURRENT_DOWNLOADS"] = "50"
        os.environ["UV_INDEX_STRATEGY"] = "unsafe-best-match"
        os.environ["UV_PYTHON"] = sys.executable
        os.environ["UV_NO_PROGRESS"] = "1"
        os.environ["PIP_DISABLE_PIP_VERSION_CHECK"] = "1"
        os.environ["PIP_NO_WARN_SCRIPT_LOCATION"] = "0"
        os.environ["PIP_TIMEOUT"] = "30"
        os.environ["PIP_RETRIES"] = "5"
        os.environ["PYTHONUTF8"] = "1"
        os.environ["PYTHONIOENCODING"] = "utf8"



class SD_SCRIPTS(ARIA2, GIT, MANAGER, ENV):
    """sd-scripts 管理工具"""

    def __init__(self, workspace: Union[str, Path], workfolder: str) -> None:
        """sd-scripts 管理工具

        参数:
            workspace (`str`, `Path`):
                工作区路径

            workfolder (`str`):
                工作区的文件夹名称
        """
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder
        self.mirror = MIRROR(self.WORKSPACE)
        self.repo_manager = REPO_MANAGER()
        self.dataset = DATASET()


    def get_model(self, url: str, path: Union[str, Path], filename: Optional[str] = None, retry: Optional[int] = 3) -> str:
        """下载模型文件到本地中

        参数:
            url (`str`):
                模型文件的下载链接

            path (`str`, `Path`):
                模型文件下载到本地的路径

            filename (`str`):
                指定下载的模型文件名称

            retry (`int`):
                重试下载的次数, 默认为 3
        
        返回值:
            `str`: 下载的文件路径
        """
        filename = url.split("/").pop() if filename is None else filename
        file_path = super().aria2(
            url=url,
            path=path,
            filename=filename,
            retry=retry
        )
        return file_path


    def get_model_from_list(self, path: Union[str, Path], model_list: list, retry: Optional[int] = 3) -> None:
        """从模型列表下载模型

        参数:
            path (`str`, `Path`):
                将模型下载到的本地路径

            model_list (`list`):
                模型列表

            retry (`int`):
                重试下载的次数, 默认为 3

        使用:
            model_list (`list`) 需要指定模型下载的链接和下载状态, 例如

            ```python
            model_list = [
                ["url1", 0],
                ["url2", 1],
                ["url3", 0],
                ["url4", 1, "file.safetensors"]
            ]
            ```

            在这个例子中, 第一个参数指定了模型的下载链接, 第二个参数设置了是否要下载这个模型, 当这个值为 1 时则下载该模型

            第三个参数是可选参数, 用于指定下载到本地后的文件名称

            则上面的例子中`url2`和`url4`下载链接所指的文件将被下载, 并且`url4`所指的文件将被重命名为`file.safetensors`
        """
        for model in model_list:
            url = model[0]
            status = model[1]
            filename = model[2] if len(model) > 2 else None
            if status == 1:
                if filename is None:
                    self.get_model(
                        url=url,
                        path=path,
                        retry=retry
                    )
                else:
                    self.get_model(
                        url=url,
                        path=path,
                        filename=filename,
                        retry=retry
                    )


    def install(
        self,
        torch_ver: Optional[str] = None,
        xformers_ver: Optional[str] = None,
        git_branch: Optional[str] = None,
        git_commit: Optional[str] = None,
        model_path: Optional[Union[str, Path]] = None,
        model_list: Optional[list] = None,
        use_uv: bool = False,
        pypi_index_mirror: Optional[str] = None,
        pypi_extra_index_mirror: Optional[str] = None,
        pypi_find_links_mirror: Optional[str] = None,
        github_mirror: Optional[Union[str, list]] = None,
        huggingface_mirror: Optional[str] = None,
        sd_scripts_repo: Optional[str] = None,
        sd_scripts_requirment: Optional[str] = None,
        retry: Optional[int] = 3,
    ) -> None:
        """安装 sd-scripts 和其余环境

        参数:
            torch_ver (`str`, `None`):
                指定的 PyTorch 软件包包名, 并包括版本号

            xformers_ver (`str`, `None`):
                指定的 xFormers 软件包包名, 并包括版本号

            git_branch (`str`, `None`):
                指定要切换 sd-scripts 的分支

            git_commit (`str`, `None`):
                指定要切换到 sd-scripts 的提交记录

            model_path (`str`, `Path`, `None`):
                指定模型下载的路径

            model_list (`list`, `None`):
                模型下载列表

            use_uv (`bool`):
                使用 uv 替代 Pip 进行 Python 软件包的安装

            pypi_index_mirror (`str`, `None`):
                PyPI Index 镜像源链接

            pypi_extra_index_mirror (`str`, `None`):
                PyPI Extra Index 镜像源链接

            pypi_find_links_mirror (`str`, `None`):
                PyPI Find Links 镜像源链接

            github_mirror (`str`, `list`, `None`):
                Github 镜像源链接或者镜像源链接列表

            huggingface_mirror (`str`, `None`):
                HuggingFace 镜像源链接

            sd_scripts_repo (`str`, `None`):
                sd-scripts 仓库地址, 未指定时默认为`https://github.com/kohya-ss/sd-scripts`

            sd_scripts_requirment (`str`, `None`):
                sd-scripts 的依赖文件名, 未指定时默认为`requirements.txt`

            retry (`int`, `None`):
                设置下载模型失败时重试次数
        """
        import os
        sd_scripts_path = os.path.join(self.WORKSPACE, self.WORKFOLDER)
        req_file = os.path.join(sd_scripts_path, sd_scripts_requirment if sd_scripts_requirment else "requirements.txt")
        sd_scripts_repo = sd_scripts_repo if sd_scripts_repo else "https://github.com/kohya-ss/sd-scripts"
        model_path = model_path if model_path else os.path.join(self.WORKSPACE, "sd-models")
        model_list = model_list if model_list else []

        self.check_gpu() # 检查是否有可用的 GPU
        # 配置镜像源
        self.mirror.set_mirror(
            pypi_index_mirror=pypi_index_mirror,
            pypi_extra_index_mirror=pypi_extra_index_mirror,
            pypi_find_links_mirror=pypi_find_links_mirror,
            github_mirror=github_mirror,
            huggingface_mirror=huggingface_mirror
        )
        self.mirror.configure_pip() # 配置 Pip / uv
        self.prepare_env_depend(use_uv=use_uv) # 准备 Notebook 的运行依赖
        # 下载 sd-scripts
        self.clone(
            addr=sd_scripts_repo,
            path=self.WORKSPACE,
            name=self.WORKFOLDER
        )
        # 切换指定的 sd-scripts 分支
        self.checkout(
            path=sd_scripts_path,
            branch=git_branch
        )
        # 切换到指定的 sd-scripts 提交记录
        self.reset(
            path=sd_scripts_path,
            commit=git_commit
        )
        # 安装 PyTorch 和 xFormers
        self.prepare_torch(
            torch_ver=torch_ver,
            xformers_ver=xformers_ver,
            use_uv=use_uv
        )
        # 安装 sd-scripts 的依赖
        os.chdir(sd_scripts_path)
        self.install_requirements(
            path=req_file,
            use_uv=use_uv
        )
        os.chdir(self.WORKSPACE)
        # 安装使用 sd-scripts 进行训练所需的其他软件包
        self.py_pkg_manager(
            pkg="lycoris-lora dadaptation open-clip-torch wandb",
            type="install",
            use_uv=use_uv
        )
        # 更新 urllib3
        self.py_pkg_manager(
            pkg="urllib3",
            type="update",
            use_uv=False
        )
        self.tcmalloc() # 设置 TCMalloc 内存优化
        self.get_model_from_list(
            path=model_path,
            model_list=model_list,
            retry=retry
        )


###################################
echo("初始化功能完成")


## 参数配置
设置必要的参数, 根据注释说明进行修改  
2. [[← 上一个单元](#功能初始化)|[下一个单元 →](#安装环境)]

In [None]:
# 环境设置
WORKSPACE = "/kaggle" # 工作路径, 通常不需要修改
WORKFOLDER = "sd-scripts" # 工作路径中文件夹名称, 通常不需要修改
SD_SCRIPTS_PATH = "/kaggle/sd-scripts" # sd-scripts 的路径
SD_SCRIPTS_REPO = "https://github.com/kohya-ss/sd-scripts" # sd-scripts 仓库地址
SD_SCRIPTS_REQUIREMENT = "requirements.txt" # sd-scripts 依赖文件名
TORCH_VER = "torch==2.5.1+cu124 torchvision==0.20.1+cu124 torchaudio==2.5.1+cu124" # PyTorch 版本
XFORMERS_VER = "xformers==0.0.28.post3" # xFormers 版本
USE_UV = True # 使用 uv 加速 Python 软件包安装, 修改为 True 为启用, False 为禁用
PIP_INDEX_MIRROR = "https://pypi.python.org/simple" # PyPI 主镜像源
PIP_EXTRA_INDEX_MIRROR = "https://download.pytorch.org/whl/cu124" # PyPI 扩展镜像源
# PIP_FIND_LINKS_MIRROR = "https://download.pytorch.org/whl/cu124/torch_stable.html" # PyPI 扩展镜像源
HUGGINGFACE_MIRROR = "https://hf-mirror.com" # HuggingFace 镜像源
GITHUB_MIRROR = [ # Github 镜像源
    "https://ghfast.top/https://github.com",
    "https://mirror.ghproxy.com/https://github.com",
    "https://ghproxy.net/https://github.com",
    "https://gh.api.99988866.xyz/https://github.com",
    "https://gitclone.com/github.com",
    "https://gh-proxy.com/https://github.com",
    "https://ghps.cc/https://github.com",
    "https://gh.idayer.com/https://github.com"
]

##############################################################################

# sd-scripts 版本设置
SD_SCRIPTS_BRANCH = "dev" # sd-scripts 分支, 可切换成 main / dev 或者其它分支, 留空则不进行切换
SD_SCRIPTS_COMMIT = "" # 切换 sd-scripts 的版本到某个 Git 提交记录上, 留空则不进行切换

##############################################################################

# 模型上传设置, 使用 HuggingFace / ModelScope 上传训练好的模型
# HuggingFace: https://huggingface.co
# ModelScope: https://modelscope.cn
USE_HF_TO_SAVE_MODEL = False # 使用 HuggingFace 保存训练好的模型, 修改为 True 为启用, False 为禁用 (True / False)
USE_MS_TO_SAVE_MODEL = False # 使用 ModelScope 保存训练好的模型, 修改为 True 为启用, False 为禁用 (True / False)

# 设置使用 ModelScope 上传文件时使用的文件上传方式, 使用新版方式上传速度更快, 通常保持默认即可
# 旧版上传方式基于 Git, 新版上传方式基于 ModelScope API
USE_NEW_MS_UPLOADER = True # 修改为 True 设置为新版, False 为旧版 (True / False)

# HuggingFace Token 在 Account -> Settings -> Access Tokens 中获取
HF_TOKEN = "" # HuggingFace Token
# ModelScope Token 在 首页 -> 访问令牌 -> SDK 令牌 中获取
MS_TOKEN = "" # ModelScope Token

# HuggingFace 模型仓库的 ID, 当仓库不存在时则尝试新建一个
HF_REPO_ID = "username/reponame" # HuggingFace 仓库的 ID (格式: "用户名/仓库名")
HF_REPO_TYPE = "model" # HuggingFace 仓库的种类 (可选的类型为: model / dataset / space), 如果在 HuggingFace 新建的仓库为模型仓库则不需要修改
# HuggingFace 仓库类型和对应名称:
# model: 模型仓库
# dataset: 数据集仓库
# space: 在线运行空间仓库

# ModelScope 模型仓库的 ID, 当仓库不存在时则尝试新建一个
MS_REPO_ID = "username/reponame" # ModelScope 仓库的 ID (格式: "用户名/仓库名")
MS_REPO_TYPE = "model" # ModelScope 仓库的种类 (model / dataset / space), 如果在 ModelScope 新建的仓库为模型仓库则不需要修改
# ModelScope 仓库类型和对应名称:
# model: 模型仓库
# dataset: 数据集仓库
# space: 创空间仓库

# 设置自动创建仓库时仓库的可见性, False 为私有仓库(不可见), True 为公有仓库(可见), 通常保持默认即可
HF_REPO_VISIBILITY = False # 设置新建的 HuggingFace 仓库可见性 (True / False)
MS_REPO_VISIBILITY = False # 设置新建的 ModelScope 仓库可见性 (True / False)

# Git 信息设置, 用于上传模型至 ModelScope 时使用, 可以使用默认值
GIT_USER_EMAIL = "username@example.com" # Git 的邮箱
GIT_USER_NAME = "username" # Git 的用户名

##############################################################################

# 训练日志设置, 可使用 TensorBoard / WandB 记录训练日志, 使用 WandB 可远程查看实时训练日志
# 使用 WandB 需要填写 WANDB_TOKEN
# 如果 TensorBoard 和 WandB 同时使用, 可以改成 all
LOG_MODULE = "tensorboard" # 使用的日志记录工具 (tensorboard / wandb / all)

# WandB Token 设置
# WandB Token 可在 https://wandb.ai/authorize 中获取
WANDB_TOKEN = "" # WandB Token

##############################################################################

# 路径设置, 通常保持默认即可
INPUT_DATASET_PATH = "/kaggle/dataset" # 训练集保存的路径
OUTPUT_PATH = "/kaggle/working/model" # 训练时模型保存的路径
SD_MODEL_PATH = "/kaggle/sd-models" # 模型下载到的路径
KAGGLE_INPUT_PATH = "/kaggle/input" # Kaggle Input 的路径

##############################################################################

# 训练模型设置, 在安装时将会下载选择的模型
# 下面举个例子:
# SD_MODEL = [
#     ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/v1-5-pruned-emaonly.safetensors", 0],
#     ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/animefull-final-pruned.safetensors", 1],
#     ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/Counterfeit-V3.0_fp16.safetensors", 0],
#     ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1.safetensors", 1, "Illustrious.safetensors"]
# ]
# 
# 在这个例子中, 第一个参数指定了模型的下载链接, 第二个参数设置了是否要下载这个模型, 当这个值为 1 时则下载该模型
# 第三个参数是可选参数, 用于指定下载到本地后的文件名称
# 
# 则上面的例子中
# https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/animefull-final-pruned.safetensors 和 
# https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1.safetensors 下载链接所指的文件将被下载
# https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/animefull-final-pruned.safetensors 的文件下载到本地后名称为 animefull-final-pruned.safetensors
# 并且 https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1.safetensors 所指的文件将被重命名为 Illustrious.safetensors

SD_MODEL = [
    # Stable Diffusion 模型
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/v1-5-pruned-emaonly.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/animefull-final-pruned.safetensors", 1],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/Counterfeit-V3.0_fp16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/cetusMix_Whalefall2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/cuteyukimixAdorable_neochapter3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/ekmix-pastel-fp16-no-ema.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/ex2K_sse2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/kohakuV5_rev2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/meinamix_meinaV11.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/oukaStar_10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/pastelMixStylizedAnime_pastelMixPrunedFP16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/rabbit_v6.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/sweetSugarSyndrome_rev15.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/AnythingV5Ink_ink.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/bartstyledbBlueArchiveArtStyleFineTunedModel_v10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/meinapastel_v6Pastel.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/qteamixQ_omegaFp16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/tmndMix_tmndMixSPRAINBOW.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sd_xl_base_1.0_0.9vae.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sd_xl_refiner_1.0_0.9vae.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sd_xl_turbo_1.0_fp16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-3.0-base.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-3.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-3.1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-4.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-4.0-opt.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/holodayo-xl-2.1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kivotos-xl-2.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/clandestine-xl-1.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/UrangDiffusion-1.1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/RaeDiffusion-XL-v2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sd_xl_anime_V52.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-delta-rev1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohakuXLEpsilon_rev1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-epsilon-rev2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-epsilon-rev3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-zeta.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/starryXLV52_v52.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/heartOfAppleXL_v20.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/heartOfAppleXL_v30.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/baxlBartstylexlBlueArchiveFlatCelluloid_xlv1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/baxlBlueArchiveFlatCelluloidStyle_xlv3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sanaexlAnimeV10_v10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sanaexlAnimeV10_v11.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/SanaeXL-Anime-v1.2-aesthetic.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/SanaeXL-Anime-v1.3-aesthetic.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1.safetensors", 1],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1-GUIDED.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v1.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v1.1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/jruTheJourneyRemains_v25XL.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/PVCStyleModelMovable_illustriousxl10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/miaomiaoHarem_v15a.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/waiNSFWIllustrious_v80.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/tIllunai3_v4.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_earlyAccessVersion.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_epsilonPred05Version.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_epsilonPred075.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_epsilonPred077.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_epsilonPred10Version.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_epsilonPred11Version.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPredTestVersion.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred05Version.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred06Version.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred065SVersion.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred075SVersion.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred09RVersion.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/noobaiXLNAIXL_vPred10Version.safetensors", 1],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/PVCStyleModelMovable_nbxl12.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/PVCStyleModelMovable_nbxlVPredV10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/ponyDiffusionV6XL_v6StartWithThisOne.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/pdForAnime_v20.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/tPonynai3_v51WeightOptimized.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/omegaPonyXLAnime_v20.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animeIllustDiffusion_v061.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/artiwaifuDiffusion_v10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/artiwaifu-diffusion-v2.safetensors", 0],

    # VAE 模型
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sd_1.5/vae-ft-ema-560000-ema-pruned.safetensors", 0],
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sd_1.5/vae-ft-mse-840000-ema-pruned.safetensors", 1],
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sdxl_1.0/sdxl_fp16_fix_vae.safetensors", 1],
]

##############################################################################
echo("参数设置完成")


## 安装环境
安装环境和下载模型和训练集, 根据注释的说明进行修改  
3. [[← 上一个单元](#参数配置)|[下一个单元 →](#模型训练)]

In [None]:
# 初始化部分参数并执行安装命令, 这一小部分不需要修改
import os
from tqdm import tqdm
echo("初始化 sd-scripts 安装参数")
os.makedirs(WORKSPACE, exist_ok=True)
os.chdir(WORKSPACE)
sd_scripts = SD_SCRIPTS(WORKSPACE, WORKFOLDER)
echo("开始安装 sd-scripts")


# 安装 sd-scripts
sd_scripts.install(
    torch_ver=TORCH_VER,
    xformers_ver=XFORMERS_VER,
    git_branch=SD_SCRIPTS_BRANCH,
    git_commit=SD_SCRIPTS_COMMIT,
    model_path=SD_MODEL_PATH,
    model_list=SD_MODEL,
    use_uv=USE_UV,
    pypi_index_mirror=PIP_INDEX_MIRROR,
    pypi_extra_index_mirror=PIP_EXTRA_INDEX_MIRROR,
    # pypi_find_links_mirror=PIP_FIND_LINKS_MIRROR, # Kaggle 的环境暂不需要以下镜像源
    # github_mirror=GITHUB_MIRROR,
    # huggingface_mirror=HUGGINGFACE_MIRROR
    sd_scripts_repo=SD_SCRIPTS_REPO,
    sd_scripts_requirment=SD_SCRIPTS_REQUIREMENT,
    retry=3,
)
# sd_scripts.install() 将会以下几件事
# 1. 安装 PyTorch / xFormers
# 2. 安装 sd-scripts
# 3. 安装 sd-scripts 的依赖
# 4. 下载模型
# 模型将会下载到 SD_MODEL_PATH 中, 即 /kaggle/sd-models


# 根据预设参数创建其他目录
echo("创建其他目录")
os.makedirs(OUTPUT_PATH, exist_ok=True) # 创建训练时保存模型的路径(由 OUTPUT_PATH 变量设定)
os.makedirs(INPUT_DATASET_PATH, exist_ok=True) # 创建存放训练集的路径(由 INPUT_DATASET_PATH 变量设定)


# 将 KAGGLE_INPUT_PATH 内的文件移动到 INPUT_DATASET_PATH 指定的路径
if os.path.exists(KAGGLE_INPUT_PATH) and len(os.listdir(KAGGLE_INPUT_PATH)) > 0:
    echo("从 Kaggle Input 导入文件中")
    for i in tqdm(os.listdir(KAGGLE_INPUT_PATH), desc="Kaggle Input 文件导入"):
        f = os.path.join(KAGGLE_INPUT_PATH, i)
        !cp -rf "{f}" "{INPUT_DATASET_PATH}"
# 在 Kaggle 界面右侧中有 Kaggle Input 的功能, 可用于导入训练集 / 模型
# 如果使用了 Kaggle Input 导入了训练集 / 模型, 则 KAGGLE_INPUT_PATH 中的所有文件将被复制到 INPUT_DATASET_PATH 中
# 即将 /kaggle/input 中的所有文件复制到 /kaggle/dataset 中


# 配置 Token 环境变量
if HF_TOKEN:
    echo("为 HuggingFace 配置 HF_TOKEN 环境变量")
    os.environ["HF_TOKEN"] = HF_TOKEN

if MS_TOKEN:
    echo("为 ModelScope 配置 MODELSCOPE_API_TOKEN 环境变量")
    os.environ["MODELSCOPE_API_TOKEN"] = MS_TOKEN

if WANDB_TOKEN:
    echo("为 WandB 配置 WANDB_API_KEY 环境变量")
    os.environ["WANDB_API_KEY"] = WANDB_TOKEN
##########################################################################################
# 下方可自行编写命令
# 下方的命令示例可以根据自己的需求进行修改


##### 1. 关于运行环境 #####

# 如果需要安装某个软件包, 可以使用 sd_scripts.py_pkg_manager() 函数
# 使用参数:
# sd_scripts.py_pkg_manager(
#     pkg="python packages name", # Python 软件包名称, 可写多个
#     type="pip operate type" ,   # 对 Python 软件包的操作 (install / install_single / force_install / force_install_single / update / uninstall)
# )
# 
# 以下是 type 可以指定的操作和对应的命令行参数
# 安装: install -> install
# 仅安装: install_single -> install --no-deps
# 强制重装: force_install -> install --force-reinstall
# 仅强制重装: force_install_single -> install --force-reinstall --no-deps
# 更新: update -> install --upgrade
# 卸载: uninstall -> uninstall -y
# 
# 下面是几个使用例子:
# 1.
# sd_scripts.py_pkg_manager(
#     pkg="lycoris-lora==2.1.0.post3 dadaptation==3.1",
#     type="install",
# )
# 这将安装 lycoris-lora==2.1.0.post3 和 dadaptation==3.1
# 
# 2.
# sd_scripts.py_pkg_manager(
#     pkg="tensorboard",
#     type="uninstall",
# )
# 这将卸载 tensorboard


##########################################################################################


##### 2. 关于模型导入 #####

# 该 Kaggle 训练脚本支持 4 种方式导入模型, 如下:
# 1. 使用 Kaggle Input 导入
# 2. 使用模型下载链接导入
# 3. 从 HuggingFace 仓库导入
# 4. 从 ModelScope 仓库导入


### 2.1. 使用 Kaggle Input 导入 ###
# 在 Kaggle 右侧面板中, 点击 Notebook -> Input -> Upload -> New Model, 从此处导入模型


### 2.2 使用模型下载链接导入 ###
# 如果需要通过链接下载额外的模型, 可以使用 sd_scripts.get_model()
# 使用参数:
# sd_scripts.get_model(
#     url="model_url",                    # 模型下载链接
#     path=SD_MODEL_PATH,                 # 模型下载到本地的路径
#     filename="filename.safetensors",    # 模型的名称
#     retry=5,                            # 重试下载的次数, 默认为 3
# )
# 
# 下面是几个使用例子:
# 1.
# sd_scripts.get_model(
#     url="https://modelscope.cn/models/user/repo/resolve/master/your_model.safetensors",
#     path=SD_MODEL_PATH,
# )
# 这将从 https://modelscope.cn/models/user/repo/resolve/master/your_model.safetensors 下载模型并保存到 SD_MODEL_PATH 中
# 
# sd_scripts.get_model(
#     url="https://modelscope.cn/models/user/repo/resolve/master/your_model.safetensors",
#     path=SD_MODEL_PATH,
#     filename="rename_model.safetensors",
# )
# 这将从 https://modelscope.cn/models/user/repo/resolve/master/your_model.safetensors 下载模型并保存到 SD_MODEL_PATH 中, 并且重命名为 rename_model.safetensors


### 2.3. 从 HuggingFace 仓库导入 ###
# 如果需要从 HuggingFace 仓库下载模型, 可以使用 sd_scripts.dataset.get_single_file_from_hf()
# 使用参数:
# sd_scripts.dataset.get_single_file_from_hf(
#     repo_id="usename/repo_id",          # HuggingFace 仓库 ID
#     repo_type="model",                  # HuggingFace 仓库种类 (model / dataset / space)
#     filename="abc/file.safetensors",    # 文件在 HuggingFace 仓库中的路径
#     local_dir=SD_MODEL_PATH,            # 模型下载到本地的路径
#     token="your_huggingface_token",     # HuggingFace Token
#     retry=5,                            # 重试下载的次数, 默认为 3
# )
# 
# 例如要从 stabilityai/stable-diffusion-xl-base-1.0 (类型为 model) 下载 sd_xl_base_1.0_0.9vae.safetensors
# sd_scripts.dataset.get_single_file_from_hf(
#     repo_id="stabilityai/stable-diffusion-xl-base-1.0",
#     repo_type="model",
#     filename="sd_xl_base_1.0_0.9vae.safetensors",
#     local_dir=SD_MODEL_PATH,
# )
# 则上述的命令将会从 stabilityai/stable-diffusion-xl-base-1.0 下载 sd_xl_base_1.0_0.9vae.safetensors 模型
# 并将模型保存到 SD_MODEL_PATH 中
# 如果仓库的为私有仓库, 需要 HuggingFace Token 才能访问, 则加上 token 参数, 填上自己的 Token (比如是 abcde)
# sd_scripts.dataset.get_single_file_from_hf(
#     repo_id="stabilityai/stable-diffusion-xl-base-1.0",
#     repo_type="model",
#     filename="sd_xl_base_1.0_0.9vae.safetensors",
#     local_dir=SD_MODEL_PATH,
#     token="abcde",
# )
# 这样就可以正常从仓库中下载文件


### 2.4. 从 ModelScope 仓库导入 ###
# 如果需要从 ModelScope 仓库下载模型, 可以使用 sd_scripts.dataset.get_single_file_from_ms()
# 使用参数:
# sd_scripts.dataset.get_single_file_from_ms(
#     repo_id="usename/repo_id",          # ModelScope 仓库 ID
#     repo_type="model",                  # ModelScope 仓库种类 (model / dataset / space)
#     filename="abc/file.safetensors",    # 文件在 ModelScope 仓库中的路径
#     local_dir=SD_MODEL_PATH,            # 模型下载到本地的路径
#     token="your_modelscope_token",      # ModelScope Token
#     retry=5,                            # 重试下载的次数, 默认为 3
# )
# 
# 例如要从 stabilityai/stable-diffusion-xl-base-1.0 (类型为 model) 下载 sd_xl_base_1.0_0.9vae.safetensors
# sd_scripts.dataset.get_single_file_from_ms(
#     repo_id="stabilityai/stable-diffusion-xl-base-1.0",
#     repo_type="model",
#     filename="sd_xl_base_1.0_0.9vae.safetensors",
#     local_dir=SD_MODEL_PATH,
# )
# 则上述的命令将会从 stabilityai/stable-diffusion-xl-base-1.0 下载 sd_xl_base_1.0_0.9vae.safetensors 模型
# 并将模型保存到 SD_MODEL_PATH 中
# 如果仓库的为私有仓库, 需要 ModelScope Token 才能访问, 则加上 token 参数, 填上自己的 Token (比如是 abcde)
# sd_scripts.dataset.get_single_file_from_ms(
#     repo_id="stabilityai/stable-diffusion-xl-base-1.0",
#     repo_type="model",
#     filename="sd_xl_base_1.0_0.9vae.safetensors",
#     local_dir=SD_MODEL_PATH,
#     token="abcde",
# )
# 这样就可以正常从仓库中下载文件


##########################################################################################


##### 3. 关于训练集导入 #####

# 该 Kaggle 训练脚本支持 4 种方式导入训练集, 如下:
# 1. 使用 Kaggle Input 导入
# 2. 使用训练集下载链接导入
# 3. 从 HuggingFace 仓库导入
# 4. 从 ModelScope 仓库导入


### 3.1. 使用 Kaggle Input 导入 ###
# 在 Kaggle 右侧面板中, 点击 Notebook -> Input -> Upload -> New Dataset, 从此处导入模型


### 3.2. 使用训练集下载链接导入 ###
# 如果将训练集压缩后保存在某个平台, 如 HuggingFace, ModelScope, 并且有下载链接, 可以使用 sd_scripts.dataset.get_dataset() 函数下载训练集
# 使用参数:
# sd_scripts.dataset.get_dataset(
#     dataset_path="path_to_local",   # 下载数据集到本地的路径
#     url="download_url",             # 训练集压缩包的下载链接
#     name="filename.zip",            # 将数据集压缩包进行重命名
#     retry=5,                        # 重试下载的次数, 默认为 3
# )
# 
# 该函数在下载训练集压缩包完成后将解压到指定的本地路径
# 压缩包格式仅支持 7z, zip, tar
# 
# 下面是几个使用的例子:
# 1.
# sd_scripts.dataset.get_dataset(
#     dataset_path=INPUT_DATASET_PATH,
#     url="https://modelscope.cn/models/user/repo/resolve/master/data_1.7z",
# )
# 这将从 https://modelscope.cn/models/user/repo/resolve/master/data_1.7z 下载训练集压缩包并解压到 INPUT_DATASET_PATH 中
# 
# 2.
# sd_scripts.dataset.get_dataset(
#     dataset_path=INPUT_DATASET_PATH,
#     url="https://modelscope.cn/models/user/repo/resolve/master/data_1.7z",
#     name="training_dataset.7z",
# )
# 这将从 https://modelscope.cn/models/user/repo/resolve/master/data_1.7z 下载训练集压缩包并重命名成 training_dataset.7z
# 再将 training_dataset.7z 中的文件解压到 INPUT_DATASET_PATH 中
# 
# 
# 训练集的要求:
# 需要将图片进行打标, 并调整训练集为指定的目结构, 例如:
# Nachoneko
#     └── 1_nachoneko
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#             ├── 0(8).txt
#             ├── 0(8).webp
#             ├── 001_2.png
#             ├── 001_2.txt
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 
# 在 Nachoneko 文件夹新建一个文件夹, 格式为 <数字>_<名称>, 如 1_nachoneko, 前面的数字代表这部分的训练集的重复次数, 1_nachoneko 文件夹内则放图片和打标文件
# 
# 训练集也可以分成多个部分组成, 例如:
# Nachoneko
#     ├── 1_nachoneko
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#     │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#     ├── 2_nachoneko
#     │       ├── 0(8).txt
#     │       ├── 0(8).webp
#     │       ├── 001_2.png
#     │       └── 001_2.txt
#     └── 4_nachoneko
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 
# 处理好训练集并调整好目录结构后可以将 Nachoneko 文件夹进行压缩了, 使用 zip / 7z / tar 格式进行压缩
# 例如将上述的训练集压缩成 Nachoneko.7z, 此时需要检查一下压缩后在压缩包的目录结果是否和原来的一致(有些压缩软件在部分情况下会破坏原来的目录结构)
# 确认没有问题后将该训练集上传到网盘, 推荐使用 HuggingFace / ModelScope


### 3.3. 从 HuggingFace 仓库导入 ###
# 如果训练集保存在 HuggingFace, 可以使用 sd_scripts.dataset.get_dataset_from_hf() 函数从 HuggingFace 下载数据集
# 使用格式:
# sd_scripts.dataset.get_dataset_from_hf(
#     local_path=INPUT_DATASET_PATH,    # 下载数据集到哪个路径
#     repo_id="username/train_data",    # HuggingFace 仓库 ID
#     repo_type="dataset",              # HuggingFace 仓库的类型 (model / dataset / space)
#     folder="folder_in_repo",          # 指定要从 HuggingFace 仓库里下载哪个文件夹的内容
#     hf_token="hf_token",              # HuggingFace Token, 用于访问私有仓库
#     retry=5,                          # 重试下载的次数, 默认为 3
# )
# 
# 比如在 HuggingFace 的仓库为 username/train_data, 仓库类型为 dataset
# 仓库的文件结构如下:
# ├── Nachoneko
# │   ├── 1_nachoneko
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
# │   │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
# │   ├── 2_nachoneko
# │   │       ├── 0(8).txt
# │   │       ├── 0(8).webp
# │   │       ├── 001_2.png
# │   │       └── 001_2.txt
# │   └── 4_nachoneko
# │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
# │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
# │           ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
# │           └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# └ aaaki
#   ├── 1_aaaki
#   │   ├── 1.png
#   │   ├── 1.txt
#   │   ├── 11.png
#   │   ├── 11.txt
#   │   ├── 12.png
#   │   └── 12.txt
#   └── 3_aaaki
#       ├── 14.png
#       ├── 14.txt
#       ├── 16.png
#       └── 16.txt
#
# 此时想要下载这个仓库中的 Nachoneko 文件夹的内容, 则下载命令为
# sd_scripts.dataset.get_dataset_from_hf(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     folder="Nachoneko",
# )
# 
# 如果想下载整个仓库, 则命令修改为
# sd_scripts.dataset.get_dataset_from_hf(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
# )
# 
# 如果仓库为私有仓库, 需要使用 HuggingFace Token 进行访问 
# sd_scripts.dataset.get_dataset_from_hf(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     hf_token="xxxxxxx",
# )
# 
# 既是私有仓库, 又需要下载里面的某个文件夹中的内容, 则命令修改为
# sd_scripts.dataset.get_dataset_from_hf(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     folder="Nachoneko",
#     hf_token="xxxxxxx",
# )


# 4. 从 ModelScope 仓库导入
# 如果训练集保存在 ModelScope, 可以使用 sd_scripts.dataset.get_dataset_from_ms() 函数从 ModelScope 下载数据集
# 使用格式:
# sd_scripts.dataset.get_dataset_from_ms(
#     local_path=INPUT_DATASET_PATH,  # 下载数据集到哪个路径
#     repo_id="usename/repo_id",      # ModelScope 仓库 ID
#     repo_type="model",              # ModelScope 仓库的类型 (model / dataset / space)
#     folder="folder_in_repo",        # 指定要从 ModelScope 仓库里下载哪个文件夹的内容
#     ms_token="ms_token",            # ModelScope Token, 用于访问私有仓库
#     retry=5,                        # 重试下载的次数, 默认为 3
# )
# 
# 比如在 ModelScope 的仓库为 username/train_data, 仓库类型为 dataset
# 仓库的文件结构如下:
# ├── Nachoneko
# │   ├── 1_nachoneko
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
# │   │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
# │   │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
# │   ├── 2_nachoneko
# │   │       ├── 0(8).txt
# │   │       ├── 0(8).webp
# │   │       ├── 001_2.png
# │   │       └── 001_2.txt
# │   └── 4_nachoneko
# │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
# │           ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
# │           ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
# │           └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# └ aaaki
#   ├── 1_aaaki
#   │   ├── 1.png
#   │   ├── 1.txt
#   │   ├── 11.png
#   │   ├── 11.txt
#   │   ├── 12.png
#   │   └── 12.txt
#   └── 3_aaaki
#       ├── 14.png
#       ├── 14.txt
#       ├── 16.png
#       └── 16.txt
#
# 此时想要下载这个仓库中的 Nachoneko 文件夹的内容, 则下载命令为
# sd_scripts.dataset.get_dataset_from_ms(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     folder="Nachoneko",
# )
# 
# 如果想下载整个仓库, 则命令修改为
# sd_scripts.dataset.get_dataset_from_ms(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
# )
# 
# 如果仓库为私有仓库, 需要使用 HuggingFace Token 进行访问 
# sd_scripts.dataset.get_dataset_from_ms(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     ms_token="xxxxxxx",
# )
# 
# 既是私有仓库, 又需要下载里面的某个文件夹中的内容, 则命令修改为
# sd_scripts.dataset.get_dataset_from_ms(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="username/train_data",
#     repo_type="dataset",
#     folder="Nachoneko",
#     ms_token="xxxxxxx",
# )


# 下载训练集的技巧
# 如果有个 character_aaaki 训练集上传到 HuggingFace 上时结构如下：
# 
#
# HuggingFace_Repo (licyk/sd_training_dataset)
# ├── character_aaaki
# │   ├── 1_aaaki
# │   │   ├── 1.png
# │   │   ├── 1.txt
# │   │   ├── 3.png
# │   │   └── 3.txt
# │   └── 2_aaaki
# │       ├── 4.png
# │       └── 4.txt
# ├── character_robin
# │   └── 1_xxx
# │       ├── 11.png
# │       └── 11.txt
# └── style_pvc
#     └── 5_aaa
#         ├── test.png
#         └── test.txt
#
# 
# 可能有时候不想为训练集中每个子训练集设置不同的重复次数，又不想上传的时候再多套一层文件夹，就把训练集结构调整成了下面的：
# 
#
# HuggingFace_Repo (licyk/sd_training_dataset)
# ├── character_aaaki
# │   ├── 1.png
# │   ├── 1.txt
# │   ├── 3.png
# │   ├── 3.txt
# │   ├── 4.png
# │   └── 4.txt
# ├── character_robin
# │   └── 1_xxx
# │       ├── 11.png
# │       └── 11.txt
# └── style_pvc
#     └── 5_aaa
#         ├── test.png
#         └── test.txt
#
# 
# 此时这个状态的训练集是缺少子训练集和重复次数的，如果直接使用 sd_scripts.dataset.get_dataset_from_hf() 去下载训练集并用于训练将会导致报错
# 不过可以自己再编写一个函数对 sd_scripts.dataset.get_dataset_from_hf() 函数再次封装，自动加上子训练集并设置重复次数
# 
#
# def make_dataset(
#     local_path: Union[str, Path],
#     repo_id: str,
#     repo_type: str,
#     repeat: int,
#     folder: str,
#     hf_token: Optional[str] = None
# ) -> None:
#     import os
#     import shutil
#     origin_dataset_path = os.path.join(local_path, folder)
#     tmp_dataset_path = os.path.join(local_path, f"{repeat}_{folder}")
#     new_dataset_path = os.path.join(origin_dataset_path, f"{repeat}_{folder}")
#     sd_scripts.dataset.get_dataset_from_hf(
#         local_path=local_path,
#         repo_id=repo_id,
#         repo_type=repo_type,
#         folder=folder,
#         hf_token=hf_token
#     )
#     if os.path.exists(origin_dataset_path):
#         echo(f"设置 {folder} 训练集的重复次数为 {repeat}")
#         shutil.move(origin_dataset_path, tmp_dataset_path)
#         shutil.move(tmp_dataset_path, new_dataset_path)
#     else:
#         echo(f"从 {repo_id} 下载 {folder} 失败")
#
# 
# 编写好后，可以去调用这个函数
# 
#
# make_dataset(
#     local_path=INPUT_DATASET_PATH,
#     repo_id="licyk/sd_training_dataset",
#     repo_type="dataset",
#     repeat=3,
#     folder="character_aaaki",
#     hf_token=HF_TOKEN,
# )
#
# 
# 该函数将会把 character_aaaki 训练集下载到 {INPUT_DATASET_PATH} 中，即 /kaggle/dataset
# 文件夹名称为 character_aaaki，并且 character_aaaki 文件夹内继续创建了一个子文件夹作为子训练集，根据 repeat=3 将子训练集的重复次数设置为 3


##########################################################################################
# sd_scripts.clear_up() # 清理输出
echo("sd-scripts 安装完成")


## 模型训练
需自行编写命令，下方有可参考的例子  
4. [[← 上一个单元](#安装环境)|[下一个单元 →](#模型上传)]

In [None]:
echo("进入 sd-scripts 目录")
os.chdir(SD_SCRIPTS_PATH)
print("=" * 50)
echo("训练集目录中的文件列表")
if os.path.exists(INPUT_DATASET_PATH):
    print(f"训练集路径: {INPUT_DATASET_PATH}")
    for i in os.listdir(INPUT_DATASET_PATH):
        print(f":: {i}")
print("=" * 50)
echo("模型目录中的文件列表")
if os.path.exists(SD_MODEL_PATH):
    print(f"模型路径: {SD_MODEL_PATH}")
    for i in os.listdir(SD_MODEL_PATH):
        print(f":: {i}")
print("=" * 50)
echo("使用 sd-scripts 进行模型训练")
##########################################################################################
# 1.
# 运行前需要根据自己的需求更改参数
# 
# 训练参数的设置可参考：
# https://rentry.org/59xed3
# https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file#links-to-usage-documentation
# https://github.com/bmaltais/kohya_ss/wiki/LoRA-training-parameters
# 
# 
# 2.
# 下方被注释的代码选择后使用 Ctrl + / 取消注释
# 
# 
# 3.
# 训练使用的底模会被下载到 SD_MODEL_PATH, 即 /kaggle/sd-models
# 填写底模路径时一般可以通过 --pretrained_model_name_or_path="{SD_MODEL_PATH}/base_model.safetensors" 指定
# 如果需要外挂 VAE 模型可以通过 --vae="{SD_MODEL_PATH}/vae.safetensors" 指定
# 
# 通过 Kaggle Inout 导入的训练集保存在 KAGGLE_INPUT_PATH, 即 /kaggle/input, 运行该笔记时将会把训练集复制进 INPUT_DATASET_PATH, 即 /kaggle/dataset
# 该路径可通过 INPUT_DATASET_PATH 调整
# 如果使用 sd_scripts.dataset.get_dataset() 函数下载训练集, 数据集一般会解压到 INPUT_DATASET_PATH, 这取决于函数第一个参数传入的路径
# 训练集的路径通常要这种结构
# $ tree /kaggle
# kaggle
# └── dataset
#     └── Nachoneko
#         └── 1_gan_cheng
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#             ├── 0(8).txt
#             ├── 0(8).webp
#             ├── 001_2.png
#             ├── 001_2.txt
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 4 directories, 12 files
# 在填写训练集路径时, 应使用 --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko"
# 
# 模型保存的路径通常用 --output_dir="{OUTPUT_PATH}" 指定, 如 --output_dir="{OUTPUT_PATH}/Nachoneko", OUTPUT_PATH 默认设置为 /kaggle/working/model
# 在 Kaggle 的 Output 中可以看到保存的模型, 前提是使用 Kaggle 的 Save Version 运行 Kaggle
# OUTPUT_PATH 也指定了保存模型到 HuggingFace / ModelScope 的功能的上传路径
# 
# --output_name 用于指定保存的模型名字, 如 --output_name="Nachoneko"
# 
# 
# 4.
# Kaggle 的实例最长可运行 12 h, 要注意训练时长不要超过 12 h, 否则将导致训练被意外中断, 并且最后的模型保存功能将不会得到运行
# 如果需要在模型被保存后立即上传到 HuggingFace 进行保存, 可使用启动参数为 sd-scripts 设置自动保存, 具体可阅读 sd-scripts 的帮助信息
# 使用 python train_network.py -h 命令可查询可使用的启动参数, 命令中的 train_network.py 可替换成 sdxl_train_network.py 等
# 
# 
# 5.
# 训练命令的开头为英文的感叹号, 也就是 !, 后面就是 Shell Script 风格的命令
# 每行的最后为反斜杠用于换行, 也就是用 \ 来换行, 并且反斜杠的后面不允许有其他符号, 比如空格等
# 训练命令的每一行之间不能有任何换行空出来, 最后一行不需要反斜杠, 因为最后一行的下一行已经没有训练参数
# 
# 
# 6.
# 如果训练参数是 toml 格式的, 比如从 Akegarasu/lora-scripts 训练器复制来的训练参数
# 可以转换成对应的训练命令中的参数
# 下面列举几种转换例子:
# 
# (1)
# toml 格式:
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 训练命令格式:
# --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 
# (2)
# toml 格式:
# unet_lr = 0.0001
# 训练命令格式:
# --unet_lr=0.0001
# 
# (3)
# toml 格式:
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# 训练命令格式:
# --network_args \
#     conv_dim=100000 \
#     conv_alpha=100000 \
#     algo=lokr \
#     dropout=0 \
#     factor=8 \
#     train_norm=True \
#     preset=full \
# 
# (4)
# toml 格式:
# enable_bucket = true
# 训练命令格式:
# --enable_bucket
# 
# (5)
# toml 格式:
# lowram = false
# 训练命令格式:
# 无对应的训练命令, 也就是不需要填, 因为这个参数的值为 false, 也就是无对应的参数, 如果值为 true, 则对应训练命令中的 --lowram
# 
# 可以根据这个例子去转换 toml 格式的训练参数成训练命令的格式
# 
# 
# 7.
# 如果需要 toml 格式的配置文件来配置训练参数可以使用下面的代码来保存 toml 格式的训练参数
# 
# toml_file_path = os.path.join(WORKSPACE, "train_config.toml")
# toml_content = f"""
# 这里使用 toml 格式编写训练参数, 
# 还可以结合 Python F-Strings 的用法使用前面配置好的变量
# Python F-Strings 的说明: https://docs.python.org/zh-cn/3.13/reference/lexical_analysis.html#f-strings
# toml 的语法可参考: https://toml.io/cn/v1.0.0
# 下面展示训练命令里参数对应的 toml 格式转换
# 
# 
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 对应训练命令中的 --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 
# unet_lr = 0.0001
# 对应训练命令中的 --unet_lr=0.0001
# 
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# 对应下面训练命令中的
# --network_args \
#     conv_dim=100000 \
#     conv_alpha=100000 \
#     algo=lokr \
#     dropout=0 \
#     factor=8 \
#     train_norm=True \
#     preset=full \
# 
# enable_bucket = true
# 对应训练命令中的 --enable_bucket
# 
# lowram = false
# 这个参数的值为 false, 也就是无对应的参数, 如果值为 true, 则对应训练命令中的 --lowram
# """.strip()
# if not os.path.exists(os.path.dirname(toml_file_path)):
#     os.makedirs(toml_file_path, exist_ok=True)
# with open(toml_file_path, "w", encoding="utf8") as file:
#     file.write(toml_content)
# 
# 使用上面的代码将会把训练参数的 toml 配置文件保存在 toml_file_path 路径中, 也就是 {WORKSPACE}/train_config.toml, 即 /kaggle/train_config.toml
# 而原来的训练命令无需再写上训练参数, 只需指定该训练配置文件的路径即可
# 使用 --config_file="{WORKSPACE}/train_config.toml" 来指定
# 
# 
# 8. 
# 如果要查看 sd-script 的命令行参数, 可以加上 -h 后再运行, 此时 sd-script 将显示所有可用的参数
# 
# 
# 9.
# 下方提供了一些训练参数, 可以直接使用, 使用时取消注释后根据需求修改部分参数即可
# 
#              .,@@@@@@@@@].                                          ./@[`....`[\\.                 
#             //\`..  . ...,\@].       .,]]]/O@@@@@@@@\]...       .,]//............\@`               
#           .O`........ .......\\.]]@@@@@@@@[..........,[@@@@\`.*/....=^............/@@`             
#          .O........    .......@@/@@@/`.....               . ,\@\....\`............O@`@             
#          =^...`....          .O@@`.........            .........\@`...[`.,@`....,@^/.@^            
#         .OO`..\....          =/..... ......            ..[@]....,\@@]]]].@@]`..//..@=\^            
#          @O/@`,............=O/......    ...   ....       ...\\.....,@@@`=\@\@@[...=O`/^.           
#          @@\.,@]..]]//[,/@^O=@.............   .\@^...........,@`.....\@@/*\o*O@\.=/.@`             
#          ,@/O`...[OOO`.,@O,\/....././\^....   ..@O` ..\`.......=\.....=\\@@@@@/\@@//               
#            ,@`\].......O^o,/.....@`/=^.....,\...,@^ ...=\...    =\.....,@,@@@@[/@@@/               
#            ..,\@\]]]]O/@.*@.....=^/\^......=@....\O..^..@@`..  ..\@.....,@.\@@\[[O`                
#                .*=@@\@@^.O^...../o^O.......O=^...=@..@..\.\\.   . @@`....,@.\@@@@`                 
# .              ..=@O^=@`,@ .....@@=`......=^.O....@..@^.=^.=@.....=@@.....,\.\@@@@.                
#                .,@@`,O@./^.....=@O/......./^.O... \`.=^.=^..=@...  O=\.....=^.\@@@@`.              
#                ./@`.=^@=@......=@O`....@,/@@.=^...=^.=^.=^.[[\@....=^\^.....@@.\@@@@`              
#               .,@^. @^O/@......=@O.]O`OO.=`\^.....,^.=@.=^....=@...=\.O.....@^\`@@/`               
#                =@ .=@..@^ .....=@/.../@^,/.=@......* =@.=^.....=\..=@`=^....=^ \/\                 
#                /^..=@.,@^ /`...=@.../O@.O...@........O=^=` ,`...@^.=@\=^..] =@..@O`.               
#               ,@...@/.=@. @^...=@../@\@/OOO.=^......=^,O@[.]]@\]/@ =^@`O..O.=@^ =@^                
#               =^...@@.=@..O\....@ //.O@O@@]..@....../^.OO@@@[[@@@@\/^@^O .O.=@@ .@^                
#               @^..=@@.,@.=^@....@@\@@@[[[[[[[\^@^..,/..O..,@@@\..=@@//OO..O./^@. =@                
#               @...=^@^.@.=^=^...=@@`/@@@@@`...*O\..@...[.=@`,@@@`.@`=^@=`.O.@.@. =@.               
#               @^..O.@^ \^=@,\..=@@ @\,@@/@@`..=^..@`.....@@\@@/@@...O.@=^,O=^.@^./@                
#               @@..O.=@.,\=@^O..=`\/@^/@@OO@^..,`,O`.. .. @@/@@\@@..=`=@../^O..@^/O^                
#              .=@^ @..@`=@o@@=^..,.O@@/@@oO@........... ...@^.\/@..=^=@/ =@O. .@\@`.                
#               .@@.@^.@^@^\@@O^..=^,O@@*.................  .......=^/@@^=@@^ .=@`.                  
#               .=O@O^,@^=^.\@^o..=/\,\ .....   .... .....    ...]@O`=@O/@@^   =@                    
#                .=O@O/^==@@`O@O^.=@.\`\`....      .  ........ ......//@.@`.   =^                    
#                  ,O@@^.O..\@@@^.=@...[O@`..      .  ........ .....//.@@,\   .@^                    
#                   .@/@@@]../@@^..@@\........     ..,/`=@/@`.....,@^..=^ =` .=@.                    
#                   =/..O... @^=\. O@@@@\....... ...//.,@..@O].,/@`=\..=@..@..@^                     
#                  ,/..O....=/=/@ .=@@@@@@@@].....//.,O@`.//.@@@@@..@^..@`.=\/O`.                    
#                 ,@../`....O=/.@...@@@@@@@@@@@@@/../\@..//.=@@@@\. @@..=\..@^/.                     
#                ,@`.=`....=@/..@...\@@@@@@@@.. O..,@/..=@ .O=@@@^. @/@..@^..@`.                     
#               ,@`.=^....,@/..=O^..,@@.[@@@@,@]@../^..=@../^=@@@...@.,\.=@`..@`                     
#              ,@..=/.   .@/...O=@...@@....,@@...,[@\.,@`..@..@@/..,@..,\.@@...@..                   
#              @`.,/.....@/...=`O@^..,@...../`.......,\@]..@..O@\]]/\`..,\,@^..,@`                   
#             =^..@...../@...,^/O@@...=@`...@............\@` /`,\,@`.=\.,\@=@`..,@.                  
#            ,@../`....@\`/@``,`]/@^...O,\/\@]..............\\..=@`\\ ,@@@@@@@....@`.                
#            O`.=^....@^O@^.@@@@@@@\....\@^=@@@@@\] ..........,@`\@\.@`=@@@@@@\....@`..              
#           =/..O...,@O/@^.@@@@@@@@@`...=/.@@@@@@@@@@@].........,@@/@`,@/@@@@O\^....@`..             
#           /^.O.../@O^@^./@@@@@@@@@\...@`=@@@@@@@@@@@@@\.......@`=\//@`,@@@@@.@`....\`...           
#         .,@.=^../`@@\@.=@@@@@@@@@@@^.=@.@@@@@@@@@@@@@@@@@`...@` =\\==`@`\@@@^.@.....\^...          
#       ../\^,@.,/.=@/=/,@@@@@@@@@@@@\ @^=@@@@@@@@@@@@@@@@@@@]@@@@@@@@@o\@`.@@\.,@.....\\...         
#       =/.@^@`/`..@@^@^=@@@@@@@@@@@@@\@.@@@@@@@@@@@@@@@@@@@@@@@@O@@@@@\/.,/.@@\.,@.....,@`..        
#     ,O`.,@=@/...=@@.@^O@@@@@@@@@@@@@@^=@@@@@@@@@@@@@@@@@@@@@@@@@@O@@@^ /@@.,@/@`.@`.....\\...      
#  ..=^...=^@^....@OO,@^/@@@@@@@@@@@@\@.@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@\@@@@@`=\.\^.\`.....,@`..    
# 
# 炼丹就不存在什么万能参数的, 可能下面给的参数里有的参数训练出来的效果很好, 有的效果就一般
# 训练参数还看训练集呢, 同一套参数在不同训练集上效果都不一样, 可能好可能坏 (唉, 被这训练参数折磨过好多次)
# 虽然说一直用同个效果不错的参数可能不会出现特别坏的结果吧
# 还有好的训练集远比好的训练参数更重要
# 好的训练集真的, 真的, 真的非常重要
# 再好的参数, 训练集烂也救不回来
# 
# 
# 10.
# 建议先改改训练集路径的参数就开始训练, 跑通训练了再试着改其他参数
# 还有我编写的训练参数不一定是最好的, 所以需要自己去摸索这些训练参数是什么作用的, 再去修改
# 其实有些参数我自己也调不明白, 但是很多时候跑出来效果还不错
# 为什么效果好, 分からない, 这东西像个黑盒, 有时候就觉得神奇呢
##########################################################################################


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数在 animagine-xl-3.1.safetensors 测试, 大概在 30 ~ 40 Epoch 有比较好的效果 (在 36 Epoch 出好效果的概率比较高)
#
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
#
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset，可以调整训练网络的大小
# 该值默认为 full，而使用 attn-mlp 可以得到更小的 LoRA 但几乎不影响 LoRA 效果
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="attn-mlp" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset，可以调整训练网络的大小
# 该值默认为 full，而使用 attn-mlp 可以得到更小的 LoRA 但几乎不影响 LoRA 效果
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 当 weight_decay 设置为 0.05 时, 大概在 38 Epoch 有比较好的效果
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="attn-mlp" \
#     --optimizer_args \
#         weight_decay=0.1 \
#         betas="0.9,0.95" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# (自己在用的)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="full" \
#     --optimizer_args \
#         weight_decay=0.05 \
#         betas="0.9,0.95" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# (自己在用的)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好 (最好还是 full 吧, 其他的预设效果不是很好)
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# 测试的时候发现 --debiased_estimation_loss 对于训练效果的有些改善
# 这里有个对比: https://licyk.netlify.app/2025/02/10/debiased_estimation_loss_in_stable_diffusion_model_training
# 启用后能提高拟合速度和颜色表现吧, 画风的学习能学得更好
# 但, 肢体崩坏率可能会有点提高, 不过有另一套参数去优化了一下这个问题, 貌似会好一点
# 可能画风会弱化, 所以不是很确定哪个比较好用, 只能自己试了
# debiased estimation loss 有个相关的论文可以看看: https://arxiv.org/abs/2310.08442
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="full" \
#     --optimizer_args \
#         weight_decay=0.05 \
#         betas="0.9,0.95" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --debiased_estimation_loss \
#     --vae_batch_size=4 \
#     --full_fp16


# (自己在用的)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好 (最好还是 full 吧, 其他的预设效果不是很好)
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# 测试的时候发现 --debiased_estimation_loss 对于训练效果的有些改善
# 这里有个对比: https://licyk.netlify.app/2025/02/10/debiased_estimation_loss_in_stable_diffusion_model_training
# 启用后能提高拟合速度和颜色表现吧, 画风的学习能学得更好
# 但, 肢体崩坏率可能会有点提高, 不过有另一套参数去优化了一下这个问题, 貌似会好一点
# 可能画风会弱化, 所以不是很确定哪个比较好用, 只能自己试了
# debiased estimation loss 有个相关的论文可以看看: https://arxiv.org/abs/2310.08442
# 
# 加上 v 预测参数进行训练, 提高模型对暗处和亮处的表现效果, 并且能让模型能够直出纯黑色背景, 画面也更干净
# 相关的论文可以看看: https://arxiv.org/abs/2305.08891
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/noobaiXLNAIXL_vPred10Version.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="full" \
#     --optimizer_args \
#         weight_decay=0.05 \
#         betas="0.9,0.95" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --debiased_estimation_loss \
#     --vae_batch_size=4 \
#     --zero_terminal_snr \
#     --v_parameterization \
#     --scale_v_pred_loss_like_noise_pred \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好 (最好还是 full 吧, 其他的预设效果不是很好)
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# 测试的时候发现 --debiased_estimation_loss 对于训练效果的有些改善
# 这里有个对比: https://licyk.netlify.app/2025/02/10/debiased_estimation_loss_in_stable_diffusion_model_training
# 启用后能提高拟合速度和颜色表现吧, 画风的学习能学得更好
# 把学习率调度器 constant_with_warmup 换成了cosine, 稍微缓解了一下拟合速度过快导致肢体崩坏率增大的问题
# 如果学的效果不够好, 拟合度不够高, 可以适当增加 --max_train_epochs 的值或者提高训练集的重复次数
# debiased estimation loss 有个相关的论文可以看看: https://arxiv.org/abs/2310.08442
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine" \
#     --lr_warmup_steps=0 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#         preset="full" \
#     --optimizer_args \
#         weight_decay=0.05 \
#         betas="0.9,0.95" \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --debiased_estimation_loss \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 人物 LoRA, 使用多卡进行训练
# 适合极少图或者单图训练集进行人物 LoRA 训练
# 训练集使用打标器进行打标后, 要保留的人物的哪些特征, 就把对应的 Tag 删去, 触发词可加可不加
# 
# 该参数使用 scale_weight_norms 降低过拟合程度, 进行训练时, 可在控制台输出看到 Average key norm 这个值
# 通常测试 LoRA 时就测试 Average key norm 值在 0.5 ~ 0.9 之间的保存的 LoRA 模型
# max_train_epochs 设置为 200, save_every_n_epochs 设置为 1 以为了更好的挑选最好的结果
# 
# 可使用该方法训练一个人物 LoRA 模型用于生成人物的图片, 并将这些图片重新制作成训练集
# 再使用不带 scale_weight_norms 的训练参数进行训练, 通过这种方式, 可以在图片极少的情况下得到比较好的 LoRA 模型
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=200 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --scale_weight_norms=1 \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用 rtx 4060 8g laptop 进行训练, 通过 fp8 降低显存占用
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# !python "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=3 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0002 \
#     --unet_lr=0.0002 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="AdamW8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --fp8_base


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 参数加上了 noise_offset, 可以提高暗处和亮处的表现, 一般使用设置成 0.05 ~ 0.1
# 但 noise_offset 可能会导致画面泛白, 光影效果变差
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --noise_offset=0.1 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 人物 LoRA, 使用多卡进行训练
# 参数中使用了 --scale_weight_norms, 用于提高泛化性, 但可能会造成拟合度降低
# 如果当训练人物 LoRA 的图片较多时, 可考虑删去该参数
# 当训练人物 LoRA 的图片较少, 为了避免过拟合, 就可以考虑使用 --scale_weight_norms 降低过拟合概率
#
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/robin" \
#     --output_name="robin_1" \
#     --output_dir="{OUTPUT_PATH}/robin_1" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --scale_weight_norms=1 \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 人物 LoRA, 使用多卡进行训练
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/murasame_(senren)_3" \
#     --output_name="murasame_(senren)_10" \
#     --output_dir="{OUTPUT_PATH}/murasame_(senren)_10" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00004 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --scale_weight_norms=1 \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用单卡进行训练 (Kaggle 的单 Tesla P100 性能不如双 Tesla T4, 建议使用双卡训练)
# !python "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/rafa" \
#     --output_name="rafa_1" \
#     --output_dir="{OUTPUT_PATH}/rafa" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=4096 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00007 \
#     --unet_lr=0.00007 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 SD1.5 画风 LoRA, 使用双卡进行训练
# 使用 NovelAI 1 模型进行训练
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animefull-final-pruned.safetensors" \
#     --vae="{SD_MODEL_PATH}/vae-ft-mse-840000-ema-pruned.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/sunfish" \
#     --output_name="nai1-sunfish_5" \
#     --output_dir="{OUTPUT_PATH}/nai1-sunfish_5" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="768,768" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1024 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=12 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00024 \
#     --unet_lr=0.00024 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


# 使用 lokr 算法训练 SD1.5 多画风(多概念) LoRA, 使用双卡进行训练
# 使用 NovelAI 1 模型进行训练
# 
# 在 SD1.5 中训练 Text Encoder 可以帮助模型更好的区分不同的画风(概念)
# 
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/train_network.py" \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animefull-final-pruned.safetensors" \
#     --vae="{SD_MODEL_PATH}/vae-ft-mse-840000-ema-pruned.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/sunfish" \
#     --output_name="nai1-sunfish_5" \
#     --output_dir="{OUTPUT_PATH}/nai1-sunfish_5" \
#     --wandb_run_name="Nachoneko" \
#     --log_tracker_name="lora-Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="768,768" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1024 \
#     --bucket_reso_steps=64 \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=1 \
#     --max_train_epochs=40 \
#     --train_batch_size=12 \
#     --gradient_checkpointing \
#     --learning_rate=0.00028 \
#     --unet_lr=0.00028 \
#     --text_encoder_lr=0.000015 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="{LOG_MODULE}" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --vae_batch_size=4 \
#     --full_fp16


##########################################################################################
# 下面是 toml 格式的训练命令, 根据上面的训练命令做了格式转换
# 只弄了自己常用的训练参数, 其他的参照下面的例子来改吧
# 
# toml 转换格式如下 (在最前面已经写过一次了, 再写一遍方便对照):
# (1)
# toml 格式:
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 训练命令格式:
# --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# 
# (2)
# toml 格式:
# unet_lr = 0.0001
# 训练命令格式:
# --unet_lr=0.0001
# 
# (3)
# toml 格式:
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# 训练命令格式:
# --network_args \
#     conv_dim=100000 \
#     conv_alpha=100000 \
#     algo=lokr \
#     dropout=0 \
#     factor=8 \
#     train_norm=True \
#     preset=full \
# 
# (4)
# toml 格式:
# enable_bucket = true
# 训练命令格式:
# --enable_bucket
# 
# (5)
# toml 格式:
# lowram = false
# 训练命令格式:
# 无对应的训练命令, 也就是不需要填, 因为这个参数的值为 false, 也就是无对应的参数, 如果值为 true, 则对应训练命令中的 --lowram
##########################################################################################



# (自己在用的, toml 格式的版本)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# toml_file_path = os.path.join(WORKSPACE, "train_config.toml")
# toml_content = f"""
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# vae = "{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors"
# train_data_dir = "{INPUT_DATASET_PATH}/Nachoneko"
# output_name = "Nachoneko_2"
# output_dir = "{OUTPUT_PATH}/Nachoneko"
# wandb_run_name = "Nachoneko"
# log_tracker_name = "lora-Nachoneko"
# prior_loss_weight = 1
# resolution = "1024,1024"
# enable_bucket = true
# min_bucket_reso = 256
# max_bucket_reso = 4096
# bucket_reso_steps = 64
# save_model_as = "safetensors"
# save_precision = "fp16"
# save_every_n_epochs = 1
# max_train_epochs = 40
# train_batch_size = 6
# gradient_checkpointing = true
# network_train_unet_only = true
# learning_rate = 0.0001
# unet_lr = 0.0001
# text_encoder_lr = 0.00001
# lr_scheduler = "constant_with_warmup"
# lr_warmup_steps = 100
# optimizer_type = "Lion8bit"
# network_module = "lycoris.kohya"
# network_dim = 100000
# network_alpha = 100000
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# optimizer_args = [
#     "weight_decay=0.05",
#     "betas=0.9,0.95",
# ]
# log_with = "{LOG_MODULE}"
# logging_dir = "{OUTPUT_PATH}/logs"
# caption_extension = ".txt"
# shuffle_caption = true
# keep_tokens = 0
# max_token_length = 225
# seed = 1337
# mixed_precision = "fp16"
# xformers = true
# cache_latents = true
# cache_latents_to_disk = true
# persistent_data_loader_workers = true
# vae_batch_size = 4
# full_fp16 = true
# """.strip()
# if not os.path.exists(os.path.dirname(toml_file_path)):
#     os.makedirs(toml_file_path, exist_ok=True)
# with open(toml_file_path, "w", encoding="utf8") as file:
#     file.write(toml_content)
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --config_file="{toml_file_path}"


# (自己在用的, toml 格式的版本)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好 (最好还是 full 吧, 其他的预设效果不是很好)
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# 测试的时候发现 --debiased_estimation_loss 对于训练效果的有些改善
# 这里有个对比: https://licyk.netlify.app/2025/02/10/debiased_estimation_loss_in_stable_diffusion_model_training
# 启用后能提高拟合速度和颜色表现吧, 画风的学习能学得更好
# 但, 肢体崩坏率可能会有点提高, 不过有另一套参数去优化了一下这个问题, 貌似会好一点
# 可能画风会弱化, 所以不是很确定哪个比较好用, 只能自己试了
# debiased estimation loss 有个相关的论文可以看看: https://arxiv.org/abs/2310.08442
# 
# toml_file_path = os.path.join(WORKSPACE, "train_config.toml")
# toml_content = f"""
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors"
# vae = "{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors"
# train_data_dir = "{INPUT_DATASET_PATH}/Nachoneko"
# output_name = "Nachoneko_2"
# output_dir = "{OUTPUT_PATH}/Nachoneko"
# wandb_run_name = "Nachoneko"
# log_tracker_name = "lora-Nachoneko"
# prior_loss_weight = 1
# resolution = "1024,1024"
# enable_bucket = true
# min_bucket_reso = 256
# max_bucket_reso = 4096
# bucket_reso_steps = 64
# save_model_as = "safetensors"
# save_precision = "fp16"
# save_every_n_epochs = 1
# max_train_epochs = 40
# train_batch_size = 6
# gradient_checkpointing = true
# network_train_unet_only = true
# learning_rate = 0.0001
# unet_lr = 0.0001
# text_encoder_lr = 0.00001
# lr_scheduler = "constant_with_warmup"
# lr_warmup_steps = 100
# optimizer_type = "Lion8bit"
# network_module = "lycoris.kohya"
# network_dim = 100000
# network_alpha = 100000
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# optimizer_args = [
#     "weight_decay=0.05",
#     "betas=0.9,0.95",
# ]
# log_with = "{LOG_MODULE}"
# logging_dir = "{OUTPUT_PATH}/logs"
# caption_extension = ".txt"
# shuffle_caption = true
# keep_tokens = 0
# max_token_length = 225
# seed = 1337
# mixed_precision = "fp16"
# xformers = true
# cache_latents = true
# cache_latents_to_disk = true
# persistent_data_loader_workers = true
# debiased_estimation_loss = true
# vae_batch_size = 4
# full_fp16 = true
# """.strip()
# if not os.path.exists(os.path.dirname(toml_file_path)):
#     os.makedirs(toml_file_path, exist_ok=True)
# with open(toml_file_path, "w", encoding="utf8") as file:
#     file.write(toml_content)
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --config_file="{toml_file_path}"


# (自己在用的, toml 格式的版本)
# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
# 
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 如果训练集的图比较少, 重复的图较多, 重复次数较高, 可能容易造成过拟合
# 
# 在 --network_args 设置了 preset, 可以调整训练网络的大小
# 该值默认为 full, 如果使用 attn-mlp 可以得到更小的 LoRA, 但对于难学的概念使用 full 效果会更好 (最好还是 full 吧, 其他的预设效果不是很好)
# 
# 可用的预设可阅读文档: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/docs/Preset.md
# 该预设也可以自行编写并指定, 编写例子可查看: https://github.com/KohakuBlueleaf/LyCORIS/blob/main/example_configs/preset_configs/example.toml
# 
# 使用 --optimizer_args 设置 weight_decay 和 betas, 更高的 weight_decay 可以降低拟合程度, 减少过拟合
# 如果拟合程度不够高, 可以提高 --max_train_epochs 的值, 或者适当降低 weight_decay 的值, 可自行测试
# 较小的训练集适合使用较小的值, 如 0.05, 较大的训练集适合用 0.1
# 大概 34 Epoch 会有比较好的效果吧, 不过不好说, 看训练集
# 自己测的时候大概在 26~40 Epoch 之间会出现好结果, 测试了很多炉基本都在这个区间里, 但也不排除意外情况 (训练参数这东西好麻烦啊, 苦い)
# 
# 测试的时候发现 --debiased_estimation_loss 对于训练效果的有些改善
# 这里有个对比: https://licyk.netlify.app/2025/02/10/debiased_estimation_loss_in_stable_diffusion_model_training
# 启用后能提高拟合速度和颜色表现吧, 画风的学习能学得更好
# 但, 肢体崩坏率可能会有点提高, 不过有另一套参数去优化了一下这个问题, 貌似会好一点
# 可能画风会弱化, 所以不是很确定哪个比较好用, 只能自己试了
# debiased estimation loss 有个相关的论文可以看看: https://arxiv.org/abs/2310.08442
# 
# 加上 v 预测参数进行训练, 提高模型对暗处和亮处的表现效果, 并且能让模型能够直出纯黑色背景, 画面也更干净
# 相关的论文可以看看: https://arxiv.org/abs/2305.08891
# 
# toml_file_path = os.path.join(WORKSPACE, "train_config.toml")
# toml_content = f"""
# pretrained_model_name_or_path = "{SD_MODEL_PATH}/noobaiXLNAIXL_vPred10Version.safetensors"
# vae = "{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors"
# train_data_dir = "{INPUT_DATASET_PATH}/Nachoneko"
# output_name = "Nachoneko_2"
# output_dir = "{OUTPUT_PATH}/Nachoneko"
# wandb_run_name = "Nachoneko"
# log_tracker_name = "lora-Nachoneko"
# prior_loss_weight = 1
# resolution = "1024,1024"
# enable_bucket = true
# min_bucket_reso = 256
# max_bucket_reso = 4096
# bucket_reso_steps = 64
# save_model_as = "safetensors"
# save_precision = "fp16"
# save_every_n_epochs = 1
# max_train_epochs = 40
# train_batch_size = 6
# gradient_checkpointing = true
# network_train_unet_only = true
# learning_rate = 0.0001
# unet_lr = 0.0001
# text_encoder_lr = 0.00001
# lr_scheduler = "constant_with_warmup"
# lr_warmup_steps = 100
# optimizer_type = "Lion8bit"
# network_module = "lycoris.kohya"
# network_dim = 100000
# network_alpha = 100000
# network_args = [
#     "conv_dim=100000",
#     "conv_alpha=100000",
#     "algo=lokr",
#     "dropout=0",
#     "factor=8",
#     "train_norm=True",
#     "preset=full",
# ]
# optimizer_args = [
#     "weight_decay=0.05",
#     "betas=0.9,0.95",
# ]
# log_with = "{LOG_MODULE}"
# logging_dir = "{OUTPUT_PATH}/logs"
# caption_extension = ".txt"
# shuffle_caption = true
# keep_tokens = 0
# max_token_length = 225
# seed = 1337
# mixed_precision = "fp16"
# xformers = true
# cache_latents = true
# cache_latents_to_disk = true
# persistent_data_loader_workers = true
# debiased_estimation_loss = true
# vae_batch_size = 4
# zero_terminal_snr = true
# v_parameterization = true
# scale_v_pred_loss_like_noise_pred = true
# full_fp16 = true
# """.strip()
# if not os.path.exists(os.path.dirname(toml_file_path)):
#     os.makedirs(toml_file_path, exist_ok=True)
# with open(toml_file_path, "w", encoding="utf8") as file:
#     file.write(toml_content)
# !python -m accelerate.commands.launch \
#     --num_cpu_threads_per_process=1 \
#     --multi_gpu \
#     --num_processes=2 \
#     "{SD_SCRIPTS_PATH}/sdxl_train_network.py" \
#     --config_file="{toml_file_path}"



##########################################################################################
os.chdir(WORKSPACE)
echo("离开 sd-scripts 目录")
echo("模型训练结束")


## 模型上传
通常不需要修改该单元内容  
5. [← 上一个单元](#模型训练)

In [None]:
# 模型上传到 HuggingFace / ModelScope, 通常不需要修改, 修改参数建议通过上方的参数配置单元进行修改

# 使用 HuggingFace 上传模型
if USE_HF_TO_SAVE_MODEL:
    echo("使用 HuggingFace 保存模型")
    sd_scripts.repo_manager.push_file_to_huggingface(
        hf_access_token=HF_TOKEN,           # HuggingFace Token
        repo_id=HF_REPO_ID,                 # HuggingFace 仓库地址
        repo_type=HF_REPO_TYPE,             # HuggingFace 仓库种类
        visibility=HF_REPO_VISIBILITY,      # 当尝试创建仓库时设置仓库的可见性
        upload_path=OUTPUT_PATH             # 要上传文件的目录
    )

# 使用 ModelScope 上传模型
if USE_MS_TO_SAVE_MODEL:
    echo("使用 ModelScope 保存模型")
    if USE_NEW_MS_UPLOADER:
        echo(f"使用 ModelScope API 模式")
        sd_scripts.repo_manager.push_file_to_modelscope(
            ms_access_token=MS_TOKEN,       # Modelscope Token
            repo_id=MS_REPO_ID,             # Modelscope 的仓库地址
            repo_type=MS_REPO_TYPE,         # ModelScope 仓库的种类
            visibility=MS_REPO_VISIBILITY,  # 当尝试创建仓库时设置仓库的可见性
            upload_path=OUTPUT_PATH         # 要上传文件的目录
        )
    else:
        echo(f"使用 Git 模式")
        # 配置 Git
        sd_scripts.repo_manager.set_git_config(
            email=GIT_USER_EMAIL,
            username=GIT_USER_NAME
        )
        # 上传模型
        sd_scripts.repo_manager.push_file_to_modelscope_legacy(
            ms_access_token=MS_TOKEN,       # Modelscope Token
            repo_id=MS_REPO_ID,             # Modelscope 的仓库地址
            repo_type=MS_REPO_TYPE,         # ModelScope 仓库的种类
            visibility=MS_REPO_VISIBILITY,  # 当尝试创建仓库时设置仓库的可见性
            work_path=WORKSPACE,            # 脚本工作目录, 仓库将克隆至该文件夹中
            upload_path=OUTPUT_PATH         # 要上传文件的目录
        )
