# SD Scripts Kaggle
#### Created by [licyk](https://github.com/licyk)

Jupyter Notebook 仓库：[licyk/sd-webui-all-in-one](https://github.com/licyk/sd-webui-all-in-one)

一个在 [Kaggle](https://www.kaggle.com) 部署 [sd-scripts](https://github.com/kohya-ss/sd-scripts) 的 Jupyter Notebook。

使用时请按顺序运行笔记单元。

## 提示：
1. 可以将训练数据上传至`kaggle/input`文件夹，运行安装时将会把训练数据放置`/kaggle/dataset`文件夹中。
2. 训练需要的模型将下载至`/kaggle/sd-scripts/sd-models`文件夹中。
3. 推荐将训练输出的模型路径改为`kaggle/working`文件夹，方便下载。
4. 训练代码的部分需要根据自己的需求进行更改。
5. 推荐使用 Kaggle 的 `Save Version` 的功能运行笔记，可让 Kaggle 笔记在无人值守下保持运行，直至所有单元运行完成。
6. 如果有 [HuggingFace](https://huggingface.co) 账号或者 [ModelScope](https://modelscope.cn) 账号，可通过填写 Token 和仓库名后实现自动上传训练好的模型，仓库需要手动创建。
7. 进入 Kaggle 笔记后，在 Kaggle 的右侧栏可以调整 kaggle 笔记的设置，也可以上传训练集等。注意，在 Kaggle 笔记的`Session options`->`ACCELERATOR`中，需要选择`GPU T4 x 2`，才能使用 GPU 进行模型训练。
8. [`功能初始化`](#功能初始化)和[`模型上传`](#模型上传)单元通常不需要修改。

### 功能初始化
1. [[下一个单元 →](#参数配置)]

In [None]:
# 初始化功能, 不需要修改

# 消息格式输出
def echo(*args):
    for i in args:
        print(f":: {i}")


# ARIA2
class ARIA2:
    WORKSPACE = ""
    WORKFOLDER = ""


    def __init__(self, workspace, workfolder) -> None:
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    # 下载器
    def aria2(self, url, path, filename):
        import os
        if not os.path.exists(path + "/" + filename):
            echo(f"开始下载 {filename} ，路径: {path}/{filename}")
            !aria2c --console-log-level=error -c -x 16 -s 16 "{url}" -d "{path}" -o "{filename}"
            if os.path.exists(path + "/" + filename) and not os.path.exists(path + "/" + filename + ".aria2"):
                echo(f"{filename} 下载完成")
            else:
                echo(f"{filename} 下载中断")
        else:
            if os.path.exists(path + "/" + filename + ".aria2"):
                echo(f"开始下载 {filename} ，路径: {path}/{filename}")
                !aria2c --console-log-level=error -c -x 16 -s 16 "{url}" -d "{path}" -o "{filename}"
                if os.path.exists(path + "/" + filename) and not os.path.exists(path + "/" + filename + ".aria2"):
                    echo(f"{filename} 下载完成")
                else:
                    echo(f"{filename} 下载中断")
            else:
                echo(f"{filename} 文件已存在，路径: {path}/{filename}")


    # 大模型下载
    def get_sd_model(self, url, filename):
        pass


    # vae模型下载
    def get_vae_model(self, url, filename):
        pass


# GIT
class GIT:
    WORKSPACE = ""
    WORKFOLDER = ""


    def __init__(self, workspace, workfolder) -> None:
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    # 检测要克隆的项目是否存在于指定路径
    def exists(self, addr=None, path=None, name=None):
        import os
        if addr is not None:
            if path is None and name is None:
                path = os.getcwd() + "/" + addr.split("/").pop().split(".git", 1)[0]
            elif path is None and name is not None:
                path = os.getcwd() + "/" + name
            elif path is not None and name is None:
                path = os.path.normpath(path) + "/" + addr.split("/").pop().split(".git", 1)[0]

        if os.path.exists(path):
            return True
        else:
            return False


    # 克隆项目
    def clone(self, addr, path=None, name=None):
        import os
        repo = addr.split("/").pop().split(".git", 1)[0]
        if not self.exists(addr, path, name):
            echo(f"开始下载 {repo}")
            if path is None and name is None:
                path = os.getcwd()
                name = repo
            elif path is not None and name is None:
                name = repo
            elif path is None and name is not None:
                path = os.getcwd()
            !git clone {addr} "{path}/{name}" --recurse-submodules
        else:
            echo(f"{repo} 已存在")



# ENV
class ENV:
    WORKSPACE = ""
    WORKFOLDER = ""


    def __init__(self, workspace, workfolder) -> None:
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    # 准备ipynb笔记自身功能的依赖
    def prepare_env_depend(self, use_uv=False):
        pip_mirror = "--index-url https://pypi.python.org/simple --find-links https://download.pytorch.org/whl/cu121/torch_stable.html"

        echo("安装自身组件依赖")
        !pip install uv {pip_mirror}
        if use_uv:
            !uv pip install huggingface_hub modelscope {pip_mirror} --system --quiet
        else:
            !pip install huggingface_hub modelscope {pip_mirror}
        !apt update
        !apt install aria2 google-perftools p7zip-full unzip -y


    # 安装pytorch和xformers
    def prepare_torch(self, torch_ver, xformers_ver, use_uv=False):
        pip_mirror = "--index-url https://pypi.python.org/simple --find-links https://download.pytorch.org/whl/cu121/torch_stable.html"
        if use_uv:
            if torch_ver != "":
                echo("安装 PyTorch")
                !uv pip install {torch_ver} {pip_mirror} --system --quiet
            if xformers_ver != "":
                echo("安装 xFormers")
                !uv pip install {xformers_ver} {pip_mirror} --no-deps --system --quiet
        else:
            if torch_ver != "":
                echo("安装 PyTorch")
                !pip install {torch_ver} {pip_mirror}
            if xformers_ver != "":
                echo("安装 xFormers")
                !pip install {xformers_ver} {pip_mirror} --no-deps
    

    # 安装requirements.txt依赖
    def install_requirements(self, path, use_uv=False):
        import os
        pip_mirror = "--index-url https://pypi.python.org/simple --find-links https://download.pytorch.org/whl/cu121/torch_stable.html"
        if os.path.exists(path):
            echo("安装依赖")
            if use_uv:
                !uv pip install -r "{path}" {pip_mirror} --system --quiet
            else:
                !pip install -r "{path}" {pip_mirror}
        else:
            echo("依赖文件路径为空")


    # python软件包安装
    # 可使用的操作:
    # 安装: install -> install
    # 仅安装: install_single -> install --no-deps
    # 强制重装: force_install -> install --force-reinstall
    # 仅强制重装: force_install_single -> install --force-reinstall --no-deps
    # 更新: update -> install --upgrade
    # 卸载: uninstall -y
    def py_pkg_manager(self, pkg, type=None, use_uv=False):
        pip_mirror = "--index-url https://pypi.python.org/simple --find-links https://download.pytorch.org/whl/cu121/torch_stable.html"

        if type == "install":
            func = "install"
            args = ""
        elif type == "install_single":
            func = "install"
            args = "--no-deps"
        elif type == "force_install":
            func = "install"
            args = "--force-reinstall"
        elif type == "force_install_single":
            func = "install"
            args = "install --force-reinstall --no-deps"
        elif type == "update":
            func = "install"
            args = "--upgrade"
        elif type == "uninstall":
            func = "uninstall"
            args = "-y"
            pip_mirror = ""
        else:
            echo(f"未知操作: {type}")
            return
        if use_uv:
            echo(f"执行操作: uv pip {func} {pkg} {args} {pip_mirror} --system --quiet")
            !uv pip {func} {pkg} {args} {pip_mirror} --system --quiet
        else:
            echo(f"执行操作: pip {func} {pkg} {args} {pip_mirror}")
            !pip {func} {pkg} {args} {pip_mirror}


    # 配置内存优化
    def tcmalloc(self):
        echo("配置内存优化")
        import os
        os.environ["LD_PRELOAD"] = "/usr/lib/x86_64-linux-gnu/libtcmalloc_minimal.so.4"



# MANAGER
class MANAGER:
    WORKSPACE = ""
    WORKFOLDER = ""


    def __init__(self, workspace, workfolder) -> None:
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    # 清理ipynb笔记的输出
    def clear_up(self, opt):
        from IPython.display import clear_output
        clear_output(wait=opt)


    # 检查gpu是否可用
    def check_gpu(self):
        echo("检测 GPU 是否可用")
        import tensorflow as tf
        echo(f"TensorFlow 版本: {tf.__version__}")
        if tf.test.gpu_device_name():
            echo("GPU 可用")
        else:
            echo("GPU 不可用")
            raise Exception("\n没有使用GPU，请在代码执行程序-更改运行时类型-设置为GPU！\n如果不能使用GPU，建议更换账号！")



class REPO_MANAGER:
    def __init__(self) -> None:
        pass

    # 获取文件夹中所有的文件的绝对路径
    def get_all_file(self, directory):
        import os
        file_list = []
        for dirname, _, filenames in os.walk(directory):
            for filename in filenames:
                file_list.append(os.path.join(dirname, filename))
        return file_list


    # ModelScope
    # 检测是否存在于仓库中
    def is_file_exists_in_ms_repo(self, upload_file, work_path, repo):
        import os
        repo_file = os.path.join(work_path, repo.split("/").pop(), upload_file)
        if os.path.exists(repo_file):
            return True
        else:
            return False


    # 克隆仓库
    def clone_modelscope_without_lfs(self, ms_access_token, repo, work_path):
        import os
        # 禁用 Git LFS
        os.environ["GIT_LFS_SKIP_SMUDGE"] = "1"
        !git lfs uninstall

        # 本地存在仓库时进行删除
        repo_name = repo.split("/").pop()
        path = os.path.join(work_path, repo_name)
        if os.path.exists(path):
            !rm -rf "{path}"

        # 下载仓库并启用 Git LFS
        repo_url = f"https://oauth2:{ms_access_token}@www.modelscope.cn/{repo}.git"
        !git clone "{repo_url}" "{path}"
        os.environ["GIT_LFS_SKIP_SMUDGE"] = "0"
        !git lfs install


    # 上传文件至 ModelScope
    def push_file_to_modelscope(self, ms_access_token, repo, work_path, upload_path):
        import os
        from modelscope.hub.api import HubApi
        if repo.split("/").pop() == upload_path.split("/").pop():
            echo("本地要上传的仓库名称与要上传到的仓库的名称相同, 这将导致本地要上传的仓库被自动删除")
            return

        api = HubApi()
        try:
            ms_access_token = api.login(ms_access_token)[0] # 将 ModelScope Token 转为 ModelScope Git Token
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败: ", e)
            return

        os.chdir(work_path)
        count = 0
        upload_file_lists = self.get_all_file(upload_path) # 原文件的路径列表

        echo(f"将文件上传至 ModelScope:: {upload_path} -> {os.path.join(work_path, repo.split('/').pop())}")
        count = 0
        sum = len(upload_file_lists)
        for upload_file in upload_file_lists:
            count += 1

            echo(f"[{count}/{sum}]:: 克隆仓库到 {work_path}")
            self.clone_modelscope_without_lfs(ms_access_token, repo, work_path)
            rel_upload_file = os.path.relpath(upload_file, upload_path) # 原文件相对路径
            repo_path = os.path.join(work_path, repo.split("/").pop()) # 仓库的绝对路径
            echo(f"[{count}/{sum}]:: 要上传的文件的相对路径: {rel_upload_file}")
            echo(f"[{count}/{sum}]:: 绝对路径: {upload_file}")
            echo(f"[{count}/{sum}]:: 仓库地址: {repo_path}")

            # 检测文件是否存在于仓库中
            if self.is_file_exists_in_ms_repo(rel_upload_file, work_path, repo):
                !rm -rf "{repo_path}"
                echo(f"[{count}/{sum}]:: {os.path.basename(upload_file)} 已存在于仓库中")
            else:
                # 为仓库创建对应的文件夹
                p_path = os.path.dirname(os.path.join(work_path, repo.split("/").pop(), rel_upload_file)) # 原文件到仓库中后对应的父文件夹
                if not os.path.exists(p_path):
                    echo(f"[{count}/{sum}]:: 创建文件对应的父文件夹: {p_path}")
                    os.makedirs(p_path, exist_ok=True)

                echo(f"[{count}/{sum}]:: {upload_file} -> {repo_path}")
                !cp "{upload_file}" "{p_path}"

                os.chdir(repo_path)
                file_name = rel_upload_file.split("/").pop() # 文件名
                echo(f"[{count}/{sum}]:: 添加文件： {rel_upload_file}")
                !git add "{rel_upload_file}"
                echo(f"[{count}/{sum}]:: 提交信息: \"upload {file_name}\"")
                !git commit -m "upload {file_name}"
                !git config lfs.https://oauth2:{ms_access_token}@www.modelscope.cn/{repo}.git/info/lfs.locksverify true
                echo(f"[{count}/{sum}]:: 上传 {file_name} 到 {repo} 中")
                !git push

                os.chdir(work_path)
                !rm -rf "{repo_path}"
                echo(f"[{count}/{sum}]:: 上传 {file_name} 完成")

        echo(f"[{count}/{sum}]:: {repo} 仓库上传完成")


    # HuggingFace
    # 获取 HuggingFace 仓库中的文件列表
    def get_hf_repo_file_list(self, hf_access_token, repo, repo_type):
        from huggingface_hub import HfApi
        api = HfApi()
        model_list = api.list_repo_files(
            repo_id = repo,
            repo_type = repo_type,
            token = hf_access_token
        )
        return model_list


    # 上传文件到 HuggingFace
    def push_file_to_huggingface(self, hf_access_token, repo, repo_type, work_path, upload_path):
        import os
        from pathlib import Path
        from huggingface_hub import HfApi, CommitOperationAdd
        api = HfApi()

        try:
            api.whoami(token = hf_access_token)
            echo("HuggingFace Token 验证成功")
        except Exception as e:
            echo("HuggingFace Token 验证失败: ", e)

        os.chdir(work_path)
        count = 0
        upload_file_lists = self.get_all_file(upload_path) # 原文件的路径列表

        echo(f"将文件上传至 HuggingFace:: {upload_path} -> {os.path.join(work_path, repo.split('/').pop())}")
        count = 0
        sum = len(upload_file_lists)
        hf_repo_flie_list = self.get_hf_repo_file_list(hf_access_token, repo, repo_type) # 获取仓库中的文件列表
        for upload_file in upload_file_lists:
            count += 1

            echo(f"[{count}/{sum}]:: 克隆仓库到 {work_path}")
            rel_upload_file = os.path.relpath(upload_file, upload_path) # 原文件相对路径
            repo_path = os.path.join(work_path, repo.split("/").pop()) # 仓库的绝对路径
            echo(f"[{count}/{sum}]:: 要上传的文件的相对路径: {rel_upload_file}")
            echo(f"[{count}/{sum}]:: 绝对路径: {upload_file}")
            echo(f"[{count}/{sum}]:: 仓库地址: {repo_path}")

            # 检测文件是否存在于仓库中
            if rel_upload_file in hf_repo_flie_list:
                echo(f"[{count}/{sum}]:: {os.path.basename(upload_file)} 已存在于仓库中")
            else:
                file_name = rel_upload_file.split("/").pop() # 文件名
                hf_path_in_repo = Path(rel_upload_file).as_posix()
                local_file_obj = Path(upload_file).as_posix()
                echo(f"[{count}/{sum}]:: {local_file_obj} -> {repo}/{hf_path_in_repo}")
                operations = [ CommitOperationAdd(path_in_repo = hf_path_in_repo, path_or_fileobj = local_file_obj) ]
                echo(f"[{count}/{sum}]:: 上传 {file_name} 到 {repo} 中")
                try:
                    api.create_commit(
                        repo_id = repo,
                        operations = operations,
                        commit_message = f"Upload {file_name}",
                        repo_type = repo_type,
                        token = hf_access_token
                    )
                    echo(f"[{count}/{sum}]:: 上传 {file_name} 完成")
                except:
                    echo(f"[{count}/{sum}]:: 上传 {file_name} 失败")

        echo(f"[{count}/{sum}]:: {repo} 仓库上传完成")


    # HuggingFace / ModelScope Token 验证
    def verify_huggingface_token(self, hf_token):
        from huggingface_hub import HfApi
        api = HfApi()
        try:
            api.whoami(token = hf_token)
            echo("HuggingFace Token 验证成功")
        except Exception as e:
            echo("HuggingFace Token 验证失败: ", e)


    def verify_modelscope_token(self, ms_token):
        from modelscope.hub.api import HubApi
        api = HubApi()
        try:
            api.login(ms_token)
            echo("ModelScope Token 验证成功")
        except Exception as e:
            echo("ModelScope Token 验证失败: ", e)


    def get_modelscope_git_token(ms_token):
        from modelscope.hub.api import HubApi
        api = HubApi()
        try:
            token = api.login(ms_token)[0]
            return token
        except:
            return None


    # 配置 Git 信息
    def set_git_config(self, email, username):
        echo("配置 Git 信息中")
        !git config --global user.email "{email}"
        !git config --global user.name "{username}"



class DATASET(ARIA2):
    def __init__(self) -> None:
        pass


    def get_dataset(self, dataset_path, url, name = None):
        import os
        path = "/tmp"
        if name is None:
            name = url.split("/").pop()
        super().aria2(url, path, name) # 下载文件
        archive_format = name.split(".").pop()
        origin_file_path = os.path.join(path, name)
        echo(f"尝试解压 {name}")
        if archive_format == "7z":
            !7z x "{origin_file_path}" -o"{dataset_path}"
        elif archive_format == "zip":
            !unzip "{origin_file_path}" -d "{dataset_path}"
        elif archive_format == "tar":
            !tar -xvf "{origin_file_path}" -C "{dataset_path}"
        else:
            echo(f"{name} 的格式不支持解压")



# SD_SCRIPTS
class SD_SCRIPTS(ARIA2, GIT, MANAGER, ENV):
    WORKSPACE = ""
    WORKFOLDER = ""

    repo_manager = REPO_MANAGER()
    dataset = DATASET()

    def __init__(self, workspace, workfolder) -> None:
        self.WORKSPACE = workspace
        self.WORKFOLDER = workfolder


    def get_sd_model(self, url, filename = None):
        path = self.WORKSPACE + "/" + self.WORKFOLDER + "/sd-models"
        filename = url.split("/").pop() if filename is None else filename
        super().aria2(url, path, filename)


    def get_vae_model(self, url, filename = None):
        path = self.WORKSPACE + "/" + self.WORKFOLDER + "/sd-models"
        filename = url.split("/").pop() if filename is None else filename
        super().aria2(url, path, filename)


    def get_sd_model_from_list(self, list):
        for i in list:
            if i != "":
                self.get_sd_model(i, i.split("/").pop())


    def get_vae_model_from_list(self, list):
        for i in list:
            if i != "":
                self.get_vae_model(i, i.split("/").pop())


    def install(self, torch_ver, xformers_ver, sd, vae, use_uv):
        import os
        self.check_gpu()
        self.prepare_env_depend(use_uv)
        self.clone("https://github.com/kohya-ss/sd-scripts", self.WORKSPACE)
        os.chdir(os.path.join(self.WORKSPACE, self.WORKFOLDER))
        self.prepare_torch(torch_ver, xformers_ver, use_uv)
        req_file = os.path.join(self.WORKSPACE, self.WORKFOLDER, "requirements.txt")
        self.install_requirements(req_file, use_uv)
        self.py_pkg_manager("lycoris-lora dadaptation open-clip-torch wandb", "install", use_uv)
        self.prepare_torch(torch_ver, xformers_ver, use_uv)
        self.tcmalloc()
        self.get_sd_model_from_list(sd)
        self.get_vae_model_from_list(vae)

###################################
echo("初始化功能完成")

### 参数配置
2. [[← 上一个单元](#功能初始化)|[下一个单元 →](#安装)]

In [None]:
# 环境设置
WORKSPACE = "/kaggle" # 工作路径, 通常不需要修改
WORKFOLDER = "sd-scripts" # 工作路径中文件夹名称, 通常不需要修改
TORCH_VER = "torch==2.3.0+cu121 torchvision==0.18.0+cu121 torchaudio==2.3.0+cu121" # PyTorch 版本
XFORMERS_VER = "xformers==0.0.26.post1" # xFormers 版本
USE_UV = True # 使用 uv 加速 Python 软件包安装



# 模型上传设置, 使用 HuggingFace / ModelScope 上传训练好的模型
# HuggingFace: https://huggingface.co
# ModelScope: https://modelscope.cn
USE_HF_TO_SAVE_MODEL = False # 使用 HuggingFace 保存训练好的模型, 修改为 True 为启用, False 为禁用
USE_MS_TO_SAVE_MODEL = False # 使用 ModelScope 保存训练好的模型, 修改为 True 为启用, False 为禁用

# HuggingFace Token 在 Account -> Settings -> Access Tokens 中获取
HF_TOKEN = "" # HuggingFace Token
# ModelScope Token 在 首页 -> 访问令牌 -> SDK 令牌 中获取
MS_TOKEN = "" # ModelScope Token

# HuggingFace / ModelScope 模型仓库的 ID, 需要在 HuggingFace / ModelScope 上提前新建一个模型仓库
HF_REPO_ID = "username/reponame" # HuggingFace 仓库的 ID
HF_REPO_TYPE = "model" # HuggingFace 仓库的种类(model / dataset / space), 如果在 HuggingFace 新建的仓库为模型仓库则不需要修改
MS_REPO_ID = "username/reponame" # ModelScope 仓库的 ID

# Git 信息设置, 用于上传模型至 ModelScope 时使用, 可以使用默认值
GIT_USER_EMAIL = "username@xxx.com" # Git 的邮箱
GIT_USER_NAME = "username" # Git 的用户名



# 路径设置, 通常保持默认即可
INPUT_DATASET_PATH = "/kaggle/dataset" # 训练集保存的路径
OUTPUT_PATH = "/kaggle/working/model" # 训练时模型保存的路径
SD_MODEL_PATH = "/kaggle/sd-scripts/sd-models" # 模型下载到的路径
KAGGLE_INPUT_PATH = "/kaggle/input" # Kaggle Input 的路径



# 训练模型设置, 在安装时将会下载选择的模型
# 前面的为模型的下载链接, 后面为是否下载模型的标记, 如果设置为 1 则会下载, 如果设置为 0 则不下载
# 下载链接中最后一个斜杠后的内容作为模型下载后的保存的名称, 如:
# https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/v1-5-pruned-emaonly.safetensors, 则下载后模型保存的名称为 v1-5-pruned-emaonly.safetensors

# Stable Diffusion 模型
SD_MODEL = [
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/v1-5-pruned-emaonly.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/animefull-final-pruned.safetensors", 1],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/Counterfeit-V3.0_fp16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/cetusMix_Whalefall2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/cuteyukimixAdorable_neochapter3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/ekmix-pastel-fp16-no-ema.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/ex2K_sse2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/kohakuV5_rev2.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/meinamix_meinaV11.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/oukaStar_10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/pastelMixStylizedAnime_pastelMixPrunedFP16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/rabbit_v6.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/sweetSugarSyndrome_rev15.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/AnythingV5Ink_ink.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/bartstyledbBlueArchiveArtStyleFineTunedModel_v10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/meinapastel_v6Pastel.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/qteamixQ_omegaFp16.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sd_1.5/tmndMix_tmndMixSPRAINBOW.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/sd_xl_base_1.0_0.9vae.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-3.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/AnythingXL_xl.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/abyssorangeXLElse_v10.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animaPencilXL_v200.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/animagine-xl-3.1.safetensors", 1],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/heartOfAppleXL_v20.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/baxlBartstylexlBlueArchiveFlatCelluloid_xlv1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-delta-rev1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohakuXLEpsilon_rev1.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-epsilon-rev3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/kohaku-xl-zeta.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/nekorayxl_v06W3.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/CounterfeitXL-V1.0.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/ponyDiffusionV6XL_v6StartWithThisOne.safetensors", 0],
    ["https://huggingface.co/licyk/sd-model/resolve/main/sdxl_1.0/Illustrious-XL-v0.1.safetensors", 1]
]

# VAE 模型
VAE = [
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sd_1.5/vae-ft-ema-560000-ema-pruned.safetensors", 0],
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sd_1.5/vae-ft-mse-840000-ema-pruned.safetensors", 1],
    ["https://huggingface.co/licyk/sd-vae/resolve/main/sdxl_1.0/sdxl_fp16_fix_vae.safetensors", 1]
]


##########################
echo("参数设置完成")

### 安装
3. [[← 上一个单元](#参数配置)|[下一个单元 →](#模型训练)]

In [None]:
import os
os.chdir(WORKSPACE)
sd_scripts = SD_SCRIPTS(WORKSPACE, WORKFOLDER)



# 处理模型列表
sd_model_list = []
vae_list = []
for i in SD_MODEL:
    if i[1] == 1:
        sd_model_list.append(i[0])

for i in VAE:
    if i[1] == 1:
        vae_list.append(i[0])



echo(f"开始安装 sd-scripts")
sd_scripts.install(TORCH_VER, XFORMERS_VER, sd_model_list, vae_list, USE_UV) # 安装 sd-scripts
os.makedirs(os.path.join(WORKSPACE, "working", "MS_REPO"), exist_ok = True) # 为 ModelScope 仓库创建临时文件夹
os.makedirs(OUTPUT_PATH, exist_ok = True) # 创建训练时保存模型的路径(由 OUTPUT_PATH 变量设定)
os.makedirs(INPUT_DATASET_PATH, exist_ok = True) # 创建存放训练集的路径(由 INPUT_DATASET_PATH 变量设定)



# 将 KAGGLE_INPUT_PATH 内的文件移动到 INPUT_DATASET_PATH 指定的路径
if os.path.exists(KAGGLE_INPUT_PATH):
    for i in os.listdir(KAGGLE_INPUT_PATH):
        f = os.path.join(KAGGLE_INPUT_PATH, i)
        !cp -r "{f}" "{INPUT_DATASET_PATH}"



# 如果需要安装某个软件包, 或者切换 sd-scripts 的版本或者分支, 参考下面的写法
# 选中代码后可以使用 Ctrl + / 取消注释
# sd_scripts.py_pkg_manager("lycoris-lora==2.1.0.post3 dadaptation==3.1", "install")
# sd_scripts_path = os.path.join(WORKSPACE, WORKFOLDER)
# !git -C "{sd_scripts_path}" reset --hard f8f5b16
# !git -C "{sd_scripts_path}" checkout dev


# 下载训练集压缩包并解压
# 压缩包格式仅支持 7z, zip, tar
# 使用格式:
# sd_scripts.dataset.get_dataset(INPUT_DATASET_PATH, "https://modelscope.cn/models/user/repo/resolve/master/data_1.7z")
# sd_scripts.dataset.get_dataset(INPUT_DATASET_PATH, "https://modelscope.cn/models/user/repo/resolve/master/data_1.7z", "data_1.7z")
# 
# 训练集的要求:
# 需要将图片进行打标, 并调整训练集为指定的目结构, 例如:
# Nachoneko
#     └── 1_nachoneko
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#             ├── 0(8).txt
#             ├── 0(8).webp
#             ├── 001_2.png
#             ├── 001_2.txt
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 
# 在 Nachoneko 文件夹新建一个文件夹, 格式为 <数字>_<名称>, 如 1_nachoneko, 前面的数字代表这部分的训练集的重复次数, 1_nachoneko 文件夹内则放图片和打标文件
# 
# 训练集也可以分成多个部分组成, 例如:
# Nachoneko
#     ├── 1_nachoneko
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#     │       ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#     │       └── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#     ├── 2_nachoneko
#     │       ├── 0(8).txt
#     │       ├── 0(8).webp
#     │       ├── 001_2.png
#     │       └── 001_2.txt
#     └── 4_nachoneko
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 
# 处理好训练集并调整好目录结构后可以将 Nachoneko 文件夹进行压缩了, 使用 zip / 7z / tar 格式进行压缩
# 例如将上述的训练集压缩成 Nachoneko.7z, 此时需要检查一下压缩后在压缩包的目录结果是否和原来的一致(有些压缩软件在部分情况下会破坏原来的目录结构)
# 确认没有问题后将该训练集上传到网盘, 推荐使用 HuggingFace / ModelScope
# 
# 如果不需要该功能向 Kaggle 传入数据集, 可使用 Kaggle 的 DataSet 功能
# 在安装时 Kaggle 的 Dataset 中的训练集将会复制到 INPUT_DATASET_PATH 的目录中



# 如果需要下载自己的模型, 可以参考下面的写法
# sd_scripts.get_sd_model("https://civitai.com/api/download/models/889818?type=Model&format=SafeTensor&size=pruned&fp=fp16", "Illustrious-XL-v0.1.safetensors")
# sd_scripts.get_sd_model("https://huggingface.co/OnomaAIResearch/Illustrious-xl-early-release-v0/resolve/main/Illustrious-XL-v0.1.safetensors")
# 模型将会下载到 /kaggle/sd-scripts/sd-models



sd_scripts.clear_up(False)
echo("sd-scripts 安装完成")

### 模型训练
需自行编写命令，下方有可参考的例子  
4. [[← 上一个单元](#安装)|[下一个单元 →](#模型上传)]

In [None]:
os.chdir(os.path.join(WORKSPACE, WORKFOLDER))
##########################################################################################
# 1.
# 运行前需要根据自己的需求更改参数
# 
# 训练参数的设置可参考：
# https://rentry.org/59xed3
# https://github.com/kohya-ss/sd-scripts?tab=readme-ov-file#links-to-usage-documentation
# https://github.com/bmaltais/kohya_ss/wiki/LoRA-training-parameters
# 
# 
# 2.
# 下方被注释的代码选择后使用 Ctrl + / 取消注释
# 
# 
# 3.
# 训练使用的底模会被下载到 {SD_MODEL_PATH}, 即 /kaggle/sd-scripts/sd-models
# 填写底模路径时一般可以通过 --pretrained_model_name_or_path="{SD_MODEL_PATH}/base_model.safetensors" 指定
# 
# 通过 Kaggle DataSet 导入的训练集保存在 /kaggle/input, 运行该笔记时将会把训练集复制进 /kaggle/dataset
# 该路径可通过 INPUT_DATASET_PATH 调整
# 如果使用 sd_scripts.dataset.get_dataset() 函数下载训练集, 数据集一般会解压到 /kaggle/dataset, 这取决于函数第一个参数传入的路径
# 训练集的路径通常要这种结构
# $ tree /kaggle
# kaggle
# └── dataset
#     └── Nachoneko
#         └── 1_gan_cheng
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2019 winter 麗.txt
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).png
#             ├── [メロンブックス (よろず)]Melonbooks Girls Collection 2020 spring 彩 (オリジナル).txt
#             ├── 0(8).txt
#             ├── 0(8).webp
#             ├── 001_2.png
#             ├── 001_2.txt
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.png
#             ├── 0b1c8893-c9aa-49e5-8769-f90c4b6866f5.txt
#             ├── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.png
#             └── 0d5149dd-3bc1-484f-8c1e-a1b94bab3be5.txt
# 4 directories, 12 files
# 在填写训练集路径时, 应使用 --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko"
# 
# 模型保存的路径通常用 --output_dir="{OUTPUT_PATH}" 指定, 如 --output_dir="{OUTPUT_PATH}/Nachoneko", OUTPUT_PATH 默认设置为 /kaggle/working/model
# 在 Kaggle 的 output 中可以看到保存的模型, 前提是使用 Kaggle 的 Save Version 运行 Kaggle
# OUTPUT_PATH 也指定了保存模型到 HuggingFace / ModelScope 的功能的上传路径
# 
# --output_name 用于指定保存的模型名字, 如 --output_name="Nachoneko"
# 
# 
# 5.
# Kaggle 的实例最长可运行 12 h, 要注意训练时长不要超过 12 h, 否则将导致训练被意外中断, 并且最后的模型保存功能将不会得到运行
# 如果需要在模型被保存后立即上传到 HuggingFace 进行保存, 可使用启动参数为 sd-scripts 设置自动保存, 具体可阅读 sd-scripts 的帮助信息
# 使用 python train_network.py -h 命令可查询可使用的启动参数, 命令中的 train_network.py 可替换成 sdxl_train_network.py 等
# 
# 
# 6.
# 下方提供了一些训练参数, 可以直接使用, 使用时取消注释后根据需求修改部分参数即可
##########################################################################################


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数在 animagine-xl-3.1.safetensors 测试, 大概在 30 ~ 40 Epoch 有比较好的效果 (在 36 Epoch 出好效果的概率比较高)
#
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
#
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用多卡进行训练
# 该参数也可以用于人物 LoRA 训练
# 
# 在训练多画风 LoRA 或者人物 LoRA 时, 通常会打上触发词
# 当使用了 --network_train_unet_only 后, Text Encoder 虽然不会训练, 但并不影响将触发词训练进 LoRA 模型中
# 并且不训练 Text Encoder 避免 Text Encoder 被炼烂(Text Encoder 比较容易被炼烂)
#
# 这个参数是在 Illustrious-XL-v0.1.safetensors 模型上测出来的, 大概在 32 Epoch 左右有比较好的效果
# 用 animagine-xl-3.1.safetensors 那套参数也有不错的效果, 只是学习率比这套低了点, 学得慢一点
# 学习率调度器从 cosine_with_restarts 换成 constant_with_warmup, 此时学习率靠优化器(Lion8bit)进行调度
# 拟合速度会更快
# constant_with_warmup 用在大规模的训练上比较好, 但用在小规模训练也有不错的效果
# 
# 参数加上了 noise_offset, 可以提高暗处和亮处的表现, 一般使用设置成 0.05 ~ 0.1
# 但 noise_offset 可能会导致画面泛白, 光影效果变差
# 
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/Illustrious-XL-v0.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/Nachoneko" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="Nachoneko_2" \
#     --output_dir="{OUTPUT_PATH}/Nachoneko" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=40 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00012 \
#     --unet_lr=0.00012 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="constant_with_warmup" \
#     --lr_warmup_steps=100 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --noise_offset=0.1 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 人物 LoRA, 使用多卡进行训练
# 参数中使用了 --scale_weight_norms, 用于提高泛化性, 但可能会造成拟合度降低
# 如果当训练人物 LoRA 的图片较多时, 可考虑删去该参数
# 当训练人物 LoRA 的图片较少, 为了避免过拟合, 就可以考虑使用 --scale_weight_norms 降低过拟合概率
#
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/robin" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="robin_1" \
#     --output_dir="{OUTPUT_PATH}/robin_1" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --scale_weight_norms=1 \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 人物 LoRA, 使用多卡进行训练
# !accelerate launch \
#     --num_cpu_threads_per_process 1 \
#     --multi_gpu \
#     --num_processes=2 \
#     sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/murasame_(senren)_3" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="murasame_(senren)_10" \
#     --output_dir="{OUTPUT_PATH}/murasame_(senren)_10" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --learning_rate=0.0001 \
#     --unet_lr=0.0001 \
#     --text_encoder_lr=0.00004 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --scale_weight_norms=1 \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16


# 使用 lokr 算法训练 XL 画风 LoRA, 使用单卡进行训练 (Kaggle 的单 Tesla P100 性能不如双 Tesla T4, 建议使用双卡训练)
# !python sdxl_train_network.py \
#     --pretrained_model_name_or_path="{SD_MODEL_PATH}/animagine-xl-3.1.safetensors" \
#     --vae="{SD_MODEL_PATH}/sdxl_fp16_fix_vae.safetensors" \
#     --train_data_dir="{INPUT_DATASET_PATH}/rafa" \
#     --prior_loss_weight=1 \
#     --resolution="1024,1024" \
#     --enable_bucket \
#     --min_bucket_reso=256 \
#     --max_bucket_reso=1536 \
#     --bucket_reso_steps=64 \
#     --output_name="rafa_1" \
#     --output_dir="{OUTPUT_PATH}/rafa" \
#     --save_model_as="safetensors" \
#     --save_precision="fp16" \
#     --save_every_n_epochs=2 \
#     --max_train_epochs=50 \
#     --train_batch_size=6 \
#     --gradient_checkpointing \
#     --network_train_unet_only \
#     --learning_rate=0.00007 \
#     --unet_lr=0.00007 \
#     --text_encoder_lr=0.00001 \
#     --lr_scheduler="cosine_with_restarts" \
#     --lr_warmup_steps=0 \
#     --lr_scheduler_num_cycles=1 \
#     --optimizer_type="Lion8bit" \
#     --network_module="lycoris.kohya" \
#     --network_dim=100000 \
#     --network_alpha=100000 \
#     --network_args \
#         conv_dim=100000 \
#         conv_alpha=100000 \
#         algo=lokr \
#         dropout=0 \
#         factor=8 \
#         train_norm=True \
#     --log_with="tensorboard" \
#     --logging_dir="{OUTPUT_PATH}/logs" \
#     --caption_extension=".txt" \
#     --shuffle_caption \
#     --keep_tokens=0 \
#     --max_token_length=225 \
#     --seed=1337 \
#     --mixed_precision="fp16" \
#     --xformers \
#     --cache_latents \
#     --cache_latents_to_disk \
#     --persistent_data_loader_workers \
#     --full_fp16

### 模型上传
5. [← 上一个单元](#模型训练)

In [None]:
# 模型上传到 HuggingFace / ModelScope, 通常不需要修改, 修改参数建议通过上方的参数配置单元进行修改
if USE_HF_TO_SAVE_MODEL:
    echo("使用 HuggingFace 保存模型")
    sd_scripts.repo_manager.push_file_to_huggingface(
        hf_access_token = HF_TOKEN, # HuggingFace Token
        repo = HF_REPO_ID, # HuggingFace 仓库地址
        repo_type = HF_REPO_TYPE, # HuggingFace 仓库种类
        work_path = os.path.join(WORKSPACE, "working", "MS_REPO"), # 脚本工作目录, 仓库将克隆至该文件夹中
        upload_path = OUTPUT_PATH # 要上传文件的目录
    )

if USE_MS_TO_SAVE_MODEL:
    echo("使用 ModelScope 保存模型")
    sd_scripts.repo_manager.set_git_config(GIT_USER_EMAIL, GIT_USER_NAME)
    sd_scripts.repo_manager.push_file_to_modelscope(
        ms_access_token = MS_TOKEN, # Modelscope Token
        repo = MS_REPO_ID, # Modelscope 的仓库地址
        work_path = os.path.join(WORKSPACE, "working", "MS_REPO"), # 脚本工作目录, 仓库将克隆至该文件夹中
        upload_path = OUTPUT_PATH # 要上传文件的目录
    )