# 在 Google Colab 中进行 EchoHeart 的 Qwen 微调

这个 Notebook 会自动配置环境、启动微调、运行测试并导出 GGUF 模型。

**步骤：**
1. 克隆/更新 GitHub 仓库。
2. 安装必要的依赖项。
3. 运行训练脚本。
4. (可选) 运行测试脚本与模型交互。
5. (可选) 将微调后的模型转换为 GGUF 格式。

In [None]:
# 1. 克隆/更新仓库
import os
repo_path = '/content/echoheart_demo'
if not os.path.exists(repo_path):
  print(f"Cloning repository into {repo_path}...")
  !git clone https://github.com/shuakami/echoheart_demo.git {repo_path}
else:
  print(f"Repository already exists at {repo_path}.")

%cd {repo_path}

print("Pulling latest changes...")
!git pull origin master

!pwd

In [None]:
# 2. 安装依赖
print("Installing dependencies from requirements.txt...")
!pip install -q -r requirements.txt

print("Applying dependency fixes...")
!pip install fsspec==2024.12.0

In [None]:
# 3. 运行训练脚本
print("Starting training...")
!python train.py

## 训练完成！

微调后的模型保存在 Colab 环境文件系统的 `output/qwen-ft` 目录中。

In [None]:
# 4. (可选) 运行测试脚本
print("Starting non-interactive testing session...")
!python test_model.py --model_path /content/echoheart_demo/output/qwen-ft 

## 5. (可选) 转换为 GGUF 格式

以下单元格会将保存在 `output/qwen-ft` 的 Hugging Face 模型转换为 GGUF 格式，默认使用 FP16 (无量化)。
转换后的文件将保存在 `output/qwen-ft/gguf-model-f16.gguf`。
您可以修改 `--out_type` 参数进行量化 (例如 `q4_0`, `q4_k_m`, `q8_0` 等，请参考 llama.cpp 文档)。

In [None]:
# 5. 转换为 GGUF
print("Starting GGUF conversion...")
!python convert_to_gguf.py --model_dir output/qwen-ft --output_file output/qwen-ft/gguf-model-f16.gguf --out_type f16