modelscope · Jintao-Huang · Oct 2, 2025 · Oct 2, 2025 · Oct 2, 2025 · Oct 2, 2025
diff --git a/docs/source/Instruction/支持的模型和数据集.md b/docs/source/Instruction/支持的模型和数据集.md
@@ -461,6 +461,7 @@
 |[deepseek-ai/DeepSeek-R1-0528-Qwen3-8B](https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B)|deepseek_r1_distill|deepseek_r1|-|&#x2714;|-|[deepseek-ai/DeepSeek-R1-0528-Qwen3-8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B)|
 |[deepseek-ai/DeepSeek-V3.1-Base](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1-Base](https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base)|
 |[deepseek-ai/DeepSeek-V3.1](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1](https://huggingface.co/deepseek-ai/DeepSeek-V3.1)|
+|[deepseek-ai/DeepSeek-V3.1-Terminus](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1-Terminus](https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus)|
 |[OpenBuddy/openbuddy-llama-65b-v8-bf16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama-65b-v8-bf16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama-65b-v8-bf16](https://huggingface.co/OpenBuddy/openbuddy-llama-65b-v8-bf16)|
 |[OpenBuddy/openbuddy-llama2-13b-v8.1-fp16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama2-13b-v8.1-fp16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama2-13b-v8.1-fp16](https://huggingface.co/OpenBuddy/openbuddy-llama2-13b-v8.1-fp16)|
 |[OpenBuddy/openbuddy-llama2-70b-v10.1-bf16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama2-70b-v10.1-bf16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama2-70b-v10.1-bf16](https://huggingface.co/OpenBuddy/openbuddy-llama2-70b-v10.1-bf16)|

diff --git a/docs/source/Instruction/评测.md b/docs/source/Instruction/评测.md
@@ -96,7 +96,7 @@ swift eval \
     --infer_backend pt \
     --eval_limit 10 \
     --eval_dataset gsm8k \
-    --dataset_args '{"gsm8k": {"few_shot_num": 0, "filters": {"remove_until": "</think>"}}}' \
+    --eval_dataset_args '{"gsm8k": {"few_shot_num": 0, "filters": {"remove_until": "</think>"}}}' \
     --eval_generation_config '{"max_tokens": 512, "temperature": 0}' \
     --extra_eval_args '{"ignore_errors": true, "debug": true}'
 ```
@@ -191,11 +191,11 @@ swift eval \
     --eval_backend Native \
     --infer_backend pt \
     --eval_dataset general_mcq \
-    --dataset_args '{"general_mcq": {"local_path": "/path/to/mcq", "subset_list": ["example"]}}'
+    --eval_dataset_args '{"general_mcq": {"local_path": "/path/to/mcq", "subset_list": ["example"]}}'
 ```
 其中：
 - `eval_dataset` 需要设置为 `general_mcq`
-- `dataset_args` 需要设置
+- `eval_dataset_args` 需要设置
     - `local_path` 自定义数据集文件夹路径
     - `subset_list` 评测数据集名称，上述 `*_dev.csv` 中的 `*`
 
@@ -240,12 +240,12 @@ swift eval \
     --eval_backend Native \
     --infer_backend pt \
     --eval_dataset general_qa \
-    --dataset_args '{"general_qa": {"local_path": "/path/to/qa", "subset_list": ["example"]}}'
+    --eval_dataset_args '{"general_qa": {"local_path": "/path/to/qa", "subset_list": ["example"]}}'
 ```
 
 其中：
 - `eval_dataset` 需要设置为 `general_qa`
-- `dataset_args` 是一个json字符串，需要设置：
+- `eval_dataset_args` 是一个json字符串，需要设置：
     - `local_path` 自定义数据集文件夹路径
     - `subset_list` 评测数据集名称，上述 `*.jsonl` 中的 `*`
 

diff --git a/docs/source_en/Instruction/Evaluation.md b/docs/source_en/Instruction/Evaluation.md
@@ -96,7 +96,7 @@ swift eval \
     --infer_backend pt \
     --eval_limit 10 \
     --eval_dataset gsm8k \
-    --dataset_args '{"gsm8k": {"few_shot_num": 0, "filters": {"remove_until": "</think>"}}}' \
+    --eval_dataset_args '{"gsm8k": {"few_shot_num": 0, "filters": {"remove_until": "</think>"}}}' \
     --eval_generation_config '{"max_tokens": 512, "temperature": 0}' \
     --extra_eval_args '{"ignore_errors": true, "debug": true}'
 ```
@@ -191,12 +191,12 @@ swift eval \
     --eval_backend Native \
     --infer_backend pt \
     --eval_dataset general_mcq \
-    --dataset_args '{"general_mcq": {"local_path": "/path/to/mcq", "subset_list": ["example"]}}'
+    --eval_dataset_args '{"general_mcq": {"local_path": "/path/to/mcq", "subset_list": ["example"]}}'
 ```
 
 Where:
 - `eval_dataset` should be set to `general_mcq`
-- `dataset_args` should be set with:
+- `eval_dataset_args` should be set with:
     - `local_path` as the path to the custom dataset folder
     - `subset_list` as the name of the evaluation dataset, taken from the `*_dev.csv` mentioned above
 
@@ -241,12 +241,12 @@ swift eval \
     --eval_backend Native \
     --infer_backend pt \
     --eval_dataset general_qa \
-    --dataset_args '{"general_qa": {"local_path": "/path/to/qa", "subset_list": ["example"]}}'
+    --eval_dataset_args '{"general_qa": {"local_path": "/path/to/qa", "subset_list": ["example"]}}'
 ```
 
 Where:
 - `eval_dataset` should be set to `general_qa`
-- `dataset_args` is a JSON string that needs to be set with:
+- `eval_dataset_args` is a JSON string that needs to be set with:
     - `local_path` as the path to the custom dataset folder
     - `subset_list` as the name of the evaluation dataset, taken from the `*.jsonl` mentioned above
 

diff --git a/docs/source_en/Instruction/Supported-models-and-datasets.md b/docs/source_en/Instruction/Supported-models-and-datasets.md
@@ -461,6 +461,7 @@ The table below introduces the models integrated with ms-swift:
 |[deepseek-ai/DeepSeek-R1-0528-Qwen3-8B](https://modelscope.cn/models/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B)|deepseek_r1_distill|deepseek_r1|-|&#x2714;|-|[deepseek-ai/DeepSeek-R1-0528-Qwen3-8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-0528-Qwen3-8B)|
 |[deepseek-ai/DeepSeek-V3.1-Base](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Base)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1-Base](https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base)|
 |[deepseek-ai/DeepSeek-V3.1](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1](https://huggingface.co/deepseek-ai/DeepSeek-V3.1)|
+|[deepseek-ai/DeepSeek-V3.1-Terminus](https://modelscope.cn/models/deepseek-ai/DeepSeek-V3.1-Terminus)|deepseek_v3_1|deepseek_v3_1|transformers>=4.39.3|&#x2714;|-|[deepseek-ai/DeepSeek-V3.1-Terminus](https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Terminus)|
 |[OpenBuddy/openbuddy-llama-65b-v8-bf16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama-65b-v8-bf16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama-65b-v8-bf16](https://huggingface.co/OpenBuddy/openbuddy-llama-65b-v8-bf16)|
 |[OpenBuddy/openbuddy-llama2-13b-v8.1-fp16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama2-13b-v8.1-fp16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama2-13b-v8.1-fp16](https://huggingface.co/OpenBuddy/openbuddy-llama2-13b-v8.1-fp16)|
 |[OpenBuddy/openbuddy-llama2-70b-v10.1-bf16](https://modelscope.cn/models/OpenBuddy/openbuddy-llama2-70b-v10.1-bf16)|openbuddy_llama|openbuddy|-|&#x2714;|-|[OpenBuddy/openbuddy-llama2-70b-v10.1-bf16](https://huggingface.co/OpenBuddy/openbuddy-llama2-70b-v10.1-bf16)|

diff --git a/swift/llm/model/model/deepseek.py b/swift/llm/model/model/deepseek.py
@@ -135,6 +135,7 @@ def get_model_tokenizer_deepseek_moe(model_dir: str,
             ModelGroup([
                 Model('deepseek-ai/DeepSeek-V3.1-Base', 'deepseek-ai/DeepSeek-V3.1-Base'),
                 Model('deepseek-ai/DeepSeek-V3.1', 'deepseek-ai/DeepSeek-V3.1'),
+                Model('deepseek-ai/DeepSeek-V3.1-Terminus', 'deepseek-ai/DeepSeek-V3.1-Terminus'),
             ]),
         ],
         TemplateType.deepseek_v3_1,