# 使用 SWIFT 进行推理

SWIFT 是 ModelScope 开源的一款框架，支持大模型的训练、推理、评测和部署。通过 SWIFT，可以轻松实现从模型训练到应用的完整链路。

本教程将详细介绍如何使用 SWIFT 进行推理，包括安装步骤和推理示例。我们将以 Yi-1.5-6B-Chat 为例进行演示。


## 🚀 使用 Colab 运行

我们提供了一键运行的 [Colab 脚本](https://colab.research.google.com/drive/1R0s7cDNWTNCWjod_z-jVpxiFc-R3_7kc?usp=drive_link)，你可以直接在 Colab 中运行这个教程。


## 安装

首先，我们需要安装相关的依赖。

（可选）可以选择设置 pip 全局镜像以加快下载速度：


In [None]:
!pip config set global.index-url https://mirrors.aliyun.com/pypi/simple/

安装 ms-swift：


In [None]:
!pip install 'ms-swift[llm]' -U

## 开始推理

在开始推理之前，需要注意你的电脑显存和内存。如果显存不足，可能会导致报错。

| 模型           | 显存使用 | 硬盘占用 |
| -------------- | -------- | -------- |
| Yi-1.5-6B-Chat | 11.5G    | 14.7G    |


我们首先设置环境变量：

In [None]:
import os
os.environ['CUDA_VISIBLE_DEVICES'] = '0'

然后加载模型和分词器：

In [None]:
from swift.llm import (
    get_model_tokenizer, get_template, inference, ModelType, get_default_template_type,
)
from swift.utils import seed_everything

# 选择模型类型，这里使用 Yi-1.5-6B-Chat
model_type = ModelType.yi_1_5_6b_chat
template_type = get_default_template_type(model_type)
print(f'template_type: {template_type}')  # 模板类型

# 加载模型和分词器
kwargs = {}
model, tokenizer = get_model_tokenizer(model_type, model_kwargs={'device_map': 'auto'}, **kwargs)

# 设置生成配置
model.generation_config.max_new_tokens = 128

# 获取模板
template = get_template(template_type, tokenizer)

# 设置随机种子
seed_everything(42)

接下来，我们进行推理：

In [None]:
# 准备输入查询
query = '你好！'

# 使用模板进行推理
response, history = inference(model, template, query)

# 打印查询和响应
print(f'query: {query}')
print(f'response: {response}')

以上代码将会输出类似如下的结果：

```
query: 你好！
response: 你好！很高兴见到你。有什么我可以帮忙的吗？
```


到这里，你已经学会了如何使用 SWIFT 进行 Yi 系列模型的推理。如果在使用过程中遇到任何问题，可以参考 [SWIFT 的官方文档](https://www.modelscope.cn/models/01-ai/Yi-1.5-6B-Chat) 获取更多帮助。