# 三行代码开启大模型对话

同济子豪兄 2024-9-3

在酷睿Ultra处理器的AIPC轻薄笔记本电脑上，基于OpenVINO本地端侧部署Qwen2-7B-Instruct开源大模型。实现和大模型的人机对话。

## 导入工具包

In [1]:
import openvino_genai as ov_genai

## 选择计算设备

In [2]:
# device = 'CPU'
device = 'GPU'
# device = 'NPU'

## 载入OpenVINO IR格式的大模型

In [3]:
pipe = ov_genai.LLMPipeline("Qwen2-7B-Instruct-int4-ov", device)

## 提示词

In [4]:
prompt = "<|im_start|>system\n<|im_end|>\n<|im_start|>user\n什么是OpenVINO？<|im_end|>\n<|im_start|>assistant\n"

## 大模型推理预测

In [5]:
result = pipe.generate(prompt)

In [6]:
result.texts

['OpenVINO（Open Visual Inference and Neural Network Optimization）是由英特尔开发的一套开源工具套件，用于在各种设备上部署深度学习模型。它提供了一种高效的方式来运行神经网络，特别是针对视觉任务，如图像和视频处理。\n\nOpenVINO的主要功能包括：\n\n1. **模型优化**：它能够优化神经网络模型，以便在不同的硬件平台上高效运行。这包括对模型进行剪枝、量化和转换，以减少计算和内存需求。\n\n2. **运行时引擎**：OpenVINO提供了一个高性能的运行时引擎，可以将优化后的模型部署到各种硬件上，包括CPU、GPU、VPU（视觉处理单元）等。\n\n3. **API支持**：它提供了多种编程接口，如C++、Python、MATLAB等，使得开发者可以轻松地将模型集成到自己的应用程序中。\n\n4. **跨平台支持**：OpenVINO支持多种操作系统和硬件平台，包括Windows、Linux、Mac OS等，以及各种类型的处理器和加速器。\n\n5. **推理工具**：它包括一系列工具，用于评估模型性能、优化模型、生成可移植的模型等。\n\nOpenVINO广泛应用于各种领域，如自动驾驶、安防监控、机器人、医疗影像分析等，帮助开发者快速构建和部署高性能的视觉和深度学习应用。']

In [7]:
print(result.texts[0])

OpenVINO（Open Visual Inference and Neural Network Optimization）是由英特尔开发的一套开源工具套件，用于在各种设备上部署深度学习模型。它提供了一种高效的方式来运行神经网络，特别是针对视觉任务，如图像和视频处理。

OpenVINO的主要功能包括：

1. **模型优化**：它能够优化神经网络模型，以便在不同的硬件平台上高效运行。这包括对模型进行剪枝、量化和转换，以减少计算和内存需求。

2. **运行时引擎**：OpenVINO提供了一个高性能的运行时引擎，可以将优化后的模型部署到各种硬件上，包括CPU、GPU、VPU（视觉处理单元）等。

3. **API支持**：它提供了多种编程接口，如C++、Python、MATLAB等，使得开发者可以轻松地将模型集成到自己的应用程序中。

4. **跨平台支持**：OpenVINO支持多种操作系统和硬件平台，包括Windows、Linux、Mac OS等，以及各种类型的处理器和加速器。

5. **推理工具**：它包括一系列工具，用于评估模型性能、优化模型、生成可移植的模型等。

OpenVINO广泛应用于各种领域，如自动驾驶、安防监控、机器人、医疗影像分析等，帮助开发者快速构建和部署高性能的视觉和深度学习应用。


In [8]:
# 也可以加推理参数和 stop flag

# def streamer(subword):
#     print(subword, end='', flush=True)
#     return False

# result = pipe.generate(prompt, eos_token_id=151645, max_length=500)

## 函数：大模型对话

In [9]:
def chat_qwen_ov(question="什么是OpenVINO？"):
    prompt = "<|im_start|>system\n<|im_end|>\n<|im_start|>user\n{}<|im_end|>\n<|im_start|>assistant\n".format(question)
    result = pipe.generate(prompt)
    return result.texts[0]

In [10]:
result = chat_qwen_ov('什么是OpenVINO？')

In [12]:
print(result)

OpenVINO（Open Visual Inference and Neural Network Optimization）是由英特尔开发的一套开源工具套件，用于在各种设备上部署深度学习模型。它提供了一种高效的方式来运行神经网络，特别是针对计算机视觉任务。

OpenVINO的主要功能包括：

1. **模型优化**：它能够优化神经网络模型，以便在不同的硬件平台上高效运行。这包括对模型进行剪枝、量化和转换，以减少模型大小和运行时间。

2. **运行时引擎**：OpenVINO提供了一个高性能的运行时引擎，用于在各种硬件平台上执行优化后的模型。这包括CPU、GPU、VPU（英特尔视觉处理器单元）等。

3. **API支持**：它提供了多种编程接口，如C++、Python、MATLAB等，使得开发者可以轻松地将优化后的模型集成到自己的应用程序中。

4. **模型库**：OpenVINO还包含了一些预训练的模型库，开发者可以直接使用这些模型进行各种计算机视觉任务，如物体检测、图像分类、目标识别等。

5. **支持多种硬件平台**：它支持多种硬件平台，包括英特尔的各种处理器和加速器，以及一些常见的开源硬件平台。

通过使用OpenVINO，开发者可以加速深度学习模型的部署过程，提高模型在实际应用中的性能，同时减少开发和部署的复杂性。
