# Pipelines

**Pipelines(管道)** 是使用模型进行推理的一种简单易上手的方式。

这些管道是抽象了Transformers 库中大部分复杂代码的对象，提供了一个专门用于多种任务的简单API，包括**命名实体识别、掩码语言建模、情感分析、特征提取和问答**等等。



| Modality                    | Task                         | Description                                                | Pipeline API                                  |
| --------------------------- | ---------------------------- | ---------------------------------------------------------- | --------------------------------------------- |
| Audio                       | Audio classification         | 为音频文件分配一个标签                                     | pipeline(task=“audio-classification”)         |
|                             | Automatic speech recognition | 将音频文件中的语音提取为文本                               | pipeline(task=“automatic-speech-recognition”) |
| Computer vision             | Image classification         | 为图像分配一个标签                                         | pipeline(task=“image-classification”)         |
|                             | Object detection             | 预测图像中目标对象的边界框和类别                           | pipeline(task=“object-detection”)             |
|                             | Image segmentation           | 为图像中每个独立的像素分配标签（支持语义、全景和实例分割） | pipeline(task=“image-segmentation”)           |
| Natural language processing | Text classification          | 为给定的文本序列分配一个标签                               | pipeline(task=“sentiment-analysis”)           |
|                             | Token classification         | 为序列里的每个 token 分配一个标签（人, 组织, 地址等等）    | pipeline(task=“ner”)                          |
|                             | Question answering           | 通过给定的上下文和问题, 在文本中提取答案                   | pipeline(task=“question-answering”)           |
|                             | Summarization                | 为文本序列或文档生成总结                                   | pipeline(task=“summarization”)                |
|                             | Translation                  | 将文本从一种语言翻译为另一种语言                           | pipeline(task=“translation”)                  |
| Multimodal                  | Document question answering  | 根据给定的文档和问题回答一个关于该文档的问题。             | pipeline(task=“document-question-answering”)  |
|                             | Visual Question Answering    | 给定一个图像和一个问题，正确地回答有关图像的问题           | pipeline(task=“vqa”)                          |



Pipelines 已支持的完整任务列表：[https://huggingface.co/docs/transformers/task_summary](https://huggingface.co/docs/transformers/task_summary)



## Natural Language Processing(NLP)

NLP(自然语言处理）任务是最常见的任务类型之一，因为文本是我们进行交流的一种自然方式。要将文本转换为模型可识别的格式，需要对其进行分词。这意味着将一系列文本划分为单独的单词或词组，然后将这些标记转换为数字。结果就是，你可以将一系列文本表示为一系列数字，并且一旦你拥有一系列数字，它就可以输入到模型中来解决各种NLP任务。

## Pipeline API

Pipeline API是对所有其他可用管道的包装。它可以像任何其他管道一样实例化，并且降低AI推理的学习和使用成本。




### 使用Pipeline API实现 Text Classification

Text Classification（文本分类）与任何模态中的分类任务一样，文本分类将一个文本序列（可以是句子级别、段落或者整篇文章）标记为预定义的类别集合之一。文本分类有许多实际应用，其中宝库哦：
- 情感分析：根据某种极性（如积极或消极）对文本进行标记，以在政治、金融和市场等领域支持决策制定。
- 内容分类：根据某个主题对文本进行标记，以帮助组织和过滤新闻和社交媒体信息流中的信息（天气、体育、金融等）

**下载模型**

模型主页：[https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english](https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english)

- 在HuggingFace下载
```bash
git lfs install
git clone https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english
```

- 在魔塔社区下载
```bash
git lfs install
git clone https://oauth2:RmL-fB_xyUQstezmhXUf@www.modelscope.cn/hengzq/distilbert-base-uncased-finetuned-sst-2-english.git
```

In [20]:
from transformers import pipeline

# 模型路径
model_path = "/home/hengzq/workspace/modelscope/distilbert-base-uncased-finetuned-sst-2-english"

pipe = pipeline("text-classification", model=model_path)
pipe("Hello World!")

Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


[{'label': 'POSITIVE', 'score': 0.9997431635856628}]

In [19]:
# 批处理调用模型推理

text_list = [
    "今天西安天气很好",
    "西红柿炒鸡蛋怎么做"
]

pipe(text_list)


[{'label': 'NEGATIVE', 'score': 0.6329299807548523},
 {'label': 'NEGATIVE', 'score': 0.7964168787002563}]

### 使用Pipeline API实现 Token Classification 

**Token Classification**(Token分类)将每个token分配一个来自预定义类别集的标签

两种常见的Token分类：
- 命名实体识别(NER):根据实体类别对token进行标记。NER在生物医学设置中特别受欢迎，可以标记基因、蛋白质和药物名称。
- 词性标注(POS):根据其词性（如名词、动词或形容词）对标记进行标记。POS对于帮助翻译系统了解两个相同的单词如何在语法上不同很有用。



**下载模型**

模型主页：[https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english)

- 在HuggingFace下载
```bash
git lfs install
git clone https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english
```

- 在魔塔社区下载
```bash
git lfs install
git clone https://oauth2:RmL-fB_xyUQstezmhXUf@www.modelscope.cn/hengzq/bert-large-cased-finetuned-conll03-english.git
```

In [21]:
from transformers import pipeline

classifier = pipeline(task="ner")

No model was supplied, defaulted to dbmdz/bert-large-cased-finetuned-conll03-english and revision 4c53496 (https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


OSError: We couldn't connect to 'https://huggingface.co' to load this file, couldn't find it in the cached files and it looks like dbmdz/bert-large-cased-finetuned-conll03-english is not the path to a directory containing a file named config.json.
Checkout your internet connection or see how to run the library in offline mode at 'https://huggingface.co/docs/transformers/installation#offline-mode'.

### 使用Pipeline API实现 Question Answering

**Question Answering**(问答)是另一个token-level的任务，返回一个问题的答案，有时带有上下文（开放领域），有时不带上下文（封闭领域）。每当我们向虚拟助手提问问题时，例如询问一家餐厅是否营业，就会发生这种情况。它还可以提供客户或技术支持，并帮助搜索引擎检索你要求的相关信息。

有两种常见的问答类型：
- 提取式：给定一个问题和一些上下文，模型必须从上下文中提取出一段文字作为答案。
- 生成式：给定一个问题和一些上下文，答案是根据上下文生成的；这种方法由`Text2TextGenerationPipeline`处理，而不是下面展示的`QuestionAnsweringPipeline`




**下载模型**

模型主页：[https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english](https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english)

- 在HuggingFace下载
```bash
git lfs install
git clone https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english
```

- 在魔塔社区下载
```bash
git lfs install
git clone https://oauth2:RmL-fB_xyUQstezmhXUf@www.modelscope.cn/hengzq/bert-large-cased-finetuned-conll03-english.git
```