<center><a href="https://www.nvidia.cn/training/"><img src="https://dli-lms.s3.amazonaws.com/assets/general/DLI_Header_White.png" width="400" height="186" /></a></center>

# 并行链

In [None]:
from videos.walkthroughs import walkthrough_24 as walkthrough

In [None]:
walkthrough()

在这个 notebook 中，您将学习如何创建和使用并行链。

---

## 目标

完成这个 notebook 后，您将能够：

- 创建和使用可以并行执行的链
- 思考并识别您链中的并行机会

---

## 导入

In [None]:
from langchain_nvidia_ai_endpoints import ChatNVIDIA
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnableLambda, RunnableParallel

---

## 创建模型实例

In [None]:
base_url = 'http://llama:8000/v1'
model = 'meta/llama-3.1-8b-instruct'
llm = ChatNVIDIA(base_url=base_url, model=model, temperature=0)

---

## 并行链执行（Parallel Chain Execution）

在之前的练习中，您组合了多个链来对一组输入**串行**处理，或者说按顺序处理。实际上，我们的任务确实需要这样做：在生成额外文本之前执行拼写和语法检查。

有时候，当我们考虑要执行的任务链时，可能会发现其中一些任务可以并行执行。好消息是，LCEL 为我们提供了易于使用的语法，可以在链中并行执行运行时。

我们将从一组与 LLM 无关的任务开始学习并行链的执行，以便熟悉语法，之后我们将应用所学的内容创建一个利用多个并行 LLM 链的链。

---

## 识别并行执行的机会

这可能看起来很明显，但在我们执行并行操作之前，需要先识别出何时可以并行执行。您可能已经在其它编程环境中有很多实践经验，能够思考并行执行的可能性，但如果没有，相信您也能很快掌握。

一般来说，只需要考虑一个过程的输出是否需要作为另一个过程的输入。如果是，那这两个过程之间就需要串行执行。如果两个（或多个）过程可以独立于其它过程而运行，那就有并行的机会。

让我们构建一个简单的例子来进一步探讨。假设我们有一段文本...

In [None]:
text = 'effective prompt engineering for application development'

...我们想对其执行两个操作：
1. 将文本转换为标题格式
2. 统计文本中包含的单词数量

如果问问自己这两个任务的输出是否需要作为另一任务的输入，我们很快就会明白答案是“否”。因此，这两个任务可以独立执行，也就是可以并行执行。

---

## 构建并行运行时

现在我们知道这个简单的问题可以并行执行两个子任务，下面看看如何在 LangChain 中实现这一点。

首先，使用 `RunnableLambda` 创建两个运行时，每个运行时实现一个子任务。

先给转换为标题格式定义一个运行时。

In [None]:
title_case = RunnableLambda(lambda text: text.title())

接下来，为统计文本单词数量定义一个运行时。

In [None]:
count_words = RunnableLambda(lambda text: len(text.split()))

我们可以使用文本示例调用这两个运行时，看看它们是否按预期工作。

In [None]:
title = title_case.invoke(text)
title

In [None]:
word_count = count_words.invoke(text)
word_count

如果我们想创建一个链来串行执行这两个步骤，可以将它们连接在一起，但需要注意串行管道的顺序。

In [None]:
serial_chain = title_case | count_words # And NOT count_words | title_case
serial_chain.invoke(text)

为了在 LCEL 中创建一个并行链，我们可以使用 `RunnableParallel`，它需要接收字典输入，字典中的每个属性都是我们希望并行执行的运行时。

和任何 Python 字典一样，我们的字典需要包含键/值对。在并行链执行的情况下，键是我们设置的任意值，而值则是运行时本身。

并行链会返回一个字典，其中键会映射到传入的运行时的结果上。

看下面的例子会更清楚。

In [None]:
parallel_chain = RunnableParallel({'title': title_case, 'word_count': count_words})

In [None]:
parallel_chain.invoke(text)

如果我们查看 `parallel_chain` 的计算图，可以看到它表示这两个运行时（`title_case` 和 `count_words`）是并行执行的。

In [None]:
print(parallel_chain.get_graph().draw_ascii())

---

## 使用并行输出

并行链是运行时，因此可以与其它运行时组合。

我们需要记住，并行链的输出是一个字典。一些运行时，比如提示模板，以字典作为输入，但其它的可能不是。

当然，如果需要，我们可以构建自定义运行时来处理并行运行时的输出。

例如，在当前的练习中，如果我们想为格式化的标题及其单词计数创建一个简单的打印输出，可以创建一个以字典作为输入的运行时，并使用其值构建输出。

In [None]:
describe_title = RunnableLambda(lambda x: f"'{x['title']}' has {x['word_count']} words.")

为了测试一下 `describe_title`，用一个字典调用它。

In [None]:
describe_title.invoke({'title': title, 'word_count': word_count})

它确实按预期工作，现在将其添加到现有链中。

In [None]:
final_chain = parallel_chain | describe_title

看看最终的链，它已经得到扩展并包含了并行和串行组件。

In [None]:
print(final_chain.get_graph().draw_ascii())

我们可以给一个标题来调用它。

In [None]:
final_chain.invoke(title)

---

## 并行运行时的字典字面量语法（Dictionary Literal Syntax）

出于方便考虑，LCEL 允许我们用要传递给 `RunnableParallel` 的字典字面量来代替调用 `RunnableParallel`。

举个例子，这是 `final_chain` 的完整定义，调用了 `RunnableParallel`。

In [None]:
final_chain = RunnableParallel({'title': title_case, 'word_count': count_words}) | describe_title

如果我们愿意，可以将链这样重写，去掉对 `RunnableParallel` 的调用，只保留字典字面量：

In [None]:
final_chain = {'title': title_case, 'word_count': count_words} | describe_title

In [None]:
final_chain.invoke(title)

不过，这种语法有点小陷阱。例如，如果我们尝试重写之前的 `parallel_chain`...

In [None]:
parallel_chain = RunnableParallel({'title': title_case, 'word_count': count_words})

...它不包含管道字符，且仅是单个并行运行时，看起来会是这样的。

In [None]:
parallel_chain = {'title': title_case, 'word_count': count_words}

这看起来不错，在定义时没有抛出任何错误，但如果现在尝试调用它，就会看到字典对象没有 invoke 属性的报错，这确实是个问题。

In [None]:
try:
    parallel_chain.invoke(title)
except AttributeError as e:
    print(e)

所以，使用 `RunnableParallel` 总是安全的，即使您更喜欢字典字面量语法，在 Python 解释器无法理解您的对象不只是一个 Python 字典时也要使用 `RunnableParallel`。

---

## 练习：创建一个包含并行 LLM 任务的链

我们将回顾一下您在之前 notebook 完成的一个练习，当时我们向您介绍了提示模板，是在您学习 LCEL 链之前。

您可能还记得我们提供了这样的列表...

In [None]:
statements = [
    "I had a fantastic time hiking up the mountain yesterday.",
    "The new restaurant downtown serves delicious vegetarian dishes.",
    "I am feeling quite stressed about the upcoming project deadline.",
    "Watching the sunset at the beach was a calming experience.",
    "I recently started reading a fascinating book about space exploration."
]

...基于此，您为情感分析、主题提取和后续问题生成这几个任务创建了提示词，最终输出摘要如下：

```
Statement: I had a fantastic time hiking up the mountain yesterday.
Overall sentiment: Positive
Main topic: Hiking
Followup question: What were some of the most challenging or memorable parts of your hiking experience?

Statement: The new restaurant downtown serves delicious vegetarian dishes.
Overall sentiment: Positive
Main topic: Vegetarian restaurants.
Followup question: What types of vegetarian dishes are served at the new downtown restaurant that are worth trying?

Statement: I am feeling quite stressed about the upcoming project deadline.
Overall sentiment: Negative
Main topic: Project deadline stress
Followup question: How do you typically manage stress and pressure when working towards a significant deadline in a project?

Statement: Watching the sunset at the beach was a calming experience.
Overall sentiment: Positive
Main topic: The experience of watching a sunset at the beach.
Followup question: What are some other activities that people often do at the beach at sunset?

Statement: I recently started reading a fascinating book about space exploration.
Overall sentiment: Positive
Main topic: Space exploration
Followup question: What are some of the most significant discoveries or achievements made in the field of space exploration that the book might touch on?
```

在这个练习中，您将根据相同的列表再次生成相同的输出，不过这次用链来实现，特别是并行链。

### 您需要的运行时

为了让您顺利开始，避免重复已经完成的工作，我们将提供几个会用到的运行时。

首先是 LLM 任务所需的 3 个提示模板。

In [None]:
sentiment_template = ChatPromptTemplate.from_template("""In a single word, either 'positive' or 'negative', \
provide the overall sentiment of the following piece of text: {text}""")

In [None]:
main_topic_template = ChatPromptTemplate.from_template("""Identify and state, as concisely as possible, the main topic \
of the following piece of text. Only provide the main topic and no other helpful comments. Text: {text}""")

In [None]:
followup_template = ChatPromptTemplate.from_template("""What is an appropriate and interesting followup question that would help \
me learn more about the provided text? Only supply the question. Text: {text}""")

接下来是一个输出解析器。

In [None]:
parser = StrOutputParser()

最后是一个自定义运行时，它期望一个包含 4 个值（`statement`, `sentiment`, `main_topic`, `followup`）的字典作为输入，并生成我们所需的文本输出。

In [None]:
output_formatter = RunnableLambda(lambda responses: (
    f"Statement: {responses['statement']}\n"
    f"Overall sentiment: {responses['sentiment']}\n"
    f"Main topic: {responses['main_topic']}\n"
    f"Followup question: {responses['followup']}\n"
))

### 规划您的链

在进行任何额外编码之前，花点时间思考一下如何构建您的链，包括任何子链。特别是，考虑在我们的任务中，哪里可以利用并行执行。

随意使用下面的单元格来写下您的想法，制定行动计划。完成后，请将其与下面的*参考答案* 进行比较。

### 您的计划

### 参考答案

整个链的输入和输出将是：

```
statements -> formatted_output
```

从 `formatted_output` 向后推，我们知道需要给它 4 个值：
```
statements ->
[statement, sentiment, main_topic, followup_question] ->
formatted_output
```

我们应该能以某种方式从 `statements` 捕获 `statement`，然后通过链传递，但对于 `sentiment`、`main_topic` 和 `followup_question`，每个都需要自己的 LLM 链：

```
statements ->
[
    statement,
    sentiment_template -> llm -> parser,
    main_topic_template -> llm -> parser,
    followup_question_template -> llm -> parser
] ->
formatted_output
```

可以观察到，`[` 和 `]` 之间的所有内容好像都可以各自独立完成，因此很可能并行执行。

为了从 4 个并行链返回一个字典到 `formatted_output`，需要使用上面定义的 `output_formatter` 运行时。

```
statements ->
[
    statement,
    sentiment_template -> llm -> parser,
    main_topic_template -> llm -> parser,
    followup_question_template -> llm -> parser
] ->
output_formatter ->
formatted_output
```

最后一件事，需要准备输入（`statements`），目前是字符串，供提示模板使用，每个都需要一个有 `text` 属性的字典。

```
statements ->
prep_statements_for_templates ->
[
    statement,
    sentiment_template -> llm -> parser,
    main_topic_template -> llm -> parser,
    followup_question_template -> llm -> parser
] ->
output_formatter ->
formatted_output
```

这看起来是个不错的思路，有了它，就可以继续了：


1) 创建一个自定义运行时，将字符串输入转换为带有文本字段的字典，以供提示模板使用。
2) 为情感分析、主题提取和后续问题生成各创建 1 个链（共 3 个链）。
3) 创建一个并行链，包含刚刚创建的 3 个链，以及一个额外的运行时（一个自定义运行时），它将传入的文本放到 `statement` 这个键下（按输出格式化运行时所要求的）。
4) 将 `prep_for_inputs` 运行时、并行链和 `output_formatter` 运行时链接在一起。
5) 使用整个链批量处理 `statements`.

### 您的代码

您直接开始动手实现所需的功能。

如果想在逐步指导下完成练习，请打开下面的*指导*部分。

## 指导

在这次练习中，我们将遵循上面*参考答案*中列出的行动步骤，即：

1) 创建一个自定义运行时，将字符串输入转换为带有文本字段的字典，以供提示模板使用。
2) 为情感分析、主题提取和后续问题生成各创建 1 个链（共 3 个链）。
3) 创建一个并行链，包含刚刚创建的 3 个链，以及一个额外的运行时（一个自定义运行时），它将传入的文本放到 `statement` 这个键下（按输出格式化运行时所要求的）。
4) 将 `prep_for_inputs` 运行时、并行链和 `output_formatter` 运行时链接在一起。
5) 使用整个链批量处理 `statements`.

### 为提示模板准备输入

创建一个自定义运行时，将字符串输入转换为带有 `text` 字段的字典，以供提示模板使用。

如果您遇到困难，可以查看下面的*参考答案*。

### 您的代码

### 参考答案

In [None]:
prep_for_template = RunnableLambda(lambda text: {"text": text})

### 创建 LLM 链

为情感分析、主题提取和后续问题生成各创建 1 个链（共 3 个链）。每个链应使用相应的提示模板，以及 LLM 实例和输出解析器。

如果您遇到困难，可以查看下面的*参考答案*。

### 您的代码

### 参考答案

In [None]:
sentiment_chain = sentiment_template | llm | parser
main_topic_chain = main_topic_template | llm | parser
followup_chain = followup_template | llm | parser

### 创建并行链

创建一个并行链，包含您刚刚创建的 3 个链，以及一个额外的运行时（一个自定义运行时），它将传入的文本放到 `statement` 这个键下（按输出格式化运行时所要求的）。

如果您遇到困难，可以查看下面的*参考答案*。

### 您的代码

### 参考答案

In [None]:
parallel_chain = RunnableParallel({
    "sentiment": sentiment_chain,
    "main_topic": main_topic_chain,
    "followup": followup_chain,
    "statement": RunnableLambda(lambda x: x['text'])
})

### 从子链组合主链

将 `prep_for_inputs` 运行时、并行链和 `output_formatter` 运行时链接到一起。

如果您遇到困难，可以查看下面的*参考答案*。

### 您的代码

### 参考答案

In [None]:
chain = prep_for_template | parallel_chain | output_formatter

In [None]:
print(chain.get_graph().draw_ascii())

### 执行链

使用完整的链批量处理 `statements`。

如果您遇到困难，可以查看下面的*参考答案*。

### 您的代码

### 参考答案

In [None]:
formatted_outputs = chain.batch(statements)

In [None]:
for output in formatted_outputs:
    print(output)

---

## 总结

这样就完成了本节的全部内容，您在这里学到了多种使用 LangChain 运行时的方式，包括创建自定义运行时，以及如何将它们链接在一起以完成各种任务。

在接下来的课程中，您将继续通过组合运行时，深入了解 LangChain 消息，利用对它的理解以多种方式控制 LLM 的输出。