<a href="https://colab.research.google.com/github/hanlintao/langchain/blob/main/langchain_01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**本教程由北京语言大学高级翻译学院教师韩林涛撰写，目的是帮助翻译专业的师生了解如何使用Langchain来解决翻译相关的的问题。**

**第一步：安装Langchain**

什么是Langchain？

Langchain 是一个开源的 Python 库，它专注于构建和操作语言链（Language Chains）。语言链是一系列的自然语言处理（NLP）组件，它们以链式的方式组合在一起，以解决复杂的语言任务。每个组件在链中承担一个特定的角色，比如文本生成、提问回答、总结等。

Langchain 库的目的是提供一个框架，使开发者能够更轻松地构建、测试和部署基于多个语言模型的应用程序。这些应用程序可以涵盖从简单的问答系统到复杂的对话系统等多种用途。

Langchain官方推荐使用Jupyter Notebook来撰写代码。Google Colab打开后可以直接进入Jupyter Notebook模式，所撰写的代码均已.ipynb结尾。


In [5]:
!pip install langchain==0.0.343

Collecting langchain==0.0.343
  Downloading langchain-0.0.343-py3-none-any.whl (1.9 MB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/1.9 MB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.3/1.9 MB[0m [31m9.6 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.9 MB[0m [31m15.2 MB/s[0m eta [36m0:00:01[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━[0m [32m1.8/1.9 MB[0m [31m16.9 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.9/1.9 MB[0m [31m15.0 MB/s[0m eta [36m0:00:00[0m
Collecting dataclasses-json<0.7,>=0.5.7 (from langchain==0.0.343)
  Downloading dataclasses_json-0.6.3-py3-none-any.whl (28 kB)
Collecting jsonpatch<2.0,>=1.33 (from langchain==0.0.343)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting langchain-core<

常见问题：

1. 为什么在Colab中安装Langchain时需要在最前面添加一个!或者一个%？

  在 Google Colab 或其他 Jupyter Notebook 环境中，`!` 和 `%` 是特殊的命令前缀，它们用于在 notebook 单元中执行特定类型的操作。

   **感叹号 (`!`)**：当您在代码单元的开始处使用感叹号 (`!`) 时，它表示接下来的命令应该在系统的 shell 中执行，而不是作为 Python 代码执行。这通常用于运行如 `pip install` 或其他系统命令。例如，在 Colab 中安装 Langchain 库的命令会是：

   ```python
   !pip install langchain
   ```

   这个命令告诉 Colab 在其后台运行的系统 shell 中执行 `pip install langchain` 命令，就像在本地终端或命令提示符中运行一样。

   **百分号 (`%`)**：百分号用于 Jupyter Notebook 的“魔法”命令（Magic Commands），这些是 Jupyter 特有的一组功能强大的命令。例如，`%timeit` 可以用来快速测量 Python 代码的执行时间。在某些情况下，可能会使用 `%pip install`，这是一个特定于 Jupyter 环境的命令，用于确保库安装在当前 notebook 环境中，而不是主 Python 安装中。但是，通常 `!pip install` 在 Colab 中就足够了。

  总之，这些特殊前缀允许您在 Jupyter Notebook 或 Colab 单元中运行不仅限于 Python 的各种命令，从而增强了 notebook 的灵活性和功能性。

2. 为什么要制定Langchain的版本？

如果不指定Langchain的版本，intall命令会默认安装最新的版本，导致现在的代码无法正常运行。



**第二步：安装OpenAI**

In [6]:
!pip install openai==0.28



In [7]:
#设置OpenAI API Key

import os

os.environ["OPENAI_API_KEY"] = ""

**第三步：基于OpenAI库回答一个问题**

In [11]:
import openai

prompt = "翻译专业学生是否需要学习编程"

response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": prompt},
    ],
)

# 从结果中抽取答案
generated_text = response['choices'][0]['message']['content']

print(generated_text)

这完全取决于学生的兴趣和职业目标。学习编程可以增加很多技能，包括逻辑思考、问题解决以及在各种领域（如机器翻译或自然语言处理等）的应用。

如果一个翻译专业的学生对这些领域感兴趣，或者他们想要探索与翻译相关的技术领域（例如，开发或改进翻译软件），那么学习编程肯定是有好处的。然而，如果他们主要关注翻译的文化和语言方面，并且不打算走技术路线，那么编程可能不是必需学习的技能。


**知识点**

上述方法没有使用Langchain，而是直接调用OpenAI提供的ChatCompletion。

这个例子也说明了：即便没有Langchain，我们也可以调用OpenAI。



**第四步：基于Langchain调用OpenAI回答一个问题**

In [12]:
from langchain.chat_models import ChatOpenAI

chat_model = ChatOpenAI()

generated_text = chat_model.predict("翻译专业学生是否需要学习编程")

print(generated_text)

翻译专业学生是否需要学习编程取决于他们的兴趣和职业规划。学习编程可以为翻译专业学生提供一些额外的技能，例如自动化翻译工具的使用和网站本地化等。此外，编程也可以帮助学生更好地理解计算机辅助翻译软件的原理和功能。然而，对于一些翻译专业学生来说，学习编程可能并不是必要的，他们可以专注于其他翻译相关的技能和知识。最终，决定是否学习编程应该根据个人的兴趣和职业目标来做出。


**知识点**

上面的例子是借助Langchain来调用OpenAI API，完成了一问一答。

这个例子可以说明为什么要学习Langchain，Langchain 简化了与大语言模型交互的过程，使开发变得更容易。

**第五步：基于Langchain的指令模板（PromptTemplate）提问**

In [13]:
# 设计提问模板

from langchain.prompts.chat import (
    SystemMessagePromptTemplate,
    HumanMessagePromptTemplate,
    ChatPromptTemplate
)

system_template = SystemMessagePromptTemplate.from_template("你是北京语言大学高级翻译学院从事翻译技术教学与研究的教师")

user_template = HumanMessagePromptTemplate.from_template("{user_prompt}")

template = ChatPromptTemplate.from_messages([system_template, user_template])

# 创建OpenAI问答实例

from langchain.chat_models import ChatOpenAI

llm = ChatOpenAI(temperature=0.7, model_name="gpt-4", n=3)

# 创建一个语言链

from langchain.chains import LLMChain

chain = LLMChain(llm=llm, prompt=template)

# 创建用户问题

user_prompt = "翻译专业学生是否需要学习编程"

# 运行语言链

chain_output = chain.run({"user_prompt": user_prompt})

print(chain_output)



作为从事翻译技术教学与研究的教师，我认为翻译专业的学生学习一些基础的编程知识是有好处的。虽然不是必须的，但在某些方面，它可以帮助翻译专业的学生更好地理解和掌握一些翻译工具，提高翻译的效率和质量。

首先，许多现代翻译工具，如计算机辅助翻译（CAT）工具，都涉及到一些编程知识，如XML、HTML等。如果学生能理解这些编程语言的基础知识，他们就能更好地使用这些工具，解决在翻译过程中可能遇到的技术问题。

其次，随着机器翻译的发展，越来越多的翻译工作涉及到人工智能和深度学习技术。对这些技术有一定了解，可以帮助学生更好地理解机器翻译的原理和限制，从而更有效地使用机器翻译工具。

再次，学习编程也可以提高学生的逻辑思维和问题解决能力，这对于翻译工作也是非常有用的。

总的来说，虽然编程不是翻译专业学生必须学习的课程，但学习一些基础的编程知识，对他们的翻译工作是有帮助的。


**结果对比**

**1. 直接调用OpenAI得到的答案**

  这完全取决于学生的兴趣和职业目标。学习编程可以增加很多技能，包括逻辑思考、问题解决以及在各种领域（如机器翻译或自然语言处理等）的应用。

  如果一个翻译专业的学生对这些领域感兴趣，或者他们想要探索与翻译相关的技术领域（例如，开发或改进翻译软件），那么学习编程肯定是有好处的。然而，如果他们主要关注翻译的文化和语言方面，并且不打算走技术路线，那么编程可能不是必需学习的技能。

**2. 使用Langchain调用OpenAI得到的答案**

  翻译专业学生是否需要学习编程取决于他们的兴趣和职业规划。学习编程可以为翻译专业学生提供一些额外的技能，例如自动化翻译工具的使用和网站本地化等。此外，编程也可以帮助学生更好地理解计算机辅助翻译软件的原理和功能。然而，对于一些翻译专业学生来说，学习编程可能并不是必要的，他们可以专注于其他翻译相关的技能和知识。最终，决定是否学习编程应该根据个人的兴趣和职业目标来做出。

**3. 使用Langchain PromptTemplate得到的答案**

  作为从事翻译技术教学与研究的教师，我认为翻译专业的学生学习一些基础的编程知识是有好处的。虽然不是必须的，但在某些方面，它可以帮助翻译专业的学生更好地理解和掌握一些翻译工具，提高翻译的效率和质量。

  首先，许多现代翻译工具，如计算机辅助翻译（CAT）工具，都涉及到一些编程知识，如XML、HTML等。如果学生能理解这些编程语言的基础知识，他们就能更好地使用这些工具，解决在翻译过程中可能遇到的技术问题。

  其次，随着机器翻译的发展，越来越多的翻译工作涉及到人工智能和深度学习技术。对这些技术有一定了解，可以帮助学生更好地理解机器翻译的原理和限制，从而更有效地使用机器翻译工具。

  再次，学习编程也可以提高学生的逻辑思维和问题解决能力，这对于翻译工作也是非常有用的。

  总的来说，虽然编程不是翻译专业学生必须学习的课程，但学习一些基础的编程知识，对他们的翻译工作是有帮助的。

**知识点**

这段代码是使用Langchain库进行文本生成的示例。

• 从langchain.prompts.chat导入SystemMessagePromptTemplate、AIMessagePromptTemplate、HumanMessagePromptTemplate和ChatPromptTemplate，用于设计提问模板。

• 使用SystemMessagePromptTemplate.from_template()创建一个系统消息模板，表示问题的背景信息。

• 使用HumanMessagePromptTemplate.from_template()创建一个用户消息模板，表示用户的提问。

• 使用ChatPromptTemplate.from_messages()创建一个包含多个消息的聊天提问模板，包括系统消息和用户消息。

• 从langchain.chat_models导入ChatOpenAI，用于创建一个OpenAI问答实例。

• 使用ChatOpenAI()创建一个实例，传入参数temperature（控制生成文本的随机性，取值范围为0到2，默认值为1）和model_name（要使用的OpenAI模型名称）。

• 从langchain.chains导入LLMChain，用于创建一个语言模型链。

• 使用LLMChain()创建一个实例，传入参数llm（问答实例）和prompt（聊天提问模板）。

• 定义用户提问user_prompt。

• 使用chain.run()运行语言模型链，传入用户提问作为字典的键值对，并将输出存储在chain_output变量中。

• 使用print()打印输出。

**ChatOpenAI()类：**

ChatOpenAI 是一个用于与 OpenAI API 交互的类，它有以下可用的参数：

• model_name: 要使用的 OpenAI 模型名称。可用的模型名称包括：

• openai_api_key: 可选，用于验证 OpenAI API 请求的 API 密钥。如果未提供，将从环境变量 OPENAI_API_KEY 中读取。

• openai_api_base: 可选，OpenAI API 的基本 URL 路径。默认值为 https://api.openai.com/v1。

• max_tokens: 可选，生成的最大令牌数。默认值为 16。

• top_p: 可选，控制生成随机性的参数。默认值为 1.0。

• temperature: 可选，控制生成随机性的参数。默认值为 1.0。

• frequency_penalty: 可选，控制生成重复令牌的参数。默认值为 0.0。

• presence_penalty: 可选，控制生成新令牌的参数。默认值为 0.0。

• n: 可选，生成多个响应的数量。默认值为 1。

• streaming: 可选，启用流式处理。默认值为False。当 streaming 设置为 True 时，可以在长生成任务中实时获取生成结果，而不需要等待整个生成任务完成。这对于生成大量文本或需要实时反馈的应用程序非常有用。

In [None]:
# 实际撰写代码时，我们会把调用的工具放在代码最前端

from langchain.prompts.chat import (SystemMessagePromptTemplate, HumanMessagePromptTemplate, ChatPromptTemplate)
from langchain.chat_models import ChatOpenAI
from langchain.chains import LLMChain

# 设计提问模板

system_template = SystemMessagePromptTemplate.from_template("你是北京语言大学高级翻译学院从事翻译技术教学与研究的教师")

user_template = HumanMessagePromptTemplate.from_template("{user_prompt}")

template = ChatPromptTemplate.from_messages([system_template, user_template])

# 创建OpenAI问答实例

llm = ChatOpenAI(temperature=0.7, model_name="gpt-4", n=3)

# 创建一个语言链

chain = LLMChain(llm=llm, prompt=template)

# 创建用户问题

user_prompt = "翻译专业学生是否需要学习编程"

# 运行语言链

chain_output = chain.run({"user_prompt": user_prompt})

print(chain_output)



**备注**

撰写以上教程时参考了：

**1. Introduction to OpenAI and LangChain**

https://medium.com/@786sksujanislam786/introduction-to-openai-and-langchain-131fb629becb

**2. LangChain Chat**

https://chat.langchain.com/

**第六步：使用LangChain Template完成批量翻译**

In [14]:
# 待翻译的英文句子

sentences = [
    "Notwithstanding the challenges faced, the project was completed on time.",
    "Her understanding of astrophysics is profound, reflecting years of dedicated study.",
    "The juxtaposition of classical and modern elements creates an intriguing aesthetic.",
    "He articulated his arguments so eloquently that everyone was convinced.",
    "This paradigm shift in scientific thought marks a pivotal moment in history.",
    "The nuances of the language make it a challenging yet rewarding subject to learn.",
    "Her mastery of the piano is evident through her emotive and technically flawless performances.",
    "Such a meticulous analysis of the data reveals previously unnoticed patterns.",
    "His rhetoric, replete with literary allusions, captivated the audience.",
    "The synthesis of these diverse ideas could lead to a groundbreaking discovery."
]

In [15]:
from langchain import PromptTemplate # 引入模板
from langchain.chat_models import ChatOpenAI # 引入模型
from langchain.chains import LLMChain # 引入语言链

# 创建模板

system_template = "你是北京语言大学高级翻译学院翻译专业的资深教师，擅长英中翻译"

user_template = "这里有一个难度比较高的英文句子：{sentences}，请翻译成适合出版的中文"

template = PromptTemplate(input_variables=["sentences"], template=user_template)

# 创建语言模型

llm = ChatOpenAI(temperature=0.7, model_name="gpt-4")

# 创建语言链

chain = LLMChain(llm=llm, prompt=template)

# 生成输入

user_prompt = {"sentences": sentences}

# 运行语言链
chain_output = chain.run(user_prompt)

print(chain_output)

1. 尽管面临许多挑战，但项目还是按时完成了。
2. 她对天体物理学的理解深邃，反映出她多年的专注研究。
3. 古典元素和现代元素的并置创造了一种引人入胜的美学。
4. 他的论据表述得如此有力，使得所有人都被说服了。
5. 这种科学思想的范式转变标志着历史上的一个关键时刻。
6. 这种语言的细微差别使其成为一门具有挑战性但又值得学习的科目。
7. 从她充满感情且技术无懈可击的演奏中，可以明显看出她对钢琴的精通。
8. 对数据的如此细致的分析揭示了之前未被注意到的模式。
9. 他的演讲充满了文学典故，深深地吸引了观众。
10. 这些多元思想的融合可能会带来一项开创性的发现。


In [16]:
# 修改代码，逐句翻译并输出

from langchain import PromptTemplate  # 引入模板
from langchain.chat_models import ChatOpenAI  # 引入模型
from langchain.chains import LLMChain  # 引入语言链

# 创建模板
system_template = "你是北京语言大学高级翻译学院翻译专业的资深教师，擅长英中翻译"
user_template = "这里有一个难度比较高的英文句子：{sentences}，请翻译成适合出版的中文"

template = PromptTemplate(input_variables=["sentences"], template=user_template)

# 创建语言模型
llm = ChatOpenAI(temperature=0.7, model_name="gpt-4")

# 创建语言链
chain = LLMChain(llm=llm, prompt=template)

# 遍历句子并翻译
for sentence in sentences:
    # 生成输入
    user_prompt = {"sentences": sentence}

    # 运行语言链
    chain_output = chain.run(user_prompt)

    # 输出翻译结果
    print(f"原句: {sentence}\n翻译: {chain_output}\n")


原句: Notwithstanding the challenges faced, the project was completed on time.
翻译: 尽管面临诸多挑战，项目还是按时完成了。

原句: Her understanding of astrophysics is profound, reflecting years of dedicated study.
翻译: 她对天体物理学的理解深刻，反映出她多年来专注的学习。

原句: The juxtaposition of classical and modern elements creates an intriguing aesthetic.
翻译: 古典与现代元素的并置创造出了一种引人入胜的美学效果。

原句: He articulated his arguments so eloquently that everyone was convinced.
翻译: 他的论点阐述得如此雄辩，以至于所有人都被说服了。

原句: This paradigm shift in scientific thought marks a pivotal moment in history.
翻译: 这种科学思维的范式转变标志着历史的关键时刻。

原句: The nuances of the language make it a challenging yet rewarding subject to learn.
翻译: 语言的微妙之处使得学习它既富有挑战性，又极具成就感。

原句: Her mastery of the piano is evident through her emotive and technically flawless performances.
翻译: 她精湛的钢琴技艺通过其充满情感且技术无懈可击的演奏显而易见。

原句: Such a meticulous analysis of the data reveals previously unnoticed patterns.
翻译: 这种对数据的细致分析揭示了以前未被注意到的模式。

原句: His rhetoric, replete with literary allusions, captivated the audience.
翻译

**第七步：打印费用和耗时**

In [22]:
from langchain import PromptTemplate  # 引入模板
from langchain.chat_models import ChatOpenAI  # 引入模型
from langchain.chains import LLMChain  # 引入语言链
from langchain.callbacks import get_openai_callback # 引入OpenAI Callback，用于计算费用
import time #用于计算耗时

# 创建模板
system_template = "你是北京语言大学高级翻译学院翻译专业的资深教师，擅长英中翻译"
user_template = "这里有一个难度比较高的英文句子：{sentences}，请翻译成适合出版的中文"

template = PromptTemplate(input_variables=["sentences"], template=user_template)

# 创建语言模型
llm = ChatOpenAI(temperature=0.7, model_name="gpt-4")

# 创建语言链
chain = LLMChain(llm=llm, prompt=template)



total_cost = 0  # 初始化总费用
total_time = 0  # 初始化总耗时

# 遍历句子并翻译
for sentence in sentences:
    # 生成输入
    user_prompt = {"sentences": sentence}

    # 记录开始时间
    start_time = time.time()

    # 使用OpenAI Callback计算费用
    with get_openai_callback() as cb:
        # 运行语言链
        chain_output = chain.run(user_prompt)

        # 本次调用的费用
        cost = cb.total_cost
        total_cost += cost  # 更新总费用

    # 计算完成这一行的耗时
    row_time = time.time() - start_time
    total_time += row_time  # 更新总耗时

    # 输出翻译结果
    print(f"原句: {sentence}\n翻译: {chain_output}\n耗时：{row_time}秒\n耗费：{cost}美元\n")

# 所有循环结束后，打印总费用和总耗时
print(f"\n所有句子翻译完毕。总费用为: {total_cost:.6f} 美元，总耗时: {total_time:.2f} 秒")



原句: Notwithstanding the challenges faced, the project was completed on time.
翻译: 尽管面临诸多挑战，项目还是如期完成了。
耗时：2.064326047897339秒
耗费：0.00294美元

原句: Her understanding of astrophysics is profound, reflecting years of dedicated study.
翻译: 她对天体物理学的理解深邃，反映出多年来的专注研究。
耗时：3.4897823333740234秒
耗费：0.0036美元

原句: The juxtaposition of classical and modern elements creates an intriguing aesthetic.
翻译: 古典与现代元素的并置产生了一种引人入胜的审美效果。
耗时：5.009399652481079秒
耗费：0.0033美元

原句: He articulated his arguments so eloquently that everyone was convinced.
翻译: 他的论点阐述得如此雄辩，以至于所有人都被说服了。
耗时：2.4561729431152344秒
耗费：0.00324美元

原句: This paradigm shift in scientific thought marks a pivotal moment in history.
翻译: 这种科学思维的范式转变标志着历史上的一个关键时刻。
耗时：2.738492488861084秒
耗费：0.00336美元

原句: The nuances of the language make it a challenging yet rewarding subject to learn.
翻译: 语言的微妙差异使得学习它既富有挑战性又极具成就感。
耗时：4.407325744628906秒
耗费：0.0038399999999999997美元

原句: Her mastery of the piano is evident through her emotive and technically flawless performances.
翻译

**总结**

通过上面的步骤，我们了解了如何通过LangChain来构建“语言链”完成纯文本翻译。