# LangChain-HelloWorld

## 1. 获取大模型

In [15]:
#导入 dotenv 库的 load_dotenv 函数，用于加载环境变量文件（.env）中的配置
import dotenv
from langchain_classic.chains.question_answering.map_rerank_prompt import output_parser
from langchain_openai import ChatOpenAI
import os

# 加载环境变量文件
dotenv.load_dotenv()

# 获取open-ai的api密钥
os.environ['OPENAI_API_KEY'] = os.getenv('OPENAI_API_KEY')

# 创建 ChatOpenAI 对象
llm = ChatOpenAI(model="gpt-4o-mini")

# 直接提供问题，并调用llm
response = llm.invoke("什么是大模型？")

# 打印结果
print(response)

content='大模型通常是指在深度学习和自然语言处理领域中，具有大量参数和复杂结构的机器学习模型。这些模型通常基于神经网络架构，例如变压器（Transformer）架构，能够处理复杂的任务如文本生成、翻译、图像识别等。\n\n大模型的特点包括：\n\n1. **参数规模大**：大模型通常包含数亿到数千亿个参数，这使得它们能够学习更加复杂的特征和模式。\n  \n2. **计算要求高**：由于模型的复杂性和参数数量，训练和推理过程需要大量的计算资源，通常需要使用高性能的GPU或TPU集群。\n\n3. **预训练和微调**：许多大模型采用预训练和微调的策略，首先在大规模数据集上进行预训练，然后再在特定任务上进行微调，以提高性能。\n\n4. **通用性和迁移学习**：大模型通常具有较强的通用性，能够在多个任务上取得良好的性能，并且可以通过迁移学习技术，适应新的领域或任务。\n\n5. **应用广泛**：大模型在许多实际应用中表现出色，包括对话系统、文本生成、图像分析、医学诊断等。\n\n一些著名的大模型包括OpenAI的GPT-3、Google的BERT和DeepMind的AlphaFold等。随着研究的不断发展，关于大模型的训练、优化和应用的技术也在不断进步。' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 327, 'prompt_tokens': 12, 'total_tokens': 339, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4o-mini-2024-07-18', 'system_fingerprint': 'fp_29330a9688', 'id': 

## 2. 使用提示词模板
创建prompt template, 并引入一些变量到prompt template中，这样在应用的时候更加灵活。


In [16]:
from langchain_core.prompts import ChatPromptTemplate

# 需要注意的一点是，这里需要指明具体的role，在这里是system和用户
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是世界级的技术文档编写者"),
    ("user", "{input}") # {input}为变量
])

# 把prompt和具体llm的调用和在一起。
chain = prompt | llm
message = chain.invoke({"input": "大模型中的LangChain是什么?"})

print(message)

content='LangChain 是一个用于构建语言模型应用程序的框架，旨在将不同的组件聚合在一起，以便开发者能够更轻松地创建复杂的、上下文驱动的对话应用。它主要适用于增强语言模型（如 OpenAI 的 GPT 系列）的能力，结合外部数据源和工具，从而实现更智能的交互。\n\n### LangChain 的主要特点和组件\n\n1. **链（Chains）**：LangChain 的核心概念之一是“链”。开发者可以将多个动作（例如调用语言模型、查询数据库、调用 API 等）串联起来，以形成更复杂的逻辑。这样，用户输入可以通过一系列处理步骤得到最终结果。\n\n2. **代理（Agents）**：代理是 LangChain 的另一重要组成部分，允许模型根据输入动态选择最适合的行动或策略。例如，代理可以在不同的语言模型或工具之间切换，以找到最佳回复。\n\n3. **内存（Memory）**：LangChain 提供了内存功能，使得模型能够在对话中保持上下文。这对于创建具有更自然和连贯交互的应用至关重要。\n\n4. **数据源**：LangChain 可以与多种外部数据源（例如数据库、API、文档存储等）集成，以获取额外的信息。这使得模型能够在更广泛的知识库中进行查询，从而提供更加准确和相关的回答。\n\n5. **工具集（Toolkits）**：LangChain 还支持各种工具，这些工具可以被用作中间步骤，例如文本处理、任务调度、数据解析等，以增强模型的功能。\n\n### 使用场景\n\n- **对话系统**：通过组合以上组件，可以创建复杂的对话系统，能够回答特定领域的问题。\n- **信息检索**：结合外部知识库，提供更准确的信息检索功能。\n- **自动化任务**：通过代理和链的组合，自动化执行各种任务，比如数据查询和处理。\n\n### 结论\n\nLangChain 是一个强大的框架，特别适用于希望构建功能丰富、上下文感知和智能交互的语言模型应用的开发者。通过模块化的设计，开发者能够灵活组合各种元素，以实现复杂的业务逻辑和用户需求。' additional_kwargs={'refusal': None} response_metadata={'token_usage': {'completion_tokens': 498, 'prompt_toke

In [17]:
print(type(message))

<class 'langchain_core.messages.ai.AIMessage'>


## 3. 使用输出解析器

In [18]:
from langchain_core.output_parsers import StrOutputParser, JsonOutputParser

# 使用输出解释器
output_parser = StrOutputParser()

# 将其添加到上一个链中
chain = chain | output_parser

# 调用并提出同样的问题
chain.invoke({"input": "LangChain是什么？"})

'LangChain 是一个开源框架，旨在简化和加速与大语言模型（LLMs）的集成和应用开发。它提供了多种模块和组件，使开发者能够更加灵活和高效地与语言模型进行交互，构建复杂的应用程序。\n\nLangChain 的主要功能包括：\n\n1. **链式调用（Chains）**：允许用户将多个操作串联在一起，以实现更复杂的逻辑。这些操作可以是调用模型、处理输入和输出等。\n\n2. **数据拆分与转换**：支持将输入数据分割成多个部分，或将输出结果进行格式化，便于后续处理和分析。\n\n3. **文档处理**：提供工具来处理和管理文档数据，支持从各种源（如文本文件、数据库等）提取信息。\n\n4. **多种接口支持**：可以与多种LLM API（如OpenAI、Hugging Face等）无缝集成，允许用户选择适合自己需求的模型。\n\n5. **智能工具集成**：支持集成外部工具或API，提高应用的功能性，如搜索引擎、数据库访问等。\n\nLangChain 被广泛应用于构建聊天机器人、智能助理、内容生成以及其他需要自然语言处理的应用中。通过帮助开发者更轻松地使用LLMs，LangChain 加速了自然语言处理技术的创新和应用。'

In [19]:
# 使用输出解释器
output_parser = JsonOutputParser()

# 将其添加到上一个链中
chain = prompt | llm | output_parser

# 调用并提出同样的问题
chain.invoke({"input": "LangChain是什么？用JSON格式回复，问题用question，回答用answer"})

{'question': 'LangChain是什么？',
 'answer': 'LangChain是一个用于构建基于自然语言处理（NLP）应用的框架，它有助于简化和加速开发过程。LangChain提供了丰富的功能，包括链式调用、数据集合、代理生成等，用以支持生成式AI和对话系统的创建。开发者可以利用它构建更复杂的应用，如聊天机器人、虚拟助手和自动内容生成工具。'}

In [20]:
# 创建提示模板
prompt = ChatPromptTemplate.from_messages([
    ("system", "你是世界级的技术文档编写者。输出格式要求：{format_instructions}"),
    ("user", "{input}")
])

# 使用输出解释器
output_parser = JsonOutputParser()

# 将其添加到上一个链中
chain = prompt | llm | output_parser

# 调用并提出同样的问题
chain.invoke({"input": "LangChain是什么？", "format_instructions": output_parser.get_format_instructions()})

{'LangChain': {'description': 'LangChain是一个用于构建语言模型应用程序的框架，旨在使开发者能够更好地利用大规模语言模型的能力，组合和扩展其功能。',
  'features': ['封装了多种语言模型提供商的接口',
   '支持链式调用和组合不同的模型',
   '集成数据加载器、向量存储、LLM等功能',
   '支持多种用例，如聊天机器人、文本生成、问答系统等',
   '提供丰富的文档和示例'],
  'useCases': ['构建对话代理', '生成个性化内容', '创建智能问答系统', '进行文本分析和理解'],
  'gettingStarted': {'installation': '可以通过pip安装：`pip install langchain`',
   'basicExample': '导入LangChain库并创建一个简单的文本生成模型'},
  'website': 'https://www.langchain.com'}}

## 4. 使用向量存储